Spaces:

Alovestocode
/

ZeroGPU-LLM-Inference

Sleeping

App Files Files Community

ZeroGPU-LLM-Inference / README.md

Commit History

Implement vLLM with LLM Compressor and performance optimizations

a79facb

Alikestocode commited on Nov 8

Migrate to AWQ quantization with FlashAttention-2

06b4cf5

Alikestocode commited on Nov 8

Update README and clean up old files

9592189

Alikestocode commited on Nov 7

Update README: Focus on CourseGPT-Pro router checkpoints

4706b45

Alikestocode commited on Nov 7

Update README with correct space URL

9af4b77

Alikestocode commited on Nov 7

Initial commit: ZeroGPU LLM Inference Space

f91e906

Alikestocode commited on Nov 7