Spaces:

Alovestocode
/

ZeroGPU-LLM-Inference

Sleeping

App Files Files Community

ZeroGPU-LLM-Inference / test_api.py

Commit History

Migrate to AWQ quantization with FlashAttention-2

06b4cf5

Alikestocode commited on Nov 8