GitHub 中文社区

回车: Github搜索 Shift+回车: Google搜索

©2025 GitHub中文社区论坛 GitHub官网网站地图 GitHub官方翻译

GitHub on X
GitHub on Facebook
GitHub on LinkedIn
GitHub on YouTube
GitHub on Twitch
GitHub on TikTok
GitHub’s organization on GitHub

集合主题趋势排行榜

#

smoothquant

Website
Wikipedia

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

low-precision pruning sparsity auto-tuning knowledge-distillation quantization quantization-aware-training post-training-quantization smoothquant large-language-models gptq int8

Python 2.49 k

2 小时前

ModelTC / LightCompress

#大语言模型#A powerful toolkit for compressing large models including LLM, VLM, and video generation models.

部署大语言模型 pruning quantization 工具 benchmark evaluation large-language-models internlm2 smoothquant mixtral vllm deepseek-v3 wan

Python 563

24 天前