pruning

#大语言模型#《李宏毅深度学习教程》（李宏毅老师推荐👍，苹果书🍎），PDF下载地址：https://github.com/datawhalechina/leedl-tutorial/releases

机器学习深度学习 leedl-tutorial cnn reinforcement-learning transformer rnn Generative Adversarial Network pruning self-attention ChatGPT 教程 diffusion transfer-learning bert

Jupyter Notebook 15.72 k

3 个月前

IntelLabs / distiller

Neural Network Distiller by Intel AI Lab: a Python package for neural network compression research. https://intellabs.github.io/distiller

PyTorch pruning quantization Jupyter Notebook 深度神经网络 regularization distillation onnx

Jupyter Notebook 4.4 k

2 年前

neuralmagic / deepsparse

#自然语言处理#Sparsity-aware deep learning inference runtime for CPUs

机器学习 onnx inference 机器视觉 object-detection pruning quantization pretrained-models 自然语言处理 cpus sparsification llm-inference performance

Python 3.16 k

3 个月前

VainF / Torch-Pruning

#大语言模型#[CVPR 2023] DepGraph: Towards Any Structural Pruning; LLMs, Vision Foundation Models, etc.

pruning model-compression efficient-deep-learning 大语言模型 transformers vision

Python 3.13 k

11 天前

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

low-precision pruning sparsity auto-tuning knowledge-distillation quantization quantization-aware-training post-training-quantization smoothquant large-language-models gptq int8

Python 2.49 k

1 天前

he-y / Awesome-Pruning

#Awesome#A curated list of neural network pruning resources.

pruning model-compression Awesome Lists

2.47 k

1 年前

quic / aimet

#计算机科学#AIMET is a library that provides advanced quantization and compression techniques for trained neural network models.

quantization 深度学习 compression Open Source 机器学习 pruning auto-ml 深度神经网络

Python 2.45 k

15 小时前

666DZY666 / micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Ari...

quantization pruning dorefa twn bnn xnor-net PyTorch model-compression group-convolution convolutional-networks quantization-aware-training post-training-quantization tensorrt onnx

Python 2.26 k

4 个月前

neuralmagic / sparseml

#自然语言处理#Libraries for applying sparsification recipes to neural networks with a few lines of code, enabling faster and smaller models

PyTorch Keras sparsification-recipes Tensorflow smaller-models deep-learning-library 深度学习 deep-learning-models automl sparsity sparsification pruning computer-vision-algorithms object-detection image-classification 自然语言处理 onnx transfer-learning

Python 2.15 k

3 个月前

peremartra / Large-Language-Model-Notebooks-Course

Practical course about Large Language Models.

chatbots huggingface langchain large-language-models transformers vector-database fine-tuning-llm pruning

Jupyter Notebook 1.68 k

1 个月前

cupcakearmy / autorestic

Config driven, easy backup cli for restic.

restic backup 命令行界面 configuration pruning incremental Entity resolution

Go 1.65 k

18 天前

open-mmlab / mmrazor

OpenMMLab Model Compression Toolbox and Benchmark.

nas pruning knowledge-distillation spos darts autoslim detection segmentation classification PyTorch quantization

Python 1.63 k

1 年前

PaddlePaddle / PaddleSlim

PaddleSlim is an open-source library for deep model compression and architecture search.

pruning quantization nas bert compression detection distillation ernie segmentation sparsity tensorrt transformer yolov6 yolov5 yolov7

Python 1.6 k

16 天前

tensorflow / model-optimization

#计算机科学#A toolkit to optimize ML models for deployment for Keras and TensorFlow, including quantization and pruning.

Tensorflow 机器学习深度学习 optimization Keras model-compression compression pruning sparsity quantization

Python 1.55 k

8 天前

huawei-noah / Efficient-Computing

Efficient computing methods developed by Huawei Noah's Ark Lab

knowledge-distillation model-compression binary-neural-networks pruning quantization self-supervised

Jupyter Notebook 1.29 k

10 个月前

openvinotoolkit / nncf

#自然语言处理#Neural Network Compression Framework for enhanced OpenVINO™ inference

quantization pruning sparsity quantization-aware-training compression semantic-segmentation object-detection classification 自然语言处理 bert transformers PyTorch Tensorflow onnx openvino 深度学习 genai 大语言模型

Python 1.08 k

2 天前

horseee / LLM-Pruner

#大语言模型#[NeurIPS 2023] LLM-Pruner: On the Structural Pruning of Large Language Models. Support Llama-3/3.1, Llama-2, LLaMA, BLOOM, Vicuna, Baichuan, TinyLlama, etc.

compression language-model 大语言模型 pruning baichuan chatglm llama vicuna llama-2 bloom llama3

Python 1.06 k

1 年前