Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

LightLLM is a Python-based LLM (Large Language Model) inference and serving framework, notable for its lightweight design, easy scalability, and high-speed performance.

创建时间
是否国产

  修改时间

2025-10-17T09:49:40Z


语言

  • Python99.6%
  • Shell0.4%
  • Dockerfile0.1%

ModelTC 的其他开源项目

Model Quantization Benchmark

Python841
6 个月前

United Perception

Python435
3 年前

您可能感兴趣的

大模型Grok-1开源

Python50.54 k
1 年前

#大语言模型#vLLM 是一个高效的开源库,用于加速大语言模型推理,通过优化内存管理和分布式处理实现高吞吐量和低延迟。

Python60.42 k
34 分钟前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python27.51 k
6 个月前

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

Go154.34 k
1 天前
Python64.31 k
17 小时前

Devika is now Opcode

Python19.49 k
24 天前

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python38 k
1 天前
hiyouga/LLaMA-Factory

#自然语言处理#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python60.41 k
1 天前

TensorRT LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and support state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT L...

C++11.89 k1
10 小时前

This project aim to reproduce Sora (Open AI T2V model), we wish the open source community contribute to this project.

Python12.05 k
21 天前

#大语言模型#Python SDK, Proxy Server (LLM Gateway) to call 100+ LLM APIs in OpenAI format - [Bedrock, Azure, OpenAI, VertexAI, Cohere, Anthropic, Sagemaker, HuggingFace, Replicate, Groq]

Python30.05 k
11 小时前

#大语言模型#Automate browser-based workflows with LLMs and Computer Vision

Python14.62 k
1 天前

#大语言模型#本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)

HTML21.39 k
9 天前

#大语言模型#MetaGPT:为 GPT 分配不同的角色,协作处理更复杂的任务。MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等

Python58.98 k
15 天前
Python21.49 k
6 天前

#大语言模型#SGLang is a fast serving framework for large language models and vision language models.

Python19.06 k
2 小时前

#大语言模型#利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.

Python46.67 k
4 个月前

Development repository for the Triton language and compiler

MLIR17.23 k
3 天前

Fast and memory-efficient exact attention

Python20.03 k
10 小时前