Loading

关于

Fast and memory-efficient exact attention

创建时间
是否国产

  修改时间

2025-06-09T02:22:08Z


语言

  • Python54.5%
  • C++33.9%
  • Cuda11.5%
  • Dockerfile0.1%
  • C0.1%
  • 其他0.01%


该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

Dao-AILab 的其他开源项目

Loading...

数据准备中,请稍后重试

您可能感兴趣的

大模型Grok-1开源

Python50.3 k
9 个月前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python26.62 k
1 个月前

#大语言模型#A high-throughput and memory-efficient inference and serving engine for LLMs

Python49.14 k
3 小时前

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

Go143.11 k
11 小时前

This project aim to reproduce Sora (Open AI T2V model), we wish the open source community contribute to this project.

Python11.98 k
4 天前
hiyouga/LLaMA-Factory

#大语言模型#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python51.83 k
2 天前

#计算机科学#DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍

Python38.76 k
1 天前
Python145.32 k
6 小时前

Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...

Python18.77 k
9 个月前

#自然语言处理#通义千问-7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的70亿参数规模的模型

Python18.46 k
1 个月前

Mamba SSM architecture

Python15.03 k
15 天前
facebookresearch/xformers

Hackable and optimized Transformers building blocks, supporting a composable construction.

Python9.56 k
4 天前

Development repository for the Triton language and compiler

MLIR15.78 k
3 天前

一个基于 Gradio 的 Web UI,用于运行像 LLaMA、llama.cpp、GPT-J、Pythia、OPT 和 GALACTICA 这样的大型语言模型。

Python43.86 k
5 小时前

LangChain 是一个用于构建基于LLM应用(大型语言模型)的Python库。

Jupyter Notebook109 k
2 天前

LLaMA模型的推理代码

Python58.34 k
4 个月前
Python57.63 k
5 小时前
Python18.7 k
3 天前

#大语言模型#LlamaIndex is the leading framework for building LLM-powered agents over your data.

Python42.18 k
1 天前