Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

一个基于HuggingFace开发的大语言模型训练、测试工具。支持各模型的webui、终端预测,低参数量及全参数模型训练(预训练、SFT、RM、PPO、DPO)和融合、量化。

创建时间
是否国产

  修改时间

2023-12-08T04:07:44Z


语言

  • Python100.0%

stanleylsx 的其他开源项目

Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。

Python178
10 个月前
Python134
1 年前

基于Tensorflow官方教程的基于注意力的神经机器翻译重构的代码,使用Seq2Seq做机器翻译和摘要生成代码仓库。使用Tensorflow2.3进行构建。

Python6
4 年前

您可能感兴趣的

ParlAI 是一个用于训练和对话人工智能研究的 Python 框架

Python10.62 k
2 年前

#计算机科学#Guide to using pre-trained large language models of source code

Python1.84 k
1 年前

#自然语言处理#An implementation of the BERT model and its related downstream tasks based on the PyTorch framework. @月来客栈

Python608
2 个月前

#大语言模型#《Pytorch实用教程》(第二版)无论是零基础入门,还是CV、NLP、LLM项目应用,或是进阶工程化部署落地,在这里都有。相信在本书的帮助下,读者将能够轻松掌握 PyTorch 的使用,成为一名优秀的深度学习工程师。

Jupyter Notebook4.09 k
8 个月前

CKAN是一款驱动数据中心和数据门户的开源DMS(数据管理系统)。CKAN使公开、分享和使用数据变的简单。

Python4.83 k
1 天前
Python404
1 年前

Create Customized Software using Natural Language Idea (through LLM-powered Multi-Agent Collaboration)

Python27.45 k
3 天前

大模型基础: 一文了解大模型基础知识

5.92 k
7 个月前

#大语言模型#Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用

Python14.7 k
6 个月前
Python4.01 k
1 年前

Stable Diffusion 是一个 text-to-image 扩散模型

Jupyter Notebook71.52 k
1 年前

#大语言模型#MetaGPT:为 GPT 分配不同的角色,协作处理更复杂的任务。MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等

Python58.72 k
3 个月前
hiyouga/LLaMA-Factory

#自然语言处理#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python59.38 k
2 天前

[EMNLP 2024] 中文领域心理健康对话大模型MeChat

Python486
10 个月前

#大语言模型#本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)

HTML21.03 k
2 个月前

This is a repository used by individuals to experiment and reproduce the pre-training process of LLM.

Python86
2 年前