Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

Train llm (bloom, llama, baichuan2-7b, chatglm3-6b) with deepspeed pipeline mode. Faster than zero/zero++/fsdp.

创建时间
是否国产

  修改时间

2024-02-05T05:23:05Z


语言

  • Python63.9%
  • C++25.0%
  • Cuda11.0%
  • C0.2%
  • 其他0.01%

CoinCheung 的其他开源项目

label-smooth, amsoftmax, partial-fc, focal-loss, triplet-loss, lovasz-softmax. Maybe useful

Python2.25 k
10 个月前

Add bisenetv2. My implementation of BiSeNet

Python1.54 k
8 个月前

mIOU=80.02 on cityscapes. My implementation of deeplabv3+ (also know as 'Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation' based on the dataset of cityscapes).

Python181
5 年前

a 2048 small game writen by python and c

Python0
8 年前

您可能感兴趣的

#大语言模型#基于ChatGLM-6B、ChatGLM2-6B、ChatGLM3-6B模型,进行下游具体任务微调,涉及Freeze、Lora、P-tuning、全参微调等

Python2.75 k
2 年前

#大语言模型#The blog, read report and code example for AGI/LLM related knowledge.

Python40
6 个月前

#大语言模型#LLaVA是一个具有 GPT-4V 级别功能的大语言和视觉模型助手

Python23.22 k
1 年前
2.52 k
2 年前
Rust257
1 年前

Monkey (LMM): Image Resolution and Text Label Are Important Things for Large Multi-modal Models (CVPR 2024 Highlight)

Python1.9 k
21 天前

Go ahead and axolotl questions

Python9.7 k
2 个月前

#大语言模型#Code examples and resources for DBRX, a large language model developed by Databricks

Python2.57 k
1 年前
Ruby52.74 k
13 天前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python27 k
3 个月前

"他山之石、可以攻玉":复旦白泽智能发布面向国内开源和国外商用大模型的Demo数据集JADE-DB

Jupyter Notebook432
1 个月前

RankLLM is a Python toolkit for reproducible information retrieval research using rerankers, with a focus on listwise reranking.

Python404
5 个月前

Minimalistic large language model 3D-parallelism training

Python2.11 k
1 个月前
Swift8.94 k
7 天前