Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP

创建时间
是否国产

  修改时间

2024-05-23T02:31:31Z



brightmart 的其他开源项目

Python7.93 k
2 年前🇨🇳

A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS, 海量中文预训练ALBERT模型

Python3.98 k
3 年前
Python2.73 k
1 年前

您可能感兴趣的

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python26.99 k
3 个月前

#自然语言处理#MNBVC(Massive Never-ending BT Vast Chinese corpus)超大规模中文语料集。对标chatGPT训练的40T数据。MNBVC数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。MNBVC数据集包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。

3.92 k
14 天前

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

Go148.73 k
5 小时前

大模型Grok-1开源

Python50.39 k
1 年前

搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。

Jupyter Notebook6.29 k
7 年前
内容违规,已屏蔽
Python75.25 k
1 年前🇨🇳
Python1.05 k
3 天前

中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。

Python4.47 k
2 年前🇨🇳

#大语言模型#本项目旨在分享大模型相关技术原理以及实战经验(大模型工程化、大模型应用落地)

HTML19.9 k
2 天前
Python12.06 k
2 年前
comfyanonymous/ComfyUI

The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

Python84.41 k
3 小时前

#安卓#fay是一个帮助数字人(2.5d、3d、移动、pc、网页)或大语言模型(openai兼容、deepseek)连通业务系统的mcp框架。

JavaScript11.65 k
13 小时前🇨🇳

#自然语言处理#通义千问-7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的70亿参数规模的模型

Python18.94 k
13 天前
krahets/hello-algo

#算法刷题#《Hello 算法》:动画图解、一键运行的数据结构与算法教程。支持 Python, Java, C++, C, C#, JS, Go, Swift, Rust, Ruby, Kotlin, TS, Dart 代码。简体版和繁体版同步更新,English version in translation

Java115.1 k
1 天前🇨🇳

结巴中文分词

Python34.3 k
1 年前🇨🇳
hiyouga/LLaMA-Factory

#自然语言处理#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

Python55.53 k
3 小时前

#自然语言处理#A curated list of resources for Chinese NLP 中文自然语言处理相关资料

7.9 k
2 年前

#大语言模型#Python SDK, Proxy Server (LLM Gateway) to call 100+ LLM APIs in OpenAI format - [Bedrock, Azure, OpenAI, VertexAI, Cohere, Anthropic, Sagemaker, HuggingFace, Replicate, Groq]

Python26.85 k
30 分钟前