Open source annotation tool for machine learning practitioners.
2018-05-09
否
2025-06-16T13:58:01Z
#自然语言处理#The official tool for transforming doccano format into common dataset formats.
#自然语言处理#Annotation meets Large Language Models (ChatGPT, GPT-3 and alike).
#自然语言处理#doccano auto labeling pipeline helps doccano to annotate a document automatically.
#数据仓库#Label Studio 是一个用于机器学习模型训练的数据标注工具,支持标注图像、音频、文本、视频等多种类型。
#数据仓库#Cleanlab's open-source library is the standard data-centric AI package for data quality and machine learning with messy, real-world data and labels.
Devika is now Opcode
Open-Sora: 完全开源的高效复现类Sora视频生成方案
pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation
#计算机科学#CVAT 是一个领先的工业级用于机器学习的图片、视频标注工具。
#计算机科学#Image Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).
tiktoken is a fast BPE tokeniser for use with OpenAI's models.
Qwen 是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。
Fast Rust bundler for JavaScript/TypeScript with Rollup-compatible API.
#大语言模型#Gorilla: Training and Evaluating LLMs for Function Calls (Tool Calls)
FauxPilot - an open-source alternative to GitHub Copilot server
#计算机科学#MLflow 是一个开源框架,旨在管理整个机器学习生命周期。 它可以在不同的平台上训练模型并为模型提供服务,让你能够使用相同的一组工具,而不管试验是在计算机本地、远程计算目标上、虚拟机上
#自然语言处理#为 Jax、PyTorch 和 TensorFlow 打造的先进的自然语言处理
Garnet 是一个微软开源的高性能的缓存服务器,可兼容现有的Redis Client
0 条讨论