GitHub 中文社区
回车: Github搜索    Shift+回车: Google搜索
论坛
排行榜
趋势
登录

©2025 GitHub中文社区论坛GitHub官网网站地图GitHub官方翻译

  • X iconGitHub on X
  • Facebook iconGitHub on Facebook
  • Linkedin iconGitHub on LinkedIn
  • YouTube iconGitHub on YouTube
  • Twitch iconGitHub on Twitch
  • TikTok iconGitHub on TikTok
  • GitHub markGitHub’s organization on GitHub
shibing624

shibing624 / text2vec

星标4.75 k
复刻413


问题 官网
 
Loading

关于

text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。

pypi.org
similarity自然语言处理text-similaritytext2vecword2vecembeddingssentence-embeddings
创建时间

2019-11-12

是否国产

是

  修改时间

2025-05-01T05:21:00Z


语言

  • Python100.0%


该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

shibing624 的其他开源项目

shibing624/pycorrector
pycorrector
@shibing624

pycorrector is a toolkit for text error correction. 文本纠错,实现了Kenlm,T5,MacBERT,ChatGLM3,Qwen2.5等模型应用在纠错场景,开箱即用。

spelling-errorserror-correctionpycorrectorkenlmerror-detection
Python6.01 k
6 天前🇨🇳
MedicalGPT
@shibing624

#大语言模型#MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO、GRPO。

llamaChatGPTgpt大语言模型medical
Python3.93 k
6 天前
python-tutorial
@shibing624

Python实用教程,包括:Python基础,Python高级特性,面向对象编程,多线程,数据库,数据科学,Flask,爬虫开发教程。

Pythonpython-tutorialNumPySciPyPyTorch
Jupyter Notebook2.19 k
2 年前

您可能感兴趣的

grok-1
@xai-org

大模型Grok-1开源

Python50.3 k
9 个月前
Langchain-Chatchat
@chatchat-space

#大语言模型#Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM, Qwen 与 Llama 等语言模型的 RAG 与 Agent 应用 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM, Qwen and Ll...

chatglmlangchain大语言模型knowledge-basellama
TypeScript35.22 k
2 个月前
Open-Sora
@hpcaitech

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python26.61 k
1 个月前
langchain
@langchain-ai

LangChain 是一个用于构建基于LLM应用(大型语言模型)的Python库。

Jupyter Notebook108.88 k
14 小时前
THUDM
ChatGLM3
THUDM@THUDM

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

Python13.71 k
5 个月前
hiyouga/LLaMA-Factory
LLaMA-Factory
@hiyouga

#大语言模型#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)

fine-tuninglanguage-modelllama大语言模型peft
Python51.71 k
3 小时前
llama_index
@run-llama

#大语言模型#LlamaIndex is the leading framework for building LLM-powered agents over your data.

agentsapplicationdatafine-tuning框架
Python42.13 k
8 小时前
Qwen
Qwen3
@QwenLM • 阿里巴巴

Qwen3 is the large language model series developed by Qwen team, Alibaba Cloud.

Shell21.87 k
8 天前
ollama
@ollama

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

llama大语言模型llama2Go
Go142.88 k
8 小时前
FlagEmbedding
@FlagOpen

#大语言模型#Retrieval and Retrieval-augmented LLMs

embeddingsinformation-retrieval大语言模型sentence-embeddingstext-semantic-similarity
Python9.85 k
2 天前
vllm
@vllm-project

#大语言模型#A high-throughput and memory-efficient inference and serving engine for LLMs

gpt大语言模型PyTorchllmopsmlops
Python49.01 k
20 分钟前
ggml-org/llama.cpp
llama.cpp
@ggml-org

Facebook 的 LLaMA 模型在 C/C++ 中的移植

llamaggml
C++81.4 k
41 分钟前
Awesome-Chinese-LLM
@HqWu-HITCS

#自然语言处理#整理开源的中文大语言模型,以规模较小、可私有化部署、训练成本较低的模型为主,包括底座模型,垂直领域微调及应用,数据集与教程等。

大语言模型自然语言处理chatglm中文llama
20.27 k
18 天前
milvus-io/milvus
milvus
@milvus-io

#向量搜索引擎#Milvus 是一款开源的、针对海量特征向量的相似性搜索引擎

annsnearest-neighbor-searchfaissvector-searchimage-search
Go35.15 k
17 分钟前
langgenius/dify
dify
@langgenius

#大语言模型#Dify 是一个易用的 LLMOps 平台,旨在让更多人可以创建可持续运营的原生 AI 应用。Dify 提供多种类型应用的可视化编排,应用可开箱即用,也能以“后端即服务”的 API 提供服务。

人工智能backend-as-a-servicegpt大语言模型openai
TypeScript101.04 k
1 小时前
OpenHands
@All-Hands-AI

#大语言模型#🙌 OpenHands: Code Less, Make More

agent人工智能大语言模型ChatGPTclaude-ai
Python57.48 k
4 小时前
DB-GPT
@eosphoros-ai

#大语言模型#AI Native Data App Development framework with AWEL(Agentic Workflow Expression Language) and Agents

数据库gpt-4vicunaprivate安全
Python16.69 k
3 天前
huggingface/transformers
Hugging Face
transformers
Hugging Face@huggingface

#自然语言处理#为 Jax、PyTorch 和 TensorFlow 打造的先进的自然语言处理

自然语言处理PyTorchlanguage-modelTensorflow
Python145.22 k
2 小时前
MetaGPT
@FoundationAgents

#大语言模型#MetaGPT:为 GPT 分配不同的角色,协作处理更复杂的任务。MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等

agentgpt大语言模型metagptmulti-agent
Python56.17 k
21 天前
Meta Research
faiss
@facebookresearch • Meta

#向量搜索引擎#向量相似性搜索库,为稠密向量提供高效相似度搜索和聚类

C++35.36 k
1 天前