Vosk 是一个离线的语言识别工具。支持 Python, Java, Node.JS, C#, C++ ,能识别20+种语言,包括中文、英语、法语等。
该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README
Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node
2019-09-03
否
2025-08-24T23:08:01Z
WebSocket, gRPC and WebRTC speech recognition server based on Vosk and Kaldi libraries
#安卓#Offline speech recognition for Android with Vosk library.
VOSK Speech Recognition Toolkit
Speech Recognition in Asterisk with Vosk Server
大模型Grok-1开源
whisper 是一个通用语音识别模型
Open-Sora: 完全开源的高效复现类Sora视频生成方案
#计算机科学#A PyTorch-based Speech Toolkit
Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...
#大语言模型#本地化搭建和运行 Llama2 和其他大模型
#计算机科学#DeepSpeech 是一款开源嵌入式(离线、设备上)语音识别引擎,最低可以在树莓派上运行
Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境,也可以作为云存储服务、远程服务器、网络托管平台等的接口。
Zero-Shot Speech Editing and Text-to-Speech in the Wild
#大语言模型#🙌 OpenHands: Code Less, Make More
#大语言模型#Automate browser-based workflows with LLMs and Computer Vision
✨ The Next Gen Airtable Alternative: No-Code Postgres
WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)
#计算机科学#Faster Whisper transcription with CTranslate2
#计算机科学#Fast inference engine for Transformer models
#大语言模型#LlamaIndex is the leading framework for building LLM-powered agents over your data.
#大语言模型#现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架支持语音合成、多模态、可扩展的(function call)插件系统。一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用
#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。
#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库
TripoSR: Fast 3D Object Reconstruction from a Single Image
0 条讨论