回车: Github搜索 Shift+回车: Google搜索

Vosk 是一个离线的语言识别工具。支持 Python, Java, Node.JS, C#, C++ ，能识别20+种语言，包括中文、英语、法语等。

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README

0 条讨论

登录后发表评论

关于

Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Node

speech-recognition asr voice-recognition speech-to-text Android iOS 树莓派深度学习深度神经网络 speech-to-text-android speaker-identification speaker-verification Python offline 隐私 kaldi deepspeech google-speech-to-text vosk stt

创建时间

2019-09-03

是否国产

否

修改时间

2025-09-10T13:13:51Z

Readme

语言

C++34.4%
Java16.9%
Python12.4%
Shell11.9%
C7.5%
JavaScript7.1%
C#6.3%
Swift2.5%
Makefile1.1%
其他0.01%

alphacep 的其他开源项目

vosk-server

@alphacep

WebSocket, gRPC and WebRTC speech recognition server based on Vosk and Kaldi libraries

WebSocket speech-recognition kaldi Python asr

Python1.18 k

3 个月前

vosk-android-demo

@alphacep

#安卓#Offline speech recognition for Android with Vosk library.

Android kaldi offline speech-recognition asr

Java949

2 年前

vosk

@alphacep

VOSK Speech Recognition Toolkit

speech-recognition voice-recognition speech-to-text Python

C477

3 年前

vosk-asterisk

@alphacep

Speech Recognition in Asterisk with Vosk Server

vosk asterisk speech-recognition speech-to-text asr

C125

1 年前

您可能感兴趣的

grok-1

@xai-org

大模型Grok-1开源

Python50.53 k

1 年前

whisper

OpenAI@openai

whisper 是一个通用语音识别模型

Python89.23 k

1 个月前

Open-Sora

@hpcaitech

Open-Sora：完全开源的高效复现类Sora视频生成方案

Python27.38 k

5 个月前

speechbrain

@speechbrain

#计算机科学#A PyTorch-based Speech Toolkit

speech-recognition speech-toolkit speaker-recognition speech-to-text speech-enhancement

Python10.54 k

2 天前

devika

@stitionai

Devika is now Opcode

Python19.49 k

16 天前

ollama

@ollama

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

llama 大语言模型 llama2 Go

Go153.88 k

15 小时前

DeepSpeech存档

Mozilla@mozilla

#计算机科学#DeepSpeech 是一款开源嵌入式（离线、设备上）语音识别引擎，最低可以在树莓派上运行

深度学习机器学习 neural-networks Tensorflow speech-recognition

C++26.62 k

4 个月前

puter

@HeyPuter

Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境，也可以作为云存储服务、远程服务器、网络托管平台等的接口。

Desktop desktop-environment osjs web-desktop webtop

JavaScript36.77 k

12 小时前

VoiceCraft

@jasonppy

Zero-Shot Speech Editing and Text-to-Speech in the Wild

Jupyter Notebook8.4 k

7 个月前

OpenHands

@All-Hands-AI

#大语言模型#🙌 OpenHands: Code Less, Make More

agent 人工智能大语言模型 ChatGPT claude-ai

Python64.12 k

9 小时前

skyvern

@Skyvern-AI

#大语言模型#Automate browser-based workflows with LLMs and Computer Vision

API 自动化 browser computer gpt

Python14.55 k

13 小时前

teable

@teableio

✨ The Next Gen Airtable Alternative: No-Code Postgres

airtable airtable-alternative 数据库无代码 SQLite

TypeScript19.98 k

4 小时前

whisperX

@m-bain

WhisperX: Automatic Speech Recognition with Word-level Timestamps (& Diarization)

asr speech speech-recognition speech-to-text Whisper

Python18.1 k

1 天前

faster-whisper

@SYSTRAN

#计算机科学#Faster Whisper transcription with CTranslate2

深度学习 inference quantization speech-recognition speech-to-text

Python18.48 k

20 小时前

CTranslate2

OpenNMT@OpenNMT

#计算机科学#Fast inference engine for Transformer models

neural-machine-translation C++mkl quantization CUDA

C++4.05 k

6 个月前

llama_index

@run-llama

#大语言模型#LlamaIndex is the leading framework for building LLM-powered agents over your data.

agents application data fine-tuning 框架

Python44.67 k

18 小时前

lobe-chat

@lobehub

#大语言模型#现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架支持语音合成、多模态、可扩展的（function call）插件系统。一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用

ChatGPT Next openai 人工智能 chat

TypeScript66.58 k

2 小时前

full-stack-fastapi-template

@fastapi

#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。

Python JSON JSON Schema Docker PostgreSQL

TypeScript38.25 k

3 天前

TTS

@coqui-ai

#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库

Python text-to-speech 深度学习 speech PyTorch

Python42.95 k

1 年前

TripoSR

@VAST-AI-Research

TripoSR: Fast 3D Object Reconstruction from a Single Image

Python5.79 k

1 年前

alphacep / vosk-api

自述文件

0 条讨论

关于

创建时间

是否国产

修改时间

语言

alphacep 的其他开源项目

您可能感兴趣的