DeepSpeech 是一款开源嵌入式(离线、设备上)语音识别引擎,最低可以在树莓派上运行
该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README
DeepSpeech is an open source embedded (offline, on-device) speech-to-text engine which can run in real time on devices ranging from a Raspberry Pi 4 to high power GPU servers.
Mozilla
2016-06-02
否
2025-06-19T12:52:51Z
PDF阅读器,使用HTML5构建
Simple, private file sharing from the makers of Firefox
从 Firefox 浏览器“阅读模式” ,独立出来的JavaScript 库
#计算机科学#🤖 💬 Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)
whisper 是一个通用语音识别模型
大模型Grok-1开源
#大语言模型#本地化搭建和运行 Llama2 和其他大模型
kaldi-asr/kaldi is the official location of the Kaldi project.
#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库
OpenAI Whisper语音识别模型,C++移植版本。
Devika is now Opcode
PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,典型的应用包括:语音识别、语音翻译、语音合成等
Open-Sora: 完全开源的高效复现类Sora视频生成方案
#大语言模型#🙌 OpenHands: Code Less, Make More
强大的少样本语音转换与语音合成Web用户界面。
#计算机科学#We write your reusable computer vision tools. 💜
#计算机科学#End-to-End Speech Processing Toolkit
The first real AI developer
#大语言模型#微软生成式AI课程,12课时
#学习与技能提升#收集了一系列与计算机相关的的资源和链接
#大语言模型#Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。
Zero-Shot Speech Editing and Text-to-Speech in the Wild
Pingora是一个Rust框架,用于构建快速、可靠、可编程的网络系统。Pingora 久经考验,它每秒处理的互联网请求数已超过4000万次。
0 条讨论