关于

一个简单的本地网页界面，使用ChatTTS将文字合成为语音，同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.

tts chattts

Python7.15 k

2 个月前

stt

@jianchang512

Voice Recognition to Text Tool / 一个离线运行的本地音视频转字幕工具，输出json、srt字幕、纯文字格式

speech speech-recognition speech-to-text stt

Python3.54 k

7 个月前

您可能感兴趣的

GPT-SoVITS

@RVC-Boss

强大的少样本语音转换与语音合成Web用户界面。

text-to-speech tts vits voice-clone voice-cloneai

Python48.03 k

6 天前

pyvideotrans

@jianchang512

Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言，同时支持语音识别转录、语音合成、字幕翻译。

text-to-speech video-transition speech-to-text

Python13.12 k

5 天前

grok-1

@xai-org

大模型Grok-1开源

Python50.29 k

10 个月前

Open-Sora

@hpcaitech

Open-Sora：完全开源的高效复现类Sora视频生成方案

Python26.74 k

2 个月前

chinese-independent-developer

Cheng Zheng@1c7

中国独立开发者项目列表 -- 分享大家都在做什么

indie indie-developer china

39.48 k

1 天前🇨🇳

MoneyPrinterTurbo

@harry0703

#大语言模型#利用AI大模型，一键生成高清短视频 Generate short videos with one click using AI LLM.

shortvideo 自动化 ChatGPT moviepy Python

Python37.09 k

14 天前

screenshot-to-code

@abi

上传截图通过GPT生成HTML/Tailwind/JavaScript代码

Python70.23 k

6 天前

stt

@jianchang512

Voice Recognition to Text Tool / 一个离线运行的本地音视频转字幕工具，输出json、srt字幕、纯文字格式

speech speech-recognition speech-to-text stt

Python3.54 k

7 个月前

OpenVoice

@myshell-ai

Instant voice cloning by MIT and MyShell. Audio foundation model.

text-to-speech tts voice-clone zero-shot-tts

Python32.73 k

2 个月前

MediaCrawler

@NanmiCoder

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频｜评论爬虫、微博帖子｜评论爬虫、百度贴吧帖子｜百度贴吧评论回复爬虫 | 知乎问答文章｜评论爬虫

Python23.75 k

19 小时前

MockingBird

@babysor

#计算机科学#🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time

人工智能 speech PyTorch 深度学习 text-to-speech

Python36.36 k

7 个月前

AniPortrait

@Zejun-Yang

AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation

Python4.96 k

1 年前

Real-Time-Voice-Cloning

Corentin Jemine@CorentinJ

#计算机科学#Real-Time-Voice-Cloning 是一个基于深度学习的语音合成工具，5秒内即可克隆一个声音。

深度学习 PyTorch Tensorflow tts 声音克隆

Python54.56 k

1 个月前

SadTalker

@OpenTalker

[CVPR 2023] SadTalker：Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation

audio-driven-talking-face cvpr2023 talking-head deep-fake deep-fakes

Python12.91 k

1 年前

TTS

@coqui-ai

#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库

Python text-to-speech 深度学习 speech PyTorch

Python40.93 k

10 个月前

GitHub-Chinese-Top-Charts

@GrowingGit

🇨🇳 GitHub中文排行榜，各语言分设「软件 | 资料」榜单，精准定位中文好项目。各取所需，高效学习。

Java99.68 k

8 个月前

facefusion

@facefusion

Industry leading face manipulation platform

deepfake 换脸人工智能 deep-fake face-swap

Python23.5 k

3 天前

vocal-separate

@jianchang512

an extremely simple tool for separating vocals and background music, completely localized for web operation, using 2stems/4stems/5stems models 这是一个极简的人声和背景音乐分离工具，本地化网页操作，无需连接外网

spleeter

Python1.63 k

7 个月前