Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

视频硬字幕提取,生成srt文件。无需申请第三方API,本地实现文本识别。基于深度学习的视频字幕提取框架,包含字幕区域检测、字幕内容提取。A GUI tool for extracting hard-coded subtitle (hardsub) from videos and generating srt files.

创建时间
是否国产

  修改时间

2025-08-21T07:19:13Z


语言

  • Python94.6%
  • Jupyter Notebook5.3%
  • Shell0.1%

YaoFANGUK 的其他开源项目

基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现。AI-based tool for removing hard-coded subtitles and text-like watermarks from videos or Pictures.

Python7.75 k
2 个月前

视频音频生成字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架。A GUI tool for generating subtitle from videos and generating srt files.

Python1.05 k
2 年前🇨🇳

clash / clashX Premium 配置文件,新版clash配置教程

Shell93
3 个月前

您可能感兴趣的

基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现。AI-based tool for removing hard-coded subtitles and text-like watermarks from videos or Pictures.

Python7.75 k
2 个月前

大模型Grok-1开源

Python50.49 k
1 年前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python27.14 k
4 个月前

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python36.66 k
1 天前

#大语言模型#利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.

Python39.71 k
3 个月前

强大的少样本语音转换与语音合成Web用户界面。

Python50.66 k
1 个月前

Translate the video from one language to another and add dubbing. 将视频从一种语言翻译为另一种语言,同时支持语音识别转录、语音合成、字幕翻译。

Python14.11 k
1 天前

视频音频生成字幕,生成srt文件。无需申请第三方API,本地实现音频转文本。基于Transformer的视频字幕生成框架。A GUI tool for generating subtitle from videos and generating srt files.

Python1.05 k
2 年前🇨🇳

A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频

Python8.73 k
8 天前

上传截图通过GPT生成HTML/Tailwind/JavaScript代码

Python70.83 k
1 个月前

whisper 是一个通用语音识别模型

Python87.78 k
19 天前
krahets/hello-algo

#算法刷题#《Hello 算法》:动画图解、一键运行的数据结构与算法教程。支持 Python, Java, C++, C, C#, JS, Go, Swift, Rust, Ruby, Kotlin, TS, Dart 代码。简体版和繁体版同步更新,English version in translation

Java116.14 k
10 天前🇨🇳

A modern GUI client based on Tauri, designed to run in Windows, macOS and Linux for tailored proxy experience

TypeScript73.42 k
4 小时前

Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...

Python19.4 k
1 年前

#计算机科学#🐸💬 - 一个深度学习的 TTS 语言合成库

Python42.43 k
1 年前
fastapi/full-stack-fastapi-template

#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。

TypeScript37.51 k
13 小时前

High-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model

C++9.67 k
1 年前

#大语言模型#本地化搭建和运行 Llama2 和其他大模型

Go151.74 k
9 小时前
openai-translator/openai-translator

#大语言模型#基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用 - Browser extension and cross-platform desktop application for translation based on ChatGPT API.

TypeScript24.59 k
10 个月前
comfyanonymous/ComfyUI

The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface.

Python87.67 k
6 小时前