GitHub 中文社区
回车: Github搜索    Shift+回车: Google搜索
论坛
排行榜
趋势
登录

©2025 GitHub中文社区论坛GitHub官网网站地图GitHub官方翻译

  • X iconGitHub on X
  • Facebook iconGitHub on Facebook
  • Linkedin iconGitHub on LinkedIn
  • YouTube iconGitHub on YouTube
  • Twitch iconGitHub on Twitch
  • TikTok iconGitHub on TikTok
  • GitHub markGitHub’s organization on GitHub
集合主题趋势排行榜
#

OCR

OCR(Optical Character Recognition,光学字符识别) 是指对包含文本内容的图像或视频进行处理和识别,并提取其中所包含的文字及排版信息的过程。 例如,一个常见的应用是将包含文档图像的不可编辑状态的 PDF 文档通过 OCR 技术识别后,转换为可编辑状态的 Word 格式文档。

Website
Wikipedia
维基百科
https://static.github-zh.com/github_avatars/tesseract-ocr?size=40
tesseract-ocr / tesseract

#计算机科学#ORC 文字识别引擎。

tesseracttesseract-ocrOCRlstm机器学习ocr-engineHacktoberfest
C++ 67.53 k
14 天前
https://static.github-zh.com/github_avatars/PaddlePaddle?size=40
PaddlePaddle / PaddleOCR

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

OCRcrnnocrlite数据库chineseocrpdf2markdownpp-ocrpp-structuredocument-parsing
Python 50.45 k
1 小时前
naptha/tesseract.js
https://static.github-zh.com/github_avatars/naptha?size=40
naptha / tesseract.js

#计算机科学#纯JavaScript OCR(文字识别),能识别超过100种语言文字

tesseractWebAssemblyOCRJavaScript深度学习
JavaScript 36.67 k
2 个月前
siyuan-note/siyuan
https://static.github-zh.com/github_avatars/siyuan-note?size=40
siyuan-note / siyuan

#大语言模型#思源笔记是一款隐私优先的个人知识管理系统,支持细粒度块级引用和 Markdown 所见即所得。

note-takinglocal-firstknowledge-baseMarkdowns3OCRChatGPTopenaiNotionObsidianevernotepdfwebdav自托管Ankinotes-appElectrondeepseekollama
TypeScript 35.29 k
2 小时前
https://static.github-zh.com/github_avatars/opendatalab?size=40
opendatalab / MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。

extract-datalayout-analysisOCRParserpdfpdf-converterPythondocument-analysispdf-parserpdf-extractor-llmpdf-extractor-pretrainpdf-extractor-ragai4science
Python 35.05 k
17 小时前
hiroi-sora/Umi-OCR
https://static.github-zh.com/github_avatars/hiroi-sora?size=40
hiroi-sora / Umi-OCR

OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。

paddleocrOCRocr-pythonumi-ocrqmlQtscreenshot
Python 34.75 k
15 天前
ShareX/ShareX
https://static.github-zh.com/github_avatars/ShareX?size=40
ShareX / ShareX

#效率工具集合#ShareX 是一个截图、录屏工具。同时支持文件上传、共享等功能

screen-capturescreen-recorderfile-sharingfile-uploadurl-shortenercolor-pickerregion-captureimgurdropboxgifgif-recorderOCRproductivityimage-annotationftpsharescreenshotShareXcaptureC#
C# 32.73 k
8 小时前
ocrmypdf/OCRmyPDF
https://static.github-zh.com/github_avatars/ocrmypdf?size=40
ocrmypdf / OCRmyPDF

为扫描的 PDF 文件添加 OCR 文本层,以方便文本搜索和复制粘贴

PythonOCRpdf图像处理tesseract
Python 29.35 k
2 天前
https://static.github-zh.com/github_avatars/paperless-ngx?size=40
paperless-ngx / paperless-ngx

#计算机科学#Paperless-ngx 是一个文档管理系统,将您的纸质文件转化为可搜索的在线存档

AngulararchivingDjangodmsdocument-managementdocument-management-system机器学习OCRoptical-character-recognitionpdf
Python 28.16 k
10 小时前
https://static.github-zh.com/github_avatars/JaidedAI?size=40
JaidedAI / EasyOCR

#计算机科学#Ready-to-use OCR with 80+ supported languages and all popular writing scripts including Latin, Chinese, Arabic, Devanagari, Cyrillic and etc.

OCR深度学习crnnPyTorchlstm机器学习scene-textscene-text-recognitionoptical-character-recognitioncnndata-mining图像处理Pythoneasyocrinformation-retrieval
Python 26.94 k
9 个月前
lukas-blecher/LaTeX-OCR
https://static.github-zh.com/github_avatars/lukas-blecher?size=40
lukas-blecher / LaTeX-OCR

#计算机科学#pix2tex: Using a ViT to convert images of equations into LaTeX code.

机器学习transformerim2latex深度学习image2textLaTeXdatasetPyTorchim2markupOCRlatex-ocrvitmath-ocrvision-transformer图像处理Pythonim2text
Python 14.53 k
5 个月前
pot-app/pot-desktop
https://static.github-zh.com/github_avatars/pot-app?size=40
pot-app / pot-desktop

🌈一个跨平台的划词翻译和OCR软件 | A cross-platform software for text translation and recognition.

translationpotTauritranslatepot-appOCRLinuxmacOSWindowsrecognizetts
JavaScript 12.65 k
1 个月前
https://static.github-zh.com/github_avatars/DayBreak-u?size=40
DayBreak-u / chineseocr_lite

超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M

ncnnOCRPyTorch
C++ 12.14 k
2 年前
https://static.github-zh.com/github_avatars/sml2h3?size=40
sml2h3 / ddddocr

带带弟弟 通用验证码识别OCR pypi版

OCRddddocrcaptcha
Python 12.03 k
6 天前
https://static.github-zh.com/github_avatars/Unstructured-IO?size=40
Unstructured-IO / unstructured

#自然语言处理#Convert documents to structured data effortlessly. Unstructured is open-source ETL solution for transforming complex documents into clean, structured formats for language models. Visit our website to...

深度学习document-parsing机器学习自然语言处理OCRinformation-retrievaldata-pipelinespreprocessingpdf-to-textpdfpdf-to-jsondocument-image-analysisdonutdocument-image-processingdocument-parserdocxlangchain大语言模型
HTML 11.49 k
2 天前
https://static.github-zh.com/github_avatars/getomni-ai?size=40
getomni-ai / zerox

OCR & Document Extraction using vision models

OCRpdf
TypeScript 11.32 k
1 个月前
tisfeng/Easydict
https://static.github-zh.com/github_avatars/tisfeng?size=40
tisfeng / Easydict

一个简洁优雅的词典翻译 macOS App。开箱即用,支持离线 OCR 识别,支持有道词典,🍎 苹果系统词典,🍎 苹果系统翻译,OpenAI,Gemini,DeepL,Google,Bing,腾讯,百度,阿里,小牛,彩云和火山翻译。A concise and elegant Dictionary and Translator macOS App for looking up words and...

dictionarytranslateAppmacOSbaidudeeplGoogletranslatorOCRshortcutsbingtencentgeminiopenai
Objective-C 9.62 k
1 天前
https://static.github-zh.com/github_avatars/ripperhe?size=40
ripperhe / Bob

#大语言模型#Bob 是一款 macOS 平台的翻译和 OCR 软件。

bobappmacOSOCRtranslateChatGPTopenaitranslationtranslatordeepseekdoubaoerniegeminigroqkimiqwenzhipuai
9.33 k
5 个月前
https://static.github-zh.com/github_avatars/dataelement?size=40
dataelement / bisheng

#大语言模型#一个大模型应用开发平台,赋能和加速大模型应用开发落地,帮助用户以最佳体验进入下一代应用开发模式。

agent人工智能聊天机器人ragworkflowenterprisegenaigptlangchianllama大语言模型llmdevopsllmopsOCRopenaiorchestrationPythonReactfinetunesft
TypeScript 8.84 k
2 天前
https://static.github-zh.com/github_avatars/zyddnys?size=40
zyddnys / manga-image-translator

#计算机科学#Translate manga/image 一键翻译各类图片内文字 https://cotrans.touhou.ai/

mangaAnimeOCR深度学习图像处理auto-translationmachine-translationpytorch-implementationtext-detectiontext-detection-recognitionchinese-translationjapanese-translations神经网络inpaintingtransformer
Python 7.89 k
6 天前
loading...