一个Python数据采集框架,能自动提取新闻、文章的标题、关键词、作者、摘要、正文等元数据


 
Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

newspaper3k is a news, full-text, and article metadata extraction in Python 3. Advanced docs:

创建时间
是否国产

  修改时间

2025-08-14T08:56:11Z


语言

  • HTML98.8%
  • Python1.2%

codelucas 的其他开源项目

Reddit clone in flask + python + nginx + https. View site:

Python531
8 年前

您可能感兴趣的

Python63.92 k
4 小时前

大模型Grok-1开源

Python50.51 k
1 年前
openinterpreter/open-interpreter

#大语言模型#Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

Python60.59 k
2 个月前

Devika is now Opcode

Python19.5 k
7 天前
scrapy/scrapy

#爬虫框架#一款流行,高效,生态丰富的Python爬虫框架

Python58.42 k
4 天前
HeyPuter/puter

Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境,也可以作为云存储服务、远程服务器、网络托管平台等的接口。

JavaScript36.67 k
3 小时前

#大语言模型#MetaGPT:为 GPT 分配不同的角色,协作处理更复杂的任务。MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等

Python58.79 k
3 个月前

上传截图通过GPT生成HTML/Tailwind/JavaScript代码

Python70.95 k
2 个月前
JavaScript111.47 k
1 小时前
openinterpreter/01

The #1 open-source voice interface for desktop, mobile, and ESP32 chips.

Python5.09 k
1 年前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python27.27 k
5 个月前
fastapi/full-stack-fastapi-template

#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。

TypeScript38.11 k
1 天前
Jupyter Notebook9.6 k
5 个月前

#网络爬虫#Python & Command-line tool to gather text and metadata on the Web: Crawling, scraping, extraction, output as CSV, JSON, HTML, MD, TXT, XML

Python4.76 k
20 天前

#爬虫框架#python爬虫框架。简单易上手,自带在线编程和任务管理界面

Python16.9 k
1 年前
Python21.85 k
1 年前
Python50.4 k
3 小时前

#网络爬虫#📰 Newspaper4k a fork of the beloved Newspaper3k. Extraction of articles, titles, and metadata from news websites.

HTML879
7 个月前
Lissy93/web-check

🕵️‍♂️ All-in-one OSINT tool for analysing any website

TypeScript26.58 k
2 个月前