一个Python数据采集框架,能自动提取新闻、文章的标题、关键词、作者、摘要、正文等元数据


 
Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

newspaper3k is a news, full-text, and article metadata extraction in Python 3. Advanced docs:

创建时间
是否国产

  修改时间

2025-08-14T08:56:11Z


语言

  • HTML98.8%
  • Python1.2%

codelucas 的其他开源项目

Reddit clone in flask + python + nginx + https. View site:

Python531
7 年前

您可能感兴趣的

Python62.25 k
4 小时前

大模型Grok-1开源

Python50.4 k
1 年前
openinterpreter/open-interpreter

#大语言模型#Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

Python60.3 k
12 天前

Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...

Python19.4 k
1 年前
scrapy/scrapy

#爬虫框架#一款流行,高效,生态丰富的Python爬虫框架

Python57.98 k
2 小时前
HeyPuter/puter

Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境,也可以作为云存储服务、远程服务器、网络托管平台等的接口。

JavaScript34.92 k
10 小时前

#大语言模型#MetaGPT:为 GPT 分配不同的角色,协作处理更复杂的任务。MetaGPT输入一句话的老板需求,输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等

Python57.93 k
2 个月前

上传截图通过GPT生成HTML/Tailwind/JavaScript代码

Python70.74 k
22 天前
JavaScript107.01 k
5 小时前
openinterpreter/01

The #1 open-source voice interface for desktop, mobile, and ESP32 chips.

Python5.09 k
10 个月前

Open-Sora: 完全开源的高效复现类Sora视频生成方案

Python27.03 k
4 个月前
fastapi/full-stack-fastapi-template

#前端开发#现代化、全栈 Web 应用模板。使用FastAPI、React, SQLModel, PostgreSQL, Docker, GitHub Actions 等技术。

TypeScript36.91 k
1 小时前
Jupyter Notebook9.58 k
4 个月前

#网络爬虫#Python & Command-line tool to gather text and metadata on the Web: Crawling, scraping, extraction, output as CSV, JSON, HTML, MD, TXT, XML

Python4.59 k
10 天前

#爬虫框架#python爬虫框架。简单易上手,自带在线编程和任务管理界面

Python16.76 k
1 年前
Python21.73 k
9 个月前

#大语言模型#A programming framework for agentic AI 🤖 PyPi: autogen-agentchat Discord: https://aka.ms/autogen-discord Office Hour: https://aka.ms/autogen-officehour

Python48.81 k
7 天前

#网络爬虫#📰 Newspaper4k a fork of the beloved Newspaper3k. Extraction of articles, titles, and metadata from news websites.

HTML844
5 个月前
Lissy93/web-check

🕵️‍♂️ All-in-one OSINT tool for analysing any website

TypeScript26.14 k
15 天前