Apache Beam 是大数据统一编程模型,用于定义和执行数据处理管道,包括ETL、批处理和流处理


 
Loading

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README


0 条讨论

登录后发表评论

关于

Apache Beam is a unified programming model for Batch and Streaming data processing.

创建时间
是否国产

  修改时间

2025-08-18T11:58:11Z


语言

  • Java67.2%
  • Python19.6%
  • Go9.5%
  • Dart2.0%
  • Shell0.6%
  • Groovy0.5%
  • HCL0.3%
  • Kotlin0.2%
  • Jupyter Notebook0.1%
  • Dockerfile0.1%

apache 的其他开源项目

apache/superset

Apache Superset 是一个企业级数据可视化和数据分析的平台。

TypeScript67.62 k
34 分钟前

echarts 是百度开源的一个基于 JavaScript 的可视化图表库

TypeScript64.39 k
11 小时前🇨🇳

Apache Spark - 用于大数据处理的统一分析引擎

Scala41.68 k
16 小时前
apache/airflow

#计算机科学#Apache Airflow 是一个workflow工作流调度、编排、监控平台

Python41.61 k
3 小时前

您可能感兴趣的

大模型Grok-1开源

Python50.4 k
1 年前
Python62.25 k
4 小时前

#编程语言#⭐️ A friendly language for building type-safe, scalable systems!

Rust20.05 k
1 天前

Iceberg 是用于庞大分析数据集的开放表格式。 Iceberg 为大数据带来了 SQL 表的可靠性和简单性,同时让 Spark、Trino、Flink、Presto、Hive 和 Impala 等引擎能够同时安全地使用相同的表。

Java7.84 k
13 小时前

Devika is an Agentic AI Software Engineer that can understand high-level human instructions, break them down into steps, research relevant information, and write code to achieve the given objective. D...

Python19.4 k
1 年前
openinterpreter/open-interpreter

#大语言模型#Open Interpreter(开放解释器) 可以让大语言模型(LLMs)在本地运行代码(比如 Python、JavaScript、Shell 等)。安装后,在终端上运行 $ interpreter 即可通过类似 ChatGPT 的界面与 Open Interpreter 聊天。

Python60.3 k
12 天前

Garnet 是一个微软开源的高性能的缓存服务器,可兼容现有的Redis Client

C#11.43 k
3 天前
HeyPuter/puter

Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境,也可以作为云存储服务、远程服务器、网络托管平台等的接口。

JavaScript34.92 k
10 小时前
Python34 k
17 小时前

Flink 是一个分布式批处理和流处理框架

Java25.15 k
3 天前

#大语言模型#Automate browser-based workflows with LLMs and Computer Vision

Python14.08 k
3 小时前
Jupyter Notebook95.13 k
12 小时前
C75.58 k
1 小时前

#大语言模型#SeaTunnel (原名为 waterdrop)是一个易用的支持海量数据实时同步的高性能分布式数据集成平台,每天可以稳定同步数百亿数据

Java8.73 k
3 天前🇨🇳

Delta Lake 是一个开源存储框架,可以使用 Spark、PrestoDB、Flink、Trino 和 Hive 等计算引擎以及适用于 Scala、Java、Rust、Ruby 和 Python 的 API 构建 Lakehouse 架构。

Scala8.22 k
21 小时前

Apache Spark - 用于大数据处理的统一分析引擎

Scala41.68 k
16 小时前
Shell36.95 k
14 小时前

RustPython 是一个用 Rust 开发的 Python 解释器

Rust20.41 k
7 天前

A flexible distributed key-value database that is optimized for caching and other realtime workloads.

C22.64 k
6 小时前

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

Python35.92 k
6 小时前