Doris 是百度开源的支持对海量大数据进行快速分析的MPP数据库。
StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。
Upserts, Deletes And Incremental Processing on Big Data.
Apache Amoro(incubating) is a Lakehouse management system built on open data lake formats.
【2025最新版】 大数据 数据分析 电商系统 实时数仓 离线数仓 数据湖 建设方案及实战代码,涉及组件 #flink #paimon #doris #seatunnel #dolphinscheduler #datart #dinky #hudi #iceberg。
数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等
Real-time Data Warehouse with Apache Flink & Apache Kafka & Apache Hudi
汇总Apache Hudi中的一些Demo,便于快速上手Apache Hudi(Apache Hudi Demos to help beginners know about Hudi)
Jupyter notebooks and AWS CloudFormation template to show how Hudi, Iceberg, and Delta Lake work
Self-managed thirdparty dependencies for Apache Doris
dbt (data build tool) projects targeting AWS analytics services (redshift, glue, emr, athena) and open table formats
Stream Loader for Apache Doris