数据工程师学习资源清单
#时序数据库#TDengine是涛思数据专为物联网、车联网、工业互联网、IT运维等设计和优化的大数据平台。
#Mysql高可用中间件#ShardingSphere 是一个用于分表分库的数据库中间件,由JDBC、Proxy 和 Sidecar组成
#Awesome#A curated list of awesome big data frameworks, ressources and other awesomeness.
为开发者设计的云文件系统。为云环境设计,兼容 POSIX、HDFS 和 S3 协议的分布式文件系统
𝗗𝗮𝘁𝗮, 𝗔𝗻𝗮𝗹𝘆𝘁𝗶𝗰𝘀 & 𝗔𝗜. Modern alternative to Snowflake. Cost-effective and simple for massive-scale analytics. https://databend.com
#计算机科学#Out-of-Core hybrid Apache Arrow/NumPy DataFrame for Python, ML, visualization and exploration of big tabular data at a billion rows per second 🚀
Upserts, Deletes And Incremental Processing on Big Data.
#计算机科学#A Cloud Native Batch System (Project under CNCF)
100+套大数据可视化炫酷大屏Html5模板;包含行业:社区、物业、政务、交通、金融银行等,全网最新、最多,最全、最酷、最炫大数据可视化模板。陆续更新中
Chunjun 纯钧,是一款稳定、易用、高效、批流一体的数据集成框架,目前基于实时计算引擎Flink实现多种异构数据源之间的数据同步与计算,已在上千家公司部署且稳定运行。
🔨 用 JSON 来生成结构化的 SQL 语句,基于 Vue3 + TypeScript + Vite + Ant Design + MonacoEditor 实现,项目简单(重逻辑轻页面)、适合练手~
Python clone of Spark, a MapReduce alike framework in Python
#时序数据库#GridDB is a next-generation open source database that makes time series IoT and big data fast,and easy.
#计算机科学#.NET for Apache® Spark™ makes Apache Spark™ easily accessible to .NET developers.
基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法