#

big-data

binhnguyennus/awesome-scalability
https://static.github-zh.com/github_avatars/binhnguyennus?size=40

#面试#一份说明可伸缩、高可靠和高性能的大规模系统模式的阅读清单。案例学习都是从服务于数百万甚至数亿用用户的线上系统总结的。

65.39 k
19 天前
https://static.github-zh.com/github_avatars/apache?size=40

Apache Spark - 用于大数据处理的统一分析引擎

Scala 41.9 k
4 小时前
https://static.github-zh.com/github_avatars/donnemartin?size=40

#计算机科学#Python 数据科学学习笔记:深度学习 (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, 大数据 (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python 核心, AWS, Linux命令

Python 28.53 k
1 年前
https://static.github-zh.com/github_avatars/apache?size=40

Flink 是一个分布式批处理和流处理框架

Java 25.26 k
2 小时前
prestodb/presto
https://static.github-zh.com/github_avatars/prestodb?size=40

Presto 是用于大数据的高性能分布式SQL查询引擎

Java 16.5 k
11 小时前
https://static.github-zh.com/github_avatars/andkret?size=40
Python 14.51 k
2 个月前
https://static.github-zh.com/github_avatars/apache?size=40

PredictionIO, a machine learning server for developers and ML engineers.

Scala 12.53 k
5 年前
https://static.github-zh.com/github_avatars/yahoo?size=40

CMAK is a tool for managing Apache Kafka clusters

Scala 11.93 k
2 年前
https://static.github-zh.com/github_avatars/vesoft-inc?size=40

A distributed, fast open-source graph database featuring horizontal scalability and high availability

C++ 11.68 k
11 天前
https://static.github-zh.com/github_avatars/StarRocks?size=40

StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。

Java 10.66 k
38 分钟前
quickwit-oss/quickwit
https://static.github-zh.com/github_avatars/quickwit-oss?size=40

#搜索#quickwit 是一个用于日志管理和分析的搜索引擎,是Datadog、Elasticsearch, Loki 和 Tempo 的替代品

Rust 10.41 k
3 天前
https://static.github-zh.com/github_avatars/cython?size=40
Python 10.28 k
5 小时前
https://static.github-zh.com/github_avatars/catboost?size=40

#计算机科学#A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computa...

C++ 8.58 k
17 小时前
https://static.github-zh.com/github_avatars/apache?size=40

Apache Beam 是大数据统一编程模型,用于定义和执行数据处理管道,包括ETL、批处理和流处理

Java 8.3 k
2 小时前
https://static.github-zh.com/github_avatars/delta-io?size=40

Delta Lake 是一个开源存储框架,可以使用 Spark、PrestoDB、Flink、Trino 和 Hive 等计算引擎以及适用于 Scala、Java、Rust、Ruby 和 Python 的 API 构建 Lakehouse 架构。

Scala 8.27 k
12 小时前
loading...
Website
Wikipedia