Apache Arrow 是用于内存分析的开发平台,支持多语言。包含一个标准化的物件栏内存格式,且能够表示平面及层级化数据,以便在现代CPU和GPU硬体上进行高效率的分析操作。
该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README
Apache Arrow is the universal columnar format and multi-language toolbox for fast data interchange and in-memory analytics
2016-02-17
-
2025-08-15T21:51:44Z
Apache Superset 是一个企业级数据可视化和数据分析的平台。
echarts 是百度开源的一个基于 JavaScript 的可视化图表库
Apache Spark - 用于大数据处理的统一分析引擎
#计算机科学#Apache Airflow 是一个workflow工作流调度、编排、监控平台
大模型Grok-1开源
一个非常快的 DataFrame 库,支持 Rust、Python、Node.js
DataFusion 是一个可扩展的查询执行框架,用Rust 编写,使用Apache Arrow 作为其内存格式
Pingora是一个Rust框架,用于构建快速、可靠、可编程的网络系统。Pingora 久经考验,它每秒处理的互联网请求数已超过4000万次。
#大语言模型#本地化搭建和运行 Llama2 和其他大模型
A flexible distributed key-value database that is optimized for caching and other realtime workloads.
Open-Sora: 完全开源的高效复现类Sora视频生成方案
#数据库#ClickHouse是性能强悍、适合OLAP实时分析的列式数据库,支持SQL语法
pgvector 是一个Postgres的向量相似搜索插件
Official Rust implementation of Apache Arrow
Build better UIs faster.
使用HTML、JavaScript、CSS完成跨平台桌面应用的开发
#计算机科学#PyTorch 是一个开源的Python机器学习库,基于Torch,底层由C++实现。
#向量搜索引擎#向量相似性搜索库,为稠密向量提供高效相似度搜索和聚类
Facebook 的 LLaMA 模型在 C/C++ 中的移植
Garnet 是一个微软开源的高性能的缓存服务器,可兼容现有的Redis Client
Distributed transactional key-value database, originally created to complement TiDB
#自然语言处理#Unified Efficient Fine-Tuning of 100+ LLMs & VLMs (ACL 2024)
Puter 是一个运行在浏览器上的OS。功能丰富、快速、可扩展性强。它可以用于构建远程桌面环境,也可以作为云存储服务、远程服务器、网络托管平台等的接口。
0 条讨论