big-data

话题找到数量

ClickHouse/ClickHouse

ClickHouse®是实时分析型数据库管理系统

46k
8.3k
291
+190
排名 #19
4月5日
查看详情

apache/spark

Apache Spark——面向大规模数据处理的统一分析引擎

43k
29k
311
+240
排名 #18
4月9日
查看详情

apache/flink

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

25k
13k
326
+21
排名 #20
4月3日
查看详情

thingsboard/thingsboard

开源物联网平台——设备管理、数据采集、处理与可视化。

21k
6.2k
201
+63
排名 #22
4月8日
查看详情

prestodb/presto

Presto分布式大数据SQL查询引擎官方项目

16k
5.5k
284
+4
排名 #8
4月2日
查看详情

trinodb/trino

Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)

12k
3.6k
283
+9
排名 #23
4月1日
查看详情

provectus/kafka-ui

开源的 Apache Kafka 管理 Web 界面

11k
1.4k
309
+5
排名 #15
3月20日
查看详情

StarRocks/starrocks

全球最快的开源查询引擎,为数据湖仓内外提供亚秒级分析能力。StarRocks凭借卓越的灵活性支持几乎所有场景,在多维分析、实时分析和即席查询领域提供顶尖性能。该项目隶属于Linux基金会。

11k
2.4k
297
+34
排名 #22
4月2日
查看详情

quickwit-oss/quickwit

面向可观测性的云原生搜索引擎。

10k
517
235
+5
排名 #13
2月11日
查看详情

delta-io/delta

一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。

8.7k
2.1k
292
+89
排名 #21
4月9日
查看详情

apache/beam

Apache Beam 是批处理和流式数据处理的统一编程模型

8.5k
4.5k
364
+5
排名 #20
4月3日
查看详情

apache/datafusion

Apache DataFusion SQL查询引擎

8.5k
2k
309
+9
排名 #24
3月11日
查看详情

h2oai/h2o-3

H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。

7.5k
2k
194
+3
排名 #16
3月9日
查看详情

vespa-engine/vespa

在线AI与数据平台 https://vespa.ai

6.8k
696
191
+20
排名 #21
2月12日
查看详情

apache/iotdb

Apache IoTDB

6.3k
1.1k
147
+5
排名 #13
3月27日
查看详情

Eventual-Inc/Daft

分布式查询引擎,为任何模态和规模的数据处理提供简单可靠的解决方案

5.4k
436
207
+37
排名 #21
4月5日
查看详情

microsoft/SynapseML

简易分布式机器学习

5.2k
860
164
排名 #13
3月25日
查看详情

apache/paimon

Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。

3.2k
1.3k
314
+1
排名 #17
4月2日
查看详情

kafbat/kafka-ui

用于管理 Apache Kafka 集群的开源 Web 用户界面

2k
255
307
+15
排名 #21
2月12日
查看详情

lakehq/sail

LakeSail的计算框架,其使命是统一批处理、流处理和计算密集型AI工作负载。

1.2k
83
77
+22
排名 #8
4月2日
查看详情

apache/ozone

专为数据分析和对象存储工作负载优化的可扩展、可靠、分布式存储系统。

1.2k
598
244
排名 #11
3月14日
查看详情

h2oai/sparkling-water

Sparkling Water在Spark集群内提供H2O功能。

977
362
182
+1
排名 #20
3月29日
查看详情

NVIDIA/spark-rapids

Spark RAPIDS 插件——利用 GPU 加速 Apache Spark

973
282
224
+6
排名 #19
4月9日
查看详情

delta-io/delta-sharing

安全数据共享的开放协议

932
221
189
+4
排名 #19
4月9日
查看详情
助手