big-data

话题找到数量

ClickHouse/ClickHouse

ClickHouse®是实时分析型数据库管理系统

46k
8.3k
295
+190
排名 #19
4月5日
查看详情

apache/spark

Apache Spark——面向大规模数据处理的统一分析引擎

43k
29k
314
+240
排名 #18
4月11日
查看详情

apache/flink

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

25k
13k
344
+21
排名 #20
4月3日
查看详情

thingsboard/thingsboard

开源物联网平台——设备管理、数据采集、处理与可视化。

21k
6.2k
203
+63
排名 #22
4月8日
查看详情

prestodb/presto

Presto分布式大数据SQL查询引擎官方项目

16k
5.5k
321
+4
排名 #8
4月2日
查看详情

trinodb/trino

Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)

12k
3.6k
310
+9
排名 #23
4月1日
查看详情

provectus/kafka-ui

开源的 Apache Kafka 管理 Web 界面

11k
1.4k
312
+5
排名 #15
3月20日
查看详情

StarRocks/starrocks

全球最快的开源查询引擎,为数据湖仓内外提供亚秒级分析能力。StarRocks凭借卓越的灵活性支持几乎所有场景,在多维分析、实时分析和即席查询领域提供顶尖性能。该项目隶属于Linux基金会。

11k
2.4k
310
+34
排名 #22
4月2日
查看详情

quickwit-oss/quickwit

面向可观测性的云原生搜索引擎。

10k
517
261
+5
排名 #13
2月11日
查看详情

delta-io/delta

一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。

8.7k
2.1k
317
+89
排名 #21
4月11日
查看详情

apache/beam

Apache Beam 是批处理和流式数据处理的统一编程模型

8.5k
4.5k
372
+5
排名 #20
4月3日
查看详情

apache/datafusion

Apache DataFusion SQL查询引擎

8.5k
2k
351
+9
排名 #24
3月11日
查看详情

h2oai/h2o-3

H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。

7.5k
2k
196
+3
排名 #16
3月9日
查看详情

vespa-engine/vespa

在线AI与数据平台 https://vespa.ai

6.8k
696
219
+20
排名 #21
2月12日
查看详情

apache/iotdb

Apache IoTDB

6.3k
1.1k
170
+5
排名 #13
3月27日
查看详情

Eventual-Inc/Daft

分布式查询引擎,为任何模态和规模的数据处理提供简单可靠的解决方案

5.4k
436
227
+37
排名 #21
4月5日
查看详情

microsoft/SynapseML

简易分布式机器学习

5.2k
860
171
+2
排名 #13
4月11日
查看详情

apache/paimon

Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。

3.2k
1.3k
333
+1
排名 #17
4月2日
查看详情

kafbat/kafka-ui

用于管理 Apache Kafka 集群的开源 Web 用户界面

2k
255
326
+15
排名 #21
2月12日
查看详情

lakehq/sail

LakeSail的计算框架,其使命是统一批处理、流处理和计算密集型AI工作负载。

1.2k
83
83
+22
排名 #8
4月2日
查看详情

apache/ozone

专为数据分析和对象存储工作负载优化的可扩展、可靠、分布式存储系统。

1.2k
598
257
排名 #11
3月14日
查看详情

h2oai/sparkling-water

Sparkling Water在Spark集群内提供H2O功能。

977
362
187
+1
排名 #20
3月29日
查看详情

NVIDIA/spark-rapids

Spark RAPIDS 插件——利用 GPU 加速 Apache Spark

973
283
231
+6
排名 #19
4月11日
查看详情

delta-io/delta-sharing

安全数据共享的开放协议

932
221
209
+4
排名 #19
4月11日
查看详情
助手