项目竞品项目

项目竞品项目数量
apache

apache/seatunnel

相关项目
9.2k 2.2k

SeaTunnel是多模态、高性能、分布式海量数据集成工具

Java data-ingestion flink spark
项目竞品项目相似度
45%
+26
StarRocks

StarRocks/starrocks

相关项目
11.5k 2.4k

全球最快的开源查询引擎,为数据湖仓内外提供亚秒级分析能力。StarRocks凭借卓越的灵活性支持几乎所有场景,在多维分析、实时分析和即席查询领域提供顶尖性能。该项目隶属于Linux基金会。

Java big-data real-time-analytics
项目竞品项目相似度
41%
+34
apache

apache/flink

相关项目
25.9k 13.9k

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

Java big-data flink
项目竞品项目相似度
29%
+21
apache

apache/doris

相关项目
15.2k 3.8k

Apache Doris 是一款易用、高性能的统一分析数据库。

Java paimon spark
项目竞品项目相似度
25%
+9
apache

apache/flink-cdc

相关项目
6.4k 2.1k

Flink CDC 是一款流式数据集成工具

Java flink paimon
项目竞品项目相似度
25%
+1
delta-io

delta-io/delta

相关项目
8.7k 2.1k

一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。

Scala big-data spark
项目竞品项目相似度
20%
+89
h2oai

h2oai/h2o-3

相关项目
7.5k 2.0k

H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。

Jupyter Notebook big-data spark
项目竞品项目相似度
20%
+3
microsoft

microsoft/SynapseML

相关项目
5.2k 860

简易分布式机器学习

Scala big-data spark
项目竞品项目相似度
20%
lakehq

lakehq/sail

相关项目
1.2k 83

LakeSail的计算框架,其使命是统一批处理、流处理和计算密集型AI工作负载。

Rust big-data spark
项目竞品项目相似度
20%
+22
h2oai

h2oai/sparkling-water

相关项目
977 362

Sparkling Water在Spark集群内提供H2O功能。

Scala big-data spark
项目竞品项目相似度
20%
+1
NVIDIA

NVIDIA/spark-rapids

相关项目
973 282

Spark RAPIDS 插件——利用 GPU 加速 Apache Spark

Scala big-data spark
项目竞品项目相似度
20%
+6
delta-io

delta-io/delta-sharing

相关项目
932 221

安全数据共享的开放协议

Scala big-data spark
项目竞品项目相似度
20%
+4
apache

apache/spark

相关项目
43.1k 29.2k

Apache Spark——面向大规模数据处理的统一分析引擎

Scala big-data spark
项目竞品项目相似度
14%
+240
助手