项目竞品

共找到 20 个竞品
apache

apache/incubator-livy

946 620

Apache Livy 是一个开源 REST 接口,支持从任意位置与 Apache Spark 进行交互。

Scala bigdata spark
相似度
50%
+1
apache

apache/spark

42.9k 29.1k

Apache Spark——面向大规模数据处理的统一分析引擎

Scala spark
相似度
25%
+206
delta-io

delta-io/delta

8.6k 2.0k

一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。

Scala spark
相似度
25%
+89
awslabs

awslabs/deequ

3.6k 581

Deequ是基于Apache Spark构建的库,用于定义"数据单元测试",可测量大规模数据集的数据质量

Scala spark
相似度
25%
+1
apache

apache/kyuubi

2.3k 985

Apache Kyuubi是面向数据仓库和数据湖的分布式多租户无服务SQL网关

Scala spark
相似度
25%
+14
apache

apache/datafusion-comet

1.1k 285

Apache DataFusion Comet Spark加速器

Scala spark
相似度
25%
+34
h2oai

h2oai/sparkling-water

977 361

Sparkling Water在Spark集群内提供H2O功能。

Scala spark
相似度
25%
+1
NVIDIA

NVIDIA/spark-rapids

961 274

Spark RAPIDS 插件——利用 GPU 加速 Apache Spark

Scala spark
相似度
25%
+6
delta-io

delta-io/delta-sharing

921 217

安全数据共享的开放协议

Scala spark
相似度
25%
+3
ClickHouse

ClickHouse/spark-clickhouse-connector

211 82

基于DataSourceV2 API构建的Spark ClickHouse连接器

Scala spark
相似度
25%
+1
DataExpert-io

DataExpert-io/data-engineer-handbook

40.2k 7.7k

数据工程全方位学习资源汇总仓库

Jupyter Notebook bigdata
相似度
25%
+489
pingcap

pingcap/tidb

39.7k 6.1k

TiDB - 专为现代应用设计的开源云原生分布式SQL数据库

Go tidb
相似度
25%
+45
DataTalksClub

DataTalksClub/data-engineering-zoomcamp

38.7k 7.8k

数据工程集训营是一门为期九周的免费课程,涵盖数据工程基础知识。

Jupyter Notebook spark
相似度
25%
+3.7k
taosdata

taosdata/TDengine

24.7k 5.0k

专为工业物联网(IIoT)场景设计的高性能、可扩展时序数据库

C bigdata
相似度
25%
+5
rustfs

rustfs/rustfs

21.9k 933

🚀 面向 MinIO 替代方案的高性能分布式对象存储

Rust bigdata
相似度
25%
+150
apache

apache/shardingsphere

20.7k 6.9k

通过分布式SQL为所有数据库提供分片、可扩展性和安全性,赋能数据智能。

Java bigdata
相似度
25%
+2
apache

apache/doris

15.0k 3.7k

Apache Doris 是一款易用、高性能的统一分析数据库。

Java spark
相似度
25%
+9
juicedata

juicedata/juicefs

13.2k 1.2k

JuiceFS 是一个基于 Redis 和 S3 构建的分布式 POSIX 文件系统。

Go bigdata
相似度
25%
+9
googleapis

googleapis/genai-toolbox

13.1k 1.2k

数据库MCP工具箱是一个开源的数据库MCP服务器

Go tidb
相似度
25%
+217
apache

apache/seatunnel

9.1k 2.2k

SeaTunnel是多模态、高性能、分布式海量数据集成工具

Java spark
相似度
25%
+26
助手