项目竞品

共找到 20 个竞品
apache

apache/spark

42.9k 29.1k

Apache Spark——面向大规模数据处理的统一分析引擎

Scala big-data spark
相似度
50%
+206
delta-io

delta-io/delta

8.6k 2.0k

一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。

Scala big-data spark
相似度
50%
+89
h2oai

h2oai/sparkling-water

977 361

Sparkling Water在Spark集群内提供H2O功能。

Scala big-data spark
相似度
50%
+1
delta-io

delta-io/delta-sharing

921 217

安全数据共享的开放协议

Scala big-data spark
相似度
50%
+3
h2oai

h2oai/h2o-3

7.5k 2.0k

H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。

Jupyter Notebook big-data gpu spark
相似度
75%
+1
awslabs

awslabs/deequ

3.6k 581

Deequ是基于Apache Spark构建的库,用于定义"数据单元测试",可测量大规模数据集的数据质量

Scala spark
相似度
25%
+1
apache

apache/kyuubi

2.3k 985

Apache Kyuubi是面向数据仓库和数据湖的分布式多租户无服务SQL网关

Scala spark
相似度
25%
+14
apache

apache/datafusion-comet

1.1k 285

Apache DataFusion Comet Spark加速器

Scala spark
相似度
25%
+34
apache

apache/incubator-livy

946 620

Apache Livy 是一个开源 REST 接口,支持从任意位置与 Apache Spark 进行交互。

Scala spark
相似度
25%
+1
pingcap

pingcap/tispark

891 250

TiSpark 专为在 TiDB/TiKV 之上运行 Apache Spark 而构建

Scala spark
相似度
25%
+2
ClickHouse

ClickHouse/spark-clickhouse-connector

211 82

基于DataSourceV2 API构建的Spark ClickHouse连接器

Scala spark
相似度
25%
+1
rapidsai

rapidsai/cudf

9.5k 1.0k

cuDF - GPU 数据帧库

C++ gpu rapids
相似度
50%
+2
apache

apache/paimon

3.2k 1.3k

Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。

Java big-data spark
相似度
50%
+1
alacritty

alacritty/alacritty

62.4k 3.3k

跨平台 OpenGL 终端模拟器。

Rust gpu
相似度
25%
+16
ClickHouse

ClickHouse/ClickHouse

46.0k 8.1k

ClickHouse®是实时分析型数据库管理系统

C++ big-data
相似度
25%
+190
DataTalksClub

DataTalksClub/data-engineering-zoomcamp

38.7k 7.8k

数据工程集训营是一门为期九周的免费课程,涵盖数据工程基础知识。

Jupyter Notebook spark
相似度
25%
+3.7k
exelban

exelban/stats

36.6k 1.2k

菜单栏内的 macOS 系统监视器

Swift gpu
相似度
25%
+196
fastai

fastai/fastai

27.8k 7.7k

fastai深度学习库

Jupyter Notebook gpu
相似度
25%
+18
apache

apache/flink

25.8k 13.9k

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

Java big-data
相似度
25%
+21
thingsboard

thingsboard/thingsboard

21.2k 6.2k

开源物联网平台——设备管理、数据采集、处理与可视化。

Java big-data
相似度
25%
+63
助手