big-data
共找到 22 个相关项目
trinodb/trino
Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)
12k
3.5k
79
+9
StarRocks/starrocks
全球最快的开源查询引擎,为数据湖仓内外提供亚秒级分析能力。StarRocks凭借卓越的灵活性支持几乎所有场景,在多维分析、实时分析和即席查询领域提供顶尖性能。该项目隶属于Linux基金会。
11k
2.3k
69
+7
h2oai/h2o-3
H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。
7.5k
2k
32
+1
apache/paimon
Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。
3.2k
1.3k
96
+1