spark
共找到 20 个相关项目
DataTalksClub/data-engineering-zoomcamp
数据工程集训营是一门为期九周的免费课程,涵盖数据工程基础知识。
h2oai/h2o-3
H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。
apache/paimon
Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。
apache/incubator-livy
Apache Livy 是一个开源 REST 接口,支持从任意位置与 Apache Spark 进行交互。
ClickHouse/spark-clickhouse-connector
基于DataSourceV2 API构建的Spark ClickHouse连接器