项目竞品项目
microsoft/SynapseML
简易分布式机器学习
h2oai/h2o-3
H2O是一个开源、分布式、快速且可扩展的机器学习平台:支持深度学习、梯度提升、XGBoost、随机森林、广义线性模型、K均值聚类、主成分分析、广义可加模型、规则拟合、支持向量机、堆叠集成、自动机器学习等。
delta-io/delta
一种开源存储框架,能够通过Spark、PrestoDB、Flink、Trino和Hive等计算引擎及API构建湖仓架构。
vespa-engine/vespa
在线AI与数据平台 https://vespa.ai
Eventual-Inc/Daft
分布式查询引擎,为任何模态和规模的数据处理提供简单可靠的解决方案
JohnSnowLabs/spark-nlp
顶尖自然语言处理技术
business-science/ai-data-science-team
一个由AI驱动的数据科学智能体团队,助您以10倍速度完成常见数据科学任务。
apache/paimon
Apache Paimon 是一种湖存储格式,支持基于 Flink 和 Spark 构建流批一体的实时湖仓架构。
apache/spark
Apache Spark——面向大规模数据处理的统一分析引擎
相关项目推荐
twitter/the-algorithm
X 推荐算法源代码
apache/spark
Apache Spark——面向大规模数据处理的统一分析引擎
lichess-org/lila
♞ lichess.org:永久免费、无广告、开源的国际象棋服务器 ♞
scala/scala
Scala 2编译器与标准库。Scala 2错误报告请提交至https://github.com/scala/bug;Scala 3项目位于https://github.com/scala/scala3
akka/akka-core
一个用于构建和运行具备弹性、敏捷性和韧性应用的平台。提供软件开发工具包、程序库及托管环境。
akka/akka
一个用于构建和运行具备弹性、敏捷性和韧性应用的平台。提供SDK、库及托管环境。