data-pipeline

话题找到数量

apache/airflow

Apache Airflow - 通过编程方式编写、调度和监控工作流的平台

44k
16k
263
+30
排名 #13
4月9日
查看详情

apache/shardingsphere

通过分布式SQL为所有数据库提供分片、可扩展性和安全性,赋能数据智能。

20k
6.9k
251
+4
排名 #18
3月1日
查看详情

airbytehq/airbyte

领先的数据集成平台,支持从API、数据库和文件到数据仓库、数据湖及湖仓一体的ETL/ELT数据管道。同时提供自托管和云托管两种部署方式。

20k
5k
272
+6
排名 #9
2月7日
查看详情

dagster-io/dagster

面向数据资产开发、生产与观测的编排平台

14k
2k
309
+13
排名 #10
2月4日
查看详情

Unstructured-IO/unstructured

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

14k
1.2k
238
+336
排名 #13
3月25日
查看详情

apache/dolphinscheduler

Apache DolphinScheduler是现代数据编排平台,通过低代码方式敏捷构建高性能工作流

14k
5k
227
+5
排名 #20
3月31日
查看详情

debezium/debezium

多种数据库的变更数据捕获功能。请在https://issues.redhat.com/browse/DBZ提交问题。

12k
2.9k
231
+7
排名 #18
4月8日
查看详情

apache/flink-cdc

Flink CDC 是一款流式数据集成工具

6.4k
2.1k
239
+1
排名 #17
4月1日
查看详情
助手