data-pipeline

共找到 7 个相关项目

apache/shardingsphere

通过分布式SQL为所有数据库提供分片、可扩展性和安全性,赋能数据智能。

20k
6.9k
76
+2
排名 #17
1月31日
查看详情

airbytehq/airbyte

领先的数据集成平台,支持从API、数据库和文件到数据仓库、数据湖及湖仓一体的ETL/ELT数据管道。同时提供自托管和云托管两种部署方式。

20k
5k
97
+6
排名 #9
2月7日
查看详情

dagster-io/dagster

面向数据资产开发、生产与观测的编排平台

14k
2k
110
+13
排名 #10
2月4日
查看详情

apache/dolphinscheduler

Apache DolphinScheduler是现代数据编排平台,通过低代码方式敏捷构建高性能工作流

14k
5k
68
+5
排名 #5
1月28日
查看详情

Unstructured-IO/unstructured

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

14k
1.2k
74
+336
排名 #13
2月23日
查看详情

debezium/debezium

多种数据库的变更数据捕获功能。请在https://issues.redhat.com/browse/DBZ提交问题。

12k
2.8k
109
+4
排名 #18
2月19日
查看详情

apache/flink-cdc

Flink CDC 是一款流式数据集成工具

6.3k
2.1k
92
排名 #17
1月28日
查看详情
助手