数据工程师

共找到 13 个相关项目

apache/flink

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

25k
13k
93
+43
排名 #24
2月12日
查看详情

trinodb/trino

Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)

12k
3.5k
79
+59
排名 #24
2月20日
查看详情

topoteretes/cognee

仅用6行代码实现AI代理记忆功能

12k
1.2k
56
+2.3k
排名 #17
2月8日
查看详情

apache/seatunnel

SeaTunnel是多模态、高性能、分布式海量数据集成工具

9.1k
2.2k
102
+26
排名 #22
2月4日
查看详情

apache/iceberg

Apache Iceberg数据表格式

8.5k
3k
49
+232
排名 #23
1月31日
查看详情

apache/hudi

大数据上的更新插入、删除与增量处理

6k
2.5k
52
+31
排名 #19
12月26日
查看详情

apache/nifi

Apache NiFi

6k
2.9k
101
+58
排名 #22
2月19日
查看详情

apache/hbase

Apache HBase

5.6k
3.4k
81
+22
排名 #21
1月30日
查看详情

apache/kyuubi

Apache Kyuubi是面向数据仓库和数据湖的分布式多租户无服务SQL网关

2.3k
985
73
+14
排名 #22
2月14日
查看详情

topoteretes/cognee

Reliable LLM Memory for AI Applications and AI Agents

2.2k
207
56
+52
排名 #15
6月2日
查看详情

kafbat/kafka-ui

用于管理 Apache Kafka 集群的开源 Web 用户界面

2k
255
127
+138
排名 #23
2月12日
查看详情

apache/polaris

Apache Polaris,面向Apache Iceberg的互操作开源目录

1.8k
383
67
+18
排名 #23
2月21日
查看详情

apache/incubator-gluten

Gluten是一个中间层,负责将基于JVM的SQL引擎执行卸载到原生引擎。

1.5k
585
82
+27
排名 #20
2月21日
查看详情

devlive-community/datacap

DataCap is integrated software for data transformation, integration, and visualization. Support a variety of data sources, file types, big data related database, relational database, NoSQL database, etc. Through the software can realize the management of multiple data sources, the data under the source of various operations conversion ...

1k
124
120
排名 #1
2月7日
查看详情
助手