数据工程师

话题找到数量

apache/flink

Apache Flink (根据技术翻译规范,保留专有技术名称"Apache Flink"不译,这是大数据处理领域分布式计算引擎的官方名称,符合开源社区和技术文档的通用表述习惯)

25k
13k
322
+43
排名 #24
4月3日
查看详情

topoteretes/cognee

仅用6行代码实现AI代理记忆功能

14k
1.4k
212
+2.3k
排名 #17
3月16日
查看详情

trinodb/trino

Trino 官方代码库——原名为 PrestoSQL 的大数据分布式 SQL 查询引擎 (https://trino.io)

12k
3.6k
265
+59
排名 #24
4月1日
查看详情

apache/seatunnel

SeaTunnel是多模态、高性能、分布式海量数据集成工具

9.2k
2.2k
329
+26
排名 #22
4月1日
查看详情

apache/iceberg

Apache Iceberg数据表格式

8.7k
3.1k
310
+232
排名 #23
4月9日
查看详情

apache/hudi

大数据上的更新插入、删除与增量处理

6k
2.5k
186
+31
排名 #19
12月26日
查看详情

apache/nifi

Apache NiFi

6k
2.9k
304
+58
排名 #22
3月18日
查看详情

apache/hbase

Apache HBase

5.6k
3.4k
240
+22
排名 #21
1月30日
查看详情

apache/kyuubi

Apache Kyuubi是面向数据仓库和数据湖的分布式多租户无服务SQL网关

2.3k
993
260
+14
排名 #22
4月9日
查看详情

topoteretes/cognee

Reliable LLM Memory for AI Applications and AI Agents

2.2k
207
212
+52
排名 #15
6月2日
查看详情

kafbat/kafka-ui

用于管理 Apache Kafka 集群的开源 Web 用户界面

2k
255
289
+138
排名 #23
2月12日
查看详情

apache/polaris

Apache Polaris,面向Apache Iceberg的互操作开源目录

1.9k
389
217
+18
排名 #23
3月7日
查看详情

apache/incubator-gluten

Gluten是一个中间层,负责将基于JVM的SQL引擎执行卸载到原生引擎。

1.5k
585
244
+27
排名 #20
3月5日
查看详情

devlive-community/datacap

DataCap is integrated software for data transformation, integration, and visualization. Support a variety of data sources, file types, big data related database, relational database, NoSQL database, etc. Through the software can realize the management of multiple data sources, the data under the source of various operations conversion ...

1k
124
255
排名 #1
2月7日
查看详情
助手