document-parsing

话题找到数量

PaddlePaddle/PaddleOCR

基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)

74k
10k
246
+1.7k
排名 #15
4月5日
查看详情

docling-project/docling

为生成式人工智能准备好你的文档

53k
3.6k
216
+87
排名 #10
2月14日
查看详情

Unstructured-IO/unstructured

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

14k
1.2k
235
+336
排名 #13
3月25日
查看详情

opendataloader-project/opendataloader-pdf

面向AI就绪数据的PDF解析器。

13k
1.1k
182
+9.2k
排名 #5
4月9日
查看详情
助手