document-parsing

共找到 3 个相关项目

PaddlePaddle/PaddleOCR

基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)

69k
9.8k
94
+298
排名 #15
1月31日
查看详情

docling-project/docling

为生成式人工智能准备好你的文档

53k
3.6k
117
+87
排名 #10
2月14日
查看详情

Unstructured-IO/unstructured

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

14k
1.2k
73
+336
排名 #13
2月23日
查看详情
助手