pdf-parser

话题找到数量

PaddlePaddle/PaddleOCR

基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)

74k
10k
255
+1.7k
排名 #15
4月5日
查看详情

opendataloader-project/opendataloader-pdf

面向AI就绪数据的PDF解析器。

13k
1.1k
193
+9.2k
排名 #5
4月9日
查看详情

run-llama/liteparse

一款快速、实用且开源的文件解析工具

4.1k
264
45
+75
排名 #8
4月9日
查看详情

yfedoseev/pdf_oxide

Python与Rust最快的PDF库。支持文本提取、图像提取、Markdown转换、PDF创建与编辑。平均耗时0.8毫秒,比行业领先产品快5倍,在3830份PDF测试中通过率100%。采用MIT/Apache-0双协议。

373
38
128
+93
排名 #13
3月6日
查看详情
助手