项目竞品项目

项目竞品项目数量
opendataloader-project

opendataloader-project/opendataloader-pdf

相关项目
13.7k 1.1k

面向AI就绪数据的PDF解析器。

Java ocr ocr-recognition pdf pdf-parser
项目竞品项目相似度
39%
+9.2k
yfedoseev

yfedoseev/pdf_oxide

相关项目
373 38

Python与Rust最快的PDF库。支持文本提取、图像提取、Markdown转换、PDF创建与编辑。平均耗时0.8毫秒,比行业领先产品快5倍,在3830份PDF测试中通过率100%。采用MIT/Apache-0双协议。

Rust document-processing pdf pdf-parser text-extraction
项目竞品项目相似度
35%
+93
T8RIN

T8RIN/ImageToolbox

相关项目
12.2k 528

🖼️ 图像工具箱是一款支持高级图像处理的强大应用,提供从基础裁剪绘制到滤镜、OCR及多种图像处理功能的数十种特性

Kotlin ocr-recognition pdf
项目竞品项目相似度
20%
+24
PaddlePaddle

PaddlePaddle/PaddleOCR

相关项目
74.9k 10.2k

基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)

Python ocr pdf-parser
项目竞品项目相似度
14%
+1.7k
siyuan-note

siyuan-note/siyuan

相关项目
42.5k 2.7k

隐私优先、自托管、完全开源的个人知识管理软件,使用 TypeScript 和 Golang 编写

TypeScript ocr pdf
项目竞品项目相似度
9%
+48
paperless-ngx

paperless-ngx/paperless-ngx

相关项目
36.2k 2.3k

社区支持的超级文档管理系统:扫描、索引和归档所有文档

Python ocr pdf
项目竞品项目相似度
9%
+37
Unstructured-IO

Unstructured-IO/unstructured

相关项目
14.3k 1.2k

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

HTML ocr pdf
项目竞品项目相似度
9%
+336
yusufkaraaslan

yusufkaraaslan/Skill_Seekers

相关项目
12.3k 1.2k

将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。

Python ocr pdf
项目竞品项目相似度
9%
+264
助手