话题找到数量
PaddlePaddle/PaddleOCR
基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)
siyuan-note/siyuan
隐私优先、自托管、完全开源的个人知识管理软件,使用 TypeScript 和 Golang 编写
koreader/koreader
支持 PDF、DjVu、EPUB、FB2 等多种格式的电子书阅读应用,可在 Cervantes、Kindle、Kobo、PocketBook 及安卓设备上运行
readest/readest
Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。
Unstructured-IO/unstructured
轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。
QuestPDF/QuestPDF
使用开源的 QuestPDF 库及其 C# 流式 API,在 .NET 应用程序中生成和编辑 PDF 文档。轻松构建发票、报告和数据导出。
yusufkaraaslan/Skill_Seekers
将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。
T8RIN/ImageToolbox
🖼️ 图像工具箱是一款支持高级图像处理的强大应用,提供从基础裁剪绘制到滤镜、OCR及多种图像处理功能的数十种特性
wmjordan/PDFPatcher
PDF补丁丁——PDF工具箱,可编辑书签、裁剪旋转页面、解除限制、提取或合并文档、分析文档结构、提取图像及转换为图像等