共找到 26 个相关项目
PaddlePaddle/PaddleOCR
基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)
koreader/koreader
支持 PDF、DjVu、EPUB、FB2 等多种格式的电子书阅读应用,可在 Cervantes、Kindle、Kobo、PocketBook 及安卓设备上运行
readest/readest
Readest是一款功能丰富的现代电子书阅读器,专为热爱阅读的用户设计,提供无缝跨平台访问、强大工具和直观界面,以提升您的阅读体验。
Unstructured-IO/unstructured
轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。
Kareadita/Kavita
Kavita是快速、功能丰富、跨平台的阅读服务器,旨在成为满足所有阅读需求的完整解决方案。可自建服务器并与亲友共享阅读资源库
yusufkaraaslan/Skill_Seekers
将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。
breezedeus/Pix2Text
一款基于SMALL模型的开源Python3工具,能够识别图像中的版面布局、表格、数学公式以及文本,并将其转换为Markdown格式。作为Mathpix的免费替代方案,它实现了视觉内容到文本表征的无缝转换,并支持80多种语言。