ocr
共找到 19 个相关项目
PaddlePaddle/PaddleOCR
基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)
ShareX/ShareX
ShareX是一款免费开源应用程序,用户只需按下单个按键即可截取或录制屏幕任意区域。该程序还支持将图像、文本及各类文件上传至多种目标存储位置。
Unstructured-IO/unstructured
轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。
dataelement/bisheng
毕昇是面向新一代企业AI应用的开源大语言模型运维平台,提供强大全面的功能:GenAI工作流、RAG、智能体、统一模型管理、评估监督、监督微调、数据集管理、企业级系统管理、可观测性等
yusufkaraaslan/Skill_Seekers
将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。
breezedeus/Pix2Text
一款基于SMALL模型的开源Python3工具,能够识别图像中的版面布局、表格、数学公式以及文本,并将其转换为Markdown格式。作为Mathpix的免费替代方案,它实现了视觉内容到文本表征的无缝转换,并支持80多种语言。
ruvnet/ruvector
RuVector是一款用Rust构建的高性能向量与图数据库,专为人工智能、智能体系统和实时分析设计。它将HNSW搜索、动态最小割一致性、图智能与自学习记忆融合为统一引擎,实现可扩展、低延迟的推理与结构化检索。