allenai

allenai/olmocr

Python
50
2026-01-11
16k
+31
#4
1.3k

项目简介

为大型语言模型数据集训练优化的PDF文本提取工具包

Toolkit for linearizing PDFs for LLM datasets/training

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

了解这个项目能帮你解决什么问题

项目健康度

40
C 一般

综合活跃度、人气、增长、社区、文档评估

活跃度
2/25
人气
25/25
增长
9/20
社区
1/15
文档
3/15
在 GitHub 上查看

项目信息

作者 allenai
来源 GitHub
周期 每日
仓库 ID allenai/olmocr
首次采集 2026-01-12 08:02:08
最后更新 2026-01-12 08:02:08

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手