parse

话题找到数量

PaddlePaddle/PaddleOCR

基于PaddlePaddle的超棒多语言OCR与文档解析工具包(实用超轻量OCR系统,支持80+语言识别,提供数据标注与合成工具,支持服务器/移动端/嵌入式/IoT设备全平台训练与部署)

74k
10k
288
+1.7k
排名 #15
4月5日
查看详情

infiniflow/ragflow

RAGFlow 是领先的开源检索增强生成引擎,融合尖端 RAG 与智能体能力,为大型语言模型构建卓越的上下文层

73k
8.2k
337
+87
排名 #12
2月26日
查看详情

docling-project/docling

为生成式人工智能准备好你的文档

53k
3.6k
248
+87
排名 #10
2月14日
查看详情

nlohmann/json

现代C++的JSON库

49k
7.4k
359
+104
排名 #19
4月11日
查看详情

swc-project/swc

基于 Rust 的 Web 平台

33k
1.4k
242
+9
排名 #14
3月2日
查看详情

google/flatbuffers

FlatBuffers:内存高效的序列化库

25k
3.5k
335
+41
排名 #24
4月11日
查看详情

tree-sitter/tree-sitter

编程工具的增量式解析系统

24k
2.6k
203
+484
排名 #23
4月8日
查看详情

simdjson/simdjson

每秒解析千兆字节级JSON数据:被Facebook/Meta Velox、Node.js运行时、ClickHouse、WatermelonDB、Apache Doris、Milvus、StarRocks采用。

23k
1.2k
241
+106
排名 #17
3月24日
查看详情

SwiftyJSON/SwiftyJSON

在Swift中处理JSON数据的更优方案。

22k
3.4k
188
+4
排名 #20
3月5日
查看详情

vectordotdev/vector

高性能可观测性数据管道。

21k
2k
336
+15
排名 #21
2月27日
查看详情

parse-community/parse-server

Node.js / Express 版 Parse 服务器

21k
4.8k
182
+3
排名 #9
3月2日
查看详情

oxc-project/oxc

⚓ 一组用 Rust 编写的 JavaScript 工具集

20k
944
329
+981
排名 #15
4月1日
查看详情

antlr/antlr4

ANTLR(语言识别另一工具)是强大的解析器生成器,用于读取、处理、执行或翻译结构化文本及二进制文件。

18k
3.4k
301
+4
排名 #22
3月31日
查看详情

nikic/PHP-Parser

使用PHP编写的PHP解析器

17k
1.1k
174
排名 #7
2月22日
查看详情

clap-rs/clap

功能齐全、快速的 Rust 命令行参数解析器

16k
1.2k
296
+145
排名 #15
2月22日
查看详情

opendataloader-project/opendataloader-pdf

面向AI就绪数据的PDF解析器。

15k
1.3k
198
+9.2k
排名 #10
4月11日
查看详情

Unstructured-IO/unstructured

轻松将文档转换为结构化数据。Unstructured是开源的ETL解决方案,可将复杂文档转换为适合语言模型的整洁结构化格式。访问我们的网站了解企业级平台产品,支持生产级工作流、分区、增强、分块和嵌入。

14k
1.2k
279
+336
排名 #13
3月25日
查看详情

yusufkaraaslan/Skill_Seekers

将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。

12k
1.2k
218
+264
排名 #15
4月3日
查看详情

munificent/craftinginterpreters

《实现解释器》一书的配套代码库

10k
1.3k
218
+7
排名 #12
3月24日
查看详情

apify/crawlee-python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

8.5k
662
133
+79
排名 #11
3月10日
查看详情

paradedb/paradedb

基于Postgres构建的事务型Elasticsearch替代方案

8.5k
340
164
+14
排名 #16
3月3日
查看详情

boa-dev/boa

Boa是一个用Rust编写的可嵌入式JavaScript引擎。

7.1k
612
301
+49
排名 #18
3月26日
查看详情

freeok/so-novel

小说下载|网文下载|网络小说

6.3k
501
132
+84
排名 #12
3月15日
查看详情

ChilliCream/graphql-platform

欢迎来到Hot Chocolate .NET GraphQL服务器、Strawberry Shake .NET GraphQL客户端以及基于Monaco的卓越GraphQL IDE Nitro的官方主页。

5.7k
804
152
+1
排名 #12
3月31日
查看详情
助手