apify

apify/crawlee

TypeScript 活跃
165
2026-03-11
22k
+36
#11
1.3k

项目介绍

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

Crawlee—A web scraping and browser automation library for Node.js to build reliable crawlers. In JavaScript and TypeScript. Extract data for AI, LLMs, RAG, or GPTs. Download HTML, PDF, JPG, PNG, and other files from websites. Works with Puppeteer, Playwright, Cheerio, JSDOM, and raw HTTP. Both headful and headless mode. With proxy rotation.

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

了解这个项目能帮你解决什么问题

项目健康度

B
69/100
良好
活跃度人气增长社区文档
活跃度 15/23

距上次更新 30 天

人气 23/25

平台 Star TOP 9% · Forks 1,254

增长 14/25

本周 +142 ⭐ · 本月 +607 ⭐

社区 12/17

111 位贡献者 · 0 条平台评论

文档 5/10

缺少 3 项内容

在 GitHub 上查看

项目信息

作者 apify
来源 GitHub
周期 每日
仓库ID apify/crawlee
最新提交 2026-03-11 21:25:14
第一收录 2026-03-12 08:00:41
最后更新 2026-03-12 08:00:58

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手