apify

apify/crawlee-python

Python 一般
112
2026-03-10
8.5k
+79
#11
662

项目介绍

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

Crawlee—A web scraping and browser automation library for Python to build reliable crawlers. Extract data for AI, LLMs, RAG, or GPTs. Download HTML, PDF, JPG, PNG, and other files from websites. Works with Parsel, BeautifulSoup, Playwright, and raw HTTP. Both headful and headless mode. With proxy rotation.

智能解读

点击生成更详细的项目介绍

智能标签

生成技术栈、用途、特征、受众等多维度标签

使用场景

了解这个项目能帮你解决什么问题

项目健康度

C
57/100
一般
活跃度人气增长社区文档
活跃度 10/23

距上次更新 32 天

人气 20/25

平台 Star TOP 25% · Forks 662

增长 12/25

本周 +73 ⭐ · 本月 +313 ⭐

社区 10/17

39 位贡献者 · 0 条平台评论

文档 5/10

缺少 3 项内容

在 GitHub 上查看

项目信息

作者 apify
来源 GitHub
周期 每日
仓库ID apify/crawlee-python
最新提交 2026-03-09 07:53:34
第一收录 2026-03-11 08:01:05
最后更新 2026-03-11 08:01:05

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手