crawling

话题找到数量

scrapy/scrapy

Scrapy:Python 快速高级网页爬取与抓取框架

60k
11k
191
+150
排名 #5
3月2日
查看详情

apify/crawlee

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

22k
1.3k
164
+36
排名 #11
3月11日
查看详情

D4Vinci/Scrapling

🕷️ 一个自适应网络爬虫框架,能够处理从单个请求到大规模爬取的所有任务!

18k
1.2k
195
+2k
排名 #14
2月27日
查看详情

getmaxun/maxun

✨ The open-source no-code platform for web scraping, crawling, search and AI data extraction • Turn websites into structured APIs in minutes ✨

14k
1.2k
190
+170
排名 #11
2月14日
查看详情

apify/crawlee-python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

8.5k
662
119
+79
排名 #11
3月10日
查看详情

lorien/awesome-web-scraping

用于网络爬虫与数据处理的库、工具及API列表。

7.8k
881
71
+48
排名 #14
4月1日
查看详情
助手