web-crawler

话题找到数量

firecrawl/firecrawl

面向AI的网页数据API——将整个网站转换为LLM就绪的Markdown或结构化数据🔥

99k
6.7k
209
+726
排名 #11
3月28日
查看详情

apify/crawlee

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

22k
1.3k
181
+36
排名 #11
3月11日
查看详情

ssssssss-team/spider-flow

新一代爬虫平台,通过图形化方式定义爬虫流程,无需编写代码即可实现数据采集。

11k
2.2k
134
+19
排名 #20
2月5日
查看详情

apify/crawlee-python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

8.5k
662
132
+79
排名 #11
3月10日
查看详情

firecrawl/firecrawl-mcp-server

🔥 官方 Firecrawl MCP 服务器 - 为 Cursor、Claude 及其他 LLM 客户端添加强大的网络爬取功能

5.3k
590
177
+9
排名 #10
1月26日
查看详情
助手