scraper

firecrawl/firecrawl

TypeScript

面向AI的网页数据API——将整个网站转换为LLM就绪的Markdown或结构化数据🔥

ai ai-agents ai-crawler

firecrawl 开发者

146k

8.4k

560

+15k

排名 #20

7月6日

查看详情

D4Vinci/Scrapling

Python

🕷️ 一个自适应网络爬虫框架，能够处理从单个请求到大规模爬取的所有任务！

ai ai-scraping automation

D4Vinci 开发者

67k

6.7k

582

+2k

排名 #15

6月30日

查看详情

huginn/huginn

Ruby

创建可监控并代您执行的智能体。您的智能体随时待命！

agent automation feed

huginn 开发者

49k

4.3k

476

+231

排名 #23

7月8日

查看详情

Panniantong/Agent-Reach

Python

为您的AI代理赋予观察整个互联网的能力。读取并搜索Twitter、Reddit、YouTube、GitHub、Bilibili、小红书——一个命令行工具，零API费用。

agent-infrastructure ai-agent ai-search

Panniantong 开发者

47k

3.7k

300

+26k

排名 #19

6月30日

查看详情

NaiboWang/EasySpider

JavaScript

易采集：一个可视化无代码/免编程的网络爬虫工具，支持通过图形化界面设计和执行采集任务。别名：ServiceWrapper面向Web应用的智能化服务封装系统。

batch-processing batch-script code-free

NaiboWang 开发者

44k

5.4k

504

+81

排名 #13

6月21日

查看详情

iawia002/lux

Go

👾 使用 Go 语言编写的快速简洁视频下载库与命令行工具

bilibili crawler download

iawia002 开发者

31k

3.3k

205

+3

排名 #13

7月5日

查看详情

apify/crawlee

TypeScript

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

apify automation crawler

apify 开发者

23k

1.4k

515

+42

排名 #13

5月10日

查看详情

getmaxun/maxun

TypeScript

🔥 开源无代码网页抓取、爬虫、搜索与AI数据提取平台 • 数分钟内将网站转为结构化API 🔥

agents api automation

getmaxun 开发者

16k

1.4k

434

+170

排名 #12

7月1日

查看详情

instaloader/instaloader

Python

从Instagram下载图片（或视频）及其标题和其他元数据。

downloader instagram instagram-client

instaloader 开发者

12k

1.5k

230

+14

排名 #15

5月3日

查看详情

yusufkaraaslan/Skill_Seekers

Python

将文档网站、GitHub仓库和PDF文件转换为Claude AI技能，并具备自动冲突检测功能。

ai-tools ast-parser automation

yusufkaraaslan 开发者

12k

1.2k

522

+264

排名 #15

4月3日

查看详情

apify/crawlee-python

Python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据，支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求，支持有头模式和无头模式，具备代理轮换功能。

apify automation beautifulsoup

apify 开发者

8.5k

662

407

+79

排名 #11

3月10日

查看详情