❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

scraper

话题找到数量

firecrawl/firecrawl

面向AI的网页数据API——将整个网站转换为LLM就绪的Markdown或结构化数据🔥

114k
7.2k
407
+726
排名 #11
5月3日
查看详情

D4Vinci/Scrapling

🕷️ 一个自适应网络爬虫框架,能够处理从单个请求到大规模爬取的所有任务!

53k
5.2k
376
+2k
排名 #15
5月24日
查看详情

huginn/huginn

创建可监控并代您执行的智能体。您的智能体随时待命!

49k
4.3k
337
+231
排名 #23
5月24日
查看详情

NaiboWang/EasySpider

易采集:一个可视化无代码/免编程的网络爬虫工具,支持通过图形化界面设计和执行采集任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。

44k
5.4k
377
+9
排名 #13
5月10日
查看详情

apify/crawlee

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

23k
1.4k
353
+42
排名 #13
5月10日
查看详情

getmaxun/maxun

✨ The open-source no-code platform for web scraping, crawling, search and AI data extraction • Turn websites into structured APIs in minutes ✨

14k
1.2k
304
+170
排名 #11
2月14日
查看详情

instaloader/instaloader

从Instagram下载图片(或视频)及其标题和其他元数据。

12k
1.5k
116
+14
排名 #15
5月3日
查看详情

yusufkaraaslan/Skill_Seekers

将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。

12k
1.2k
361
+264
排名 #15
4月3日
查看详情

apify/crawlee-python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

8.5k
662
295
+79
排名 #11
3月10日
查看详情

tiagozip/cap

面向现代网络的隐私优先、自托管验证码解决方案。

6.6k
455
279
+552
排名 #10
5月26日
查看详情

truelockmc/streambert

一款跨平台的Electron桌面应用,可流媒体播放和下载全球任何电影、电视剧或动漫,零广告且无追踪。

4.6k
366
143
+3.9k
排名 #16
5月24日
查看详情

gosom/google-maps-scraper

从谷歌地图抓取数据。提取每个地点的名称、地址、电话号码、网站URL、评分、评论数量、经纬度、评论内容、电子邮件等信息。

4k
589
310
+526
排名 #16
5月10日
查看详情

Mathieu2301/TradingView-API

📈 从TradingView获取实时股票数据

3.2k
645
126
+146
排名 #5
4月24日
查看详情

any4ai/AnyCrawl

AnyCrawl 🚀:一款基于Node.js/TypeScript的爬虫工具,可将网站转化为适用于大语言模型的就绪数据,并能从谷歌、必应、百度等搜索引擎提取结构化搜索结果。原生支持多线程以进行批量处理。

3.2k
341
129
+382
排名 #17
5月16日
查看详情

AhmadIbrahiim/Website-downloader

💡 使用Node.js下载任意网站的完整源代码(包含所有资源文件)。[ JavaScript文件、样式表、图像 ]

2.6k
773
273
+67
排名 #4
5月13日
查看详情

TeamNewPipe/NewPipeExtractor

NewPipe用于从流媒体网站提取数据的核心库

1.7k
523
357
+56
排名 #19
2月10日
查看详情

GodsScion/Auto_job_applier_linkedIn

通过使用此自动申请器自动化您的申请流程,让您的求职变得轻松。

1.6k
458
236
+44
排名 #14
2月19日
查看详情

HDoujinDownloader/HDoujinDownloader

支持 1000 多个不同网站的易用漫画及同人志下载器

790
32
163
+3
排名 #18
4月1日
查看详情

dinguschan-owo/Helios

Helios是一款完全无法被屏蔽的带标签页代理工具,支持静态托管、本地运行,且仅使用HTML/CSS/JS技术栈。这是目前唯一真正仅依赖HTML且能突破任何屏蔽软件的代理方案!项目完全开源,您可基于此代码构建专属代理!

300
532
299
+1
排名 #10
4月15日
查看详情

nirholas/XActions

⚡ 完整的X/Twitter自动化工具包——包含爬虫、AI代理MCP服务器(Claude/GPT)、命令行工具、浏览器脚本。无需API费用。开源。自动取关未回关用户。实时监控分析数据。自动关注、点赞、评论、采集,无需API。

173
31
197
+7
排名 #9
4月3日
查看详情
助手