❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序,在微信中搜索 TrendForge Pro 即可使用小程序,如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

scraping

话题找到数量

firecrawl/firecrawl

面向AI的网页数据API——将整个网站转换为LLM就绪的Markdown或结构化数据🔥

125k
7.6k
426
+726
排名 #11
5月28日
查看详情

scrapy/scrapy

Scrapy:Python 快速高级网页爬取与抓取框架

62k
11k
427
+272
排名 #18
5月31日
查看详情

D4Vinci/Scrapling

🕷️ 一个自适应网络爬虫框架,能够处理从单个请求到大规模爬取的所有任务!

60k
5.9k
440
+2k
排名 #15
6月4日
查看详情

Mintplex-Labs/anything-llm

内置RAG、AI智能体、无代码智能体构建器、MCP兼容等功能的桌面与Docker一体化AI应用

60k
6.5k
530
+2.3k
排名 #16
5月21日
查看详情

huginn/huginn

创建可监控并代您执行的智能体。您的智能体随时待命!

49k
4.3k
343
+231
排名 #23
6月9日
查看详情

soxoj/maigret

🕵️‍♂️ 通过用户名从数千个网站收集个人档案

31k
2.2k
388
+10k
排名 #13
5月31日
查看详情

dgtlmoon/changedetection.io

最优秀且简洁的网站变更检测、网页监控与网站变动提醒工具。完美适用于内容变更追踪、价格下降提醒、补货通知及网站篡改监控——完全免费或选择我们的SaaS方案!

30k
1.7k
300
+32
排名 #7
4月4日
查看详情

assafelovic/gpt-researcher

一个能够利用任何大型语言模型提供商对任意数据进行深度研究的自主智能体。

25k
3.3k
508
+36
排名 #6
1月26日
查看详情

apify/crawlee

Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。

23k
1.4k
387
+42
排名 #13
5月10日
查看详情

CloakHQ/CloakBrowser

一款能通过所有机器人检测测试的隐形Chromium浏览器。可直接替代Playwright,并附带源码级指纹补丁。30/30项测试全部通过。

22k
1.8k
308
+21k
排名 #15
5月31日
查看详情

JCodesMore/ai-website-cloner-template

使用AI编程代理,通过一条命令克隆任意网站

16k
2.5k
91
+118
排名 #8
6月3日
查看详情

getmaxun/maxun

✨ The open-source no-code platform for web scraping, crawling, search and AI data extraction • Turn websites into structured APIs in minutes ✨

14k
1.2k
346
+170
排名 #11
2月14日
查看详情

pystardust/ani-cli

用于浏览和播放动漫的命令行工具

12k
777
402
+598
排名 #16
5月12日
查看详情

yusufkaraaslan/Skill_Seekers

将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。

12k
1.2k
410
+264
排名 #15
4月3日
查看详情

apify/crawlee-python

Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。

8.5k
662
337
+79
排名 #11
3月10日
查看详情

daijro/camoufox

🦊 反检测浏览器

8.3k
702
321
+1.3k
排名 #21
5月13日
查看详情

lorien/awesome-web-scraping

用于网络爬虫与数据处理的库、工具及API列表。

7.8k
881
272
+48
排名 #14
4月1日
查看详情

tabulapdf/tabula

Tabula是一款用于从PDF文件中提取表格数据的工具

7.3k
683
333
排名 #11
3月4日
查看详情

jo-inc/camofox-browser

为AI代理提供无头浏览器自动化服务器,用于访问通常被屏蔽的网站

6.2k
619
194
+2.5k
排名 #13
6月2日
查看详情

firecrawl/firecrawl-mcp-server

🔥 官方 Firecrawl MCP 服务器 - 为 Cursor、Claude 及其他 LLM 客户端添加强大的网络爬取功能

6.2k
699
346
+17
排名 #13
4月30日
查看详情

gosom/google-maps-scraper

从谷歌地图抓取数据。提取每个地点的名称、地址、电话号码、网站URL、评分、评论数量、经纬度、评论内容、电子邮件等信息。

4.3k
636
361
+526
排名 #20
6月7日
查看详情

jstrieb/github-stats

为您的个人资料提供更优质的GitHub统计图像,同时支持私有仓库的统计数据

3.5k
751
147
+35
排名 #15
6月8日
查看详情

any4ai/AnyCrawl

AnyCrawl 🚀:一款基于Node.js/TypeScript的爬虫工具,可将网站转化为适用于大语言模型的就绪数据,并能从谷歌、必应、百度等搜索引擎提取结构化搜索结果。原生支持多线程以进行批量处理。

3.2k
341
137
+382
排名 #17
5月16日
查看详情

Virtual-Browser/VirtualBrowser

免费反指纹浏览器,指纹浏览器,隐私浏览器,防识别浏览器,反识别浏览器,防关联浏览器,免费的 Web3 空投专用指纹浏览器 https://vbhub.net/?src=github

2.8k
470
356
+29
排名 #18
6月2日
查看详情
助手