scraper
话题找到数量
NaiboWang/EasySpider
易采集:一个可视化无代码/免编程的网络爬虫工具,支持通过图形化界面设计和执行采集任务。别名:ServiceWrapper面向Web应用的智能化服务封装系统。
apify/crawlee
Crawlee——一个用于构建可靠爬虫的Node.js网络爬取和浏览器自动化库。支持JavaScript与TypeScript。可为人工智能、大语言模型、检索增强生成或GPT提取数据。从网站下载HTML、PDF、JPG、PNG等文件。兼容Puppeteer、Playwright、Cheerio、JSDOM及原始HTTP请求。支持有头模式与无头模式。提供代理轮换功能。
getmaxun/maxun
✨ The open-source no-code platform for web scraping, crawling, search and AI data extraction • Turn websites into structured APIs in minutes ✨
yusufkaraaslan/Skill_Seekers
将文档网站、GitHub仓库和PDF文件转换为Claude AI技能,并具备自动冲突检测功能。
apify/crawlee-python
Crawlee——用于构建可靠爬虫的 Python 网页抓取与浏览器自动化库。为 AI、大语言模型、检索增强生成或 GPT 提取数据,支持从网站下载 HTML、PDF、JPG、PNG 等文件。兼容 BeautifulSoup、Playwright 及原始 HTTP 请求,支持有头模式和无头模式,具备代理轮换功能。
gosom/google-maps-scraper
从谷歌地图抓取数据。提取每个地点的名称、地址、电话号码、网站URL、评分、评论数量、经纬度、评论内容、电子邮件等信息。
AhmadIbrahiim/Website-downloader
💡 使用Node.js下载任意网站的完整源代码(包含所有资源文件)。[ JavaScript文件、样式表、图像 ]
GodsScion/Auto_job_applier_linkedIn
通过使用此自动申请器自动化您的申请流程,让您的求职变得轻松。
dinguschan-owo/Helios
Helios是一款完全无法被屏蔽的带标签页代理工具,支持静态托管、本地运行,且仅使用HTML/CSS/JS技术栈。这是目前唯一真正仅依赖HTML且能突破任何屏蔽软件的代理方案!项目完全开源,您可基于此代码构建专属代理!
nirholas/XActions
⚡ 完整的X/Twitter自动化工具包——包含爬虫、AI代理MCP服务器(Claude/GPT)、命令行工具、浏览器脚本。无需API费用。开源。自动取关未回关用户。实时监控分析数据。自动关注、点赞、评论、采集,无需API。