getmaxun

getmaxun/maxun

TypeScript 一般
186
2026-02-14
14k
+51
#9
1.2k

项目介绍

✨ The open-source no-code platform for web scraping, crawling, search and AI data extraction • Turn websites into structured APIs in minutes ✨

智能解读

智能解读 自动生成

Maxun是一款开源的零代码网络数据平台,旨在将网页内容快速转化为结构化的API数据。它通过模拟真实用户行为,支持从任何网站进行数据提取、爬取、搜索和自动化采集,无需编写代码即可构建复杂的数据工作流。平台提供多种智能模式:录制模式允许用户直接记录浏览操作并自动生成可复用的采集机器人;AI模式则支持用自然语言描述需求,由大语言模型驱动完成精准提取。此外,Maxun还具备全站爬取、网页转Markdown/HTML、截图及定时搜索等功能,并提供了完整的开发者工具包。无论是市场调研、竞品分析、价格监控,还是内容聚合与学术研究,Maxun都能帮助用户高效、可靠地获取网络数据,降低技术门槛并提升自动化效率。

智能标签

使用场景

使用场景 自动生成

适合需要从网站快速获取结构化数据但不想编写和维护爬虫代码的业务人员或开发者。

1

竞品价格监控

电商运营需要每天手动查看多个竞争对手的商品价格和库存信息,耗时且容易出错。

使用Maxun的Recorder模式录制浏览竞品网站的操作,创建自动化机器人定时抓取价格、库存等结构化数据。

为亚马逊、eBay等平台的10个竞品商品创建提取机器人,每天自动获取价格变化并生成API数据供分析系统使用。

2

市场调研数据收集

市场分析师需要从多个新闻网站、论坛收集行业动态和用户评论,但手动复制粘贴效率低下。

利用Maxun的AI模式,用自然语言描述需要提取的信息(如“提取最近一周关于AI芯片的新闻标题和摘要”),让LLM自动识别并结构化数据。

从TechCrunch、Hacker News等网站提取特定时间段内关于某个技术话题的所有讨论帖子和文章摘要。

3

网站内容归档备份

开发者需要将整个产品文档网站或博客内容爬取下来进行本地备份或格式转换,但传统爬虫编写复杂。

使用Maxun的Crawl功能,配置起始URL和爬取范围,自动抓取整个网站的所有页面并转换为干净的Markdown格式。

将公司旧版文档网站(约500个页面)完整爬取并转换为Markdown,用于迁移到新的文档系统。

4

自动化招聘信息聚合

HR需要从多个招聘网站收集特定岗位的职位描述和薪资范围,手动操作重复性高。

通过Maxun的Search功能自动执行多个招聘网站的搜索查询,提取搜索结果中的职位信息并整合成结构化数据。

在LinkedIn、Indeed等网站搜索“前端工程师”职位,提取职位名称、公司、地点、薪资范围等信息,每天自动更新。

项目健康度

B
62/100
良好
活跃度人气增长社区文档
活跃度 10/23

距上次更新 54 天

人气 22/25

平台 Star TOP 15% · Forks 1,197

增长 12/25

本周 +57 ⭐ · 本月 +243 ⭐

社区 8/17

18 位贡献者 · 0 条平台评论

文档 10/10

文档资料完整

在 GitHub 上查看

项目信息

作者 getmaxun
来源 GitHub
周期 每日
仓库ID getmaxun/maxun
最新提交 2026-02-14 21:47:43
第一收录 2026-02-15 08:01:12
最后更新 2026-02-25 23:07:10

赞赏支持

如果本站对你有帮助,欢迎打赏支持

微信打赏码

微信

支付宝打赏码

支付宝

评论 0

登录 后发表评论

加载评论中...

助手