bb-browser 坏孩子浏览器
让 AI Agent 直接操作你登录好的浏览器
深度报告
-
bb-browser(BadBoy Browser)是由开发者 epiral 于 2026 年初发布的开源浏览器自动化工具,核心理念是「你的浏览器就是 API」。与传统 Playwright、Selenium 等无头浏览器方案不同,bb-browser 通过 Chrome 扩展和 CDP 协议,让 AI Agent 直接复用用户真实浏览器的登录态来访问互联网,无需 API Key、无需模拟登录、无需反爬对抗。目前支持 36 个平台、103 条命令,GitHub 已获 4600+ Stars,npm 周下载量约 1700 次。中文开发者社区对其关注度较高,但英文社区渗透率仍然偏低,整体处于早期快速迭代阶段。
-
bb-browser 由独立开发者 yan5xu(GitHub 用户名 epiral)开发,使用 TypeScript 编写(占比 88.8%),采用 MIT 开源协议。项目首次 commit 于 2026 年 1 月 31 日,3 月 15 日正式发布中文 README 并开始推广,到 4 月中旬已迭代至 v0.11.3 版本,共 18 个 Release、29 个 npm 版本。 项目的诞生背景直指 AI Agent 领域的一个核心痛点:互联网的设计目标是为人类浏览器服务的,99% 的网站不提供机器接口,AI Agent 的主流访问方式仍然是 API,这意味着绝大多数没有开放 API 的网站对 Agent 几乎不可达。bb-browser 的思路是翻转这个等式——不是强迫网站提供机器接口,而是让机器直接使用人类接口。 项目在中文开发者社区传播迅速。3 月 15 日 README 中文版发布后,WarpNav 曲速导航于 3 月 16 日首发推荐(当时 845 stars),随后知乎、掘金、何三笔记、蓝戒博客、Vibe Tools、什么值得买等平台相继发布评测文章,到 3 月底 stars 已突破 3300。3 月 16 日,项目也在 Hacker News 上发帖,获得了 7 分和少量正面评论。
-
bb-browser 的核心能力分为两层:高层语义接口和底层原子操作。 高层语义接口提供一行命令式的平台调用,返回结构化 JSON。覆盖 36 个平台、103 条命令,涵盖搜索引擎(Google、百度、Bing、DuckDuckGo、搜狗、微信)、社交媒体(Twitter/X、Reddit、微博、小红书、即刻、LinkedIn、虎扑)、新闻资讯(BBC、Reuters、36 氪、今日头条、东方财富)、技术开发(GitHub、StackOverflow、HackerNews、CSDN、博客园、V2EX、Dev.to、npm、PyPI、arXiv)、视频平台(YouTube、B站)、影音娱乐(豆瓣、IMDb、起点中文网)、财经股票(雪球、东方财富、Yahoo Finance)、求职招聘(BOSS 直聘、LinkedIn)、知识百科(Wikipedia、知乎、Open Library)等 11 个类别。B 站单独就有 9 个适配器,是命令最多的单一平台。 底层原子操作提供 7 个基础浏览器控制命令:open(打开页面)、snapshot(获取可访问性树)、click/fill(模拟点击输入)、eval(执行 JavaScript)、fetch(带登录态的网络请求)、network(抓包分析)、screenshot(页面截图)。所有命令均支持 --json 格式化输出、--jq 内联数据过滤、--tab 多标签页并发操作。 技术架构采用四层设计:AI Agent(Claude Code、Codex、Cursor 等)通过 CLI 或 MCP 协议连接 bb-browser CLI,CLI 通过 HTTP 与本地 Daemon 通信(默认监听 localhost:19824),Daemon 通过 CDP WebSocket 与 Chrome 扩展连接,Chrome 扩展通过 chrome.debugger 协议操控真实浏览器。Site Adapter(站点适配器)本质上是一个 JS 文件,在浏览器标签页内通过 eval() 直接执行,调用页面自身的 fetch() API 携带真实 Cookie,甚至可以直接调用页面已有的 Webpack 模块或 Pinia Store 完成复杂签名。这也是 bb-browser 与传统方案最本质的区别——无头浏览器再怎么伪装,指纹、行为模式、WebSocket 握手总会露出马脚,而 bb-browser 根本不存在这个问题,因为它就是用户的真实浏览器。 适配器按复杂度分三个等级:Tier 1 仅需 Cookie 直接 fetch,像 Reddit、GitHub、V2EX 约 1 分钟即可完成;Tier 2 需要 Bearer Token 加 CSRF token,像 Twitter、知乎约 3 分钟;Tier 3 涉及 Webpack 注入或 Pinia Store 操作,像 Twitter 搜索、小红书约 10 分钟。官方测试过 20 个 AI Agent 并发运行,各自独立逆向不同网站并产出可用适配器,让新网站纳入 Agent 可访问互联网的边际成本正在接近零。 产品提供三种使用方式:CLI 直接命令行使用、OpenClaw 免扩展模式(通过 --openclaw 参数直接使用 OpenClaw 内置浏览器,无需安装扩展和启动 daemon)、MCP Server 模式(在 MCP 配置文件中添加一条 npx -y bb-browser --mcp 即可接入 Claude Code、Cursor 等 AI 编码工具)。 与竞品相比,bb-browser 的核心差异化在于 Token 效率和反检测能力两个维度。传统 CDP 方案(如 Browser Use、Playwright MCP)单个 DOM 快照可能消耗 50K+ tokens,而 bb-browser 通过站点适配器直接返回结构化 JSON,仅需几百个 tokens。Hacker News 用户 genedai 在实际使用几天后验证了这一点:「Way less token waste compared to the usual CDP approach.」10 个浏览器自动化工具的横评中,bb-browser 被归类为「路线有趣,但成熟度待观察」的定位,Bingal 的作者更推荐 agent-browser(Vercel Labs 出品)作为 CLI 首选、Playwright MCP 作为 MCP 深度用户首选。
-
bb-browser 是完全开源免费的项目,采用 MIT 许可证,无任何付费功能或商业限制。npm 包每周下载量约 1700 次,没有 SaaS 服务、没有云托管版本、没有付费计划。开发者通过 GitHub 仓库维护项目,社区通过 bb-sites 仓库贡献平台适配器。 这种纯开源模式意味着项目没有直接的变现路径。从长期来看,可能的商业化方向包括企业版服务、托管型云浏览器方案或专业的适配器市场,但目前这些都未出现在项目路线图中。
-
中文开发者社区对 bb-browser 的评价整体正面偏谨慎。技术博客普遍赞赏其思路创新和实用性。何三笔记的作者评价「没有 bb-browser,AI Agent 的世界是文件+终端+几个需要密钥的 API;有了它,AI Agent 的世界是文件+终端+整个互联网」。Linux.do 社区的用户用「真的很丧良心,但真的很好用」来概括。掘金文章作者给了功能完整性五星、易用性五星、可扩展性五星,但安全性仅给三星。 具体正面评价集中在几个维度。Token 效率极高,传统方案单次操作 50K+ tokens,bb-browser 仅需几百 tokens,这是实际用户反复验证的优势。零配置开箱即用,npm install -g bb-browser 一条命令即可开始使用,无需申请任何 API Key。反爬能力从根本上解决,使用真实浏览器和真实登录态,网站无法区分是人类还是 AI Agent。适配器机制灵活,三种复杂度层级覆盖从 1 分钟到 10 分钟的适配场景,配合 AI Agent 还能实现自动化批量适配。 负面反馈主要集中在安全和成熟度两个方向。隐私安全顾虑是最被讨论的问题,bb-browser 通过 CDP 协议获得了浏览器近乎完全的控制能力,社区贡献的适配器未经官方审计可能包含恶意代码,eval 在浏览器标签页内执行存在 XSS 或本地代码执行风险。高频自动化操作仍可能触发平台风控,尽管技术上不可检测。适配器质量参差不齐,部分平台适配可能因网站改版失效,项目整体仍处于早期阶段。什么值得买和搜狐 IT 频道的文章评论区几乎没有互动,说明在非技术社区认知度还很低。
-
在 AI 浏览器自动化赛道中,bb-browser 走出了一条独特的技术路线。Unbrowse 的 2026 年浏览器自动化格局分析将市场分为五大类别,bb-browser 的「站点适配器 + 真实登录态」路线与 Browser Use 的「LLM 自主导航」、Playwright 的「编程式控制」、Steel Browser 的「云基础设施」形成差异化竞争。AI 浏览器市场预计从 2024 年的 45 亿美元增长至 2034 年的 768 亿美元,2026 年正处于拐点。 行业分析指出三个趋势:云基础设施正在趋同(Browserbase、Steel、Browserless 差异越来越小)、SDK 层正在商品化(自然语言控制浏览器正变成「功能」而非「产品」)、浏览器正变成底层实现细节(绕过浏览器的 API 原生方案在成本和速度上有压倒性优势)。bb-browser 的路线——直接在浏览器内执行适配器、返回精简 JSON——在成本和效率上与行业趋势吻合,但其对本地真实浏览器的依赖也意味着不适合大规模云端部署场景。 苏米客的分析文章提供了最深入的安全合规审视,指出该工具的核心机制本质上就是绕过网站的安全防护措施,使用时必须清醒认识到合规风险高(大概率违反目标平台服务条款,可能触犯相关法律)、账号风险高(可能导致账号被永久封禁)、安全责任在用户(工具本身不提供合规保障)。这篇文章是中文社区对该项目最严肃的独立审视。
-
安全隐私是 bb-browser 最核心的争议点。项目的 PRIVACY.md 明确声明:所有通信均在 localhost 本地进行,数据仅存在于内存中,不记录浏览历史,不提取或存储 cookies/凭据,无遥测、无分析、无云服务。但这些声明并不能完全消除风险。 具体风险包括几个层面。浏览器完全控制权方面,通过 CDP 协议获得了近乎完全的浏览器控制能力,恶意适配器理论上可以窃取任意页面数据。适配器代码安全方面,社区贡献的适配器未经官方审计,eval 在浏览器标签页内执行任意 JavaScript 存在严重的供应链攻击风险。登录态暴露方面,将用户全部登录态暴露给 AI Agent,一旦 Agent 被劫持或行为异常后果严重。平台合规风险方面,以自动化身份访问平台几乎必然违反各平台服务条款,可能导致账号封禁。法律风险方面,在中国《网络安全法》和《数据安全法》对未授权访问有严格规定,在美国 CFAA 可能适用。道德影响方面,「无可检测性」是一把双刃剑,「一句话逆向」若被恶意使用可实现刷量、水军、数据倒卖,20 个 Agent 并发的特性使大规模自动化滥用成为可能。 建议用户安装独立的 Chrome 浏览器实例专门供 bb-browser 使用,保持主浏览器干净,个人学习研究使用时注意控制频率和范围。
-
bb-browser 最适合以下几类用户:使用 Claude Code、Cursor 等 AI 编码工具的开发者,需要让 Agent 具备实时网络访问能力;进行跨平台信息聚合的研究人员,一条命令在多个平台同时搜索同一话题;需要自动化监控多平台动态的运营人员,如每日定时抓取热榜和新闻;希望降低 AI Agent 接入互联网门槛的技术爱好者。 不适合的场景包括:需要大规模商业化数据采集的生产环境(合规风险高)、对隐私安全要求极高的场景(工具获得浏览器完全控制权)、需要无界面服务器部署的云端场景(依赖本地真实浏览器)、需要 100% 合规的企业生产环境(可能违反平台 ToS)。 替代方案方面,如果只是需要浏览器自动化能力而不需要登录态复用,agent-browser(Vercel Labs)是更成熟轻量的选择;如果已深度依赖 MCP 生态,Playwright MCP 是最稳妥的默认选项;如果需要云端浏览器基础设施,Steel Browser 提供最慷慨的免费额度。
-
bb-browser 用一种巧妙的方式解决了 AI Agent「无法上网」的核心痛点——不是让网站适配机器,而是让机器使用人类的浏览器。它的站点适配器路线在 Token 效率和反检测能力上远超传统方案,4600+ Stars 和快速增长的开发迭代证明了社区对其方向的认可。但作为一个 v0.11 版本的早期项目,其安全模型、适配器稳定性和法律合规性仍需时间验证。对于个人开发者和技术爱好者来说,这是一个值得尝试的工具;但在生产环境中使用,需要充分评估风险并做好安全隔离。
用户评论
-
Sharon_TaylorII12—跟browser-use对比了一下,bb-browser在Token消耗上确实有压倒性优势。browser-use做一个10步的工作流要4美元的LLM费用,bb-browser几百tokens就搞定了。不过browser-use是通用型的,能操作任意网页,bb-browser只能操作有适配器的平台。 -
SAbro—bb-browser的PRIVACY.md写得还挺详细的,说所有通信都在本地、不存cookie、不上传数据。不过代码审计这种事一般人谁会去做呢,还是得信开源社区的监督。 -
Philip_RogersX—问一下这个支持Firefox吗?看文档好像只支持Chrome -
Raymond_Simmons520—这东西是不是有安全问题啊,把浏览器完全控制权交给一个开源工具,总感觉不太放心 -
dONALDrEED—试了一下bb-browser的MCP接入,直接加到Claude Code里就能用了,一条命令查知乎热榜,真的挺方便的。之前用browser-use查一个知乎问题要花好几万tokens,现在几百个就够了,这个token效率差距太明显了。 -
Gerald.Diaz_20228—最近在做RAG相关的调研,用bb-browser一条命令同时在arxiv、GitHub、StackOverflow、知乎、Twitter、36氪六个平台搜同一话题,返回的结构化JSON直接丢给LLM分析。这个工作流如果人工做至少要半天,现在几分钟搞定。不过有一点要注意,不同平台的适配器质量差异挺大的,GitHub和Reddit的比较稳定,小红书和微博的偶尔会出问题。 -
DPerez007—npm install -g bb-browser 然后配置MCP就完事了 上手成本几乎为零 -
ShirleyMorales—yyds,从此Claude Code可以帮我刷知乎了 -
Anna.Ward_2023—只支持Chrome 原理是CDP协议 其他浏览器没这个 -
JoeDiaz_20240—作为一个用了一个月的人说几句实话:好处是token效率高、接入简单、反爬无敌;坏处是有些适配器不稳定会突然失效、项目还很早期文档不完善、安全性需要自己把关。整体评价:值得折腾但不建议当生产主力。 -
JordanEvans_20211—当浏览器变成API的时候,反爬这个行业是不是要失业了 -
DRamirezII0—请问这个能在服务器上跑吗?我没有桌面环境 -
Melissa.JonesII—bb-browser跟Playwright MCP该怎么选?我的理解是如果你需要登录态复用就选bb-browser,如果只是通用浏览器控制就选Playwright MCP。两个不冲突可以同时装。 -
Ashleybarker—不行 它依赖真实Chrome浏览器 服务器上没桌面环境用不了 除非你用Xvfb或者noVNC之类的方案 -
贾萱—4600星的开源项目,免费+MIT协议,这种开发者真的该respect -
WAnderson_88—今天刷搜狐看到bb-browser的文章,评论区0互动说明大众用户根本不知道这东西啊哈哈,但作为Claude Code用户,这玩意真的打开了新世界的大门 -
Michelle.Jimenez_Pro—有人拿anybrowse和bb-browser做对比,我觉得这两个定位不太一样。anybrowse更偏通用浏览器自动化,bb-browser的核心是站点适配器+登录态复用。看你的需求选。 -
Timothy_Ortiz168—v0.11.3更新了,适配器比之前稳定了不少,之前bilibili的有些命令会报错现在好多了 -
NancyGonzalez_7722—新版本修复了不少bug 但Twitter的适配器还是偶尔抽风 -
LauraWrightQ—说真的 這東西的思路太簡單粗暴了 直接在瀏覽器tab裡面跑js 用你登入的cookie發fetch 這跟傳統爬蟲完全是兩個路線 -
KVasquez780—台灣有篇介紹文把它翻成繁體了,看起來順眼多了哈哈哈 -
APrice007—装了独立Chrome专门跑bb-browser,登录了常用网站,现在Claude Code让我查什么就查什么,跨平台研究效率拉满了 -
Andrew.Murray_7—Unbrowse那篇2026浏览器自动化格局分析提到了行业三大趋势,bb-browser的路线跟「浏览器变成底层实现细节」这个趋势是吻合的。不过它依赖本地真实浏览器这个特点,在云端部署场景下确实是个硬伤。 -
天涯138—笑死 真的很丧良心但真的很好用 -
JessicaWright520—知乎有人把bb-browser列为免费开源软件推荐,跟一堆知名工具放在一起。说实话这个项目确实有点东西,至少思路是全新的。 -
NFTCollector357—有人担心20个Agent并发适配网站这个特性被滥用,我觉得这个担心不是没有道理。降低逆向门槛是好事也是坏事,就看用在什么地方了。 -
Marilyn_Williams_66490—Tier1的适配器1分钟就能写完这个太夸张了,配合AI Agent读一遍guide自己就能逆向,边际成本趋近于零不是吹的 -
飞鸟246—苏米客那篇文章分析得太深入了,法律风险、技术风险、道德风险三个层面都讲到了。特别是提到CFAA可能适用这一点,很多开发者可能根本没想过这个问题。 -
JRichardson—3.3k星了,一个月前才800多,涨得真快。不过话说回来,项目还这么早期,适配器质量参差不齐,有的能用有的直接报错。 -
莲花776—没有bb-browser的话,AI Agent的世界是「文件系统+终端+几个有API key的服务」;有了它,Agent的世界是「文件+终端+整个互联网」。这个比喻太到位了。