Browse Now
面向 AI 智能体的浏览器自动化 CLI,由 Nowledge Mem 应用和 Exchange 扩展提供
browse-now 是随 Nowledge Mem 桌面应用一起提供的浏览器自动化 CLI。
当智能体需要的是真实浏览器,而不是普通网页抓取时,就该用它:例如登录态网站、动态页面、表单填写、截图,或者只有完整渲染后才能看到的内容。
它和 Nowledge Mem Exchange 浏览器扩展 是配套工作的。扩展负责提供浏览器桥接能力,browse-now 则把这条能力暴露成智能体可以直接调用的命令行工具。
如果你使用 AI Now,也可以在 AI Now → 插件 → 技能 中直接打开内置的 Browse Now 开关。打开后,AI Now 就能在合适的时候主动调用这条能力。
它适合做什么
遇到下面这些情况时,用 browse-now:
- 网站依赖你的登录态或浏览器 Cookie
- 任务需要点击、输入、滚动或页面跳转
- 页面是动态的,普通抓取拿不到真实状态
- 智能体需要截图,或读取渲染后的页面内容
如果只是简单的公开网页查询,普通网页搜索往往更快,不必动用它。
使用条件
你需要同时具备:
- 已安装 Nowledge Mem 桌面应用
- 机器上可以直接调用随应用提供的
browse-nowCLI - 在 Chrome、Edge、Arc 或其他受支持的 Chromium 浏览器中安装了 Nowledge Mem Exchange 扩展
- 至少有一个已连接且扩展处于可用状态的浏览器
本机安全边界
browse-now 只能在本机使用。它必须运行在安装了 Nowledge Mem 应用和已连接浏览器扩展的同一台机器上。「随处访问 Mem」不会暴露浏览器桥接端点。
如果应用已经装好,browse-now 通常会自动安装。你可以先检查:
browse-now status
browse-now --help第一条有用路径
先拿一个你本来就会使用的网站来试:
- 用
browse-now open <url>打开页面 - 用
browse-now snapshot -i查看可交互元素 - 按 ref 去点击或填写
- 用
browse-now get url确认是否真的跳转成功 - 页面变化后,再运行一次
snapshot -i
这就是最核心的使用顺序。
browse-now open https://example.com
browse-now snapshot -i
browse-now click @e5
browse-now wait 2
browse-now get url
browse-now snapshot -i优先使用 Ref
推荐的交互顺序是:
snapshot -iclick @eN或fill @eN ...get url或get title- 导航或 DOM 明显变化后,再次
snapshot -i
如果页面的无障碍信息很弱,再考虑这些兜底方式:
browse-now find "query"browse-now click -T "可见文本"browse-now screenshot /tmp/page.png
常用命令
browse-now open https://example.com
browse-now snapshot -i
browse-now find "search button"
browse-now click @e12
browse-now fill @e3 "Nowledge Mem" --submit
browse-now get page-text --max-chars 4000
browse-now screenshot /tmp/page.png可靠性说明
- 来自
snapshot -i的 ref 是最可靠的点击目标。 - 页面跳转后 ref 会重置,所以需要重新抓取。
- 点击成功,不代表一定能绕过登录墙、付费墙或反爬限制。
- 在判断动作是否失败之前,先确认自己到底跳到了哪个页面。
为智能体安装技能
让智能体学会使用 browse-now,通常有两条路:
- 如果你在用 AI Now,直接打开内置的 Browse Now 技能开关
- 如果你在用外部智能体,安装下面的复用型
npx skills技能包
如果你希望支持的智能体学会何时、怎样使用 browse-now,可以安装 community 里的复用型技能包:
npx skills add nowledge-co/community/nowledge-mem-browse-now-npx-skills这个技能包会教智能体:
- 遇到登录态或交互型网页任务时优先使用
browse-now - 以
snapshot -i返回的 ref 作为主要操作入口 - 导航后重新抓取页面
- 用
get url和get title验证结果
它和 Mem 的关系
browse-now 不是记忆检索的替代品,它负责的是浏览器控制这一侧。
一个更完整的组合通常是:
- 先用 Nowledge Mem 的技能或集成读取上下文
- 当任务需要真实浏览器时,再调用
browse-now - 如果这次浏览器操作产出了值得长期保留的信息,再把它保存回 Mem
PyPI 与远程使用
browse-now 也发布到了 PyPI。这个发布主要是为了让你在桌面应用捆绑之外,也能安装 CLI 或 Python API。
但这并不表示浏览器自动化可以通过远程访问来暴露。即使你使用的是 PyPI 包,浏览器桥接能力仍然只保留在本机,这一点是出于安全考虑。