Browse Now
让 AI Now 和 Mem 智能体使用你的本机浏览器,处理登录态、动态页面和交互型网页任务。
Browse Now 让 Mem 使用你正在使用的真实浏览器。
有些页面不能靠普通抓取解决:它们需要你的登录态、需要 JavaScript 完整渲染、需要点击、填写表单,或者需要截图。Browse Now 给 AI Now 和受支持的智能体提供了一条本机浏览器路径,让它们能在你的 Chrome、Edge、Arc 或其他 Chromium 浏览器里工作。
这是 Mem 的浏览器能力。AI Now 做网页任务时会用到它;Feed 和 Timeline 智能体检查 URL 时会用到它;Library 学习需要浏览器渲染的网页时,也会用到它。
只在本机运行
Browse Now 只能控制与 Mem 应用或 Mem 服务器位于同一台机器上的浏览器。「随处访问 Mem」不会暴露浏览器桥接端点;远程客户端也不能让服务器去控制你当前笔记本或手机上的浏览器。
第一件值得尝试的事
如果你在使用 AI Now,可以先拿一个只有你的浏览器才能访问的页面来试:
- 打开 AI Now。
- 进入 插件 → 技能,启用 Browse Now。
- 提一个需要真实页面状态的任务:
打开我已登录的项目看板,总结这周发生了哪些变化。
当浏览器在本机打开,智能体能读取渲染后的页面,并且回答内容确实来自这个浏览器会话时,就说明它已经工作正常。
如果页面是公开、静态的,Mem 可能会直接用普通网页搜索或 URL 获取。这不是问题。Browse Now 只在真实浏览器会改变结果时才有必要。
它会出现在哪里
| 位置 | Browse Now 的作用 |
|---|---|
| AI Now | 让智能体在任务中浏览登录态或动态页面。 |
| Feed / Timeline 智能体 | 当 URL 需要页面渲染时,给后台智能体一条检查页面的路径。 |
| Library URL 学习 | 帮助 Mem 学习那些不能通过普通下载完整读取的网页。 |
| 外部智能体 | 通过 CLI 和复用型技能,让受支持的智能体可以有意识地操作浏览器。 |
Browse Now 不是记忆检索的替代品。它负责的是:当任务必须看到真实网页时,让 Mem 可以看到。
使用条件
你需要同时具备:
- 已安装 Nowledge Mem 桌面应用
- 在 Chrome、Edge、Arc 或其他受支持的 Chromium 浏览器中安装了 Nowledge Mem Exchange 扩展
- 至少有一个已连接且扩展处于可用状态的浏览器
- 如果要在 AI Now 中使用,需要在 AI Now → 插件 → 技能 中启用 Browse Now
远程和移动端
如果你通过「随处访问 Mem」连接到另一台 Mem,Browse Now 仍然只会运行在承载 Mem 服务器、并且连接了浏览器扩展的那台机器上。它不会控制远程客户端设备上的浏览器。
日常使用 AI Now、Feed、Timeline 或 Library 时,一般不需要手动运行命令行。
命令行工具
桌面应用同时内置了一个名为 browse-now 的 CLI。智能体会在底层调用它;如果你是高级用户,也可以直接在终端运行。
如果应用已经安装好,CLI 通常会自动就绪。你可以先检查:
browse-now status
browse-now --help核心顺序是:
- 打开页面
- 查看可交互元素
- 按引用点击或填写
- 确认当前页面地址
- 页面变化后再次查看
@e5 这样的引用来自 snapshot -i。它们通常比猜选择器或坐标更可靠。
browse-now open https://example.com
browse-now snapshot -i
browse-now click @e5
browse-now wait 2
browse-now get url
browse-now snapshot -i如果页面的无障碍信息很弱,CLI 也支持文本查找、按可见文本点击、截图、滚动、按键和读取页面文本:
browse-now find "query"browse-now click -T "可见文本"browse-now screenshot /tmp/page.png
常用命令
browse-now open https://example.com
browse-now snapshot -i
browse-now find "search button"
browse-now click @e12
browse-now fill @e3 "Nowledge Mem" --submit
browse-now get page-text --max-chars 4000
browse-now screenshot /tmp/page.png一开始不必纠结什么
- 普通公开网页不一定需要 Browse Now。搜索或 URL 学习通常更快。
- 日常使用 AI Now 时,不需要手动运行 CLI。打开技能,让智能体在需要时调用即可。
- 它不会绕过付费墙、权限提示、反爬限制,也不能访问你的浏览器本身打不开的页面。
为智能体安装技能
让智能体学会使用 browse-now,通常有两条路:
- 如果你在用 AI Now,直接打开内置的 Browse Now 技能开关
- 如果你在用外部智能体,安装下面的复用型
npx skills技能包
如果你希望支持的智能体学会何时、怎样使用 browse-now,可以安装 community 里的复用型技能包:
npx skills add nowledge-co/community/nowledge-mem-browse-now-npx-skills这个技能包会教智能体:
- 遇到登录态或交互型网页任务时优先使用
browse-now - 以
snapshot -i返回的 ref 作为主要操作路径 - 导航后重新抓取页面
- 用
get url和get title验证结果
它和 Mem 的关系
一个更完整的组合通常是:
- 先用 Nowledge Mem 的技能或集成读取上下文
- 当任务需要真实浏览器时,再调用
browse-now - 如果这次浏览器操作产出了值得长期保留的信息,再把它保存回 Mem
PyPI 与远程使用
browse-now 也发布到了 PyPI。这个发布主要是为了让你在桌面应用捆绑之外,也能安装 CLI 或 Python API。
但这并不表示浏览器自动化可以通过远程访问来暴露。即使你使用的是 PyPI 包,浏览器桥接能力仍然只保留在本机,这一点是出于安全考虑。