过去几个月,@ perplexity_ai、@ browsercompany 以及 @ OpenAI 等公司纷纷推出了各自的 agentic 浏览器。
对这些公司而言,掌控浏览器层是顺理成章的进化,因为这样他们便能全面掌控用户的操作系统和整体体验。
目前这些浏览器的操作大多聚焦于读取层,例如读取、解释和总结屏幕内容。而像 comet 这样的浏览器则可以启动浏览器代理,代表用户执行写入等操作。

@ perplexity_ai comet 与 reddit 集成界面
目前,如果你希望 agentic 浏览器为你进行交易,流程如下:

上述流程大约耗时 10 秒,其中链上兑换仅需约 2 秒。
浏览器代理会持续截取当前视图的屏幕截图,处理后再通过 DOM 执行操作。如果应用界面复杂,整体流程会显著变慢。
在加密市场,每一毫秒都极其关键。你肯定希望代理能以最快速度执行操作。试想因为代理(即浏览器)在解析类似 Bloomberg Terminal 的复杂界面时延误,导致你错过最佳买入时机。

2016 年 McD 统计数据界面
任何 LLM 在上述界面下都难以高效操作,而加密领域不少协议和应用的界面体验都较差。
agentic 浏览器无法充分发挥加密行业最核心的优势——数据和协议的公开透明。
任何与加密交互的代理都应具备以下能力:
每位用户都应享有这样的基本权利:仅凭简单英文提示词即可创建并执行复杂金融任务,无需编写脚本、代码或自行部署基础设施。
一个优质 prompt 的价值远超千行代码。
SendAI 致力于让每位用户都能拥有这种基本权利。





