
文章图片

文章图片
近期 , 一则“悬而未决”的竞购在AI圈引发轰动 。
靠AI搜索成为行业独角兽的Perplexity称要以345亿美元的价格收购谷歌的Chrome浏览器 , 这一报价几乎是Perplexity自身估值(180亿美元)的两倍 。 想买Chrome的还不止Perplexity , 另一家AI明星企业OpenAI , 此前也透露出了收购意愿 。 不过 , 谷歌方面暂时没有接受任何报价 。
看到这个新闻 , 很多人不由得发出疑问:浏览器 , 这个“老掉牙”的互联网产品 , 怎么又重新“性感”起来了?
不止国外 , 国内互联网大厂近一年来也都围绕浏览器做文章 。 腾讯、阿里、360 , 分别押宝QQ浏览器、夸克浏览器、360AI浏览器 , 想要打造“AI时代的超级入口” 。
有必要讨论:当AI遇上浏览器 , 会发生什么化学反应?AI浏览器 , 为什么能成为大厂和创业公司在AI时代的战略重心?这场争夺赛 , 谁最有可能占得先机?
AI浏览器的两大流派:界面、功能各不相同什么是AI浏览器?
可以理解为将AI融入到传统浏览器中 , 具备智能搜索与问答、内容理解与生成摘要、自动化任务执行、多模态交互体验、个性化推荐等功能 , 实现从“工具”到“智能”的转变 。
很多从业者认为 , AI浏览器和Agent一样 , 都属于大势所趋 , 但此刻大家围绕AI浏览器的谜团也有很多 。
目前各家公司在AI浏览器的技术路线与产品形态上有着明显区别 , 究竟何种形态才能称之为AI浏览器?它和Chatbot、Agent在功能和技术上又有何区别?
先看竞争比较激烈的国外市场 。
谷歌和微软这两大科技巨头均推出了“AI浏览器” , 前者让Chrome浏览器直接集成了AI能力 , 从而对用户搜索内容进行总结提炼 。 后者则在原有Edge浏览器的基础上推出了Copilot模式 , 启用该模式后 , Edge浏览器的新标签页会变成一个简洁的输入框 , 用户可以直接和AI对话 。
Edge中开启Copilot模式
但与传统版本相比 , 两家AI浏览器的整体界面形态变化不大 。
从事Agent应用算法方向研究的资深人士赵江杰表示 , 谷歌和微软均采用的是集成技术路线打造AI浏览器 , 即把AI作为独立模块融入到传统浏览器架构中 , 可以简单理解为 , 在管理网页的基础上 , 加上了AI能力和Chatbot式交互 。
另一种为AI原生路线 , 多为AI初创公司采用 。
比如Perplexity的Comet、TheBrowserCompany的Dia浏览器以及FellouAI的同名浏览器 , “这些产品在开发时便基于AI原生架构打造 , 和集成模式不同 , 它是在Chatbot式交互和AI能力的基础上 , 加入网页管理功能 。 界面设计大多采用对话框形式 , 凸显了AI交互的核心地位 。 ”赵江杰表示 。
FellouAI页面
再看国内 , 目前公开宣布研发AI浏览器的主要为互联网大厂 , “AI六小虎”为代表的大模型初创公司尚未公布相关动作 , 赵江杰透露 , 除夸克外 , 国内大厂的AI浏览器基本都采用的是集成模式 。
除了界面存在差异 , 各家AI浏览器的功能侧重点也不太一样 , 区别在于智能化水平 。
目前大多数AI浏览器可以理解为非自主型 , 较传统浏览器相比 , AI功能体现在能完成网页总结、生成框架图、推荐相似网页、网页翻译、文字续写、语音助手 。
比如360AI浏览器比较突出的功能有总结概括长视频内容 , 快速梳理出重点概念并生成脑图 。 阿里的夸克浏览器支持在文字之外制作PPT、生成图片等多模态能力 。
总体来看 , 国外的Chrome以及国内绝大多数的AI浏览器 , 基本都以上述信息交互与内容生成功能为主 。
另一类偏自主型AI浏览器 , 能自主完成多网页读取与分析、自主操作复杂任务 , 以及预测用户的个性化需求 。
比如国外的Comet、Dia可跨网站执行多步任务操作 , FellouAI更是号称“全球首个行动型浏览器” , 用户给出“在亚马逊搜RTX4060显卡 , 并按评分加购最高型号”的指令 , FellouAI会自动执行“登录-筛选-比价-下单”整个过程 。
目前自主型AI浏览器是AI初创公司主打的功能方向 。
在赵江杰看来 , 自主型AI浏览器更加智能 , 不过他也强调 , 即便自主型AI浏览器看起来做到了智能化 , 但功能也比较基础 , 目前成熟场景主要有三种:多标签页信息对比总结、自动搜索并回复社交媒体发帖、监控Gmail邮件反馈以及跨境电商自动报价等商用场景 。 总之 , 是辅助用户处理一些重复性的工作 。
Agent带飞浏览器在互联网早期 , 因为具备搜索、社交、购物等多样功能 , 浏览器曾是用户上网的主要入口 。
2000年前后 , 微软的IE浏览器(Internet Explorer , 后被Edge取代)凭借Windows系统预装垄断市场 , 份额一度高达95% 。 到了移动互联网时代 , 随着苹果硬件畅销、谷歌安卓系统被广泛使用 , 苹果的Safari浏览器和谷歌的Chrome浏览器不断蚕食IE浏览器的地盘 。
根据市场调查机构 Statcounter 最新公布的数据 , 在全球所有平台中 , Chrome、Safari、Edge的市场份额分别为:67.9%、16.2%、5.1% 。 在国内 , 除了三巨头之外 , 360浏览器、QQ浏览器、UC浏览器也有一定的市场份额 。
然而 , 这些年浏览器们的日子并不好过 。 因为在移动时代 , 浏览器的入口地位被APP严重削弱 , 只有在访问陌生网站、临时查信息等场景下 , 浏览器还有一点存在感 。
到了AI时代 , 本来以为 , 被Chatbot接替了部分功能的浏览器 , 地位会更加岌岌可危 。 然而 , 随着Agent的爆发 , 浏览器彻底“翻红”了 。
石榴AI首席研究员、大模型从业者张恒认为 , 浏览器被重新重视 , 主要是因为它的Agent入口地位 。
据了解 , 大模型的产品形态由简单到复杂可分为:Chatbot(对话机器人)、Copilot(智能助手)、单智能体和多智能体 , 后两者被统称为Agent 。 如今以ChatGPT为代表的Chatbot类产品 , 弊端越来越明显 , 比如:用户能否提出明确指令 , 直接影响回复的准确度与完成度 , 同时Chatbot自身缺乏长期记忆与连续性 , 这在一定程度上降低了大模型的智能水平 。
图源 / pexels
相比之下 , Agent则像个有自主意识的智能助手 , 能帮用户琢磨事、做计划、动手干活、规划行程、完成报告等等 , 且具有自主性和通用性 。
而这些功能的实现 , 绕不开浏览器 。
赵江杰表示 , 目前Agent的开发场景主要有两种 , 一种是垂直领域 , 比如完成做视频这种单一任务 , 只需生成视频片段并做拼接 , 操作比较简单 , 或者专门针对某一企业 , 只服务于公司内部系统 , 不用跨其他平台 。
另一种则是toC场景 , 比如常见的网购、订票 , 这种涉及可视化界面和跳转到其他网站的功能 , 都得依靠浏览器 。
简言之 , 浏览器是Agent的“舞台” , 帮它在不同应用之间进行操作 , 从而完成访问登录网站、浏览电脑文件等复杂任务 。 “大模型像人的脑子 , Agent是手和脚 , 浏览器就是手脚和脑子一起干活儿的地方 , 在执行一项复杂指令时 , 需要大模型、Agent和浏览器三者协作完成 。 ”他表示 。
以购买一双跑鞋为例 , 用户下达这一指令后 , 大模型作为大脑接收、理解“买跑鞋”的任务 , Agent作为手脚行动将其拆解为“比价”“购买”等多个子任务执行 , 而其在操作时需要通过浏览器打开淘宝、京东这些网站 。
赵江杰认为 , Agent的关键在于高效完成任务并交付结果 , 而浏览器作为本地环境 , 天然具备访问用户本地数据和操作权限的能力 , 能直接读取用户的登录状态、已安装的插件、本地存储的数据等必要信息 , 从而显著提升Agent完成任务的质量和准确性 。
而且 , 将浏览器作为Agent入口 , 用户无需将账号密码等个人信息交给第三方AI工具 , 降低了泄露用户隐私的风险 。
总之 , 如果Agent有未来 , 浏览器也会有未来 。
AI浏览器的喜和忧浏览器不仅是Agent入口 , 在整个AI生态中也占据着重要位置 。
张恒表示 , 浏览器减少了AI需要适配的终端类型 , 是AI应用的统一入口 , 比如 , 浏览器使Copilot的功能开发更聚焦 , 用户无需在多个应用或设备间切换 , 提升了使用便捷性 。
意识到了浏览器对于AI产品的独特价值 , Perplexity等AI独角兽 , 不仅自研AI浏览器 , 还要花高价收购Chrome 。 综合从业者的说法 , 竞购的目的主要有两点 。
一是抢市场份额 。
据第三方数据平台Statcounter统计 , 截至2025年7月 , Chrome在全球浏览器市场的份额为67.9% , 拥有超过30亿活跃用户 , 可见其主导地位 。
在张恒看来 , 海外的浏览器三巨头 , Edge主要适配Windows系统 , Safari依托苹果设备的封闭生态 , 而Chrome凭借跨平台兼容性、丰富的插件生态和与谷歌服务的深度整合 , 市占率最高 , 这就意味着AI初创公司只要掌握了Chrome、占有了Chrome产品 , 也就相当于拥有了大批用户 , 比自己做浏览器从零积累要快得多 。
而且 , 做一个具有强兼容性和丰富生态的浏览器 , 复杂度等同于操作系统 。 “想要再自研一个类似于Chrome的浏览器难度巨大 , 市面上大多数浏览器都为Chrome(Chromium)套壳 。 ”赵江杰表示 。
图源 / pexels
二是通过浏览器积累用户数据 。
用户在浏览器上的每一次搜索、每一次停留、每一个纠错反馈 , 都是珍贵的数据信息 , “研发团队不仅能及时根据用户反馈优化AI模型 , 也可以用来改进AI产品 , 让产品变得越来越‘懂’用户 。 ”
不过 , 与传统浏览器相比 , AI浏览器目前也有明显弊端 , 一是会和Chatbot一样出现“幻觉” , 二是生态尚未成熟 。
所谓“幻觉” , 就是AI会一本正经地胡说八道 , 编造出看似合理但根本不存在的信息 , 这主要是由于浏览器的信息生成、内容总结功能 , 都依赖大模型完成 。 换句话说 , 幻觉的根源是大模型 , AI浏览器自身无法降低幻觉 。
生态未成熟可以理解为配套问题 , “AI浏览器要理解网页 , 要么靠截图 , 要么靠解析DOM树(网页的结构化表示方法) , 但截图会漏掉如下拉菜单这类隐藏元素 , 解析DOM树又很耗费计算资源 。 而且现在的图像识别技术 , 还没法像人一样顺畅地操作复杂网页 , 也会触发验证码之类的安全验证 , 这些都让AI浏览器用起来不够顺畅 。 ”赵江杰表示 。
以上种种问题共同导致AI浏览器在实际应用中面临效率低、可靠性差等挑战 , 限制了其在复杂场景下的广泛应用 。
在使用习惯上 , AI浏览器也面临着不小的挑战 。
一位从业者认为 , 传统浏览器的核心操作逻辑是“用户主动搜索+筛选” , 老用户已经习惯了在地址栏输网址或输入关键词、点链接跳转 , 相比之下 , AI浏览器更像“主动服务” , 用户能否适应这一转变也不一定 , 这也是传统搜索公司面对AI浏览器这块“香饽饽”时格外谨慎、不敢贸然推出颠覆性的AI浏览器的原因 , 即便是推出了AI浏览器 , 也保留着传统浏览器的操作界面 。
目前 , 从业者更倾向于构建“AI浏览器—Chatbot—Agent”的协同生态 , 实现各司其职的高效分工 , 三者的功能边界与应用场景有所区分 , AI浏览器提供信息检索和展示 , 方便用户快速获取信息;Chatbot一方面侧重获取信息的基础功能 , 另一方面完成文本生成、知识问答等更细节性的任务 , 但不执行实际操作;Agent则是思考+操作 , 侧重自动化办公、数据分析等复杂任务 。
比如用户想做一个假期带娃出游计划:可以用AI浏览器爬取OTA平台、景区官方等平台信息 , 筛选出适合带娃的景点以及路线 , 然后自己做规划;也可以让Chatbot给出某地某项目适合多少岁的孩子玩等具体规划 , 但自己买票;或者直接用Agent给出整体规划并直达交付链条 , 即用户接收确认景点门票的订单链接 。
简言之 , 同样是做假期带娃出游计划 , AI浏览器负责给用户整理信息包 , Chatbot给用户提供详细的建议和文案 , Agent不仅给建议 , 还帮用户进行预约、下单 , 三者的核心差异在于“提供的服务深度”和“是否能自主操作” 。
不过 , 虽然浏览器已在AI时代展现出独特价值 , 但仍然有很多问题等待解决 。
而眼下这场轰轰烈烈的“Chrome争夺战” , 最终的赢家 , 不仅会重写浏览器的市场格局 , 更有可能主导AI时代的数据主权和技术标准 。
回到故事原点 , 美国司法部以反垄断的理由 , 竭力想让谷歌卖掉Chrome , 但“手握重器”的谷歌 , 一定知道Chrome的价值 , 也一定会尽力使Chrome免于分拆 。
那些想通过收购Chrome一飞冲天的AI公司 , 恐怕还得继续眼馋 。
【浏览器,又“性感”了?】本文来自微信公众号“定焦”(ID:dingjiaoone) , 作者:王璐 , 编辑:阿伦 , 36氪经授权发布 。
推荐阅读
- 真我预热“挑战全球最大电池手机”,还有神秘新品
- 2025公认“接近完美”的拍照手机,512G大受欢迎,轻松用六年
- 阿里本地生活要做“拼好饭”?似乎并不现实
- “AI+跨境电商”大赛社会赛道赛果揭晓
- 苹果服软了?有国外网友发现,Apple TV+出现“隐藏折扣”
- 为什么总有私人号码给你打电话,让你免费升级话费套餐?
- vivo“双机”被确认:一款已官宣,一款配置规格也已清晰!
- 3个月,降了2000元!
- 视频产业的创意活力,被百度蒸汽机这颗“动力心脏”激活了
- 小米空调,打到格力家门口后,“华为空调”也要来了?
