
文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片

文章图片
你的下一个Office , 不一定要是Office 。
但凡稍微关注点AI圈子 , 2025年你看到最多的关键词 , 会是什么?
Agent(智能体)绝对榜上有名 。
2025年还没过完 , 市面上的AI Agent产品已经大爆发到让人眼花缭乱——从能帮你写代码的、画画的 , 到能帮你订机票、做规划的 , 选择琳琅满目 。
但它们普遍又是面目模糊的 。 通用的AI Agent好像什么都能干 , 但什么都干得不精;而很多垂类Agent , 哪怕如vibe coding这样场景明确 , 又高度标准化的场景 , 真正用起来也会在某个环节卡壳 , 比如指令理解生硬 , 需要多轮交互修改代码——对小白用户而言 , 这不可持续 。
字节跳动旗下的“扣子空间” , 希望能够给出一种新的解法 。 9月3日 , 扣子空间(Coze Space)进行了一次大版本升级 , 以及上线了AI Excel等重磅新功能 。
来源:扣子空间
“扣子空间”是一个通用智能体平台 , 在今年4月上线 。 在内测阶段 , “扣子空间”就已经爆火 , 一码难求 。
自此之后 , 扣子空间一直在更新迭代 , 近期更是频频升级:9月3日正式推出AI Excel能力之后 , AI设计版块也开始内测豆包图像创作模型Seedream 4.0模型 , 带来了多图融合、图像修改等能力的又一次升级 。
在完成最近的功能更新之后 , 36氪发现扣子空间的定位也进行了一次刷新:一站式AI办公空间——你的下一代办公空间 , 可能真的不一定是Office 。
简单来说 , 扣子空间要面向的是几乎所有有学习和工作需求的C端用户 。 今天 , 当我们再分析扣子空间的能力时 , 可以发现它已经覆盖了AI写作、AI PPT、AI设计、AI Excel、AI网页、AI播客 。
从2024年上线以来 , 扣子的变化轨迹清晰可见:从一个To C的智能体生态 , 逐步完善AI基建 , 接入丰富多元的MCP广场 。
2024年被称为Agent元年 , 直到2025年 , Agent才开始逐步落地 。 可以说 , 年初Manus的爆火 , 彻底打开了Agent市场 , 但要真正让每一个人都用上Agent , 依旧还有很长的路要走 。
如今Agent也走到了这样的岔路口 。
“最后一公里” , 几乎是每一代的技术浪潮中的公司 , 都会提到并希望解决的问题 。 以上一代AI技术的发展过程为例 , 传统模型参数规模小 , 识别、OCR、TTS等单点算法只能在特定场景产生价值 , 企业上线时必须做大量系统集成、数据标注、流程再造 。 结果就是 , 每一个新客户就意味着一次新版本的深度定制 。
扣子空间的目标 , 不只是做一堆工具的简单集合 , 而更像是一个打通了普通用户、开发者和企业三方的完整生态 。 就在不久前的7月 , 扣子也宣布将另外两个产品——扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop) , 开源至GitHub 。
如果说 , “扣子空间”要让路人都能轻松用AI完成学习、工作的产品;那么“扣子开发平台”和“扣子罗盘” , 就是为开发者提供了一整套“AI工具台” 。
归根结底 , 扣子要解决的问题只有一个:让Agent真能用 , 真落地 。 扣子空间在其中扮演的角色 , 就是让每个普通人都能以最简单的方式 , 轻松用AI完成学习、工作的产品 。
从50分到80分 , 靠谱AI实习生如何练成?在扣子空间批量上新后 , 36氪迅速跑了数个场景 , 包括最新图像模型Seedream 4.0 , 发现还真有点东西 。
任务一:一键生成可用的PPT做PPT是职场的几乎是各家通用智能体平台的标配功能 , 扣子空间也同样如此 。
各家都能做PPT , 但产出的质量截然不同 。 尤其是 , 现在大多数AI PPT的体验 , 给人的感觉像在带一个“50分实习生” 。 它或许能帮你搜点资料 , 写个初稿 , 但内容会浅尝辄止 , 图片和文字格式也常会错乱 。
PPT场景是扣子空间的王牌场景 , 36氪体验之后 , 发现它最优秀的地方在于——靠谱 , 能稳定交付 。 不会任务半途中止 , 并且需要人类员工返工的步骤 , 也明显少了许多 。
我们模拟了一个场景 , 要求扣子空间根据我们最近的一篇文章《裸辞的年轻人 , 把尼泊尔躺成大理》 , 生成一份PPT 。
点击一键优化 , 扣子空间就开始丰富Prompt , 并且开始发散思考了 。
扣子空间没有像很多通用Agent一样 , 直接生成一个成品 , 让用户开盲盒 。 相反 , 它就像实习生一样 , 在每个关键步骤都会停下来和用户进行确认 。
扣子空间生成大纲后 , 和用户进行确认 图源:扣子空间
在内容生成上也是如此 , 扣子空间会先进行一轮网页搜索 , 补充信息 。 可以看出 , 扣子所选用的信源质量较高 , 一般都是来自权威媒体或者官网 。
完成这一步后 , 再根据大纲进行图片搜索 。 文字和图片匹配是现在AI PPT的难点之一 , 采用这样的机制 , 也能够有效地控制PPT最终的质量 , 避免图不对文的问题 。
值得注意的一点是 , 在生成PPT的过程中 , 扣子空间所展现的思考过程 , 也非常详细 。
它甚至会根据PPT主题来进行搜索的优化 , 同一个主题(比如建筑)领域 , 所采用的审美、布局 , 都是类似的 , 但是会根据具体的Prompt做细微改进 。
改进的结果就是 , 排版样式跟别人不会撞车 , 并且会根据搜索到的资料 , 自己生成图表 , 个性化程度比较高 。
扣子空间第一版给出的PPT , 从排版到设计都是格局完整的 , 排版简洁清晰 。
到了修改环节 , 扣子空间能够支持修改维度 , 几乎是市面上最多的 。
扣子空间不仅能够支持常规的插入图片/文字 , 增加页数 , PPT背景的增加和删减 , 还可以支持不同区块的位移、缩放、样式修改 。
在PPT制作中 , 需要的数据、信息常常会分散在word、pdf、网页链接等文件中 。 用户也不需要再费心进行二次转换和整理——只要扔给扣子空间 , 扣子空间就可以一键帮忙排版 , 还会帮忙整理逻辑、增加数据 。
场景二:一键生成、修改配图我们再以36氪编辑日常的一个工作场景为例——给文章做配图 。
作为科技媒体 , 给文章配一张风格独特、主题明确的封面图是家常便饭 。 这事说大不大 , 但比较耗时间 , 我们把这个任务交给了扣子空间:
比如 , 让扣子空间直接给本期文章生成一个配图 , 我们还同步提供了扣子的官方形象照 。
提示词:画面参考漫画分镜风格生成一张图 , 一共分6个不规则区域 , 分别IP形象在写作、2分析数据、3画画、4演讲PPT、5敲代码做网页、6录制播客的场景 , 背景对应区域对应不同场景和不同的动作 。 参考形象图见附件 , 21:9比例 , 图中不带任何文字 。
扣子空间马上抓取了核心要点 , 然后开始马不停蹄开始设计 , 并且很快就给出了成品 , 中间没有寻求我们的确认 。
最后的成品中 , 扣子的形象非常严格保持一致 , 并且无论是风格和氛围 , 都非常符合我们的要求 , 并直接作为了本文封面图使用 。
除此之外 , 设计场景的修改环节也很省心 。 修改环节里 , 图生图的能力也是由新一代图像创作模型Seedream 4.0支持的 。
简单来说 , 有了这个模型 , “用嘴改图”能真的实现稳定交付 , 我们选用了扣子近期的公众号上的活动进行海报修改测试 。
比如 , 在做另一个海报修改场景时 , 我们尝试用非常口语化的方式指挥扣子空间:把一张海报里的主角 , 从女生替换成男生 。
文字一致性也是AI生图场景的一大难点 , 但扣子空间同样速度很快地完成了图生图任务 。 无论是人物的神态表情、动作 , 画面中的元素、文字 , 甚至二维码 , 都能很好保持 。
对比以前 , 由于海报中的元素繁多 , 如果交由设计师去设计 , 需要把海报的元素分层 , 以及大量重新设计和渲染工作 , 现在只需要一句话就能搞定 。
场景三:一键长文写作跟进海外新闻 , 并且及时写分析复盘 , 是36氪编辑的日常工作之一 。
以前两天的一则重要新闻为例——To B软件巨头Atlassian以6.1亿美元收购浏览器服务商The Browser Company , 让扣子空间写作一篇深度文章 , 复盘Atlassian的成长之路 。
对于新闻场景 , 信息真实性和准确性是我们考量的第一要义 。 扣子空间会根据我们的要求 , 从各个维度了解这个主题 , 并且搜索相应的材料 , 并且搜索来源也都集中在权威媒体、以及行业研报等 。
而在扣子空间生成大纲后 , 我们还可以对大纲进行二次修改 , 再进行下一步的成文操作 。 同时 , 信源都可追溯 , 可跳转 , 以供我们核实 。
数字序号标注出信源 , 可以直接跳转到原文链接
写作场景里也有很多产品的小设计 , 方便二次编辑修改 。 比如 , 生成文章大纲后 , 扣子空间就会自动形成一个目录 , 方便跳转查看 。
平均每轮对话产出2000字左右 , 是以前ChatBot类型产品的上限 。 可以明显看出 , 扣子空间在这方面基本没有token限制 。 在确认了大纲之后 , 扣子空间最终产出了一篇超过1.7万字的深度复盘 , 堪比一篇研究报告 。
扣子空间的写作 , “人机味”也更少了 。 从目录可以看出 , 每个章节由清晰的时间线和公司发展阶段描述交织 , 很少见到华丽空泛的形容词 , 看起来简炼、整洁 。
甚至 , 扣子空间还会预判你的预判 。 在复盘完Atlassian自身的发展状况之后 , 还会适当地补充关键数据的走势图 , 以及增加与同类型产品的对比 。
由于《Atlassian战略转型深度分析》内容过长 , 可点击文末阅读原文查看 。
场景四:一键生成真人语音播客现在 , 把图文内容转化为播客 , 已经成了很多自媒体创作者的常规操作 。 但这事儿同样费时费力:先要把文章改成适合口语表达的脚本 , 然后自己录音、剪辑、配乐 , 一套流程下来 , 半天就过去了 。
超拟人语音是扣子空间的另一个王牌功能 。 我们想看看 , 扣子空间能不能把这个流程也简化 。
同样地 , 我们直接把一篇专访链接丢给了它 , 甚至没有给任何指令 。
图源:扣子空间
整个过程同样体现了扣子空间“保姆式”的交互风格 , 没有直接开始生成 , 而是先拆解任务:将专访文章转化为音频连接和网页 。
然后 , 扣子空间就根据播客的特点 , 去除原文中的图片等元素 , 并且对原文进行压缩 , 调整为两个人对话的版本 。
扣子空间
在扣子空间自动生成播客里 , 无论是语气、停顿还是两个人说话的节奏 , 都已经到了非常真实的地步——扣子空间还很聪明地在段落之间加入了合适的停顿 , 甚至在关键节点配上了简单的音效(比如水杯碰到桌面的声音) , 让听感不那么枯燥 。
最方便的还是修改环节 。 试听之后 , 我们觉得某一段的语气有点太激动了 。
这也可以局部修改 。 我们直接在对话框里输入:“这一段语气稍微冷静一点” , 它就能立刻重新生成那一小段音频 , 而不是让整个任务从头再来 。
整个体验下来 , 扣子空间把一个原本需要多个专业软件配合、耗时数小时的工作 , 压缩到了几分钟内 。 对于想试水播客的内容团队来说 , 这个功能大大降低了启动门槛 。
“最强办公搭子”背后是一位AI基建狂魔大模型技术正在改写整个软件生态 , 无论是字节 , 还是阿里、腾讯、百度 , 都从2024年开始建设自己的Agent产品 , 2025年 , 建设开发平台和生态的脚步也越来越快 。
放眼市场 , 一个有趣的现象是 , 不少Agent平台都喜欢采用“多模型路由”策略——也就是混用多家模型 , 来规避单一模型能力不足的风险 。 一些面向海外的中国产品 , 甚至自家就是专门做大模型的公司 , 居然都直接用国外的模型作为内核 。
在这个背景下 , 扣子空间选择底层All in“豆包大模型” , 这种路线曾经看来略显“笨重” 。 在2024年 , 这一度和市场显得有些格格不入 。
但到了2025年 , 市场给出了为何要这样做的答案 。
普遍来看 , 市面上的Agent产品很多都打着“一句话生成xxxxAgent”的名号 , 但到了实操环节 , 真正生成的Agent总有这样那样的问题 , 不是调用失败 , 就是生成的质量差 。
后续的调试、排错 , 即使是用最简单的托拉拽形式 , 用户也依然有学习门槛 , 需要一定的开发基础 。 这种门槛 , 很容易就把To C用户挡在门外——这就导致 , 如今几乎所有的Agent的交付物 , 集中在生成简单的PPT、网页、小游戏 。
想让结果真正“可交付”而不是“半成品” , 大模型的可靠性依然是不足的 。
数据也已经有验证 。 根据OpenAI内部的一则研究 , 即使GPT-4o也仅将Agent的工具选择准确率提升了3% , 但处理复杂任务时极易掉链子 。 今年全球发布的多个重磅模型 , 无论是GPT-5、Claude4 , 针对智能体的优化也仍然是难题 。
这也是为什么 , 扣子空间选择了从底层到应用的全链路、端到端性能调优的路线 。 简单来说 , 这就好比一个在工厂里 , 从发动机到最小的螺丝钉 , 都是自己设计和生产的 。
扣子空间的PPT、长文理解、代码优化之所以能够做到稳定交付 , 内容涉及更加深度 , 在于团队做了大量的工程化工作 。
以PPT场景举例 , 在做PPT时 , 扣子空间会根据教育、医疗等不同行业做深度优化 , 这里面有大量的模型后训练工作 , 加入了人类专家的反馈以不断优化 , 从而让产出风格更贴近专业需求 。
一个建筑领域的PPT Case , 生成的PPT风格就以大图为背景 , 更有艺术感和氛围感
反馈到效果上 , 你会发现 , 这种精细打磨 , 让AI的产出不再是千篇一律的模板 , 而是真正能用的成果 , 是针对你的需求“专人专办”的 。
这也让扣子空间有底气 , 把交付成本拉到最低——扣子空间是市面上为数不多 , 在PPT场景提供无限次下载、增页 , 设计场景能快速批量生图的产品 。
简单来说 , 它不再像一个需要你手把手去教、去哄的“50分实习生” , 反而更像一个已经磨合过、能领会意图的“80分老员工” 。
在整个测试过程中 , 我们印象深刻的一点在于 , 扣子空间提供了一种“保姆式的产品体验” 。 它很清楚用户在使用AI时真正会遇到的麻烦 , 并提前把它们解决了 。
这种保姆式体验 , 从第一步就已经开始 。 很多用户面对AI工具的那个空白输入框 , 难免脑袋都会空白一下——到底要写什么?尤其是对Agent产品 , 清晰、高质量的指令 , 对普通用户来说 , 门槛并不低 。
扣子空间的解法 , 是主动来引导你 , 尽可能消除“主动给指令”这一步 。
比如 , 在你输入模糊想法后 , 对话框的右下角会提供一个“一键优化”的按钮 , 帮你把大白话翻译成AI能精准理解的指令 。
而在制作PPT这类复杂任务中 , 它还会在关键节点停下来 , 让你确认大纲、选择风格——能做选择题 , 就不做填空题 。
Agent产品另一个普遍问题在于 , 很多AI在工作时就像一个黑盒子 。 下达指令后 , 你只能盯着屏幕干等 , 最后它给你一个结果 , 好不好就像抽卡 , 如果不满意 , 还得从头再来 。 这种失控感和不确定性 , 让人很焦虑 。
整个过程 , 感觉旁边坐着一个经验丰富的助理 。 安全感则来自产品上的很多小设计:在关键节点上不断跟你确认需求 , 让你始终握着方向盘;版本也会随时保存 , 能够撤销和回退 。
扣子空间全链路优化的优势 , 还体现在丰富的MCP(插件)生态上 。
扣子空间不仅接入了多样的第三方插件 , 还与飞书等MCP进行了深度整合 。 这种“内部协同”带来的丝滑体验 , 是外部调用API难以比拟的 。
比如 , 接了飞书的MCP后 , 你可以在扣子空间里 , 发出指令 。 在前面我们测试的长文场景中 , 生成长文后 , 可以直接把内容转成飞书文档 。
如今 , 扣子空间的上线 , 意味着Agent产品矩阵 , 已经形成了一种清晰的用户分层:
面向普通用户 , To C产品“扣子空间”会提供深度优化过的 , 能靠谱交付结果的各个垂直Agent;
对于不满足于现有功能的专业用户和开发者 , 开发者可以在“扣子开发平台”上轻松构建自己的Agent , 然后用“罗盘”这个调试工具反复调优 , 最后把打磨好的Agent发布到“扣子空间” , 让产品摆脱了“AI玩具”的属性 , 进阶到企业级水平 。
如果说 , 全球Agent市场经历这两年的发展 , 告诉了大家什么 , 那就是:在新技术发展的初期 , 一个纯粹开放、完全“放养”的轻平台模式 , 其实很难跑出真正好用的产品 。
回看历史 , 无论是从前和现在 , 科技巨头们的试验都已经给后来者打了个样 。 平台方必须主动投入资源 , 去做用户教育和市场培育 。
苹果的App Store也走过从封闭转向开放的道路 。 一个关键转折点在于 , App Store没有单纯开放生态 , 而是通过提供强大的iPhone SDK和Xcode等原生开发工具 , 主动引导生态 , 设置准入门槛 , 最终催生了大量高质量的应用爆发 。
而OpenAI在2023年上线的GPTs商店 , 则是一个反例 。 由于缺少有效的准入门槛和平台引导 , 大量简单的“套壳”应用涌入 , 淹没了那些真正用心打磨的好产品 , 伤害了用户和开发者的体验 。
建立一个怎样的AI生态 , 本质上是一种产品选择 。
自然语言编程的兴起 , 让每个人随手做一个AI应用Demo变得简单 , 但要让它变成能稳定服务于成千上万用户的“生产级”产品 , 背后需要的基础设施还远远不够 。
扣子空间选择了那条更“笨”也更现实的路:在吆喝大家来盖楼之前 , 自己先下场 , 用最好的材料和工艺 , 亲手搭出一个功能强大、体验极佳的样板间 。
【扣子空间,偷偷搞全了AI Office】从这个角度看 , 扣子空间的形态 , 可能为当下的AI基建大战 , 提供了一个更现实、也更有参考意义的样本——先从“超强办公室搭子”做起 , 让用户用得爽 , 让Agent“有用” , 这可能才是当下最重要的事 。
推荐阅读
- 具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法
- 清华、北航联合提出类脑空间认知框架,导航、推理、早餐样样精通
- 4款AI PPT大横评:扣子空间脱颖而出,用户指令决定最终表现
- 拯救手机存储空间 荣耀宣布超50款新老机型升级支持图库清理建议
- 群核科技发布空间大模型,旨在解决AI视频空间一致性难题
- 空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了
- 8K电视真的有必要吗?内行人偷偷告诉你真相
- 真正的应用来了,百度智能云“空间智能”燃爆深圳
- 九章云极普惠智算入驻上海模速空间 推出企业级智能体
- 华为Mate XTs再次被确认:eSIM+性能飙升40%,小空间大作为!
