扣子空间,偷偷搞全了AI Office

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片

扣子空间,偷偷搞全了AI Office

文章图片


你的下一个Office , 不一定要是Office 。

但凡稍微关注点AI圈子 , 2025年你看到最多的关键词 , 会是什么?
Agent(智能体)绝对榜上有名 。
2025年还没过完 , 市面上的AI Agent产品已经大爆发到让人眼花缭乱——从能帮你写代码的、画画的 , 到能帮你订机票、做规划的 , 选择琳琅满目 。
但它们普遍又是面目模糊的 。 通用的AI Agent好像什么都能干 , 但什么都干得不精;而很多垂类Agent , 哪怕如vibe coding这样场景明确 , 又高度标准化的场景 , 真正用起来也会在某个环节卡壳 , 比如指令理解生硬 , 需要多轮交互修改代码——对小白用户而言 , 这不可持续 。
字节跳动旗下的“扣子空间” , 希望能够给出一种新的解法 。 9月3日 , 扣子空间(Coze Space)进行了一次大版本升级 , 以及上线了AI Excel等重磅新功能 。

来源:扣子空间
“扣子空间”是一个通用智能体平台 , 在今年4月上线 。 在内测阶段 , “扣子空间”就已经爆火 , 一码难求 。
自此之后 , 扣子空间一直在更新迭代 , 近期更是频频升级:9月3日正式推出AI Excel能力之后 , AI设计版块也开始内测豆包图像创作模型Seedream 4.0模型 , 带来了多图融合、图像修改等能力的又一次升级 。
在完成最近的功能更新之后 , 36氪发现扣子空间的定位也进行了一次刷新:一站式AI办公空间——你的下一代办公空间 , 可能真的不一定是Office 。
简单来说 , 扣子空间要面向的是几乎所有有学习和工作需求的C端用户 。 今天 , 当我们再分析扣子空间的能力时 , 可以发现它已经覆盖了AI写作、AI PPT、AI设计、AI Excel、AI网页、AI播客 。
从2024年上线以来 , 扣子的变化轨迹清晰可见:从一个To C的智能体生态 , 逐步完善AI基建 , 接入丰富多元的MCP广场 。
2024年被称为Agent元年 , 直到2025年 , Agent才开始逐步落地 。 可以说 , 年初Manus的爆火 , 彻底打开了Agent市场 , 但要真正让每一个人都用上Agent , 依旧还有很长的路要走 。
如今Agent也走到了这样的岔路口 。
“最后一公里” , 几乎是每一代的技术浪潮中的公司 , 都会提到并希望解决的问题 。 以上一代AI技术的发展过程为例 , 传统模型参数规模小 , 识别、OCR、TTS等单点算法只能在特定场景产生价值 , 企业上线时必须做大量系统集成、数据标注、流程再造 。 结果就是 , 每一个新客户就意味着一次新版本的深度定制 。
扣子空间的目标 , 不只是做一堆工具的简单集合 , 而更像是一个打通了普通用户、开发者和企业三方的完整生态 。 就在不久前的7月 , 扣子也宣布将另外两个产品——扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop) , 开源至GitHub 。
如果说 , “扣子空间”要让路人都能轻松用AI完成学习、工作的产品;那么“扣子开发平台”和“扣子罗盘” , 就是为开发者提供了一整套“AI工具台” 。
归根结底 , 扣子要解决的问题只有一个:让Agent真能用 , 真落地 。 扣子空间在其中扮演的角色 , 就是让每个普通人都能以最简单的方式 , 轻松用AI完成学习、工作的产品 。

从50分到80分 , 靠谱AI实习生如何练成?在扣子空间批量上新后 , 36氪迅速跑了数个场景 , 包括最新图像模型Seedream 4.0 , 发现还真有点东西 。
任务一:一键生成可用的PPT做PPT是职场的几乎是各家通用智能体平台的标配功能 , 扣子空间也同样如此 。
各家都能做PPT , 但产出的质量截然不同 。 尤其是 , 现在大多数AI PPT的体验 , 给人的感觉像在带一个“50分实习生” 。 它或许能帮你搜点资料 , 写个初稿 , 但内容会浅尝辄止 , 图片和文字格式也常会错乱 。
PPT场景是扣子空间的王牌场景 , 36氪体验之后 , 发现它最优秀的地方在于——靠谱 , 能稳定交付 。 不会任务半途中止 , 并且需要人类员工返工的步骤 , 也明显少了许多 。
我们模拟了一个场景 , 要求扣子空间根据我们最近的一篇文章《裸辞的年轻人 , 把尼泊尔躺成大理》 , 生成一份PPT 。

点击一键优化 , 扣子空间就开始丰富Prompt , 并且开始发散思考了 。
扣子空间没有像很多通用Agent一样 , 直接生成一个成品 , 让用户开盲盒 。 相反 , 它就像实习生一样 , 在每个关键步骤都会停下来和用户进行确认 。

扣子空间生成大纲后 , 和用户进行确认 图源:扣子空间
在内容生成上也是如此 , 扣子空间会先进行一轮网页搜索 , 补充信息 。 可以看出 , 扣子所选用的信源质量较高 , 一般都是来自权威媒体或者官网 。

完成这一步后 , 再根据大纲进行图片搜索 。 文字和图片匹配是现在AI PPT的难点之一 , 采用这样的机制 , 也能够有效地控制PPT最终的质量 , 避免图不对文的问题 。
值得注意的一点是 , 在生成PPT的过程中 , 扣子空间所展现的思考过程 , 也非常详细 。
它甚至会根据PPT主题来进行搜索的优化 , 同一个主题(比如建筑)领域 , 所采用的审美、布局 , 都是类似的 , 但是会根据具体的Prompt做细微改进 。
改进的结果就是 , 排版样式跟别人不会撞车 , 并且会根据搜索到的资料 , 自己生成图表 , 个性化程度比较高 。

扣子空间第一版给出的PPT , 从排版到设计都是格局完整的 , 排版简洁清晰 。
到了修改环节 , 扣子空间能够支持修改维度 , 几乎是市面上最多的 。
扣子空间不仅能够支持常规的插入图片/文字 , 增加页数 , PPT背景的增加和删减 , 还可以支持不同区块的位移、缩放、样式修改 。
在PPT制作中 , 需要的数据、信息常常会分散在word、pdf、网页链接等文件中 。 用户也不需要再费心进行二次转换和整理——只要扔给扣子空间 , 扣子空间就可以一键帮忙排版 , 还会帮忙整理逻辑、增加数据 。
场景二:一键生成、修改配图我们再以36氪编辑日常的一个工作场景为例——给文章做配图 。
作为科技媒体 , 给文章配一张风格独特、主题明确的封面图是家常便饭 。 这事说大不大 , 但比较耗时间 , 我们把这个任务交给了扣子空间:
比如 , 让扣子空间直接给本期文章生成一个配图 , 我们还同步提供了扣子的官方形象照 。

提示词:画面参考漫画分镜风格生成一张图 , 一共分6个不规则区域 , 分别IP形象在写作、2分析数据、3画画、4演讲PPT、5敲代码做网页、6录制播客的场景 , 背景对应区域对应不同场景和不同的动作 。 参考形象图见附件 , 21:9比例 , 图中不带任何文字 。
扣子空间马上抓取了核心要点 , 然后开始马不停蹄开始设计 , 并且很快就给出了成品 , 中间没有寻求我们的确认 。

最后的成品中 , 扣子的形象非常严格保持一致 , 并且无论是风格和氛围 , 都非常符合我们的要求 , 并直接作为了本文封面图使用 。
除此之外 , 设计场景的修改环节也很省心 。 修改环节里 , 图生图的能力也是由新一代图像创作模型Seedream 4.0支持的 。
简单来说 , 有了这个模型 , “用嘴改图”能真的实现稳定交付 , 我们选用了扣子近期的公众号上的活动进行海报修改测试 。
比如 , 在做另一个海报修改场景时 , 我们尝试用非常口语化的方式指挥扣子空间:把一张海报里的主角 , 从女生替换成男生 。

文字一致性也是AI生图场景的一大难点 , 但扣子空间同样速度很快地完成了图生图任务 。 无论是人物的神态表情、动作 , 画面中的元素、文字 , 甚至二维码 , 都能很好保持 。

对比以前 , 由于海报中的元素繁多 , 如果交由设计师去设计 , 需要把海报的元素分层 , 以及大量重新设计和渲染工作 , 现在只需要一句话就能搞定 。
场景三:一键长文写作跟进海外新闻 , 并且及时写分析复盘 , 是36氪编辑的日常工作之一 。
以前两天的一则重要新闻为例——To B软件巨头Atlassian以6.1亿美元收购浏览器服务商The Browser Company , 让扣子空间写作一篇深度文章 , 复盘Atlassian的成长之路 。
对于新闻场景 , 信息真实性和准确性是我们考量的第一要义 。 扣子空间会根据我们的要求 , 从各个维度了解这个主题 , 并且搜索相应的材料 , 并且搜索来源也都集中在权威媒体、以及行业研报等 。
而在扣子空间生成大纲后 , 我们还可以对大纲进行二次修改 , 再进行下一步的成文操作 。 同时 , 信源都可追溯 , 可跳转 , 以供我们核实 。

数字序号标注出信源 , 可以直接跳转到原文链接
写作场景里也有很多产品的小设计 , 方便二次编辑修改 。 比如 , 生成文章大纲后 , 扣子空间就会自动形成一个目录 , 方便跳转查看 。

平均每轮对话产出2000字左右 , 是以前ChatBot类型产品的上限 。 可以明显看出 , 扣子空间在这方面基本没有token限制 。 在确认了大纲之后 , 扣子空间最终产出了一篇超过1.7万字的深度复盘 , 堪比一篇研究报告 。
扣子空间的写作 , “人机味”也更少了 。 从目录可以看出 , 每个章节由清晰的时间线和公司发展阶段描述交织 , 很少见到华丽空泛的形容词 , 看起来简炼、整洁 。

甚至 , 扣子空间还会预判你的预判 。 在复盘完Atlassian自身的发展状况之后 , 还会适当地补充关键数据的走势图 , 以及增加与同类型产品的对比 。
由于《Atlassian战略转型深度分析》内容过长 , 可点击文末阅读原文查看 。
场景四:一键生成真人语音播客现在 , 把图文内容转化为播客 , 已经成了很多自媒体创作者的常规操作 。 但这事儿同样费时费力:先要把文章改成适合口语表达的脚本 , 然后自己录音、剪辑、配乐 , 一套流程下来 , 半天就过去了 。
超拟人语音是扣子空间的另一个王牌功能 。 我们想看看 , 扣子空间能不能把这个流程也简化 。
同样地 , 我们直接把一篇专访链接丢给了它 , 甚至没有给任何指令 。

图源:扣子空间
整个过程同样体现了扣子空间“保姆式”的交互风格 , 没有直接开始生成 , 而是先拆解任务:将专访文章转化为音频连接和网页 。
然后 , 扣子空间就根据播客的特点 , 去除原文中的图片等元素 , 并且对原文进行压缩 , 调整为两个人对话的版本 。

扣子空间
在扣子空间自动生成播客里 , 无论是语气、停顿还是两个人说话的节奏 , 都已经到了非常真实的地步——扣子空间还很聪明地在段落之间加入了合适的停顿 , 甚至在关键节点配上了简单的音效(比如水杯碰到桌面的声音) , 让听感不那么枯燥 。
最方便的还是修改环节 。 试听之后 , 我们觉得某一段的语气有点太激动了 。
这也可以局部修改 。 我们直接在对话框里输入:“这一段语气稍微冷静一点” , 它就能立刻重新生成那一小段音频 , 而不是让整个任务从头再来 。
整个体验下来 , 扣子空间把一个原本需要多个专业软件配合、耗时数小时的工作 , 压缩到了几分钟内 。 对于想试水播客的内容团队来说 , 这个功能大大降低了启动门槛 。

“最强办公搭子”背后是一位AI基建狂魔大模型技术正在改写整个软件生态 , 无论是字节 , 还是阿里、腾讯、百度 , 都从2024年开始建设自己的Agent产品 , 2025年 , 建设开发平台和生态的脚步也越来越快 。
放眼市场 , 一个有趣的现象是 , 不少Agent平台都喜欢采用“多模型路由”策略——也就是混用多家模型 , 来规避单一模型能力不足的风险 。 一些面向海外的中国产品 , 甚至自家就是专门做大模型的公司 , 居然都直接用国外的模型作为内核 。
在这个背景下 , 扣子空间选择底层All in“豆包大模型” , 这种路线曾经看来略显“笨重” 。 在2024年 , 这一度和市场显得有些格格不入 。
但到了2025年 , 市场给出了为何要这样做的答案 。
普遍来看 , 市面上的Agent产品很多都打着“一句话生成xxxxAgent”的名号 , 但到了实操环节 , 真正生成的Agent总有这样那样的问题 , 不是调用失败 , 就是生成的质量差 。
后续的调试、排错 , 即使是用最简单的托拉拽形式 , 用户也依然有学习门槛 , 需要一定的开发基础 。 这种门槛 , 很容易就把To C用户挡在门外——这就导致 , 如今几乎所有的Agent的交付物 , 集中在生成简单的PPT、网页、小游戏 。
想让结果真正“可交付”而不是“半成品” , 大模型的可靠性依然是不足的 。
数据也已经有验证 。 根据OpenAI内部的一则研究 , 即使GPT-4o也仅将Agent的工具选择准确率提升了3% , 但处理复杂任务时极易掉链子 。 今年全球发布的多个重磅模型 , 无论是GPT-5、Claude4 , 针对智能体的优化也仍然是难题 。
这也是为什么 , 扣子空间选择了从底层到应用的全链路、端到端性能调优的路线 。 简单来说 , 这就好比一个在工厂里 , 从发动机到最小的螺丝钉 , 都是自己设计和生产的 。
扣子空间的PPT、长文理解、代码优化之所以能够做到稳定交付 , 内容涉及更加深度 , 在于团队做了大量的工程化工作 。
以PPT场景举例 , 在做PPT时 , 扣子空间会根据教育、医疗等不同行业做深度优化 , 这里面有大量的模型后训练工作 , 加入了人类专家的反馈以不断优化 , 从而让产出风格更贴近专业需求 。

一个建筑领域的PPT Case , 生成的PPT风格就以大图为背景 , 更有艺术感和氛围感
反馈到效果上 , 你会发现 , 这种精细打磨 , 让AI的产出不再是千篇一律的模板 , 而是真正能用的成果 , 是针对你的需求“专人专办”的 。
这也让扣子空间有底气 , 把交付成本拉到最低——扣子空间是市面上为数不多 , 在PPT场景提供无限次下载、增页 , 设计场景能快速批量生图的产品 。
简单来说 , 它不再像一个需要你手把手去教、去哄的“50分实习生” , 反而更像一个已经磨合过、能领会意图的“80分老员工” 。
在整个测试过程中 , 我们印象深刻的一点在于 , 扣子空间提供了一种“保姆式的产品体验” 。 它很清楚用户在使用AI时真正会遇到的麻烦 , 并提前把它们解决了 。
这种保姆式体验 , 从第一步就已经开始 。 很多用户面对AI工具的那个空白输入框 , 难免脑袋都会空白一下——到底要写什么?尤其是对Agent产品 , 清晰、高质量的指令 , 对普通用户来说 , 门槛并不低 。
扣子空间的解法 , 是主动来引导你 , 尽可能消除“主动给指令”这一步 。

比如 , 在你输入模糊想法后 , 对话框的右下角会提供一个“一键优化”的按钮 , 帮你把大白话翻译成AI能精准理解的指令 。
而在制作PPT这类复杂任务中 , 它还会在关键节点停下来 , 让你确认大纲、选择风格——能做选择题 , 就不做填空题 。
Agent产品另一个普遍问题在于 , 很多AI在工作时就像一个黑盒子 。 下达指令后 , 你只能盯着屏幕干等 , 最后它给你一个结果 , 好不好就像抽卡 , 如果不满意 , 还得从头再来 。 这种失控感和不确定性 , 让人很焦虑 。
整个过程 , 感觉旁边坐着一个经验丰富的助理 。 安全感则来自产品上的很多小设计:在关键节点上不断跟你确认需求 , 让你始终握着方向盘;版本也会随时保存 , 能够撤销和回退 。
扣子空间全链路优化的优势 , 还体现在丰富的MCP(插件)生态上 。
扣子空间不仅接入了多样的第三方插件 , 还与飞书等MCP进行了深度整合 。 这种“内部协同”带来的丝滑体验 , 是外部调用API难以比拟的 。
比如 , 接了飞书的MCP后 , 你可以在扣子空间里 , 发出指令 。 在前面我们测试的长文场景中 , 生成长文后 , 可以直接把内容转成飞书文档 。

如今 , 扣子空间的上线 , 意味着Agent产品矩阵 , 已经形成了一种清晰的用户分层:
面向普通用户 , To C产品“扣子空间”会提供深度优化过的 , 能靠谱交付结果的各个垂直Agent;
对于不满足于现有功能的专业用户和开发者 , 开发者可以在“扣子开发平台”上轻松构建自己的Agent , 然后用“罗盘”这个调试工具反复调优 , 最后把打磨好的Agent发布到“扣子空间” , 让产品摆脱了“AI玩具”的属性 , 进阶到企业级水平 。
如果说 , 全球Agent市场经历这两年的发展 , 告诉了大家什么 , 那就是:在新技术发展的初期 , 一个纯粹开放、完全“放养”的轻平台模式 , 其实很难跑出真正好用的产品 。
回看历史 , 无论是从前和现在 , 科技巨头们的试验都已经给后来者打了个样 。 平台方必须主动投入资源 , 去做用户教育和市场培育 。
苹果的App Store也走过从封闭转向开放的道路 。 一个关键转折点在于 , App Store没有单纯开放生态 , 而是通过提供强大的iPhone SDK和Xcode等原生开发工具 , 主动引导生态 , 设置准入门槛 , 最终催生了大量高质量的应用爆发 。
而OpenAI在2023年上线的GPTs商店 , 则是一个反例 。 由于缺少有效的准入门槛和平台引导 , 大量简单的“套壳”应用涌入 , 淹没了那些真正用心打磨的好产品 , 伤害了用户和开发者的体验 。
建立一个怎样的AI生态 , 本质上是一种产品选择 。
自然语言编程的兴起 , 让每个人随手做一个AI应用Demo变得简单 , 但要让它变成能稳定服务于成千上万用户的“生产级”产品 , 背后需要的基础设施还远远不够 。
扣子空间选择了那条更“笨”也更现实的路:在吆喝大家来盖楼之前 , 自己先下场 , 用最好的材料和工艺 , 亲手搭出一个功能强大、体验极佳的样板间 。
【扣子空间,偷偷搞全了AI Office】从这个角度看 , 扣子空间的形态 , 可能为当下的AI基建大战 , 提供了一个更现实、也更有参考意义的样本——先从“超强办公室搭子”做起 , 让用户用得爽 , 让Agent“有用” , 这可能才是当下最重要的事 。

    推荐阅读