AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

文章图片

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

文章图片

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

文章图片

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

文章图片

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

作者|苏子华
编辑|郑玄
过去两年 , 很多人对 AI 的印象 , 基本都停留在一个对话框里:
有问题 , 敲几个字 , 它就给答案 。 好用是好用 , 但也让人觉得有点单调——AI 难道就只能困在对话框里吗?
我一直觉得 , 真正的 AI , 不该只是「会背百科全书的老师」 , 而应该能跟我一起走进生活 , 理解我当下正在经历什么 。
昨晚刚刚正式发布的 Looki L1 , 可能就是第一台真正让 AI「走出来」的设备 。
这就是 Looki L1 , 有三个颜色可供选择|图片来源:Looki
早在半个月前 , 我开始试用 Looki L1 , 第一次拿到手 , 我差点以为这是个挂坠形相机 。 但很快我发现 , 它既不是运动相机 , 也不是简单挂在脖子上的 GPT 硬件 。
我日常习惯于把 Looki L1 磁吸在胸前 。 Looki 为用户提供了不同的机身贴纸 , 我挑了个鬼脸图案|图片来源:极客公园
当我开启它的 Story Mode(故事模式) , 它会自动捕捉视频和声音 , 然后交给 AI 去理解我当下的情境 , 那一刻 , 我身边的一切——街道、朋友的笑声、我的表情——都成了 AI 的提示词 。
和它一起生活的感觉很特别:我经历什么 , 它就经历什么 , 它不再只是一个回答问题的工具 , 而是一个和我共享日常的 AI 伙伴 。
过去几年 , 大部分 AI 产品都在强调「效率」和「生产力」 。 但能真正进入每个人生活的 AI , 几乎还是一片空白 。
Looki 正是瞄准了这项空白 。 成立一年 , 这个团队在半年时间里完成了三轮融资(天使、天使+、Pre-A) , 金额超千万美金 。 本轮融资由钟鼎资本领投 , 老股东 BAI、阿尔法公社和同歌创投超额追投 。 根据官方定义 , 它是一款 AI lifelogging camera(AI 生活日志相机) , 是全球首个真正实现了多模态交互的 AI 硬件 。
使用的这段时间 , 我已经忘了说过多少句「我靠」了 。 回过头看 , 它不仅是一个「生活记忆体」 , 还让我重新理解了自己 , 更带给我不少生活习惯的变化 。 而在它身上 , 也打开了我对「AI 交互」未来的想象 。

当 AI 进入我的生活和传统的任何相机相比 , Looki 的外观设计、操作实在太简单了 , 甚至可以说是「简陋」 。
Looki L1 没有屏幕 , 一共只有两个物理按键 , 通过长短按开启 Story Mode(间隔拍摄)、拍照、录像和录音功能 。 机身正面的 touchpad 实现了和 AI 对话的功能 , 体验和微信的发送语音很像 。
侧边是两个功能键 , 正面是 touchpad , 可以触按|图片来源:极客公园
而且它的重量只有 30 克 , 戴在身上没什么感觉 , 以至于让我觉得 , 这个团队的目的就是让用户少去操作它 , 尽量忘掉这个相机的存在 。
Looki 的 App 界面|图片来源:极客公园
Looki 的 App 也延续了极简思路 , 如上图所示:
For You:每天 AI 主动推送的「生活流」 , 像私人版 Instagram feed , 但只给你看;
Chat:拥有生活全记忆的 AI 聊天 , 绝对是最懂我的 AI , 可以在这里聊自己的生活;
Lifelog:AI 自动理解和整理的生活档案 , 把素材变成有主题的 Moments;
Device:主要用来查看设备状态 , 以及一些其他基本设置 。
用 Looki 记录日常 , 最大的感受是「投入当下」 。
我最常用的功能是 Story mode , 也就是间隔自动拍摄 。 开启之后 , 我便不再管它 , 无需考虑什么时候按快门 , 专心享受当下就行 。
如果遇到突然想记录的画面 , 也不需要从兜里掏出手机 , 再解锁、拍照 。 而是直接按一下 looki L1 的拍照键或录制键 。
不知道你是否有这样的感受:实际上 , 无论用什么设备 , 拍摄不是最难的事情 。 最难的是拍摄后的素材整理 。 而这 , 也是我认为真正让 Looki 差异化于其他相机的关键 。
以往 , 我们可能拍摄了海量的照片和视频 , 但绝大多数都沉睡在硬盘里 , 无从整理 。
而 Looki 的「Moments」功能 , 利用多模态 AI 的能力 , 理解视频中的人物、场景和情感 , 能将海量素材自动整理成一个个有主题的事件 , 并从里面提炼出「高光片段」 , 将碎片化的瞬间编织成有意义的叙事 。 整个过程都不需要人介入 , 节省了大量时间 。
在「moments」页面 , 可以查看高光时刻 , 和所有素材片段|图片来源:极客公园
一天下来 , 当我们翻看「Moments」界面时 , 就好像有了自己的「传记」 。
另外 , 这些天观察下来 , Looki 生成的 vlog 也比较有讲究 。 它会自己捋顺一条故事线 , 然后分析出一个主题 , 并根据这个主题配乐 , 同时给不同的画面配文或者关键词 。 整体有一种欧美纪录片的质感 。
我截取了两个 Looki 生成的 vlog 的封面 , 可以感受下风格|图片来源:极客公园
我曾经试过拍 vlog , 但坚持半个月就放弃了 , 一方面总会忘记拿出手机或相机来拍摄 , 一方面每天录了很多素材之后 , 晚上剪辑、制作也会花掉很长时间 , 耗费精力 。 因此 , 对于我这种懒人来说 , 它就是我目前能遇到的最佳解决方案了 。

产品设计哲学:AI 向内 , 让我看见更多的自己这个产品对我最大的改变 , 是让我开始更多地向内看 。
这项功劳可能归结于 Looki 的内容生成能力 。 我每天都会期待它推送给我 Moment 和 vlog , 因为我很好奇 AI 如何解读我 , 如何解读我的生活 。
Looki 给我推送的 moment , 看它配文的解读是种乐趣|图片来源:极客公园
自从有了第一次惊喜体验后 , 我不仅日常把它磁吸在胸前 , 当我坐下来的时候 , 我也会把它取下来放在桌子上 , 将镜头对着我自己 。 这样 , 我开始出现在了视频画面里 。 而且 , Looki AI 基于场景和音频、视频等信息 , 也迅速地判断出我是这个故事的主人公 , 并彻底记住我 。
Looki L1 可以依靠背后的磁吸按钮 , 立在桌子上|图片来源:极客公园
它经常会拾取一些被我忽视的、但可能当时情绪更丰沛的生活片段 , 然后配上解读和描述 , 看了之后 , 我常常会感到 , 「哦 , 原来我是这样度过那个时刻的 。 」、「原来我那个时刻那么开心 。 」——要知道 , 如果不是看到 Looki L1 的「回放」 , 我一定会把那个时刻忽视掉了 , 只当作它是一个庸常、乏味的日常碎片 。
当我回看的那一刻 , 我仿佛看到了更多的自己 , 重新获得了一段时光 。
即便如此 , Looki L1 也并不能替代传统相机 。
传统相机的逻辑是追求画质、追求高光时刻 。 比如 , 大疆的无人机 , GoPro 的极限运动相机 , 都是围绕「极致画面」展开 。 但 Looki 的选择恰好相反:它不追求 4K , 而是采用 Sony IMX681 CMOS(和 Meta Rayban 同款) , 分辨率 1080p , 但换来的是 12 小时续航和 30 克的轻便 。
社交媒体让人们习惯于展示「高光时刻」 , 而恰恰相反 , Looki 不是为了小红书、Instagram 这样的「表演式分享」设计的 。 它要捕捉的 , 是生活的连续性和日常细节 。
毕竟 , 我们的生活不是由一个个「完美瞬间」组成的 , 那些不那么光鲜 , 却琐碎、真实的「非高光」日常 , 才是「我之所以为我」的关键 。
如今 , 我们正处在一个被内容淹没的环境里 , 很容易被各种宏大叙事或八卦消息所牵引 。 因此 , 从 Looki 的产品机制看 , 它具备一种「反潮流」的气质 , 它似乎在引导人关注自己的生活 , 从自己的日常里、从自己身上发掘惊喜 。

Looki 让我看到了「多模态 AI 硬件」的潜力其实 , 「记录一生」这个想法很早就有人提过 。
上世纪 90 年代 , 计算机先驱戈登·贝尔就尝试过全天佩戴相机来记录生活 , 最后失败了 。 原因很简单:拍得再多 , 没有 AI 的辅助 , 大量素材也很难被整理为真正有用的故事 。
而 Looki 的突破在于:多模态 AI 。 它能理解视觉、声音和语义 , 让碎片化的素材变成可用的「记忆」 。
例如 , 当我问 Looki , 我昨天喝了什么咖啡时 , 它能够迅速分析录像素材 , 告诉我分别在哪家店铺 , 喝了什么口味的咖啡 , 还会描述一下当时的氛围等等 , 同时把当时的照片罗列出来 。
我和 Looki AI 聊天的页面|图片来源:极客公园
有多位创业者曾对我表达过相似的观点 , 大模型如果想要真正发挥作用 , 一定要具备对物理世界的感知能力 , 要具备硬件 。 这可能也是为什么「随身 AI 硬件」会成为当下创投圈备受关注的热点 。
Looki 的创新之处就在于 , 它率先通过巧妙设计的硬件释放了多模态 AI 的能力 , 让人们感知到了「多模态 AI」到底能够在现实生活中做到什么 , 将未来摆在了所有人眼前 。
过去 , 服务于个人生活的 AI 很难做 , 一个关键原因就是缺少上下文(context) 。
Looki 团队告诉我 , 他们接入的大模型是 ChatGPT 和 Gemini 。 但是我体验下来 , Looki AI 完全优于我使用的网页版的 ChatGPT 和 Gemini , 它会更加懂我 , 更能够结合我的生活来和我聊天 。
我想 , 核心原因 , 就在于 Looki 的硬件捕捉了我所处的物理环境信息 , 为 AI 提供了更多上下文 。 如果没有个性化的上下文 , 那么 AI 给出的答案往往是正确但无用的 。
可以说 , Looki 能生成什么内容 , 基本取决于它拍摄到什么 。 我带着它去的地方越多 , 它生成的内容也就越丰富、越深刻 。 此时 , 照片、视频不再是终点 , 而是提示词(Prompt) 。 有了 Looki L1 , 整个世界都在成为我的 AI 提示词 。
Looki L1 的外形看上去像个外星人 , 每次戴着它出门 , 都好像带着一位外星朋友 , 一同走进这个社会 。 它会记录我们一起去过的地方 , 见过的人 , 经历过的事件 。 它就像一个和我有着共同经历、总出现在我身边的朋友 。 它也会随着经历的丰富而成长 , 会和我形成感官共鸣 。
还记得 , 前段时间 OpenAI 收购了前苹果设计总监 Jony Ive 的公司 , 目标要改变人和 AI 之间的交互方式 , 打算在 2026 年推出 AI 硬件 , 而其概念流出图和 Looki L1 极为相似 。
【AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词】也许 , 我们今天看到的 Looki L1 , 就是「个人 AI 硬件」的起点 。

    推荐阅读