豆包,猛攻智能体生态位

营销管理
王智远
2天前

豆包正在猛攻智能体生态位。为什么这么说呢?

事情是这样:

早上,客户和我视频会议,豆包电脑端,突然弹出一个窗口,问我:要不要让它帮我读取会议内容,顺便整理成会议纪要?

我觉得挺新鲜,试了一下。不到两分钟,内容整理好了:结构清晰、没有错别字,速度特别快。这让我对豆包的能力刮目相看。

说到智能体,大家可能听过不少解释,但想真正理解透彻它,得先说说Chatbot。

市面上Chatbot大致分两类:一类是手机端交互型。

比如Kimi、文小言、通义;它们最初主要用于搜索和聊天,后来还加入了打电话功能。你可以把它们想象成手机里的“小秘书”,随时随地帮你处理事情。

另一类是PC端开源APP型,比如Monica。

这类Chatbot更像“多功能工具箱”,接口灵活,能接入各种API,实现图片生成、聊天甚至本地操作。它们适合有定制化需求的用户,功能强大且扩展性强。

不过,智能体在Chatbot的基础上做了升级,不仅集成了两者的优点,还融入了更贴近人类交互的属性。这句话可能有点抽象,举个例子你就明白了。

很多公司,在做PC端搜索功能。一般的AI搜索流程是这样的:先打开公司网站,再进入聊天页面,在对话框里输入问题,才能得到答案。

Kimi就是这种模式。

但豆包的PC端搜索简洁得多,不用单独打开APP,直接在浏览器上就能用;浏览器窗口可以随意放置,我习惯放在屏幕右侧,利用那一小块区域输入问题,马上就能看到答案。

更贴心的是,答案里还会附带相关链接,点击能直接查阅。这种设计不仅操作简单,还让交互过程特别轻便,完全没有繁琐的感觉。

除了AI搜索,打电话也很实用。

最初,各大厂推出语音功能时,我还在想:打电话这个场景,在工作中到底什么时候会用到?毕竟刷短视频都忙不过来,谁有空天天跟硅基生命聊天?

但豆包的交互改变了我的看法。

比如,像我们这种天天码字的人,有时真不想动手,或者遇到复杂情况时,打字打到一半,思路可能就断了。这种情况下,我直接在PC端「打电话」给豆包,问题就解决了。

我把所有想法一股脑说出来,趁着思路还没断时讲清楚,它马上就能理解,并迅速给出答案;这种方式不仅节省时间,还避免了因忘记思路导致的效率低下。

还有一个功能我经常用:读网页。

有些网站、公众号的文章太长了,实在没精力看完。虽然有些平台会提供总结,但总结往往不够全面,容易漏掉关键内容,因为它的结构化,并不能满足每个人的需要。

这时,我会直接把链接发给豆包,再加一些提示词,告诉它我想要的重点是什么。豆包理解力很强,能快速给出我想要的答案。

云盘很符合工作流程,也可以叫:临时处理逻辑。

现在好多公司都在做知识库,把它当个存储空间,能放链接、文档,还能搜索。但说实话,这种方式让工作流程变得越来越复杂。

豆包的收藏功能就不同。我有时候突然有了想法,或者让它帮忙查资料,但没时间马上整理,中间的流程就很麻烦。不过,在豆包中,我只要点击聊天记录,就能把内容存到收藏夹里。

然后,等不忙的时再打开,能直接定位到对话的关键环节,甚至还能让豆包基于之前的对话做二次优化。

这个独立空间里,还能做更多操作。比如,筛选对话内容、视频、播客、PDF文件,甚至是多轮对话记录等等。它完全避免了繁琐的中间步骤,真正做到了“为我所用”。

豆包的学术搜索能帮我快速拓宽知识面,尤其是在AI行业。

这个领域变化太快了,新技术、新概念层出不穷。比如,OpenAI发布了新东西,或者马斯克又对AI提出了新想法,这些我都会特别关注。

但问题来了,新东西里有很多专业术语,看得人一头雾水。比如,MOE架构是什么?多模态融合网络又是干啥的?普通搜索引擎要么解释得太简单,要么找不到重点,很难满足需求。

这时,豆包就派上用场了。

只要把不懂的词输进去,它就能把复杂概念讲得清清楚楚,还会提供最新的研究材料,如此一来,不仅帮我理解了概念,还梳理了背景和由来,非常实用。

我之前一直在想,图片生成技术到底能用在哪些地方呢?很多朋友可能知道,我以前在公众号上经常分享“小绿书”,那些封面就是用图片生成工具做的。

最早时,我用的「即梦」。后来我发现,网页版用起来太卡,体验不太好,于是转而使用豆包了,虽然你们都是字节的产品,但是得吐槽。

现在我只要给它一个简单的指令,甚至懒得想指令时,直接让它帮我写提示词;接着,把提示词发给豆包图像生成功能,就能生成一张图片,整个过程非常顺畅。

豆包的优势还不止于此。

如果生成的图片有些地方不太满意,比如某个局部不够理想,还可以进行重绘、擦除或者扩图等调整,功能非常强大。此外,豆包里还有一些现成的模板可以参考。

除了做封面,豆包还能应用在很多产品场景中,类似于生成咖啡封面、沐浴露的产品场景图,效果看起来特别逼真。偶尔某些细节不符合实际需求,但从创意的角度来看,还是挺有意思的。

对于像 UI 设计师、新媒体运营这样的职业来说,如果工作中要作图但又找不到合适的工具,完全可以试试。它的风格有很多,电影风、写真风、3D 动漫风等,选择非常丰富。

除文成图,我还在用好多别的功能,比如:改写小红书文案。

我公众号的文章,一般都挺长。但有时候,我想把精华部分挑出来,发到小红书上;要是手动一段一段去改,那可太费时间,还特别麻烦。

所以,我就直接用专门改写小红书文案的功能。

我只要把文章分成几段输进去,再给它一些简单的提示。比如,不要加表情包,让内容更有条理,“提炼重点信息”,或者“语言正式一点”。它就能很快把修改好的内容弄出来。

虽然生成的内容偶尔会有点AI感觉,但这完全没关系。只要稍微调整一下,很快就能得到满意的结果。

写到这里,你可能也看出来了,豆包是不是一个智能体?我觉得是。

它和其他产品一样,整合了AI搜索、云盘、图像生成、AI总结等功能。但问题是,为什么豆包能吸引这么多用户?

根据豆包APP的数据,截至2024年11月底,累计用户规模已经超过1.6亿;到今年1月19日,月活跃用户达到了5600万左右。

如果用两个词总结它的成功秘诀,那就是「体验」和「交互设计」。

传统C端产品的交互方式,比如按钮、菜单等,操作流程固定,按设定好的步骤完成任务即可。

但很多声称要做C端市场的产品,包括一些我用过的工具,比如Kimi,仍然带着传统产品经理的思维在做;网页版和APP用起来特别难用,前面拼命获客,后面却不重视留存,结果还是没什么用。

前段时间我还吐槽过通义。作为一个手机端智能助手,主界面放什么日历、非核心功能,明显没有抓住用户的真正需求。

AI产品的交互完全不同,要重新思考人与人之间的交流方式。人与人交流是什么样?很简单:我想要什么,就能解决什么。比如:

  • 让AI帮我写一篇文案,只要简单描述需求,就能快速生成符合我想法的内容;
  • 结果不满意,我可以随时调整要求,就像朋友之间互相沟通、磨合一样,不用过多赘述。
  • 再比如,想让它推荐一家适合聚餐的餐厅,只要告诉它预算、地点和口味偏好,就能给出精准建议,甚至还能附上理由,让人觉得贴心又实用。

所以,AI交互的核心在于,不再冷冰冰地执行命令,而是能理解我的意图,灵活应对我的需求,真正做到像人一样为我服务。不是吗?

前几天,字节跳动CEO梁汝波在2025年2月13日的全员会上提到,AI业务有三个重点目标:

一,追求「智能」上限,把智能作为核心目标推动技术创新;二,探索新交互方式,让产品更便携、更自然;三,加强规模效应,让AI产品越多人用越好用。

我把这段话发到社群里,不少朋友觉得很有高度。但问题来了,什么是便携?什么是自然?怎么理解“全新交互方式”呢?

我不是产品经理,我是用户。作为一个普通用户,我的看法是这样的:

首先,在AI与人的交互场景下,我不喜欢「学习能力」这个词。设计一个App或日常工具,又不是造宇宙飞船,没必要让用户去「学习以下」,尤其是C端产品。

所以,我们可以把「学习能力」拆成两个维度来看,即:学习成本和学习意愿 。

学习成本在产品设计中是个负面因素。一个好的产品设计,应该尽量避免让用户花时间去“学习”如何使用。这一点已经被很多成功案例验证了。

比如:苹果和Google的产品,它们通过直观的操作逻辑和有意义的动效设计,给用户提供线索,让用户一看就懂、一用就会。这就是,降低学习成本的经典方法。

即便是为飞行员,设计宇宙飞船的操作界面(不好意思,刚看完《星际穿越》……),我相信设计者也会尽量遵循「学习成本越低越好」的原则;复杂的功能可以通过优化设计变得更易上手,而不是让用户去适应复杂性。

学习意愿则是另一个维度。

用户为什么会愿意去学习?因为他们有需求。比如,用户想给家人买一张去新疆的机票,但订票网站特别复杂,他们只能硬着头皮摸索、尝试。这是外在因素驱动的学习意愿。

还有内在因素,比如社交产品。用户为了认识新朋友、和老朋友保持联系、和家人分享生活,会主动去学习如何使用这些产品,甚至琢磨出一些“使用策略”。

所以,设计一个产品时,认真考虑学习成本和学习意愿是非常有价值的。

C端产品,尤其是面向大众的产品,90%以上的用户是小白。他们不是不聪明,也不是学不会,而是不屑于学,或者有太多选择可以替代你的产品。

既然这样,产品经理的目标是不是应该设计出最简单、最适合他们的产品呢?

我的理解:是。

所以,不要搞什么与用户操作相悖的地方了。也许,不要让人觉得麻烦,也不要让用户觉得自己笨,才是重点。反正我使用AI产品,一根脑神经都不想动;要是你乐意,我只能说:哥、姐,你真是人形算力。

参与讨论

回到顶部