Soulter's Blog
The world is your canvas!
1.5k words

对 Agent 产品形态及 AstrBot 发展方向的一些思考

今天和 Fellou AI 的一个合伙人吃了一顿晚餐,我们畅谈了各自对 AI Agent 未来交互形态的思考、目前各种类型的 AI Agent 产品以及我创业的一些想法。我们聊的很开心。在这里我将一些我的思考和见解写下来,希望对未来的自己有帮助。

  1. 目前多数 General Agent 产品(比如 Manus、OK Computer、Minimax Agent)偏向于单轮对话(或者轮数较低的多轮对话),并没有考虑长周期的用户需求。这类产品目前尚不成熟,完成一个复杂任务的成功率不可观,但随着模型 Agentic 性能的提升(这也是今年所有模型厂商的一个发展趋势),将会以更少的重试次数和 token 数,逐渐完成更复杂的任务。最终确实能够提高生产力,但依旧只是中间形态。某些 General Agent 产品依赖于中心化的基础设施,并且开销巨大,难以支撑大规模的用户量级。

  2. AI 陪伴类产品(比如 Google 的 Character AI、酒馆、Minimax 的星野 AI、猫箱、筑梦岛等;硬件产品或公司如小智、芙崽、萌友智能、跃然创新等)的难点在于算法的稳定性和效果需要长周期的检验,并且效果难以量化,强依赖用户反馈。并且算法难度、多样性相较于 General Agent 要更五花八门,比如 Memory、情绪模型、多模态交互等。此外,用户的陪伴需求是强因人而异的,千人千面。有人需要解决生理需求、有人需要解决心理需求,技术难以完全覆盖所有人的预期。此外,用户的情绪需求是会变化的,可能今天用户需要一个 AI “女朋友”,但是第二天现实生活中有女生来找用户聊天,用户获得了满足感,就大概率可能放弃继续使用。也源源不断有 AI 陪伴应用宣布死亡,比如阶跃的冒泡鸭、Soul 的异世界回响等。

  3. 产品存在的理由是能够给用户创造价值,好的产品能够持续给用户创造价值。对于 Agent 产品,这里的价值我划分为两类——生产力价值和情绪价值。而 Agent 的终极形态,从我个人而言,应该是同时提供生产力价值和情绪价值的。General 的工具调用能力、Memory 和情绪都需要具备。此外,它应该具有主动性,主动了解用户背景,比如学习用户的使用习惯、总结用户的画像,并适时给予用户建议;主动学习外部信息,并在新的一轮与用户的交互中带来更新的知识。抽象出来就是,以最优的方式持续获得最优质和尽可能多的用户 Context。

  4. AstrBot 目前已经具备可观的用户基数,其主要的交互模型是接入各个消息平台,通过消息平台的接口来交互。然而,交互只是一个产生与用户 Context 的一个壳,消息平台是以图文为主的交互模式,得到的用户 Context 终究有限,如果要在 AstrBot 上落地 Agent 终极形态,未来 AstrBot 就应该将这个壳和 Agent Core 隔离开,并实现能够产生更多用户 Context 的壳,比如 GUI,也就是 Local Agent;再比如硬件,又或者是 GUI + 硬件。目前 GUI 结合的 Agent 交互形态除了 ChatBot 还有模拟 OS、画布、桌宠、Browser 等等,大家正在积极探索最合适的交互形态。此外,AstrBot 需要开发一个命令式的 SDK,并且这个 SDK 应该实现构建到部署再到反馈的闭环。作为开源社区,AstrBot 社区如果要可持续发展,就不可避免地需要引入商业模式,开源版 + 商业版结合是可行的也是经过开源社区和市场考验的一条出路。具体的商业模式可以是提供 SaaS 一样的服务。虽然这也不可避免地引入开源贡献者的利益分配问题,但这是一件很容易解决的事情。

  5. 创业最重要的是找对合伙人。不需要合格,但一定要合适。技能互补很重要,一个人的成功概率太低。

Comments