对 Agent 产品形态及 AstrBot 发展方向的一些思考

今天和某 AI 初创合伙人吃了一顿晚餐，我们畅谈了各自对 AI Agent 未来交互形态的思考、目前各种类型的 AI Agent 产品以及我创业的一些想法。我们聊的很开心。在这里我将一些我的思考和见解写下来，希望对未来的自己有帮助。

目前多数 General Agent 产品（比如 Manus、OK Computer、Minimax Agent）偏向于单轮对话（或者轮数较低的多轮对话），并没有考虑长周期的用户需求。这类产品目前尚不成熟，完成一个复杂任务的成功率不可观，但随着模型 Agentic 性能的提升（这也是今年所有模型厂商的一个发展趋势），将会以更少的重试次数和 token 数，逐渐完成更复杂的任务。最终确实能够提高生产力，但依旧只是中间形态。某些 General Agent 产品依赖于中心化的基础设施，并且开销巨大，难以支撑大规模的用户量级。
AI 陪伴类产品（比如 Google 的 Character AI、酒馆、Minimax 的星野 AI、猫箱、筑梦岛等；硬件产品或公司如小智、芙崽、萌友智能、跃然创新等）的难点在于算法的稳定性和效果需要长周期的检验，并且效果难以量化，强依赖用户反馈。并且算法难度、多样性相较于 General Agent 要更五花八门，比如 Memory、情绪模型、多模态交互等。此外，用户的陪伴需求是强因人而异的，千人千面。有人需要解决生理需求、有人需要解决心理需求，技术难以完全覆盖所有人的预期。此外，用户的情绪需求是会变化的，可能今天用户需要一个 AI “女朋友”，但是第二天现实生活中有女生来找用户聊天，用户获得了满足感，就大概率可能放弃继续使用。也源源不断有 AI 陪伴应用宣布死亡，比如阶跃的冒泡鸭、Soul 的异世界回响等。
产品存在的理由是能够给用户创造价值，好的产品能够持续给用户创造价值。对于 Agent 产品，这里的价值我划分为两类——生产力价值和情绪价值。而 Agent 的终极形态，从我个人而言，应该是同时提供生产力价值和情绪价值的。General 的工具调用能力、Memory 和情绪都需要具备。此外，它应该具有主动性，主动了解用户背景，比如学习用户的使用习惯、总结用户的画像，并适时给予用户建议；主动学习外部信息，并在新的一轮与用户的交互中带来更新的知识。抽象出来就是，以最优的方式持续获得最优质和尽可能多的用户 Context。
AstrBot 目前已经具备可观的用户基数，其主要的交互模型是接入各个消息平台，通过消息平台的接口来交互。然而，交互只是一个产生与用户 Context 的一个壳，消息平台是以图文为主的交互模式，得到的用户 Context 终究有限，如果要在 AstrBot 上落地 Agent 终极形态，未来 AstrBot 就应该将这个壳和 Agent Core 隔离开，并实现能够产生更多用户 Context 的壳，比如 GUI，也就是 Local Agent；再比如硬件，又或者是 GUI + 硬件。目前 GUI 结合的 Agent 交互形态除了 ChatBot 还有模拟 OS、画布、桌宠、Browser 等等，大家正在积极探索最合适的交互形态。此外，AstrBot 需要开发一个命令式的 SDK，并且这个 SDK 应该实现构建到部署再到反馈的闭环。作为开源社区，AstrBot 社区如果要可持续发展，就不可避免地需要引入商业模式，开源版 + 商业版结合是可行的也是经过开源社区和市场考验的一条出路。具体的商业模式可以是提供 SaaS 一样的服务。虽然这也不可避免地引入开源贡献者的利益分配问题，但这是一件很容易解决的事情。
创业最重要的是找对合伙人。不需要合格，但一定要合适。技能互补很重要，一个人的成功概率太低。

Categories