Agentic 时代的影像生产力:RoboNeo Agent 架构实践

课程 ID: 19350

描述:
话题概述: 随着大模型与多模态技术快速发展,影像创作正在从传统工具式操作,走向自然语言驱动的智能体协作模式。但在真实业务中,影像任务往往涉及修图、设计、视频生成、素材处理等多工具链路,传统方式存在操作门槛高、流程长、个性化表达不稳定、批量生产效率低等问题。 RoboNeo Agent 面向影像生产力场景,将复杂影像需求转化为可对话、可规划、可执行、可持续优化的智能体流程。分享将结合 RoboNeo 的工程实践,拆解其在多 Agent 编排、MCP 工具系统、长期记忆机制、Hooks 可控执行与反馈评测闭环中的关键架构设计。 演讲题纲: 话题亮点: 我们通过引入智能体规划、多 Agent 协同、工具能力抽象、执行控制和长期记忆机制,完成了影像任务从工具调用到智能体能力体系的升级。关键步骤包括将复杂需求拆解为任务流,统一管理底层工具能力,增强任务执行过程的可观测与可干预能力,并沉淀用户长期偏好以提升后续任务一致性。技术攻关主要集中在长链路任务的上下文膨胀、工具路由不稳定、复杂调用失败率高和记忆污染等问题上,早期也踩过让单一 Agent 承担过多职责、规划层直接面对大量工具导致效果波动的坑。