让 Agent 从“会生成”走向“可交付”：快手直播客户端 Agent Verify体系建设

课程 ID: 19351

描述:
话题概述: 随着 AI Coding 和各类 AI 工具快速普及，研发效能提升开始进入新的瓶颈期：代码生成越来越快，但复杂业务场景下，Agent 是否真的把事情做对，仍然很难稳定验证。尤其在直播客户端这类高实时、多状态、强交互的场景中，很多问题并不是“能不能点到按钮”或“截图看起来对不对”，而是业务链路是否真实生效、关键状态是否到达预期、失败时能否快速定位根因。基于这一背景，我们在项目中建设 Verify 能力，希望让 Agent 从“辅助编码和操作界面”，进一步升级为“能构造场景、判断结果、沉淀证据，并驱动修复闭环”的研发研发伙伴演讲题纲: 话题亮点：核心思路是把“验证”从传统的黑盒 UI 检查，升级为面向业务结果的证据驱动验证。Agent 不只是模拟用户点击页面，而是围绕一个业务目标，先构造可复现的场景，再触发关键行为，并通过运行时观测、业务状态读取、事件信号和界面结果等多维证据，判断链路是否真正生效。