课程 ID: 19351
描述:
话题概述:
随着 AI Coding 和各类 AI 工具快速普及,研发效能提升开始进入新的瓶颈期:代码生成越来越快,但复杂业务场景下,Agent 是否真的把事情做对,仍然很难稳定验证。尤其在直播客户端这类高实时、多状态、强交互的场景中,很多问题并不是“能不能点到按钮”或“截图看起来对不对”,而是业务链路是否真实生效、关键状态是否到达预期、失败时能否快速定位根因。基于这一背景,我们在项目中建设 Verify 能力,希望让 Agent 从“辅助编码和操作界面”,进一步升级为“能构造场景、判断结果、沉淀证据,并驱动修复闭环”的研发研发伙伴
演讲题纲:
话题亮点:
核心思路是把“验证”从传统的黑盒 UI 检查,升级为面向业务结果的证据驱动验证。Agent 不只是模拟用户点击页面,而是围绕一个业务目标,先构造可复现的场景,再触发关键行为,并通过运行时观测、业务状态读取、事件信号和界面结果等多维证据,判断链路是否真正生效。