评估 AI,做好上线前的准备

按照传统软件的观念,只要测试 case 都通过,就可以上线。但 AI Agent 不是这样的,它始终是概率事件,输入 A,预期 B,但还是有可能输出 C,D 的。那如何把握住 AI Agent 项目的质量呢?

测概率而不是结果!

找测试边界,bad case,多生成几百条。结果或许并准确率不高,那就通知下个环节去调整 Prompt,workflow 等。

你把这项能力学会,写在简历上,很亮眼
#简历上如何体现你的“AI”能力?#
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务