1. 实习拷打2. AI Coding 的笔试如果只是人工造 case 去测,你觉得它离生产可交付还差什么人工造 case 只能验证“在已知分布上能不能过样例”,离生产可交付还差三层。第一层是任务边界,要明确输入约束、输出格式、失败语义和回滚策略,不然模型生成的内容没法进入真实工作流。第二层是稳定性,要知道不同仓库规模、不同语言、不同依赖环境下性能会不会抖。第三层是验收能力,必须补静态检查、单测、sandbox 执行、diff 审核和回归评估。没有这些,AI Coding 最多是演示能力,不是工程能力。 def validate_patch(patch, repo_path): if not ...