4.7智谱华章一二面

一面:

感觉没问什么

像是被迫来面试我的

二面:

被拷打完了

1.这个skill是怎么测评的?(被说明做这个没有意义)

需要有一定的指标,比方说之前生产图片的质量不行,人为进行标注可利用率65%,之后调用完了可利用率到达80%作用,效果非常可观;具体指标这个得根据需求来说,需求覆盖哪些风格,哪些镜头,甚至一致性的,对应出一系列的测试集,可以人工评测也可以用模型去评,重点是评测数据结果。

2.最后用户的使用数据?

没有评测数据,也没有用户的使用数据,那你这个东西做了和没做有什么区别??命中率是如何提升的?

3.所做的任务对于命中率的贡献是多少?

4.工作有问题,对结果并不敏感,做了和没做一样。

反问:公司的评测标准是什么样子的?

根据需求和指标,设计不同的测试集,比方说我们要实现skill,一定是因为我们认为当前阶段用裸模型他没有办法完成我们的交付或者说是技术上的指标;

对于标准产品的话,我们其实会有一些自动化的方法,或者就是跑个评测的agent,然后我们认为评测的agent和我们人工标注对齐,就可以采纳使用了。

核心是评测,而不是评测办法,做一件事情一定是有指标的,去设计一些指标他能准确的评估你对做这件事情的价值。

感觉整场面试全是围绕着指标,感觉面试官讲的很有道理,感觉像是大手子哈哈哈哈

虽然被狠狠拷打了但也是学到了一些思想和方法

加油干吧

全部评论
有的面试官就是有病,在校生基本接触不到生产级别的agent项目,非要问人家实际生产要考虑的问题
1 回复 分享
发布于 04-12 23:23 江苏
感觉问的还行啊
点赞 回复 分享
发布于 04-11 23:20 北京
这个是测试还是agent开发
点赞 回复 分享
发布于 04-11 23:12 辽宁
学到东西了,那这面试值了呢
点赞 回复 分享
发布于 04-11 12:09 陕西
佬 我司考虑么 考虑的话 可以看我主页帖子
点赞 回复 分享
发布于 04-10 13:35 上海
同学,拼多多暑期实习考虑嘛,简历优先筛选,核心部门,hc充足,一对一帮忙跟进进度 服务端研发实习生:https://careers.pddglobalhr.com/campus/intern/detail?t=cIZaQ3ghs7
点赞 回复 分享
发布于 04-10 08:44 上海

相关推荐

4.14 一面横向两天后 4.17流程结束面试问题一、项目相关1. 你先简单介绍一下自己。2. 你的第一个项目(开源操作系统社区)能大概介绍一下吗?3. 你们当时为什么会选择做这样一个偏操作系统底层的项目?4. 这个项目目前是一个开源状态吗?大概有多少 star 和代码量?5. 你在这个项目里面主要做了哪一块的升级改造?6. loop 子系统的作用是什么?你具体实现了哪些功能?7. cgroup 子系统的作用是什么?为什么要实现它?8. 你们再去实现 cgroup 资源控制时,租户路径隔离的方案是怎么样的?9. 你提到的 bug hunter skill 是一个什么样的东西?10. bug hunter skill 怎么样去保证在尽量少的 token 下实现?用的是一套模型还是多套模型?11. 从轻量级往重量级去做的时候,对上下文的理解是怎样的?是一上来就确定模型,还是轻量级效果不好会换?12. callback 之后会有反馈机制或者打标吗?13. 介绍一下第二个项目(serverless 容器平台)。14. 这个 serverless 容器在创建和删除的过程中,如果别人再去操作,隔离是怎么做的?二、技术关注与认知15. 平时会关注哪些技术?我答了cc源码但是面试官好像不理睬三、算法/编程题(AI Coding)16. 构建一个智能旅行助手,需要获取天气、机票、酒店信息,要求保持整体低延迟并行调用。---## 反问环节1. 后续的流程和后续流程的时间大概是?- 尽快横向对比,提报上去,两个工作日内沟通。2. 是两轮技术加一轮 HR 吗?- 是的,两轮技术加一轮 HR。3. 面试官觉得还有什么地方可以再学习?- 面试的岗位是 AI 应用研发,介绍项目时尽量体现出 AI 上的使用场景或应用,要根据岗位来 match。4. 实习生如果进入到这个部门,大概会负责哪些业务?- 会安排新业务场景,不会负责很老的或已成熟的系统。技术栈给到足够自由。商品技术细分商品、商家、价格等,具体团队不确定,但保证是创新性新命题。
查看16道真题和解析
点赞 评论 收藏
分享
评论
4
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务