作业帮- AI应用算法一面凉经分享

感觉自己好菜、面试很难,还是要多多练习
1.实习拷打
2.Agent和模型方面你更倾向于什么?为什么在实习还在考虑其他公司?
3.问GUI-Agent项目:背景是什么?为什么这么做?单用SFT不行吗?online的方法是什么?GRPO在这里面起什么作用?你的奖励函数是怎么设计的?为什么这样设计?后续的版本是怎么做的?衰减因子没有考量一下长短链路的问题吗?为什么用2B的模型,其他模型效果应该是可以解决的?图标分不开的情况如果是通过数据层面去解决有试过吗?有考虑过直接做前后状态判别的惩罚解决你遇到的reward hacking问题吗?GRPO有几个模型?损失函数知道吗?reference model具体的作用是什么?
4.你遇到过大模型输出的时候复读机的情况吗?代码:判断复读机情况,最后一次可以不算进去。
5.平时有用哪些AI工具?有自己写过Skill吗?
6.DPO真的有解决你遇到的问题吗?还是那你认为DPO能否解决复读机问题呢?你怎么看SFT和DPO?
全部评论

相关推荐

开场: 1、熟悉的语言八股:2、Java 当中的常见集合介绍下3、ConcurrentHashMap Segment 分段锁有什么弊端4、StringBuilder 和 StringBuffer 的区别,**StringBuffer 如何保证线程安全的**5、JVM 内存结构了解吗6、JVM 常见问题排查常用命令知道吗7、Java 基本数据类型和包装类型的区别8、int a = 2; Integer b = 2; a == b; 以及 Integer a = 200; Integer b = 200; a == b; 结果分别是9、B 树和 B+ 树的区别10、Redis 了解吗11、Redis 持久化方式介绍下12、先后执行 set name 张三 和 set name 李四 在 AOF 持久化过程中都写入 AOF 文件吗13、场景:类似 12306 买车票,如何保证多个请求不会发生超卖14、Redis 高可用方案知道哪些15、Redis Cluster 集群如何分配 key 在哪个 slot16、一般什么情况下会用 Redis17、String 类型,如果 value 大小几十兆会怎么样18、Set 类型元素个数过多怎么办19、SQL 语句性能问题如何排查优化20、MySQL 什么情况下会锁表21、场景:一个表,name 字段是非唯一索引,有多条 name = 张三,这个时候查询 where name = 张三,是什么锁22、场景:一个表,用户余额进行扣减,只在MySQL层面,如何保证并发安全23、MySQL 什么情况下加记录锁24、TCP 和 UDP 区别,HTTP 用的哪个传输协议25、HTTP 报文有哪些部分,响应体有哪些类型26、TCP 三次握手和四次挥手过程,为什么不是五次六次其他:27、平时写代码有什么注意的点或者规范吗28、一个大型项目,你会怎么对代码分层29、平时写代码会用到 AI 吗,哪些场景会用30、到岗时间、实习时间、实习地点相关反问:
查看30道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务