作业帮- AI应用算法一面凉经分享

感觉自己好菜、面试很难,还是要多多练习
1.实习拷打
2.Agent和模型方面你更倾向于什么?为什么在实习还在考虑其他公司?
3.问GUI-Agent项目:背景是什么?为什么这么做?单用SFT不行吗?online的方法是什么?GRPO在这里面起什么作用?你的奖励函数是怎么设计的?为什么这样设计?后续的版本是怎么做的?衰减因子没有考量一下长短链路的问题吗?为什么用2B的模型,其他模型效果应该是可以解决的?图标分不开的情况如果是通过数据层面去解决有试过吗?有考虑过直接做前后状态判别的惩罚解决你遇到的reward hacking问题吗?GRPO有几个模型?损失函数知道吗?reference model具体的作用是什么?
4.你遇到过大模型输出的时候复读机的情况吗?代码:判断复读机情况,最后一次可以不算进去。
5.平时有用哪些AI工具?有自己写过Skill吗?
6.DPO真的有解决你遇到的问题吗?还是那你认为DPO能否解决复读机问题呢?你怎么看SFT和DPO?
全部评论

相关推荐

04-30 16:23
📍上海·长宁|拼多多总部真实工作全记录✨ 先看这份「真实福利清单」✨💰 薪资与回报:行业竞争力薪资:拼多多的薪资在互联网行业有“天花板级别”的说法。对于技术岗,总包涨幅可观,年终奖通常是重要的组成部分。年终激励:根据公开信息,年终奖通常为4个月工资左右,是年度收入的重要部分。🍱 吃在公司,公司管饱:免费三餐+夜宵:公司为员工免费提供早、中、晚三餐,晚上十点后还有夜宵供应。餐食种类丰富,可通过内部APP预订。饮料水果自由:办公区提供多种饮料(可乐、雪碧、元气森林、三得利、东方树叶等)和水果,全天候供应。🚀 你的代码将直面“亿级”战场在这里,你解决的每一个技术问题,都直接服务于数亿用户:核心战场:参与支撑万亿级GMV的电商交易系统,每一行代码都关乎千万消费者的购物体验。技术巅峰:构建支持每秒百万级SKU查询的商品API架构;在618大促期间,处理单日亿级的电子面单调用,峰值达每秒数十万单。全栈挑战:从国内主站到跨境业务Temu,从高并发抢单系统到智能客服,业务场景全面覆盖,技术栈不断演进。🌱 在这里成长,没有“舒适区”扁平透明:层级简单,沟通直接,好想法能快速落地验证。技术驱动:面对的是真实的、大规模的技术难题,如如何防止万人并发抢单超卖、如何设计支撑全球业务的高并发架构。清晰的目标:一切围绕业务结果和技术突破,成长路径明确——要么成为解决复杂问题的技术专家,要么成为驱动业务增长的核心骨干。🎯 我们寻找这样的“硬核”工程师对用技术解决超大规模、高复杂度问题有强烈的热情和好奇心。有扎实的Java/Go基础,并乐于深入分布式系统、高并发架构、云原生等领域。具备“死磕精神”,对技术有追求,不满足于“能用”,追求“极致”。能适应快节奏、高强度的环境,渴望在一个业务飞速发展、技术挑战巨大的平台上,快速成长,创造影响。📮 如何加入这场“硬核”挑战?【拼多多集团-PDD校园招聘】内推链接:https://careers.pddglobalhr.com/campus/grad?t=nZjV6Nsn9m,内推码:nZjV6Nsn9m。期待你的加入!我们一起,无拼不青春!(通过此链接投递计入内推,内推简历优先筛选~)
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务