阿里健康搜推算法一面 1h

前段时间面的阿里健康,感觉问的不是很难,基本上都答出来了,但是没有后续了,发下面经攒攒人品
1.选一个项目进行介绍
2.infoNCE loss是计算公式是什么?为什么使用这个损失函数?
3.为什么模型结构要换成HSTU?
4.Cross attention和普通的self attention有什么区别?
5.Flash attention的原理是什么?
6.Self attention的 self 体现在哪里?为什么要使用多头?这个多头是怎么实现的? 
7.为什么QK点积需要除以根号d k?
8.什么是kv cache?
9.介绍一下什么是因果掩码?
10.SFT微调和预训练之间的区别?
11.为什么现在的大模型都使用因果掩码?
12.普通的推荐模型和大模型之间有什么关联?生成式推荐了解吗?
全部评论
大佬,问一下简历上准备的什么搜推项目
点赞 回复 分享
发布于 02-11 20:25 河南

相关推荐

本人bg南京中9本硕垃圾工科专业共有3段产品实习经历,两段本地小厂,一段苏州   momenta南京的钉钉悟空商业拓展专员4-22投递4-24一面面试官是+1的业务面,问的基本上都是为什么想要来做bd以及曾经的项目内容拷打,本人前三段实习都是产品和运营相关,硬往上扯到想做bd,每个问题本人都扯的比较发散,基本上都是我在说,反问后面试官直接说会继续推进4-25二面面试官是区域的bd总监,自我介绍完之后也是再问为什么想要做bd,然后就是拷打简历,实习遇到过的最大的困难和解决方案,ai工具的应用,同样是本人讲的比较多,反问完后表明会向后推进5-7三面面试官是hrg,早就听说阿里的hrg权力较大,存在压力面和一票否决的权利,上来还是为什么做bd,然后设置了有些场景,商业拓展的方法,遇到挫折怎么办,如何和客户沟通交流,抗压能力,能否接受99加班,是否有别家offer等,由于面试官还有下一场面试,故30分钟就草草结束,反问环节询问得知,该岗位就是按照实习-转正来招的,入职后为p5,薪资构成不是底薪加绩效。5-8询问hr,口头表明应该是过了,后续招聘同事会联系我有点疑惑是否该接这个offer,从前职业规划为做产品或是运营,由于本人暑期实习投递4月中才开始,导致基本接不到面,hc应该都没了,腾讯,阿里蚂蚁字节vivo,荣耀等都在泡池子,不知道是否该接这个offer,不过offer下来似乎还需要一段时间,感觉可以观望一下,能都接到别家面试。阿里钉钉的悟空agent的tob销售,有没有懂的哥姐来给我科普一下正式工的工作内容,大概薪资以及发展情况啊有点迷茫,想要留南京,但是大厂几乎为0,是否可以先进去,后续再看看是否匹配,得到title再按照产品写到简历参加秋招?求解惑
查看10道真题和解析
点赞 评论 收藏
分享
05-07 22:16
已编辑
门头沟学院 Java
发帖攒人品 4.3一面(50min):项目问了大概十分钟对数据库增删改查频繁的情况怎么处理jvm调优,出现oom如何排查MySQL索引的作用?什么时候适合建索引,什么时候不适合?线程池的作用,线程池的核心参数,核心线程数的设置,什么是io密集型和CPU密集型任务equals比较的是什么为什么重新equals方法也要重写hashcode哈希表put一个元素的流程平时如何使用ai辅助编码?skill是什么Redis单点访问过大如何处理spring和springboot的关系transactional注解什么情况会失效及应对情况了解jdk新版本的内容吗?虚拟线程是什么手撕: 动态规划爬楼梯4.10二面(25min):平时使用的什么消息队列?消息队列的作用?为什么不用线程池替换?rocketmq怎么做消息持久化的Redis为什么快Redis单节点能抗多少请求,怎么来的详解Redis有哪些数据结构,zset底层实现,各适用于什么场景为什么使用线程池?线程池核心线程数如何设置?核心线程数是在加载的时候创建还是在执行的时候创建?MySQL单表数据量上限平时用的什么垃圾收集器?g1的region设置的是数量还是大小?设置的数量大了还是小了对gc有什么影响?了解agent吗?短期记忆和长期记忆如何实现?cv和nlp的关联(简历上写了自己投的cv论文)无手撕给孩子过吧4.14 ai面(35min)5.6 hr电话过来没接到,回拨打不通5.7 hr电话过来依然没接到,但是回拨打通,电话hr面,并发英语评测5.7 英语评测(30min)应该挂了,感觉做的一坨
查看22道真题和解析
点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务