研二大模型算法求助

友友们,本人研二,211本硕,大模型方向,导师散养,无相关论文。目前有一段中小厂的大模型算法实习,方向文本处理(感觉用处不大)。目前在自学多模态。
😭如果目标秋招大厂,明年暑期之前是all in大模型,找一个多模态相关的大厂日常实习;还是该转学java啊😭;还是转学搜广推。
感觉时间好紧张,感觉自己去年选错路了😥😥
全部评论
多模态相关的大厂日常实习,实习期间卷一篇论文,秋招乱杀。搜广推没多少东西,到时候想转1个月复习就差不多了。llm,vllm等其他基本功平时就要整理,到时候集中复习,而不是集中学。
14 回复 分享
发布于 2024-11-15 13:34 北京
大模型更卷但是上限更高,搜推基本有实习就能拿不错的包了,感觉看自己取舍吧
4 回复 分享
发布于 2024-12-04 21:28 天津
我是双非本,双非硕,已经拿到上市公司的算法offer了
3 回复 分享
发布于 2024-11-15 22:56 黑龙江
我双非本硕,组里搞嵌入式的,感觉薪资不太行,上限也很低,solo搞大模型了,其实是独自撞南墙没事,环境不好,不行就去开发吧
1 回复 分享
发布于 2024-12-06 12:57 江苏
研二大模型方向?
1 回复 分享
发布于 2024-11-25 15:50 安徽
和我情况一模一样
1 回复 分享
发布于 2024-11-21 12:32 北京
我也是,难兄难弟啊
点赞 回复 分享
发布于 2024-12-12 00:27 江苏
情况差不多
点赞 回复 分享
发布于 2024-12-09 19:04 江苏

相关推荐

1️⃣抖音一面1、聊项目。2、AUC的两种公式是?你能证明这两种等价的吗?3、BERT-CRF中,为什么要加CRF?好处是?4、self-attention为什么要用QKV三个矩阵,不用有什么问题?有没有哪个模型的Q和K矩阵是一样的?5、reinforce属于on-policy还是off-policy?为什么?6、reinforce带上baseline好处是?reinforce的loss写一下?7、策略梯度会推导吗?简单写一下?8、代码题(代码题一般别着急写,先跟面试官说下思路,确定了再写):lc 46,全排列(lc表示leetcode,下同)。lc 73,矩阵置0。2️⃣抖音二面1、介绍项目。2、知识蒸馏有哪几种?你觉得哪种效果最好?3、nlp的数据增强方法,主要有哪几种?每一种举个例子?4、分类的损失函数为什么是交叉熵而不是mse?5、BERT对输入文本的长度有什么限制,为什么要限制长度呢?6、BigBird里面有哪几种注意力机制?相比原始transformer的self-attention的优势?7、场景题:如何根据拼多多的商品数量,估计淘宝的商品数量?8、给出emb_size, max_len, vocab_size, ff_inner_size,num_heads, 12层,求BERT参数量。9、代码题:n皇后问题。3️⃣抖音三面‍1、简单聊项目。2、CRF和HMM区别?CRF为什么比HMM效果好?3、如果BERT词表很大,比如vocab_size达到几百万,怎么办?4、快速手写一些transformer的mha(多头注意力),伪代码意思一下就行。5、为什么对比学习中,temperature很小,而知识蒸馏的temperature比较大?6、你觉得在抖音买东西,和淘宝、拼多多他们的区别是?(我没在抖音买过,就只能现场编。)7、你最近看到过哪些paper?简单介绍下?8、你觉得自己有那些优缺点?平时喜欢怎么缓解压力?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
评论
12
38
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务