首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
求offer的猫头鹰很漂亮
2024-09-14 07:26
门头沟学院 C++
发布于上海
关注
已关注
取消关注
秋招捞人
上海字节 美团 b站有没有好心人可以捞一下我,进度一直在初筛,岗位方向是算法推理引擎😁
全部评论
推荐
最新
楼层
牛客599676869号
Нижегородский государственный технический университет им. Р. Е. Алексеева C++
这还不明白吗,没hc了
点赞
回复
分享
发布于 2024-09-14 09:11
上海
暂无评论,快来抢首评~
相关推荐
04-11 10:51
电子科技大学 算法工程师
26届暑期实习防焦虑帖!!
师弟师妹们好呀!看到大家最近为暑期实习忙碌的身影,作为经历过这段历程的师兄,真的很理解你们的心情。这几年帮助内推的过程中,我见证了许多同学的成长,想和大家分享几点心得: 1. 认清暑期实习的本质暑期实习是企业提前选拔人才的机会,因此标准往往比秋招更高。企业投入资源培养实习生,是希望未来能留住优秀人才。即使名校同学,在这个过程中遇到挫折也很正常,千万不要因此否定自己。 2. 暑期实习≠秋招结果- 能拿到暑期offer的同学确实优秀,但没拿到也不代表秋招没机会- 往届很多同学没有暑期实习,却在秋招早期就收获满意offer- 甚至有些同学在秋招初期就锁定目标,后续面试都婉拒了 3. 关于70%HC的...
Kyle师兄:
有任何问题也可私聊Kyle师兄聊一聊
软开人,秋招你打算投哪些公司呢
点赞
评论
收藏
分享
04-29 14:44
上海交通大学 C++
暑期实习offer帮选
投票
👋个人背景:security方向硕士👏offer1:高德-算法工程师-安全算法。主要做风控类的工作,最近在用大模型agent做漏洞挖掘,base北京,作息10-9-5。优点是跟硕士方向很匹配,进去感觉直接是舒适区,转正率高,部门内部人员很稳定,有很多十年老员工。但秋招不考虑北京的岗位所以去基本是镀金。💯offer2:美团-大模型算法工程师。部门业务是做数字人直播,作息10-8-5。优点是base上海,而且新兴业务发展潜力比较大。缺点是新兴业务容易整个部门裁掉..🌱offer3:vivo-安全算法。部门业务是做整个v厂的隐私合规和风险控制算法,作息9-6-5。硬件厂的共同优点是相对不卷,缺点是面试的感觉是进去很难学到东西。#offer比较#
投递美团等公司7个岗位
点赞
评论
收藏
分享
04-12 07:59
已编辑
门头沟学院 C++
B站暑期还有hc吗?
如题,B站无论是春招还是暑期是不是都没什么hc啊?就摆个招聘好玩的双非非科班转码的前路到底在哪#牛客AI配图神器#
点赞
评论
收藏
分享
05-01 19:10
中山大学 算法工程师
为什么现在 LLM 很少使用 Dropout了?
翻遍各种大模型的实现,虽然结构上可能保留了 dropout 的实现,但是采样概率都设置为 0 了。唯一一个比较新的,还用 Dropout 的模型是 Meta 训练的 Galactica 模型。那为什么现在不用了呢?核心还是要弄清楚 Dropout 的使用场景。Dropout 之前在深度学习当中是一个特别好用的方法,可以防止过拟合,提高泛化。所以说,当模型较大,数据较少的时候,使用 Dropout 是比较合适的。现在大模型处在什么状态呢?✅预训练在预训练阶段,目前可能还是处于欠拟合的状态。之所以说可能,是基于目前公开的一些论文的出的结论。但是现在闭源的公司在采用大量数据合成的情况下,已经训练足够充分或者接近充分也说不定。以 llama 一系列论文为例,训练 llama 1 的时候,龙猫 Scaling law 里面提到 GPT3 是一个训练很不充分的模型。然后给出的数据配比的建议是,10B 的模型要采用 200B 的 token 来训练。但是 llama 1 采用了 7B 的模型,训练量 1T 的 token 发现性能依然有提升。而且预训练所有的语料一般只过一个 epoch,某些特定的领域可能过 2个 epoch,可以认为样本的重复率很低。所以,在数据足够多,多样性足够而且没有太多重复的情况下,大模型在预训练阶段仍然没有过拟合的风险。也就完全不需要采用 dropout。✅Dropout 就完全不需要了么?如果上面的条件不能满足,Dropout 还是有用武之地的。比如前面提到的 Galactica 模型。这个模型和其他大模型不太一样的地方是训练了 4.25 个 epoch,因为他们认为高质量的数据更重要一些,但是又没有那么多,所以就 repeat 数据了。在论文《To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis》 中,详细列举了数据 Repeat 对训练 LLM 的影响,并且证明了 Dropout 可以缓解数据重复带来的性能损失。在文章《Can LLMs learn from a single example?》中,也提到了在 SFT 的时候,少量的重复数据就会降低模型的性能。这也符合常理,SFT 的数据分布和预训练的通常是不太一样的,重复的数据会让模型拟合新的分布,从而忘掉旧的分布。文中同样也提到 Dropout 可以缓解数据重复带来的影响。所以 Dropout 在数据量较少,多样性不高,需要 repeat 的场景下,依然是一个减少过拟合的很方便的手段。比如现在已经有一些在 LoRA 微调的时候采用 Dropout 的研究了。#算法# #简历中的项目经历要怎么写# #算法岗面试# #互联网大厂招聘# #大模型# #大模型面经#
简历中的项目经历要怎么写
点赞
评论
收藏
分享
04-10 19:44
南京大学 算法工程师
求助,选大模型or搜广推…
研一在读,本硕C9,实验室做的是cv相关的工作,但是显卡资源很少。未来可能考虑大模型或者搜广推方向,目前无实习无论文,导师给的指导很少,大佬们推荐一下该选哪个方向…#牛客AI配图神器#
牛客916098993号:
搜推常青树只需要卷实习就够了,llm现在就有卷论文的趋势了,实习难找的一批。换我回到研一就走搜推算了,泪啊。
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
1
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
以Mentor视角,说说喜欢什么样的实习生
3.6W
2
...
可是妈妈,我好像没那么优秀
1.7W
3
...
京东开抢头部技术人才了!薪酬还能再创新高吗?
1.3W
4
...
越是平平无奇的人越喜欢说风凉话嘲讽他人
8873
5
...
节孝子,启动!
4570
6
...
校招0offer偷走了属于我的自信心
4486
7
...
一名双非本科上岸的经历
3990
8
...
携程已OC:求职总结版
3895
9
...
滴滴前端凉经
3703
10
...
成年以后,我们需要尽快学会“课题分离”
3335
创作者周榜
更多
正在热议
更多
#
面试问题记录
#
22049次浏览
365人参与
#
面试经验谈
#
14206次浏览
216人参与
#
京东TGT
#
29688次浏览
152人参与
#
职场新人生存指南
#
334020次浏览
7159人参与
#
面试吐槽bot
#
2799次浏览
36人参与
#
异地恋该为对方跳槽吗
#
24392次浏览
120人参与
#
硬件人更看重稳定还是高薪
#
39541次浏览
204人参与
#
硬件人秋招的第一个offer
#
66067次浏览
1082人参与
#
机械求职避坑tips
#
41524次浏览
355人参与
#
租房找室友
#
28298次浏览
147人参与
#
上班苦还是上学苦呢?
#
214058次浏览
1288人参与
#
滴滴工作体验
#
23793次浏览
123人参与
#
不考虑转正,实习多久合适
#
24663次浏览
119人参与
#
对妈妈没说出口的话
#
6779次浏览
198人参与
#
学历or实习经历,哪个更重要
#
114577次浏览
753人参与
#
硬件人你反向读研了吗
#
40303次浏览
608人参与
#
深信服求职进展汇总
#
189053次浏览
1694人参与
#
得物求职进展汇总
#
92780次浏览
792人参与
#
你遇到过哪些神仙同事
#
69875次浏览
623人参与
#
材料进Fab厂真的劝退吗?
#
36552次浏览
158人参与
#
非技术岗投递进展
#
137600次浏览
1222人参与
牛客网
牛客企业服务