首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
南山不会开梅花
03-18 17:51
未填写教育信息 Java
发布于江苏
关注
已关注
取消关注
网易五题A4题笔试没过
估计还是卡本科学校,哈哈哈,有实习有竞赛有项目但本科不行,感觉字节坐牢了
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
04-10 11:43
上海师范大学 运营
离境退税这招也太牛了吧!怎么想出来的啊?
加我关税?那我就直接拉老外来家里买,不走出口这条线好绝好绝啊再加上之前的对外免签证240小时旅游政策再加上甲亢哥带来的热度,活生生的招牌妈呀,细思极恐!丝滑小连招,但凡有一个顺序变了都不达到效果。太高明了!太聪明了!难怪我从不了政🥹
中美关税战对我们有哪些影响
点赞
评论
收藏
分享
昨天 07:49
中山大学 算法工程师
为什么现在 LLM 很少使用 Dropout了?
翻遍各种大模型的实现,虽然结构上可能保留了 dropout 的实现,但是采样概率都设置为 0 了。唯一一个比较新的,还用 Dropout 的模型是 Meta 训练的 Galactica 模型。那为什么现在不用了呢?核心还是要弄清楚 Dropout 的使用场景。Dropout 之前在深度学习当中是一个特别好用的方法,可以防止过拟合,提高泛化。所以说,当模型较大,数据较少的时候,使用 Dropout 是比较合适的。现在大模型处在什么状态呢?✅预训练在预训练阶段,目前可能还是处于欠拟合的状态。之所以说可能,是基于目前公开的一些论文的出的结论。但是现在闭源的公司在采用大量数据合成的情况下,已经训练足够充分或者接近充分也说不定。以 llama 一系列论文为例,训练 llama 1 的时候,龙猫 Scaling law 里面提到 GPT3 是一个训练很不充分的模型。然后给出的数据配比的建议是,10B 的模型要采用 200B 的 token 来训练。但是 llama 1 采用了 7B 的模型,训练量 1T 的 token 发现性能依然有提升。而且预训练所有的语料一般只过一个 epoch,某些特定的领域可能过 2个 epoch,可以认为样本的重复率很低。所以,在数据足够多,多样性足够而且没有太多重复的情况下,大模型在预训练阶段仍然没有过拟合的风险。也就完全不需要采用 dropout。✅Dropout 就完全不需要了么?如果上面的条件不能满足,Dropout 还是有用武之地的。比如前面提到的 Galactica 模型。这个模型和其他大模型不太一样的地方是训练了 4.25 个 epoch,因为他们认为高质量的数据更重要一些,但是又没有那么多,所以就 repeat 数据了。在论文《To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis》 中,详细列举了数据 Repeat 对训练 LLM 的影响,并且证明了 Dropout 可以缓解数据重复带来的性能损失。在文章《Can LLMs learn from a single example?》中,也提到了在 SFT 的时候,少量的重复数据就会降低模型的性能。这也符合常理,SFT 的数据分布和预训练的通常是不太一样的,重复的数据会让模型拟合新的分布,从而忘掉旧的分布。文中同样也提到 Dropout 可以缓解数据重复带来的影响。所以 Dropout 在数据量较少,多样性不高,需要 repeat 的场景下,依然是一个减少过拟合的很方便的手段。比如现在已经有一些在 LoRA 微调的时候采用 Dropout 的研究了。
点赞
评论
收藏
分享
04-11 10:51
电子科技大学 算法工程师
26届暑期实习防焦虑帖!!
师弟师妹们好呀!看到大家最近为暑期实习忙碌的身影,作为经历过这段历程的师兄,真的很理解你们的心情。这几年帮助内推的过程中,我见证了许多同学的成长,想和大家分享几点心得: 1. 认清暑期实习的本质暑期实习是企业提前选拔人才的机会,因此标准往往比秋招更高。企业投入资源培养实习生,是希望未来能留住优秀人才。即使名校同学,在这个过程中遇到挫折也很正常,千万不要因此否定自己。 2. 暑期实习≠秋招结果- 能拿到暑期offer的同学确实优秀,但没拿到也不代表秋招没机会- 往届很多同学没有暑期实习,却在秋招早期就收获满意offer- 甚至有些同学在秋招初期就锁定目标,后续面试都婉拒了 3. 关于70%HC的...
Kyle师兄:
有任何问题也可私聊Kyle师兄聊一聊
软开人,秋招你打算投哪些公司呢
点赞
评论
收藏
分享
昨天 21:25
The University of Nottingham 营销
求问网易互娱的暑期转正率
想问问网易这边暑期实习转正率如何呢?需要做到什么程度才可以转正呀
投递网易游戏等公司7个岗位
点赞
评论
收藏
分享
昨天 11:12
浪潮集团_后端开发工程师(实习员工)
京天威一面+HR面
面试官是一个HR面试官+一个技术面试官1.先做个自我介绍2.HR问想走的方向,想走toc,但是公司是以tob为主。3.拷打实习项目还有技术栈,上一家公司能不能给你转正,为什么离开想来我们这。4.java的==和equals有什么区别?5.高精度场景,使用什么数据类型?6.String、StringBuilder、StringBuffer的区别?7.String为什么不能修改?8.了解stream流吗?IO的9.ArrayList和LinkedList的区别10.知道什么国产的东西吗?数据库中间件都可以(友友之前了解过达梦,没有一点犹豫直接达梦)11.使用过什么数据库?(关系的我说了4个,非关系...
查看16道真题和解析
菜鸟友友的实习面经
职场新人生存指南
点赞
评论
收藏
分享
一键发评
本科很重要啊
接好运
忍耐王
字节真的卷
项目经历如何
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
以Mentor视角,说说喜欢什么样的实习生
2.0W
2
...
心塞
5973
3
...
京东开抢头部技术人才了!薪酬还能再创新高吗?
5634
4
...
携程笔试
5295
5
...
越是平平无奇的人越喜欢说风凉话嘲讽他人
5273
6
...
为何我今年的大厂面试体验越来越糟糕😢
4942
7
...
节孝子,启动!
4013
8
...
校招0offer偷走了属于我的自信心
3097
9
...
携程已OC:求职总结版
2775
10
...
2025/5/8 后端机考笔试java卷
2675
创作者周榜
更多
正在热议
更多
#
硬件人你反向读研了吗
#
39318次浏览
608人参与
#
硬件人秋招的第一个offer
#
65090次浏览
1081人参与
#
京东TGT
#
22965次浏览
146人参与
#
非技术岗投递进展
#
137320次浏览
1222人参与
#
滴滴工作体验
#
22800次浏览
123人参与
#
材料进Fab厂真的劝退吗?
#
35638次浏览
158人参与
#
机械求职避坑tips
#
40637次浏览
355人参与
#
不考虑转正,实习多久合适
#
23580次浏览
117人参与
#
职场新人生存指南
#
328879次浏览
7044人参与
#
机械只有转码才有出路吗?
#
125690次浏览
1590人参与
#
互联网回暖,腾讯要招5000+人!
#
263419次浏览
4888人参与
#
面试经验谈
#
10103次浏览
147人参与
#
面试问题记录
#
13824次浏览
258人参与
#
vivo求职进展汇总
#
208496次浏览
1341人参与
#
异地恋该为对方跳槽吗
#
21538次浏览
112人参与
#
硬件人更看重稳定还是高薪
#
36758次浏览
196人参与
#
租房找室友
#
26631次浏览
142人参与
#
你遇到过哪些神仙同事
#
68944次浏览
623人参与
#
25届如何提前做秋招准备?
#
163694次浏览
2451人参与
#
携程求职进展汇总
#
485647次浏览
3577人参与
#
深信服求职进展汇总
#
188187次浏览
1692人参与
牛客网
牛客企业服务