巧了，我也是

01-06 22:15 门头沟学院 Java

关注

京东搜索推荐算法一面-日常实习

1.PPO、GRPO、DPO 的损失函数
2.给你看 DPO的公式，从数学关系上推一下刚开始的 loss 是多少-这里是In2
3.这里为什么使用 RL，而不是用 RAG去幻觉-RAG 针对于知识缺失去幻觉，RL针对的是行为推理层面去幻觉
4.奖励函数是如何设计的
5.如果一个句子中确定性的词汇比较多，这样导致会不会导致整体句子的熵比较低，如何解决
6.GNN里边你觉得最重要的知识点是什么
7.手撕:合并 K个升序链表

全部评论

推荐最新楼层

长沙学院 Java

如果一个句子中确定性的词汇比较多，这样导致会不会导致整体句子的熵比较低，如何解决咋回答的

点赞回复分享

发布于 01-22 20:24 云南

01-10 14:26

门头沟学院机械设计/制造

写论文的崩溃时刻

由于实习下完班感觉累累的就不想再去看文献什么的，致使我的外文翻译超过限定日期十来天才提交，其实是拖延症导致的，在整理翻译的过程中发现，这玩意真折磨人呐，虽然大体都是用Ai翻译的，但里面有些用词翻译的不太准确，得一个一个去检查修正，除此之外还要排版格式，图片，表格，公式，最要命的是公式，有很多个希腊字母的符号，laplace变换，傅里叶变换......今天总算是整理完并提交了，下一个进展就是要开始整文献综述了，也是有点小 头疼......

写论文的崩溃时刻

点赞评论收藏

分享

2025-12-31 13:20

北京大学算法工程师

字节大模型算法日常实习一面凉经

1. 这个岗位是抖音电商岗位，在data部门，主要是做山寨商标识别的，可能需要用到多模态模型对山寨logo识别，或用到AIGC模型生成一些山寨logo2. 介绍完自我介绍，就是一道力扣困难题，求两个有序数组中位数，要求时间复杂度log(m+n)，可能需要二分法，但之前看力扣答案还看不明白，再写下去属实是浪费时间3. 项目深挖，主要是问我textual Inverion和Lora的作用，没有问我的论文4. 八股：Lora实现细节，PPO实现细节，是否知道大语言模型常用的旋转位置编码，是否了解deepseek的GRPO，你对多模态模型了解多少5. 思维题：如果你和一个人比赛但是你的胜率较低，你是选择五局三胜还是三局两胜获胜的概率大？答案应该是三局两胜，我跟面试官说可以建一个二叉树用回溯法求全概率然后比较。但是他让我用直觉判断，果然我的直觉是不准的，选了五局三胜。6. 开放题：如果让你去生成一些山寨logo，该怎么做。我回答的是首选图像编辑模型，在原有logo的基础上通过语言进行额外控制，可以最大限度保留原logo特征；因为logo的颜色较为单一，可以考虑用controlnet➕线稿修改的方式生成。线稿修改可以人工提供一些样本，成本相较于直接人工绘制山寨logo较低。

点赞评论收藏

分享

01-07 18:49

已编辑

作为mt，希望你入职第一天是这样的……

虽然我早已不记得，自己入职第一天具体发生了什么（毕竟也不是新手村的人了），但作为mt，倒是可以和大家分享：入职第一天怎么做，能给你未来的导师和同事留下一个好印象📒别迟到！尽量早一点到（或至少准时）绝对是加分项。一个有时间观念的新人，会让同事觉得你态度认真、做事靠谱，第一印象分直接拉满 💯。进工作群后，主动打招呼但不用刻意“装E”，在工作群里简单自我介绍、和大家问声好，还是很有必要的。记住要“大大方方”的啊，让团队感受到你想融入的热情。衣着干净整洁，上班前一天洗澡是基本礼仪，懂的都懂（你不洗澡也至少洗个头！）。穿一件清爽整洁的衣服，传递出你重视这份工作、也尊重身边同事的信号。主动问mt今天要...

小肥罗：我不喜欢送礼物，但我喜欢收礼物（疯狂暗示

）

入职第一天

点赞评论收藏

分享

01-10 10:35

中南大学算法工程师

字节大模型算法日常实习一面 70min

1.GAN和Transformer 这两个分别在你的项目里承担了哪些作用？这两个是怎么帮助你推动模型进行图像或者视频重建并提升性能？2.你的GAN以及生成器和判别器主要负责什么工作的，讲一下他们的核心作用以及怎么协同的3.你做项目的时候是先用的生成器还是判别器，为什么要这样设计呢？4.你的轻量化参差模块在优化Swin transformer发挥的什么作用？5.计算机视觉中多尺度融合是什么含义6.为什么深层次神经网络中提取的图像特征被称为”语义特征”？怎么处理图片信息的，多尺度特征的提取怎么提升的模型性能，你用了什么技术和算法框架去实现的7.在你处理模型时用的什么注意力机制，在大模型图像处理项目时这些模块在整体架构分别承担了什么职责？8.你在里面用的对抗损失函数怎么设计的，怎么结合别的模块使用的9.你用的WGAN，他和原始的GAN是怎么改进梯度问题的，以及损失函数中梯度惩罚项怎么实现的Lipschitz约束10.你说一下逻辑回归他的原理还有适用场景以及如何实现的11.在逻辑回归中，我们一般用交叉墒损失函数，你可以说一下为什么吗？12.你结合一下逻辑回归二分类任务，说一下为什么这种情况经常使用交叉墒损失而不是均方误差损失呢？13.L1L2正则化在机器学习模型中的作用是什么(这里要求写数学公式)14.请详细介绍一下PPO这个在强化学习中的策略优化算法，主要思路和流程是什么15.在PPO的算法损失函数中，有两个操作，一个是clip，还有一个是min，请你说一下这两个操作的方式作用还有他们在PPO中的意义。16.在PPO算法的损失函数设计中，cilp的操作已经能够限制策略更新的幅度确保稳定性，为什么还需要在损失计算中取原始的目标和clip的较小值？如果只保留clip部分，不取较小值会有什么问题？

查看16道真题和解析

点赞评论收藏

分享

01-15 16:15

海康威视_技术支持部_云存储开发工程师(准入职员工)

网易游戏内推，网易游戏内推码

幸福三要素：吃、累、全 关于吃 网易作为互联网行业出名的猪厂，真的是有原因的！作为曾经的员工，不得不夸夸网易，第一个优点是有饭堂，第二个优点是饭堂真的太多好吃的，单单自选菜式，每顿就有十几种不同的菜可选，还有粥粉面、麻辣烫、汉堡薯条、铁板饭、健康餐……近乎完美地覆盖到不同口味的同事需求！此外，早餐和宵夜都是免费的！早餐样式也很多，好喜欢吃蜂蜜蛋糕、蛋挞和肠粉！！宵夜的话也有几种选择，但是得加班到点才能领取，一般是面包+水果+牛奶，也还阔以！ 所以，如果入职网易一点也不用担心每天吃啥！ 关于累 感到累才会有所获，个人感觉工作强度还是相对较大的，而且非常卷。除了刚入职的一段时间，后面基本上每天都要...

网易游戏公司福利 587人发布

点赞评论收藏

分享

评论

2

2

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些公司开春招了？ #

11869次浏览 123人参与

# 四大天坑是哪四家？ #

101234次浏览 235人参与

# 上班以后，你还有哪些坚持的爱好？ #

8059次浏览 185人参与

# 一人一个landing小技巧 #

142938次浏览 1497人参与

# 你最近因为什么迷茫？ #

36320次浏览 582人参与

# 互联网公司评价 #

479437次浏览 4086人参与

# 你觉得什么岗位会被AI替代 #

34769次浏览 230人参与

# 我和mentor的爱恨情仇 #

101533次浏览 919人参与

# 找工作以来，你最看不惯__ #

16617次浏览 331人参与

# 工作压力大怎么缓解 #

138521次浏览 1251人参与

# 聊聊你的被动加班经历 #

3826次浏览 72人参与

# 实习离职怎么跟领导说 #

76091次浏览 432人参与

# AI coding的好用工具分享 #

20476次浏览 397人参与

# 实习教会我的事 #

51985次浏览 408人参与

# 实习怎么做才有更好的产出 #

13327次浏览 239人参与

# 百度工作体验 #

302357次浏览 2219人参与

# 百度求职进展汇总 #

653969次浏览 6275人参与

# 你今年的保底offer是哪家 #

164501次浏览 701人参与

# 你都在哪些场所面过试？ #

21637次浏览 233人参与

# 实习生工资多少才算正常？ #

14050次浏览 210人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务