小米算法offer了!

一面:
梯度爆炸
梯度消失
激活函数
大模型的了解

二面:
论文项目

转部门
一面:
词嵌入
bert
transformer
对大模型的了解
强化学习
还一些八股忘记了

二面:
论文项目
全部评论
大佬,啥背景,学校+论文+实习+项目+竞赛。
7 回复 分享
发布于 2024-01-03 18:16 北京
如果没有别的,就先签了再找找吧
3 回复 分享
发布于 2024-01-03 14:09 北京
看起来都很熟悉😋
2 回复 分享
发布于 2024-01-03 17:21 北京
算法类的八股有专门书籍推荐吗
1 回复 分享
发布于 2024-03-02 21:54 陕西
目前南京还有算法岗位hc~感兴趣私
1 回复 分享
发布于 2024-01-13 13:56 江苏
佬是武汉哪个组的
1 回复 分享
发布于 2024-01-03 11:27 湖北
zqy我居然碰到了你😂
1 回复 分享
发布于 2024-01-02 23:08 福建
请问二面之后多久出的结果啊
点赞 回复 分享
发布于 2024-01-29 11:45 北京
就这么简单的问题?
点赞 回复 分享
发布于 2024-01-11 19:05 安徽
23k吗
点赞 回复 分享
发布于 2024-01-03 18:31 山西
开的啥水平
点赞 回复 分享
发布于 2024-01-03 01:40 湖北
佬,oc和offer之间隔了多长时间呀?base地是哪里呢?
点赞 回复 分享
发布于 2024-01-02 23:00 浙江

相关推荐

发一下问题给大家参考,攒攒人品!1*Agent与Workflow的区别是什么?在实际业务中,你会根据什么标准选择对应的方案2*设计一个企业级Agent架构,如何实现 BFF、Tool Server 与 Worker 的多组件拆分3*在企业级Agent中,怎么实现安全与隔离?权限管理、审计与日志追踪具体的落地方案是什么?4*说一下什么是MCP?它在Agent生态中解决了什么痛点?5*MCP 有哪些具体的分类?Transport 层是怎么工作的?如何开发一个 MCP Server?6*谈谈你对 Claude Code、Manus 这类 Agent 产品的理解,它们的架构逻辑与传统 Chat Agent 有什么差别?它工程部分的能力是怎么实现的?7*如何实现 Claude 的 Agent Research 方法论?Deepsearch 场景下需要配备哪些工具?基础设施与安全挑战在哪里?8*在多轮对话中,分别实现 Short-term memory、Long-term memory 与 Task memory怎么做?9*上下文机制的完整实现流程是怎样的?说一下它的写入策略、读取策略以及 Rerank 的做法是怎么样的。10*当上下文超过 Token 限制时,组合使用 Rolling Summary、State Extraction 与 RAG 这三段式策略?11*说一下Prefix Caching 和 KV Cache 的原理。为什么缓存的是 K 和 V 而不是 Q?不再计算前缀具体节省了哪部分算力?12*引入 Prefix Caching 后,Attention 的计算复杂度是怎么下降的?13*Few-shot在Agent评测中是为了提升能力还是降低方差?在评测Pipeline的哪个阶段注入?如何防止过拟合?14*对比一下Transformer中Self-attention与FFN的作用差异。15*为什么 Prefix Caching 只能优化 Attention 部分,而无法优化 FFN 部分?16*从 Softmax 的数学角度解释,为什么在计算过程中加上负无穷就能让注意力权重变为 0?17*什么是掩码?你分别说一下Causal Mask与 Padding Mask 的作用是什么。
查看17道真题和解析
点赞 评论 收藏
分享
评论
6
23
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务