中邮消费金融 AI算法工程师 一面

面试官迟到3分钟。
准点时hr先叫我自我介绍,所以实际上面试官没听到我的自我介绍。
自我介绍完面试官进来会议室直接开始问问题。
1、做的大模型的项目有没有做模型优化?
2、优化模型的项目,科研做的项目?
3、会什么编程语言?
4、cpp里面什么时候可以用多态?
5、bert和gpt的区别?

反问:
1、后续面试流程,下一次hr面
2、公司业务,自然语言处理做问答系统,交易吧啦吧啦的一些文本处理

———————————————-
更新:
一周后给了面试结果。
全部评论
请问一下,面试官说二面是hr面嘛
点赞 回复 分享
发布于 2023-11-04 14:54 陕西
大模型为什么会用到cpp
点赞 回复 分享
发布于 2023-11-02 17:23 上海
那没收到通知是不是凉了
点赞 回复 分享
发布于 2023-11-02 10:14 北京
大佬,方便说下什么类型学校?
点赞 回复 分享
发布于 2023-11-01 19:45 广东
请问佬一面是什么时候的
点赞 回复 分享
发布于 2023-11-01 17:41 江苏
这么快嘛,我也是算法岗,明天才面呢
点赞 回复 分享
发布于 2023-11-01 16:58 北京
佬,一面过了吗,我还没通知
点赞 回复 分享
发布于 2023-11-01 16:01 广东

相关推荐

● 自我介绍● 了解 DeepSeek-R1 吗?介绍一下?● R1 的 MLA 是如何实现 KV-Cache 的节约● R1 在 SFT 时冷启动的目的● 位置编码是什么?解释 ROPE?● 一个 14B 的模型,推理和训练要多少缓存● 显存的占用和哪些因素有关● 大模型灾难性遗忘是什么?如何解决?● BF16、FP16、FP32 对比?● Adam、AdamW 原理● deepspeed 的三个阶段● 自我介绍● 手写 Self-Attention 公式,解释 Q/K/V 的作用● 位置编码有哪些实现方式?相对位置编码相比绝对位置编码的优势?● LayerNorm 和 BatchNorm 的区别?为什么 Transformer 用 LayerNorm?● 多头注意力的本质是什么?头数如何影响模型性能● 大模型训练中的显存瓶颈如何解决?● LoRA/Adapter/P-Tunning 的区别?如何选择微调方法?● 解释 PLHF 流程,客服场景如何应用?● 大模型灾难性遗忘的原因和缓解方法?● 如何实现混合精度训练(AMP)?遇到 NaN 怎么处理?● Deeppspeed 的 ZeRO 阶段 1 2 3 分别优化了什么?● 解释梯度累计的原理和实现代码?26届校招华为AI岗位内推:"AI算法工程师""大模型应用工程师""AI数据工程工程师""AI安全工程师"“AI软件开发工程师”岗位多多,欢迎私聊,或者**************
点赞 评论 收藏
分享
评论
点赞
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务