美团春招-机器学习算法-面经
一面 3.21
问项目:问了一个项目,问的非常详细,大概问了30min
然后问基础:
transformer的架构
为什么使用multi-head、残差链接和前馈神经网络层
梯度消失的原因是什么
gpt和t5的区别
bert和t5的区别
了解现有的大模型,比如LLaMa这些吗
代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
问项目:问了一个项目,问的非常详细,大概问了30min
然后问基础:
transformer的架构
为什么使用multi-head、残差链接和前馈神经网络层
梯度消失的原因是什么
gpt和t5的区别
bert和t5的区别
了解现有的大模型,比如LLaMa这些吗
代码:删除链表倒数第k个节点,需要考虑到k>链表长度这个边界情形
全部评论
佬的项目是什么呀
手写测试用例吗
佬,请问是什么业务方向呀
相关推荐
点赞 评论 收藏
分享
01-28 16:12
中南大学 Java
明天不下雨了:那我建议可以用 chatgpt atlas 或者 dia 去刷,也可以用 chrome 加个 ai 插件去刷 点赞 评论 收藏
分享
