社招-百度昆仑芯一面
C++基础的知识,内存的创建等(记不太清了)
介绍RmsNorm这个算子的公式和实现流程,怎么做优化的
FP16和BF16的区别,为什么BF16的表示的精度没有FP16高
MLP在TP切分下数据的流程
Attention在并行策略下的切切分
大模型结构整个计算流程
给4台服务器,从零开始怎么做训练、推理、部署、微调
上下文并行了解吗
了解哪些位置编码,有什么区别
使用TP,PP,DP模型内部怎么计算的
FlashAttention使用AscendC怎么实现的
读过vllm源码嘛
PageAttention的原理,怎么分块的,上层分了一块,下层分了几块
指令微调数据集怎么构建的
了解Lora微调嘛,当有多个Lora微调权重的时候,怎么选择,调度策略是什么
Lora和Loss是怎么考虑的和预训练的loss有什么区别
算法题:
1、快速排序,要求空间复杂度O(1)
2、二分查找找到最左边的,要求时间复杂度O(logN)
有些可能写的不清楚,有点忘记了
#社招##校招##百度#
介绍RmsNorm这个算子的公式和实现流程,怎么做优化的
FP16和BF16的区别,为什么BF16的表示的精度没有FP16高
MLP在TP切分下数据的流程
Attention在并行策略下的切切分
大模型结构整个计算流程
给4台服务器,从零开始怎么做训练、推理、部署、微调
上下文并行了解吗
了解哪些位置编码,有什么区别
使用TP,PP,DP模型内部怎么计算的
FlashAttention使用AscendC怎么实现的
读过vllm源码嘛
PageAttention的原理,怎么分块的,上层分了一块,下层分了几块
指令微调数据集怎么构建的
了解Lora微调嘛,当有多个Lora微调权重的时候,怎么选择,调度策略是什么
Lora和Loss是怎么考虑的和预训练的loss有什么区别
算法题:
1、快速排序,要求空间复杂度O(1)
2、二分查找找到最左边的,要求时间复杂度O(logN)
有些可能写的不清楚,有点忘记了
#社招##校招##百度#
全部评论
大佬面的什么岗位
宝贵的社招面经,三连了
相关推荐
08-31 16:37
复旦大学 Java 内推__免笔试:同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~

点赞 评论 收藏
分享
点赞 评论 收藏
分享
昨天 15:21
宁波工程学院 新媒体运营 点赞 评论 收藏
分享