先问深度学习相关,回归模型和分类模型分别是什么,有哪些,是否了解分类模型,二分类的损失函数和激活函数,二分类的评估指标,写sigmoid和交叉熵损失的伪代码然后是transformer相关,写encoder的伪代码流程batchnorm和layernorm的区别,如果要处理会实时不断出现的数据能用batchnorm吗,怎么用?batchnorm在训练和推理中有什么区别?还问了我做的项目中两个方法的损失函数怎么设计最后是两道手撕,一道是删除链表中的重复元素(重复就全部删除),还有一道是在有序矩阵(横向有序,纵向无序)中找到topk元素的最快方法思路,给出时间复杂度