讯飞NLP线下面

1. 开场环节:进行自我介绍,重点说明过往项目经历与技术栈。介绍结束后,面试官追加询问是否有论文发表经历

2. 项目深挖:聚焦简历中的核心项目,先完整阐述项目整体流程。因项目中用到T5模型,被要求说明选择该模型的原因(如Text-to-Text统一框架适配任务需求、Encoder-Decoder结构利于序列转换等)。随后针对项目中应用的Continual Learning技术,详细讲解技术选型、实现思路及解决的具体问题。

3. 基础概念考察:

• 询问已知的激活函数种类,列举并简要说明ReLU、sigmoid等函数的特点。

• 现场通过纸笔推导softmax的前向传播公式与反向传播梯度(结合交叉熵损失)。

• 分析sigmoid激活函数的局限性(当时仅答出梯度消失问题),以及对应的优化方式(回答了替换为ReLU等其他激活函数,后续复盘发现还可补充改进版sigmoid、调整初始化方式等方法)。

• 阐述Transformer架构。

全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务