金山办公 大模型实习一面 2025.01.06

1、自我介绍
2、详细讲一下项目
3、微调的数据集怎么来的?
4、RAG怎么用的在项目中?
5、讲一下Transformer的结构
6、知道哪些位置编码?
7、Transformer每个结构的作用,多头注意力、归一化、残差链接、全连接层?
8、Transformer在多头自注意力计算中有什么优化方法?
9、知道树模型吗?
10、VLLM的原理,在batch这一块有优化吗?
11、微调评估的ROUGE怎么计算的,什么原理?
12、最长公共子序列是什么?
13、讲一下学校的研究课题?
14、反问

说是WPS的EXCEL组,做类似自然语言转公式,还有多模态的一些工作。

#面经##大模型##实习#
全部评论

相关推荐

程序员小白条:你是沟通了900个,不是投了900份简历,你能投900份,意味着对面都要回复你900次,你早就找到实习了,没亮点就是这样的,别局限地区,时间投的也要早,现在都要7月了
点赞 评论 收藏
分享
评论
4
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务