小红书面经,nlp算法工程师
小红书的中台部门,具体是否属于技术部不太清楚。面试中主要针对论文和项目进行提问,可以看出面试官的能力还是不错的,提问有深度,不过不像字节那样深。
0908 一面
1. 介绍EMNLP论文2. BERT的self-attention中Q,K,V由来,multi-head attention目的:为了关注到句子中的不同模式(比如主-谓,谓-宾)。
3. 为什么分类任务使用交叉熵损失函数,不用MSE,优点在哪里
4. 情感转移模型:
a) Topic是怎么加入transformer的
b) 是否关注过将知识图谱中实体等信息加入transformer的方法
5. 小样本事件抽取:样本类别数量,GCN的原理
6. 开放题:小红书笔记中包含8个实体和6个情感,找出实体对应情感可以分为几步来做(可以标注出实体、情感、实体间关系)
1. 介绍EMNLP论文
2. 介绍小样本事件抽取论文(可能是因为写了在投)
3. 业务场景题:给出一个包含目标实体的文本,把它链接到知识库中,步骤及会遇到的困难。
4. 事件抽取方面的难点,比如处理未见事件有什么方法。
5. 事件线抽取的做法:不知道
6. 做题:两个字符串的最长连续子串,长度及输出
1. 讲项目,无针对项目提问
2. 别人眼中的自己什么样
反问:nlp技术中台主要业务及分组
内容理解:预训练模型,文本分类(树状和平铺),信息抽取,文本生成,情感分析(不同粒度的)
用户理解:用户的基本标签,如性别年龄等,具体的还没做#面经##小红书##面试题目#