贪心学院面试整理1
方差和偏差
能否用平方损失作为损失函数
指数族分布
项目1
文本分类可以详见左边特征工程
数据不平衡处理方法
欠采样:
- 随机删除:可能会丢失信息在里面
- 原型生成(PG):
过采样 - 随机复制:单纯复制容易过拟合
- 样本构建(SMOTE):
模型算法
MetaCost算法
Focal Loss
更加关注难分类样本
G-Mean
ROC曲线:
优点:兼顾正例和负例
PR曲线:
基本只看正例:
纵坐标:precision
横坐标:recall
UDA
回译
EDA
Jordon RNN和Elman RNN
https://blog.csdn.net/qq_31375855/article/details/106795105
- 多模态文本分类
Representation:Joint Representation;Coordinated Representation
模态对齐:显式对齐,隐式对齐
多模态融合分类:Pixel Level,Feature Level,Decision Level
Co-learning:协同学习
Group Convolution
通道之间的全连接参数非常大,不利于计算,所以要转换成局部连接
对平移和缩放有不变性,对旋转不变性质较弱。
遮挡敏感性,遮挡了需要识别的物体后,识别的准确率迅速下降。
RNN的梯度消失