skip thought论文阅读
skip thought核心思想:用一句句子去预测周围的句子
使用方法:训练encoder,之后再训练线性分类器用在不同任务上。
编码器:
是句子中的N个字。每个时间步,编码器产生一个隐藏状态作为w_{i}^1,...,w_{t}^t序列的隐藏表示。于是就能表示整个句子。
解码器:
概率建模
损失函数:
给定配对(),
使得前向后向的概乘积率最大
实验:
训练细节
语义相关
段落检测
图像句子打分
总结:
需要更高质量的表示。
skip thought核心思想:用一句句子去预测周围的句子
使用方法:训练encoder,之后再训练线性分类器用在不同任务上。
编码器:
是句子中的N个字。每个时间步,编码器产生一个隐藏状态作为w_{i}^1,...,w_{t}^t序列的隐藏表示。于是就能表示整个句子。
解码器:
概率建模
损失函数:
给定配对(),
使得前向后向的概乘积率最大
实验:
训练细节
语义相关
段落检测
图像句子打分
总结:
需要更高质量的表示。
相关推荐