skip thought论文阅读

skip thought核心思想:用一句句子去预测周围的句子
使用方法:训练encoder,之后再训练线性分类器用在不同任务上。
编码器:

是句子中的N个字。每个时间步,编码器产生一个隐藏状态作为w_{i}^1,...,w_{t}^t序列的隐藏表示。于是就能表示整个句子。




解码器:



概率建模

损失函数:
给定配对(),


使得前向后向的概乘积率最大

实验:
训练细节
语义相关
段落检测
图像句子打分

总结:
需要更高质量的表示。

全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务