Enhanced LSTM for Natural Language Inference(ESIM)阅读笔记

文章目录

模型介绍
- Hybrid Neural Inference Models
实验
- 参数设置
- 实验结果

模型介绍

Hybrid Neural Inference Models

可以用BiLSTM编码, 也可以使用Tree-LSTM.
这里只介绍基于BiLSTM的结构.

1. Input Encoding

输入两句话分别接embeding + BiLSTM

2. Local Inference Modeling

就是一个计算attention的过程
Locality of inference
首先计算两个句子 word 之间的相似度，得到2维的相似度矩阵.

Local inference collected over sequences
利用前面的词相似矩阵, 进行两句话的 local inference. 用之前得到的相似度矩阵，结合 a，b 两句话，互相生成彼此相似性加权后的句子.attention的常规操作,公式如下

Enhancement of local inference information
利用减法和element-wise product计算 $< <mover accent="true"> a ˉ </mover>, <mover accent="true"> a ~ </mover> >$ 之间的差异
然后,将得到的向量进行拼接

3. Inference Composition

The composition layer
和之前input encoding一样, 将上一步得到的 $m_{a}, m_{b}$ 再送入BiLSTM.
但是这里目的不同, 它们用于捕获局部推理信息 $m_{a}$ 和 $m_{b}$ 以及它们的上下文，以便进行推理组合。

Pooling
同时使用 MaxPooling 和 AvgPooling 进行池化操作, 最后接一个全连接层(tanh作为激活函数)+softmax

实验

参数设置

batch_size: 32
optimizer: Adam, 其中(momentum设为0.9, 0.999)
learning_rate: 0.0004
word embedding: 300
dropout: 0.5
hidden size: 300
OOV问题: initialized randomly with Gaussian samples
损失函数: 多分类的cross-entropy loss

实验结果

数据集使用SNLI, acc作为评价指标

全部评论

推荐最新楼层

06-10 21:01

已编辑

门头沟学院人工智能

该怎么选？

牛友们，在下目前大三下，双非，省一本人工智能专业，学院派...去公司也只能搞开发，没啥优势（技术方向都在模型上了，搞开发数据库什么的用的肯定没专业的好），所以决定去考研。目前人工智能的实训，这种重要吗？没有项目经验，搞最多的也只是竞赛和研究生组微调大模型和网上接单，没有东西能往简历上写的。现在，有个项目院领导要搞的一个项目，还要搞软著有署名啥的，一堆画饼的东西。但能给我带来的是项目经验，与可能的找领导推荐导师（考研到那个学校去）如果考研失败，就只能用学校的项目了，所以有点纠结。# 现在有三条路：1：搞那个项目，缺点是要分心认真搞一段时间。2：随便搞个实训项目能过就行，专心考研。3：找老师进组去...

点赞评论收藏

06-12 17:57

门头沟学院 Java

二本 27 面试有感

TimeLine：4.15  开始八股文准备5.9  参加校招，并开始在 Boss 投简历 校招有一家，天河的线下面【难度老大了，最后一问 JVM 底层操作流程】至今： 接下来就是 Boss 的不断打招呼了。最多的就是： 6.12 也就是今天，再次参加校招会，就投了两家【PS:一共就三家招 Java。最后一家 100-150r/天，不想面了】整体情况就是： 有几个小厂offer，目前也差不多要去哪一家了，但是还在面，就是想挑选更好的。心态： 刚开始，背八股老猛了，就算很多不会，也学了老爽了。然后就是处女面：校招的线下复试没过对我打击挺大的，开始有点累的感觉了。殊不知，噩耗才刚开始，二十多天的B...

校招第一份工作你干了多久？

点赞评论收藏

05-11 11:58

中国矿业大学 Java

大佬们，为啥这个简历练小厂都不回复啊😦

man,我是真的一点不想考研啊😭😭

程序员牛肉：主要是因为小厂的资金本来就很吃紧，所以更喜欢有实习经历的同学。来了就能上手。而大厂因为钱多，实习生一天三四百的就不算事。所以愿意培养你，在面试的时候也就不在乎你有没有实习（除非是同级别大厂的实习。）按照你的简历来看，同质化太严重了。项目也很烂大街。要么换项目，要么考研。你现在选择工作的话，前景不是很好了。

点赞评论收藏