Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification阅读笔记

Att-BLSTM

Model

<center> </center>

模型主要包括五部分:

  1. Input layer
  2. Embedding layer
  3. Lstm layer
  4. Attention layer
  5. Output layer

Word Embedding

没啥好说的…

Bidirectional Network

Bi-LSTM结构, 最后输出

<center> </center>

Attention

Attention部分, 先对LSTM输出做非线性激活, 然后计算attention权重.

<center> </center>

最终的句表示:

<center> </center>

Classifying

<center> </center>

损失函数: 加上L2正则的交叉熵

<center> </center>

实验

数据集: SemEval-2010
参数设置:
word embedding: 分别尝试了50, 100
optimizer: AdaDelta
learning rate: 1.0
batch size: 10
dropout: 0.3, 0.3, 0.5
评价指标: macro-F1score

<center> </center>
全部评论

相关推荐

03-27 22:42
南京大学 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务