Non Autoregressive Sequence Generation

为什么要NAT:AT的解码速度太长了,NAT可以并行解码
会带来的问题:multi-modality问题,就是概率分布的对应比较混乱
图片说明
想法1:
图片说明
问题:输出模糊,数据集的平均,multi modality
原因:没有dependency
解决:autoregressive:pixel rnn; gan:output完整structure的方法
图片说明

Vanilla NAT:

  1. encoder output decoder对应几个字,数字总和决定输出长度
  2. Fertility:(latent variable)
    图片说明

知识蒸馏

图片说明

Noisy Parallel Decoding

sample不同的Fertility
decoder输出不同结果
交给autoregressive打分数

Evolution of NAT

  1. Vanilla NAT
  2. Iterative Refinement
  3. Insertion-based
  4. Insert-delete
  5. CTC-based

Mask-Predict

图片说明

Insertion Transformer

输出拼接预测要插入的字
图片说明

图片说明
优先insert靠中间的字

KERMIT

只用encoder,同时train 5个test

Levenshtein Transformer

图片说明
训练方法:imitation learning
Levenshtein distance algorithm
图片说明
图片说明

Imputer

图片说明

block decoding

每个block每步都要变一个

CTC text generation

图片说明

NAT distill

算法小屋 文章被收录于专栏

不定期分享各类算法以及面经。同时也正在学习相关分布式技术。欢迎一起交流。

全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
# 长得好看会提高面试通过率吗? #
3423次浏览 43人参与
# HR最不可信的一句话是__ #
1044次浏览 32人参与
# MiniMax求职进展汇总 #
25028次浏览 321人参与
# 春招至今,你的战绩如何? #
15286次浏览 141人参与
# AI面会问哪些问题? #
916次浏览 22人参与
# 你的实习产出是真实的还是包装的? #
2862次浏览 52人参与
# 米连集团26产品管培生项目 #
7196次浏览 225人参与
# 沪漂/北漂你觉得哪个更苦? #
1401次浏览 40人参与
# 你做过最难的笔试是哪家公司 #
1181次浏览 21人参与
# AI时代,哪个岗位还有“活路” #
2751次浏览 50人参与
# XX请雇我工作 #
51153次浏览 171人参与
# 军工所铁饭碗 vs 互联网高薪资,你会选谁 #
7987次浏览 43人参与
# 简历第一个项目做什么 #
32109次浏览 359人参与
# 简历中的项目经历要怎么写? #
310971次浏览 4261人参与
# 不考虑薪资和职业,你最想做什么工作呢? #
152861次浏览 889人参与
# 当下环境,你会继续卷互联网,还是看其他行业机会 #
187569次浏览 1123人参与
# AI时代,哪些岗位最容易被淘汰 #
64610次浏览 870人参与
# 如果重来一次你还会读研吗 #
229995次浏览 2011人参与
# 投格力的你,拿到offer了吗? #
178289次浏览 891人参与
# 你怎么看待AI面试 #
180721次浏览 1301人参与
# 正在春招的你,也参与了去年秋招吗? #
364274次浏览 2641人参与
# 腾讯音乐求职进展汇总 #
160837次浏览 1114人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务