RNN时间序列里h(t)

h(t)是一个向量,为啥能存储过去的所有输入的信息,求大神解答一下小弟的疑问


全部评论
ht根据h(t-1)算的,这样递归下去可以认为rnn能得到过去“所有”的信息。实际上双向LSTM也只能捕获t时刻周围9~13个词的信息
点赞 回复
分享
发布于 2019-01-03 09:40

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务