ht根据h(t-1)算的,这样递归下去可以认为rnn能得到过去“所有”的信息。实际上双向LSTM也只能捕获t时刻周围9~13个词的信息
点赞 3

相关推荐

点赞 评论 收藏
转发
宇信外包 Java 7.5k
点赞 评论 收藏
转发
牛客网
牛客企业服务