2021-04-11 20:37 已编辑门头沟学院 Java

关注

循环神经网络RNN

1、简介

RNN主要用来处理序列数据，在传统的神经网络模型中，是从输入层到隐含层再到输出层，每层内的节点之间无连接，循环神经网络中一个当前神经元的输出与前面的输出也有关，网络会对前面的信息进行记忆并应用于当前神经元的计算中，隐藏层之间的节点是有连接的，并且隐藏层的输入不仅包含输入层的输出还包含上一时刻隐藏层的输出。理论上，RNN可以对任意长度的序列数据进行处理。

2、模型

一个经典的RNN网络：

RNN采用参数共享的机制，在时间维度上共享权重U、V、W一个简单的前向传播过程入下图所示：

$h_t$ 是t时刻隐藏层的值， $y_t$ 是t时刻输出层的值，也就是最终的标签，其中参数 $w_{hh}$ 、 $w_{xh}$ 、 $w_{hy}$ 是需要通过训练学习到的参数。
通常我们这样定义一个RNN模型：

$x$ 是输入， $h$ 是隐层单元， $o$ 为输出， $L$ 为损失函数， $y$ 为训练集的标签。下标 $t$ 代表 $t$ 时刻的状态，其中需要注意的是，隐藏单元 $h$ 在 $t$ 时刻的表现不仅由此刻的输入决定，还受 $t$ 时刻之前时刻的影响。 $V$ 、 $W$ 、 $U$ 是权值。
$h_t=\phi(Ux_i+Wh_{t-1}+b)$
$\phi$ 是激活函数，一般为 $t a n h$ 函数， $b$ 是偏置。
$t$ 时刻的输出为：（ $c$ 是偏置）
$o_t=Vh_t+c$
模型的输出： $\hat y_t=\sigma(o_t)$ 这里 $\sigma$ 是激活函数，通常RNN用于分类，所以常为softmax函数。

3、训练

RNN使用反向传播梯度下降法更新权重。

上图的损失函数的定义针对机器翻译，不同的任务，损失函数的设定不同。
由上图可知，对于较大程度的序列，使用RNN的训练过程容易出现梯度消失的现象。因为求到的偏导数本身就是一个比较小的值，较长的链式求导，易导致梯度几乎为0，导致系统误差仍是一个较大的值，最终导致训练失败。对于较长的序列，我们通常使用LSTM模型。

参考：
[1]赵卫东《机器学习》

全部评论

推荐最新楼层

01-15 13:40

数字马力（长沙）信息技术有限公司_后端开发

「评论焚诀」在牛客，我解锁了评论新姿势💜

Prompt名称：牛客评论专家适用平台：牛客网提示词正文：见下文效果展示：见下文思路背景最开始参与了牛客的评论活动，后来工作有些忙，无暇评论。闲下来的时候 又断断续续的，于是乎想起来用ai帮我快速评论。版本迭代基于对话直接作为prompt第一版直接使用ai对话平台使用原始的对话prompt进行评论生成。不足及优化在评论了一些帖子之后，发现回答过于人机，遂改良如下： #角色 你是一个评论回复员，在阅读完用户给你的文章后，可以针对性的给出一些实用建议或者暖心评论 #回复要求 保持活人感（即回复具有口语化，且适当结合内容玩一些当下热门的梗且适当使用一些合适emoji表情）结合文章内容，判断文章表达的...

牛客激励计划

点赞评论收藏

分享

01-14 14:34

西安电子科技大学 Java

一次面试让我重新认识了 Cursor

上周面试的时候，面试官突然问我：“你用过 Cursor 对吧，那你知道 rules 嘛？”当时小爱一愣，把问题听成了Cursor的弱势，本来一张嘴就要编了，结果被面试官及时制止，强行纠正了下发音没事，不明白咱可以学。面试完了，小爱同学就去了解了下这个点什么是 Cursor RulesCursor Rules也就是Cursor规则，本质上就是一组“开发规范/约束提示”，告诉 AI 在帮你写代码、生成文件时要遵守的规则。类似于你在写 prompt，但它是持久的，全局生效Cursor Rules 有两种类型：全局规则（User Rules）、项目规则（Project Rules），全局适用于所有项目...

越今朝0：我实习的时候花了半个月专门研究cursor

查看1道真题和解析

点赞评论收藏

分享

2025-12-31 16:41

已编辑

江西农业大学 C++

27届，寒假找实习

最近在投递简历。在BOSS上，投了50来份小厂(1000人以下)。只有几个人回复(我知道这很正常)，目前有一个小厂hr的电话，说他们的要求很高，我代码有点少。感觉小厂的要求都好高，什么QT，游戏项目/引擎，嵌入式，音视频，图片处理，机器学习，数据挖掘/分析等等，我是不是要改变策略，投中大厂(可能他们的要求比较低，比较看重学习能力)？现在想，先投一个月(边复习+MySQL+QT)，不行就考研去了。

程序员花海：实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价其中项目经历注意要体现业务实习经历里面的业务更是要自圆其说简历模板尽可能保持干净整洁不要太花哨的

你投了多少家公司？进展是...

点赞评论收藏

分享

2025-12-15 11:27

门头沟学院 Java

这就是BOSS市场的现状吗？？？？

？？？？？？如何评价

哇哇的菜鸡oc：所有人不要理会，就好了，后面他就知道怎么回事了，只能说有的时候市场都是被宰的人搞坏的

点赞评论收藏

分享

01-13 20:01

柠檬微趣_数据库内核测试工程师(准入职员工)

柠檬微趣内推，柠檬微趣内推码

面经：暑假投递，面试时间线拉的比较长自我介绍实习经历介绍问了我他们公司有什么产品，让我说一款的细节设置，以及和竞品的细节差异在这个游戏设计一个中秋节主题关卡，应该怎么设计，什么思路？现在的关卡设置有什么需要改进的地方？休闲游戏的目标客户群体？有什么理解？休闲游戏符合设置付费点？什么品类的游戏是经久不衰的？🍋【柠檬微趣26届秋招】火热开启！一周极速Offer，职等柠来！✔ 研发发行《宾果消消消》《浪漫餐厅》《梦幻旅行》等爆款手游✔ 中国手游发行商出海收入排行榜Top 5✔ 合成手游赛道全球收入No.1的发行商📍 工作地点：北京市西城区🔥 秋招亮点✅ 岗位全覆盖：游戏开发、数据分析、游戏策划...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 为了入行xx岗，我学了__ #

7922次浏览 118人参与

# 被说“做题家”，你的反应是_____？ #

3521次浏览 110人参与

# 简历第一个项目做什么 #

9050次浏览 127人参与

# 工作压力大怎么缓解 #

131755次浏览 1132人参与

# 参加哪些竞赛对找工作有帮助？ #

10129次浏览 154人参与

# Prompt分享 #

3888次浏览 103人参与

# 你都见过什么样的草台班子？ #

11812次浏览 89人参与

# 打工人锐评公司红黑榜 #

190292次浏览 1046人参与

# 担心入职之后被发现很菜怎么办 #

275203次浏览 1174人参与

# 找实习记录 #

44356次浏览 617人参与

# AI了，我在打一种很新的工 #

128511次浏览 1316人参与

# AI让你的思考变深了还是变浅了？ #

6528次浏览 161人参与

# 工作压力大，你会干什么？ #

16164次浏览 346人参与

# 辞职之后最想做的一件事 #

31037次浏览 250人参与

# 如果不上班，你会去做什么 #

9046次浏览 303人参与

# 运营面经 #

151633次浏览 1333人参与

# 金融财会交流会 #

130691次浏览 445人参与

# 运营来爆料 #

74532次浏览 456人参与

# 小厂实习有必要去吗 #

78372次浏览 372人参与

# 金融财经春招备战日记 #

47457次浏览 221人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务