首页 > 试题广场 >

对于某个训练任务，发现有 2 个训练任务最外层对应的输出网络

[单选题]

对于某个训练任务，发现有 2 个训练任务最外层对应的输出网络全连接层分别使用 Sigmoid 和 Softmax，则最有可能对应的任务分别是（）

手写阿拉伯数字识别和二元情感分析

二元情感分析和手写阿拉伯数字识别

手写阿拉伯数字识别和猫脸识别

```
猫脸识别和二元情感分析
```

查看正确选项

傅天麟头像

傅天麟

在神经网络中选择合适的激活函数（Activation Function）对模型的性能至关重要。不同的激活函数适用于不同的任务和网络结构，选择时需综合考虑梯度传播、计算效率、输出范围、稀疏性等因素。以下是选取激活函数的系统方法：

1. 根据任务类型选择

(1) 二分类问题（Binary Classification）

输出层：用 Sigmoid
（输出范围 (0,1)，表示概率）
隐藏层：ReLU 或其变体（如 LeakyReLU）
（避免梯度消失，加速训练）

(2) 多分类问题（Multi-class Classification）

输出层：用 Softmax
（输出概率分布，满足多类互斥）
隐藏层：ReLU/Swish
（平衡计算效率和梯度稳定性）

(3) 回归问题（Regression）

输出层：
- 无约束回归（如预测房价）→ 线性激活（f(x)=x）
- 正数输出（如预测价格）→ ReLU
- 概率输出（如 (0,1)）→ Sigmoid
隐藏层：ReLU/Tanh（根据数据分布选择）

2. 根据网络结构选择

(1) 深度神经网络（DNN）

隐藏层：优先 ReLU（计算快，缓解梯度消失）
- 若出现“死亡神经元”（Dead ReLU），改用 LeakyReLU 或 Swish
- 对初始化敏感时，可尝试 Tanh（但需注意梯度消失）

(2) 卷积神经网络（CNN）

隐藏层：ReLU（稀疏激活，适合图像特征提取）
- 更复杂任务（如 ImageNet）可尝试 Swish（Google 实验证明优于 ReLU）

(3) 循环神经网络（RNN/LSTM）

隐藏层：Tanh（梯度更稳定，缓解梯度爆炸）
- 门控结构（如 LSTM）中配合 Sigmoid（控制信息流）

3. 根据激活函数特性选择

激活函数	优点	缺点	适用场景
Sigmoid	输出概率，平滑梯度	梯度消失，非零中心	输出层（二分类）
Tanh	零中心，梯度比 Sigmoid 稳定	梯度消失	RNN/LSTM
ReLU	计算快，稀疏激活	死亡神经元	隐藏层（DNN/CNN）
LeakyReLU	解决死亡神经元	需调参数 α	替代 ReLU
Swish	平滑，自门控，实验表现优	计算稍复杂	深层网络

4. 实验调优技巧

默认首选：隐藏层用 ReLU，输出层根据任务选择（Sigmoid/Softmax/线性）。
遇到问题：
- 梯度消失 → 换 LeakyReLU/Swish
- 输出不稳定 → 换 Tanh（但需小心梯度消失）
- 死亡神经元 → 调小学习率或用 LeakyReLU
高级策略：
- 在残差网络（ResNet）中，ReLU 放在残差连接之前（Pre-activation）。
- 对噪声敏感的任务（如强化学习），尝试 SELU（自归一化激活）。

发表于 2025-07-07 19:08:09 回复(0)

提交观点

问题信息

深度学习

难度：

1条回答 5收藏 34浏览

热门推荐

相关试题

在CNN网络中，图A经过核为3x3...

算法工程师顺丰集团 2019 深度学习

评论(45) 来自顺丰科技2019秋招视觉...
4.该校1997年男女教师的比例为...

资料分析言语理解与表达资料分析

评论(1)
计算机在工作过程中，若突然停电，（...

计算机常识普及 C++ Pascal 选择题

评论(1) 来自NOIP2008初赛普及组
MySQL中执行 SELECT I...

SQL

评论(1)
订单表order_table全部记...

查找数据库数据分析 SQL

评论(2)

扫描二维码，关注牛客网
意见反馈
下载牛客APP，随时随地刷题

扫一扫，把题目装进口袋

求职之前，先上牛客: 扫描二维码，进入QQ群



扫描二维码，关注牛客公众号

公司地址：北京市朝阳区北苑路北美国际商务中心K1座一层-北京牛客科技有限公司
联系方式：010-60728802 投诉举报电话：010-57596212（朝阳人力社保局）
牛客科技© All rights reserved admin@nowcoder.com
京ICP备14055008号-4 增值电信业务经营许可证营业执照人力资源服务许可证
京公网安备 11010502036488号