本文对BGD的解释和其他技术博客不一致,BGD似乎不是只计算一个batch的梯度,而是针对整个数据集。GD是一种方法论,BGD SGD MBGD 都是GD的实例
4

相关推荐

牛客网
牛客网在线编程
牛客网题解
牛客企业服务