神经网络主要通过两种学习算法进行训练,即有师学习和无师学习。 (1)有导师学习算法将一组训练集 ( training set )送入网络,根据网络的实际输出与期望输出间的差别来调整连接权。 (2)无导师学习抽取样本集合中蕴含的统计特性,并以神经元之间的联接权的形式存于网络中。 (3)增强学习(reinforcementlearning, RL)又叫做强化学习,是近年来机器学习和智能控制领域的主要方法之一。增强学习是指从动物学习、随机逼近和优化控制等理论发展而来,是一种无导师在线学习技术,从环境状态到动作映射学习,使得Agent根据最大奖励值采取最优的策略。 (4)观察与发现学习是人和动物这类具有感官生命体的生物才具有得学习能力,就是用来凑数的
A项正确,有导师学习算法将一组训练集 ( training set )送入网络,根据网络的实际输出与期望输出间的差别来调整连接权。
B项正确,增强学习(reinforcementlearning, RL)又叫做强化学习,是近年来机器学习和智能控制领域的主要方法之一。增强学习是指从动物学习、随机逼近和优化控制等理论发展而来,是一种无导师在线学习技术,从环境状态到动作映射学习,使得Agent根据最大奖励值采取最优的策略。
C项错误,观察与发现学习是人和动物这类具有感官生命体的生物才具有得学习能力。
D项正确,无导师学习抽取样本集合中蕴含的统计特性,并以神经元之间的联接权的形式存于网络中。
故本题选C。