机器学习与优化第20章

半监督学习的基本思想是:使用已标记的实例,以提高整体的分类准确率。如果假设有效,那么对于已标记实例稀缺和未标记实例丰富的情况,会得到一个非常有价值的性能提升。如果一个人想区分不同的语言,他最好不要分开聚在一起的人,而要在空白区域划线。
20.1.1
低密度区域的分离
无标记的数据往往会引导边界线远离密集区域。

 许多情况下,已标记的实例稀缺目难得,未标记的实例却很老,它们平时沉睡在商业
数据库里或网页上。
半监督学习方案同时使用可用的已标记实例和未标记实例,以提高整体的分类准确
所有实例的分布可以用于激励ML分类方案,从而创建类别之间的穿过低密度区域的
边界(直推SVM)、
如果问题以图来建模(实体和以距离标记的关系),阁|上的平滑操作可以用来使业
已标记节点的信息传送创机邻节点(图的拉背拉斯算了)。
实例的分布可以用于学习一个度量,而度量是州续进行监督学习的关键组成部分,
一个外尽人到了地球上,在征服我们之前,可以先结合网页1,不计其数的信息,加上
从人类笔友(或像雅虎样的目录)那儿获得的此已标记信息,以刚集的方武学习了解
人类文明。地球上的企业使用火似的技术水挖掘收据和征服更多的客户。


#机器学习#
全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务