牛客图书馆 > 读书笔记
  • Machine Learning 8th

    集成学习先产生一组个体学习器,再用某种策略将它们结合起来.如果集成中只包含同种类型的个体学习器则叫同质集成,其中的个体学习器称为基学习器,相应的学习算法称为基学习算法.如果包含不同类型的个体学习器则叫异质集成,其中的学习器常称为组件学习器. 要获得...
    Just丶Like 编辑于 2019-11-22 17:46:35
  • Machine Learning 9th

    聚类既能作为一个找寻数据内在分布结构的单独过程,也可以作为其他学习任务的前驱过程. 我们希望"物以类聚",也就是聚类结果的"簇内相似度"高且"簇间相似度"低.聚类性能度量大致有两类.一类是...
    Just丶Like 编辑于 2019-11-22 17:47:24
  • Machine Learning 10th

    懒惰学习在训练阶段只把样本保存起来,训练时间开销为零,待收到测试样本后再进行处理,如k近邻学习(kNN).急切学习则在训练阶段就对样本进行学习处理. 若任意测试样本x附近任意小的δ距离范围内总能找到一个训练样本,即训练样本的采样密度足够大,或...
    Just丶Like 编辑于 2019-11-22 17:48:05
  • Machine Learning 11th

    对当前学习任务有用的属性称为相关特征,没什么用的属性称为无关特征.从给定特征集合中选择出相关特征子集的过程称为特征选择.特征选择是一个重要的数据预处理过程. 冗余特征是指包含的信息可以从其他特征中推演出来的特征.冗余特征在很多时候不起作用,但...
    Just丶Like 编辑于 2019-11-22 17:48:50
  • Machine Learning 12th

    计算学习理论研究的是关于通过计算来进行学习的理论,目的是分析学习任务的困难本质,为学习算法提供理论保证,并提供分析结果指导算法设计. 计算学习理论中最基本的是概率近似正确(Probably Approximately Correct,P...
    Just丶Like 编辑于 2019-11-22 17:49:32
  • Machine Learning 13th

    主动学习是指先用有标记样本训练一个模型,通过引入额外的专家知识,将部分未标记样本转变为有标记样本,每次都挑出对改善模型性能帮助大的样本,从而构建出比较强的模型. 未标记样本虽未直接包含标记信息,但若它们与有标记样本是从同样的数据源独立同...
    Just丶Like 编辑于 2019-11-22 17:50:12
  • Machine Learning 14th

    机器学习最重要的任务,是根据一些已观察到的证据来对感兴趣的未知变量进行估计和推测.生成式模型考虑联合分布P(Y,R,O),判别式模型考虑条件分布P(Y,R|O). 概率图模型是一类用图来表达变量相关关系的概率模型.若变量间存在显式的因果...
    Just丶Like 编辑于 2019-11-22 17:51:29
  • Machine Learning 15th

    规则学习是指从训练数据中学习出一组能用于对未见示例进行判别的规则.规则学习具有较好的可解释性,能使用户直观地对判别过程有所了解. 规则学习的目标是产生一个能覆盖尽可能多的样例的规则集,最直接的做法是序贯覆盖,即逐条归纳:每学到一条规则,...
    Just丶Like 编辑于 2019-11-22 17:51:59
  • Machine Learning 16th

    强化学习的目的是要找到能使长期累积奖赏最大化的策略.在某种意义上可看作具有"延迟标记信息"的监督学习问题. 每个动作的奖赏值往往来自于一个概率分布,因此强化学习会面临"探索-利用窘境",因此...
    Just丶Like 编辑于 2019-11-22 17:52:35
  • 《机器学习》读书笔记第三、四章

    一、基本形式 线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,我们一般用向量的形式来表示, f ( x ) = w T x + b f(x)=w^Tx+b 因为w ww直观地表达了各属性在预测中地重要性,因此线性模型有很好地...
    LZY1999 编辑于 2021-03-26 18:59:37