Day40:机器学习概述与环境配置

alt

前面的章节中,我们系统学习了Python的用法,又在数据分析和爬虫中学习了各种库,现在让我们一起进入另一个重要的篇章——机器学习。

1. 机器学习概述

机器学习是一种人工智能领域的分支,旨在使计算机能够通过从数据中学习来改善自身的性能,而无需显式编程。它依赖于统计学、概率论和优化理论等领域的算法和技术,通过分析和处理大量数据来构建模型并做出预测或决策,比如中世纪就有人通过计算七个成年人的脚长来估计成年人的脚长,这可以算做初步的统计机器学习的范畴。

机器学习可以分为以下几个主要类别:

  • 监督学习:使用已标记的训练数据,通过学习输入特征与相应输出之间的关系来构建预测模型。监督学习可以用于分类问题(预测离散类别)和回归问题(预测连续值)。
  • 无监督学习:使用未标记的训练数据,通过发现数据中的模式、结构和关联来构建模型。无监督学习可以用于聚类问题(将数据分为相似的组)和降维问题(减少数据维度)。
  • 强化学习:通过与环境的交互来学习,通过尝试和观察行动的结果来优化策略,以最大化预期的累积奖励。

正式学习这一节之前,我们来简单了解一下后续我们可能遇见的一些名词:

  1. 样本空间(Sample Space):样本空间是指所有可能的样本取值的集合。在机器学习中,我们从样本空间中选取样本用于训练和测试模型。
  2. 特征向量(Feature Vector):特征向量是指描述样本的特征值组成的向量。每个样本可以由多个特征组成,这些特征构成了特征向量,用于表示样本在特征空间中的位置。
  3. 标签(Label):标签是指样本所属的类别或目标值。在监督学习中,我们用带有标签的样本来训练模型,使其能够预测未标记样本的标签。
  4. 维数(Dimensionality):维数是指特征空间的维度,即特征向量的长度。维数描述了特征向量的个数或特征的数量。
  5. 回归(Regression):回归是一种机器学习任务,旨在预测连续型变量的值。通过学习样本的特征与对应的连续型目标值之间的关系,构建回归模型用于预测未知样本的目标值。
  6. 分类(Classification):分类是一种机器学习任务,旨在将样本分配到预定义的类别中。通过学习样本的特征与对应的类别之间的关系,构建分类模型用于对未知样本进行分类预测。

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

大模型-AI小册 文章被收录于专栏

1. AI爱好者,爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生,给实验室搬砖的uu,强烈建议你花时间学完这个,后续搬砖比较猛 4. 任何对编程感兴趣的,且愿意掌握一门技能的人

全部评论
好多概念!!!!!
点赞
送花
回复
分享
发布于 2023-07-14 15:21 上海

相关推荐

1 1 评论
分享
牛客网
牛客企业服务