首页 > 试题广场 >

问题:朴素贝叶斯(naive Bayes)法的要求是?

[问答题]

问题:朴素贝叶斯(naive Bayes)法的要求是?

 朴素贝叶斯是基于贝叶斯定理和条件独立性假设的分类方法 。对于给定的训练数据集,首先基于特征条件独立性假设学习输入/输出的联合概率分布P(X,Y) (其中P(X,Y) = P(X|Y)P(Y)),然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率的最大的输出y。
发表于 2019-05-20 16:13:00 回复(0)

朴素贝叶斯面试总结

  1. 朴素贝叶斯与LR的区别?

简单来说:朴素贝叶斯是生成模型,根据已有样本进行贝叶斯估计学习出先验概率P(Y)和条件概率P(X|Y),进而求出联合分布概率P(XY),最后利用贝叶斯定理求解P(Y|X), 而LR是判别模型,根据极大化对数似然函数直接求出条件概率P(Y|X);朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的),而LR则对此没有要求;朴素贝叶斯适用于数据集少的情景,而LR适用于大规模数据集。

  1. 朴素贝叶斯“朴素”在哪里?

简单来说:利用贝叶斯定理求解联合概率P(XY)时,需要计算条件概率P(X|Y)。在计算P(X|Y)时,朴素贝叶斯做了一个很强的条件独立假设(当Y确定时,X的各个分量取值之间相互独立),即P(X1=x1,X2=x2,...Xj=xj|Y=yk) = P(X1=x1|Y=yk)P(X2=x2|Y=yk)...*P(Xj=xj|Y=yk)。

  1. 在估计条件概率P(X|Y)时出现概率为0的情况怎么办?

简单来说:引入λ,当λ=1时称为拉普拉斯平滑。

  1. 朴素贝叶斯的优缺点

优点:对小规模的数据表现很好,适合多分类任务,适合增量式训练。

缺点:对输入数据的表达形式很敏感(离散、连续,值极大极小之类的)。

转自于:https://blog.csdn.net/jingyi130705008/article/details/79464740

发表于 2019-04-19 15:28:05 回复(0)

各类之间是独立同分布的


发表于 2019-04-19 00:28:55 回复(0)