数据分析与挖掘

简要概括数据挖掘、数据分析以及机器学习的区别和特点

【数据预处理】如何避免过拟合overfitting

8、【统计】某调查公司接受委托满意度调查,满意度分数在0~20之间,随机抽取36名消费者,平均满意分12,标准差3,在大样本的假设下,根据调查结果对总体平均满意情况的95%的置信区间,结果是

要熟悉各种假设检验的区别

[实习写的最复杂的sql:用sql返回json格式数据
统计学问题:辛普森悖论:经济系和法律系都是女生比例低,两个系加在一起女生比例一定低吗
辛普森悖论:为什么个别录取率男皆大于女,但是总体录取率男却远小于女
在分组比较中都占优势的一方,在总评中有时反而是失势的一方。
录取率低的法学院,因为女生申请为数少,所以不录取的女生相对很少。而录取率很高的商学院虽然录取了很多男生,但是申请者却不多。使得最后汇总的时候,女生在数量上反而占优势。
为了避免辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

误区产生的原因说起来也很简单,就在于将“值与量”两个维度的数据,归纳成了“值”一个维度的数据,并进行了合并。
如果要避免“辛普森悖论”给我们带来的误区,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响。
](https://www.nowcoder.com/discuss/462124)

.sql 主键怎么创建

XGBoost,随机森林了解吗,XGBoost原理没学过,主要讲了下bagging和boosting的区别

[、怎么看待数据分析(这个估计是个常规必问问题) 4、做笔试中做的不太好的题,我被问到了sql题(中位数/众数/平均数),因为我写的时候用到了count(),问有没有不用count()的,用rank和row_number两列,然后作差

然后没想出来,面试官解答了,豁然开朗,然后觉得我写的有点乱,得练格式了
](https://www.nowcoder.com/discuss/458879)

全部评论

相关推荐

1 收藏 评论
分享
牛客网
牛客企业服务