2022-02-13 11:33 数据分析师

关注

数据分析之机器学习与数据挖掘高频面试题及答案

机器学习与数据挖掘-2

6.实习内容中：RFM模型和kmeans（猿辅导）

参考答案

RFM模型根据客户活跃程度和交易金额的贡献，进行客户价值细分的一种方法。它能够识别优质客户；可以制定个性化的沟通和营销服务，为更多的营销决策提供有力支持；能够衡量客户价值和客户利润创收能力。

R（Recency）——最近一次交易时间间隔。

F（Frequency）——客户在最近一段时间内交易次数。

M（Monetray）——客户最近一段时间内交易金额。

Kmeans算法：

第一步：数据归一化、离群点处理后，随机选择k个聚类质心

第二步：所有数据点关联划分到离自己最近的质心，形成k个簇；

第三步：重新计算每个簇的质心；

重复第二步、第三步，直到簇不发生变化或达到最大迭代次数。

7.特征工程怎么做的，选择了哪些特征作为预测变量？为什么用RFM模型来构建特征变量？（字节跳动）

参考答案

特征工程包括：特征构建->特征提取->特征选择。

选择特征：用户行为特征、用户消费特征、用户画像特征

为什么RFM模型：因为我们没有太多的用户行为数据，能用的数据比较有限。但是有一定的成交数据。只要有成交数据，就能进行RFM的分析。其次，模型的分层可解释性强。其他很多算法模型、机器学习模型，往往通过聚类进行用户的分层，对于业务来讲，不是很好解释。但RFM模型分成的用户类别，是非常好理解的。

8.rfm模型介绍一下？（京东、作业帮）

参考答案

R（Recency）——最近一次交易时间间隔。

F（Frequency）——客户在最近一段时间内交易次数。

M（Monetray）——客户最近一段时间内交易金额。

9.xgb原理（猿辅导）

参考答案

xgboost就是一堆CART树的集合，将每棵树的预测值加在一起得到最后的预测值。xgboost利用了损失函数二阶的导数信息，并且在目标函数之外加入了正则项，避免过拟合。

10.实习项目介绍，为什么用xgb（猿辅导）

参考答案

xgboosting在传统boosting的基础上，利用cpu的多线程，引入正则化项，控制了模型的复杂度。并且xgb可并行处理，并能对缺失值处理，还内置交叉验证。

答案解析

xgboost的优点

#学习路径#

全部评论

推荐最新楼层

牛客549436921号

南京农业大学

多谢，楼主做了一个系列呀！

点赞回复

04-27 11:17

考虑的点：等不等拼多多？白菜都大于别的ssp了  还有字节还有hc吗？一直泡着。 b站认可度够不够啊？为爱发电

投递哔哩哔哩等公司10个岗位 > 现在还是0offer，延毕还是备考软件开发薪资爆料

点赞评论收藏

无无五

03-25 14:46

安徽信息工程学院计算机类

Java简历实习锐评一下

   兄弟们，刚写了个大概的简历，这样能在六月多找个小厂日常实习吗。   学历民办二本，两个项目烂大街的😂😂 外卖+点评。有视频的项目烂大街，没视频的项目看不懂，吃不透，也不知道怎么写在简历上。

点赞评论收藏

26加瓦鼠鼠

04-09 09:31

莆田学院计算机类

我等了你8天，你却...

时隔8日hr终于回复了，我茶不思饭不想了8天，他说我不合适😭，兄弟们我要掉小珍珠了😭渣男 #沉淀# #黑皮体育生# #java#

点赞评论收藏

想减肥的中国人在找内推

05-02 23:43

已编辑

北京航空航天大学电子信息类

捞一波25届还没有实习的大佬们

近期还有很多企业都在招实习岗位，其中还有国企央企，所以大家千万不要焦虑，大胆去投就行了！

找实习多的是你不知道的事

点赞评论收藏

2 58 评论

招聘动态

滴滴

2025届秋招储备实习生招聘

全站热榜

正在热议

# 产品实习，你更倾向大公司or小公司 #

# 参加过提前批的机械人，你们还参加秋招么 #

9399次浏览 302人参与

# 校招入职后的感受 #

41041次浏览 697人参与