数据模型面试题与解析1

面试高频题1:

题目:介绍一下k-means,你的数据如何处理,模型的输出是什么?

答案解析:

介绍kmeans:

第一步:数据归一化、离群点处理后,随机选择k个聚类质心

第二步:所有数据点关联划分到离自己最近的质心,形成k个簇;

第三步:重新计算每个簇的质心;

重复第二步、第三步,直到簇不发生变化或达到最大迭代次数;

数据如何处理:

为了防止均值和方差大的维度将对数据的聚类产生决定性影响,所以在聚类前我们对数据进行了归一化处理。

模型输出:

n个维度,输出为 的向量。[0 1 1 0 1],就是把第1,4维分为一类,其他分为另一类。

面试高频题2:

题目:特征工程怎么做的,选择了哪些特征作为预测变量?为什么用RFM模型来构建特征变量?

答案解析:

特征工程包括:

特征构建->特征提取->特征选择。

选择特征:

用户行为特征、用户消费特征、用户画像特征 为什么RFM模型:

因为我们没有太多的用户行为数据,能用的数据比较有限。但是有一定的成交数据。只要有成交数据,就能进行RFM的分析。其次,模型的分层可解释性强。其他很多算法模型、机器学习模型,往往通过聚类进行用户的分层,对于业务来讲,不是很好解释。但RFM模型分成的用户类别,是非常好理解的。

面试高频题3:

题目:RFM模型介绍一下?

答案解析:

RFM模型根据客户活跃程度和交易金额的贡献,进行客户价值细分的 一种方法。它能够识别优质客户;可以制定个性化的沟通和营销服务,为更多的营销决策提供有力支持;能够衡量客户价值和客户利润创收能力。 R(Recency)

剩余60%内容,订阅专栏后可继续查看/也可单篇购买

2022年最新整理:数据分析师高频考点与解析,包含top11面试考点和177道高频面试题与解析

全部评论

相关推荐

03-18 09:45
莆田学院 golang
牛客749342647号:佬,你这个简历模板是哪个,好好看
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客企业服务