昨天 13:22 已编辑 The University of Sydney Python 发布于山东

关注

欧莱雅美容 - 预测客户成交量

一、项目简介（简历原文精简版）

两阶段模型设计与开发：

阶段 1（分类模型）：主要使用随机森林等算法，预测客户是否会进行交易，精准识别过去成交量为 0 的客户。

阶段 2（回归模型）：在阶段 1 结果基础上，对预测为 0 的客户进行修正后，针对其余客户进行成交量预测；应用随机森林、梯度提升、模型堆叠等回归方法，显著提升预测精度。

预测指标：两阶段模型的 R² 可达 0.87，并针对高度不平衡数据集进行了处理和优化。

成果：两阶段方法有效提高了潜在高价值客户的挖掘与成交量预测的准确度，为后续个性化营销与重点客户管理提供数据支持。

二、项目主要思路与流程

变量维度：

1. 客户身份维度	`CustomerID`, `Post Code`, `City`	标识客户及其地理位置
2. 时间行为维度	`Total_Spent_1M`, `Transaction_Count_3M`, `Total_Spent_AllTime`	在不同时间窗口内的消费金额与次数
3. 品牌维度	`Brand Description_Hyalu B5`等	客户是否购买过某品牌的产品
4. 产品功能维度（Class / Category / Sub-Category / Concern）	如 `Class Description_Anti-Ageing` 、`Skin Concern_Acne-Prone Skin`	客户关注的产品类型与护肤功效
5. SKU / 产品编码维度（EAN）	如 `EAN_HyaluB5Serum30ml`	是否购买过某个具体的商品（产品条形码）
6. 目标变量及标签	`Total_Spent_Nov23_May24` ，`Has_Transaction_Nov23_May24`	用于建模的目标（是否发生交易，或总消费额）

在项目中，为了更好地模拟真实业务场景，我们将预测客户是否会下单和预测具体下单金额分成两个阶段：

阶段 1：分类（是否下单）

先对大量历史成交为 0 的客户进行建模，区分出可能会“复购”的潜在客户；对其余确定性极低者统一视为 0 交易。

阶段 2：回归（成交金额预测）

对阶段 1 预测为“可能会下单”的用户构建回归模型，进一步细化预测他们的成交量。模型采用随机森林、回归树、Lasso、梯度提升等，并通过交叉验证筛选出最佳参数，最终在验证集上取得了理想的 R²（约 0.86~0.87）。

模型整体流程示意（引用报告中原图 Figure 3.1）：

Figure 3.1：两阶段建模的示意图（Stage 1 先判定“是否交易”，Stage 2 再行回归成交额）

三、核心分析与关键图表

阶段 1 分类模型表现

为了验证分类模型效果，报告中给出了在验证集上的准确率（Accuracy）与F1 Score。

其中，随机森林在阶段 1 取得了约 76.41% 的准确率，F1 Score 约为 0.82，相比逻辑回归有更优表现。

Figure 3.6 & 3.7（报告原文节选）

图中可见 Random Forest 的 Accuracy≈0.76，F1≈0.82

阶段 2 回归模型表现

针对仅剩的“会发生交易”的客户数据做成交金额预测。

从报告中可见，在回归树、Lasso等多种方法对比后，最终Random Forest取得了最高 R²≈0.87，RMSE 较低，说明预测精度较高。

Figure 3.8（报告原文节选）

可见 Random Forest 的 R² ≈ 0.868，优于其它回归模型

变量重要性与特征工程

在两阶段模型中，“过去 12 个月（或更长时间）累计消费额”和“是否购买特定品类（如 Face Care）”对预测最为关键。

通过对数变换、Box-Cox 等方法减少数据偏度，并提取“人均交易额”等新特征，显著改善了模型的学习效果。

Figure 3.4（示例：阶段 2 的特征重要度图）

四、项目贡献与总结

洞察与成就：

首创两阶段建模思路，可屏蔽掉大量历史成交为 0 的噪声用户，把资源集中在真正有交易潜力的客户。

分析结果为营销部门提供了针对高潜客户的推荐策略，如 VIP 专属折扣、个性化推送等。

项目成果在校内竞赛与企业实习中均获得认可，为后续在其他业务场景（如活动复购、精准促销）提供可复制的建模模板。

后续优化：

持续补充更多客户画像（如访问时长、偏好品类、地域分布），构建更全面的特征集；

动态更新预测模型，定期用最新交易数据进行再训练，不断提升模型鲁棒性与精度。

全部评论

推荐最新楼层

楼主

The University of Sydney Python

R² 0.87厉害

点赞回复分享

发布于昨天 22:26 山东

04-24 10:18

已编辑

浙江长征职业技术学院 Java

美团暑期一面凉经

面试官人很好很温柔，可惜我太菜了，还有许多进步空间。1.介绍一下项目。好像是美团系统出问题了，拿的是很久之前我投的日常的简历，这里和面试官都懵逼了2分钟。2.幂等性是什么？你是怎么理解幂等性的？有啥用？怎么保证的？3.分片上传是怎么做的？分片大小怎么确定？断点续传咋传的？怎么保证完整性？4.限速下载是怎么做的。5.联合索引是怎么用的？结合项目。6.双token机制具体怎么实现的。什么是双token？7.MySQL索引有什么作用。8.最左前缀原则。9.为什么要有最左前缀原则？10.jvm、jre、jdk有什么区别？11.http和https的区别。12.线程池的参数。这里居然把拒绝策略忘了我真该...

小博真爱学习：美团招golang吗

查看16道真题和解析

点赞评论收藏

分享

04-06 13:10

哈尔滨工程大学 Java

计算机暑假实习，211本大二

目前清明结束，由于学校原因只能这个暑假找实习，也就只有一个tlias项目，然后准备在花一周半时间做苍穹外卖，这然后在做一下算法题，这样子大概能找个啥样的啊，小登求助

点赞评论收藏

分享

04-02 13:22

已编辑

门头沟学院后端

美团复活赛一面凉

首先项目，深挖了某一个具体功能，这个功能点的实现、参数设置、优化以及各种场景（一致性、可用性等），拷打30分钟；之后八股+手写MySQL，比较easy，有一道要用窗口函数又忘了怎么写了没写出来，10分钟左右；最后面试官自己出了一道题写，字符串转int，要求考虑全面，写了大概五分钟，从正负号、特殊字符、小数点方面考虑。更：一周后挂，拿我刷KPI是吧，化身团黑子

美团一面2111人在聊

查看3道真题和解析

点赞评论收藏

分享

04-07 15:52

内蒙古科技大学 Java

面经：2025-04-07，Day 1

🎓学历背景：本5在职👨‍💻意向职位：Java目前在刷BOSS阶段，还未收到面试邀约，每日分享一道面试题分库分表ID冲突解决方案：1.使用自增主键+步长，如分3张表，步长为3，（A（1，4，7，10），B（2，5，8，11），C（3，6，9，12））    优点：索引友好，操作简单    缺点：无法扩容，后续如果再次对表扩容后ID需要重新设置2.UUID    优点：简单方便    缺点：索引不友好，可读性差，查询性能低3.Redis    优点：高性能，高并发，灵活可扩展    缺点：单点故障，网络延迟，内存占用，数据持久化问题4.雪花算法    优点：全局唯一，高性能，有序，可扩展    缺点：时间戳回拨问题（时间倒退，可能重复）5.各大厂开源分布式ID解决方案    

我的简历长这样

点赞评论收藏

分享

04-07 17:48

滴滴_C++研发工程师(准入职员工)

滴滴内推滴滴内推滴滴内推滴滴内推

滴滴如何，值得去吗❓先说结论：非常安利！！！ 在滴滴成长很快，对新人有培养体系。老板们和同事都很职业，能力强，培养了我比较好的职业习惯，也拿到了比较好的结果。当然有时候压力也会大一点点，挺过去就好了。 上下班不打卡，包晚餐，9点后打车免费。有商保报销90%，过节有公司礼盒。有人情味，相较其他厂老人（3年以上司龄）相对更多些！1️⃣网上都说产品经理上限更高，工资也高，我就想试试产品，所以投了很多产品相关岗位。 2️⃣投递方式：内推 3️⃣岗位：产品运营 4️⃣面试，30分钟： 1.自我介绍 2.两段实习经历介绍，哪段更有收获，追问细节 3.其中一段实习的ABtest怎么做，有什么效益提升 4.为...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 毕业季，给职场新人一些建议 #

25880次浏览 449人参与

# 你的房租占工资的比例是多少？ #

22921次浏览 255人参与

# 我的求职总结 #

29143次浏览 492人参与

# 计算机专业还有必要去大厂卷吗 #

20536次浏览 109人参与

# 我的实习日记 #

2442986次浏览 25440人参与

# 薪资一样，你会选择去大厂还是小公司 #

16726次浏览 102人参与

# 辞职之后最想做的一件事 #

11241次浏览 163人参与

# 选offer应该考虑哪些因素 #

20146次浏览 296人参与

# 金蝶求职进展汇总 #

44129次浏览 242人参与

# 晒一晒你收到的礼盒 #

62605次浏览 374人参与

# 你见过最离谱的招聘要求是什么？ #

188582次浏览 1403人参与

# Offer比较，求稳定还是求发展 #

49570次浏览 239人参与

# 你怀疑过自己的专业选择吗？ #

17587次浏览 201人参与

# 为了秋招你都做了哪些准备？ #

11089次浏览 166人参与

# 你想吐槽公司的哪些规定 #

17729次浏览 68人参与

# 第一份工作应该只看薪资吗 #

138976次浏览 1461人参与

# 我的工作日记 #

98497次浏览 1272人参与

# 非技术岗薪资爆料 #

355781次浏览 2747人参与

# 秋招想进国企该如何准备 #

58406次浏览 376人参与

# 你想留在一线还是回老家？ #

38332次浏览 449人参与

牛客网
牛客企业服务