【业务知识】携程:用户画像指标
一级分类
基础信息、生命周期、出行偏好、行为偏好
一、基础信息
(1)账户信息
账户来源:账户的注册来源(包含智行 商旅 去哪儿 IBU 其他 铁友等)。
账户分类:自然人账户、分销用户、临时用户(非转正)、内部专用账号、商旅账号等。
系统版本号:手机系统。
会员等级:
礼品卡boss客户
(2)常住地
居住地、工作地位置
常住地分类:居住地、工作地、学校、老家四类。
城市熟悉度:常住地设置为1,别的城市设置为count(distinct d)/35
IBU常住地
省份名称
省份ID
用户常住城市ID
用户常住地城市ID
用户常住地
国家名称
国家ID
城市名称:会员注册时候的客户所属城市名称。
城市ID
地区
(3)个人信息
年龄
国籍
年龄段
性别
IBU用户语言能力
(4)身份特征
代理分级:根据给人代理下单的人数进行代理人等级划分。
超级会员
学生:一部分根据火车学生票,另一部由模型预测。
小秘书:根据工作日订票和周末订票预测。
内部员工
用户身份(客服标记):知名企业高管/市场分析经理等。
二、生命周期
(1)投诉历史
末次投诉时间
末次投诉BU
近一年投诉订单占比
近一年投诉次数
近一年赔付总金额:过去一年用户获得的赔付金额。
(2)竞品意向
去哪儿偏好
(3)交易RFM(Recency/Frequency/Monetary)
全网分月成交订单数
度假历史订单数
全网预订订单数:用户在携程的截止至今的所有预订订单量。
(4)生命周期
是否XBU老客:cid是否曾下过单(包括全站和XBU,XBU指交通、酒店、PKG团队游、DIY自由行、门票、租车)。
注册日期
(5)访问RF
近30天活跃天数
近30天访问时长
近30天访问session数:即网站访问次数,注意半小时内重复进入的只算一个session。
近30天访问pv数:pv即网页点击数。
XBU末次访问时间
XBU首次访问时间
首次访问时间:用户第一次访问携程的日期。
末次访问时间:用户最近一次访问携程的日期。
(6)用户价值
客户价值:标记度假业务的毛利润。
皇冠用户:全局年利润贡献率前0.3%的用户为皇冠用户。
用户价值:全局利润按1%分段赋值,即1-100。
三、出行偏好
(1)出行主题
近两年滑雪***程占比:行程的定义是各BU属于同一个行程的整合到一起。
近两年海岛游形成占比
近两年温泉***程占比
近两年回家行程占比
近两年休闲行程占比
近两年商务行程占比
通勤
(2)出行时间
近两年出行节假日占比:出行的节假日天数/两年节假日总数
近两年出行工作日占比
近两年出行周末占比
出行日期时间类型分布:{出行节假日天数,出行工作日天数,出行周末天数}/用户出行总天数。
行程出行时间类型分布:{节假日出行行程数,工作日出行行程数,周末出行行程数}/用户总行程数。
(3)出行人员
下个行程同行人数
近两年带老人行程占比:近两年内,带老人的行程数/用户总行程数。
近两年亲子行程占比
人员构成:通过关键词判断人员构成。
(4)出行目的地
国际行程占比:用户国际行程数/用户总行程数。
出行意图:通过模型预测输出携程用户近期正在出行或者将要出行的目的地(行前或行中)。
四、行为偏好
(1)预定偏好
用车“猜你喜欢”专用标签:{1:豪华型;2:舒适型}
(2)消费水平
XBU最小消费单价:近两年用户的最小消费单价(其中,单价分别指酒店间夜价,交通票价,门票票价,团队游和自由行人均价格,租车单天价)。
XBU最大消费单价
平均行程花费:近两年内,用户每次出行的花费(其中,行程必须至少包含酒店和交通订单;行程计算的是单人花费)。
酒店间夜价分位数:近两年内,用户的平均间夜价在所有用户的平均间夜价数据中的分位数(其中,这里的分位数是上分位数,即分位数越小,间夜价越高)。
机票两舱订单比:近两年内,用户两舱(头等舱、公务舱)订单占比。
酒店订单成交价格标准差
度假消费水平(浏览):全量度假订单数据计算用户浏览产品的价格段倾向。
度假消费水平(订单)
酒店消费水平:0/1/2/3,数值越高消费水平越高。
酒店平均间夜价
火车票商务座订单比
酒店间夜价分位数_城市颗粒度:近两年用户在某城市的酒店平均间夜价在近两年所有在该城市预订过酒店的用户中的分位数。
消费能力:根据酒店平均间夜价进行分级,级别越高消费能力越高。
BU客单价:各BU成交的客单价。
平均成交星级
用户星级_机酒火度特征指数:基于用户酒店、机票、火车票和度假的订单数据,得到各BU的特征指数。
用户星级:各BU特征指数求均值,取整得到星级。
酒店平均星级:用户所有酒店订单的酒店星级均值。
租车高级车型订单比
六七星酒店订单比
(3)价格敏感
(4)退改偏好
机酒火取消订单占比
(5)机票偏好
转机订单最长转机时长:用户含有中转的航段中,最长的转机时长。
近两年红眼航班占比:近两年内,用户的红眼航班订单占总机票订单的比值(其中,红眼航班是指航班在22:00-7:00运行且飞航时间少于8个小时)。
近两年直飞订单占比:其中,直飞航班是指没有中转。
(6)产品偏好
内容标签偏好:{内容标签id:标准化后的偏好分数},分数是基于统计用户浏览点击行为计算的。
产品偏好:近两年内。如果用户仅有酒店订单,则划分为纯酒店客户(h);如果有机票和酒店订单,就划分为机酒交叉用户(hf);依此类推。
用户订单BU偏好:根据用户在不同BU的订单总数和时间衰减计算出用户的偏好BU。
民宿偏好:基于用户历史订单信息,基础特征等数据得到用户对民宿的偏好程度。
(7)度假偏好
(8)酒店偏好
用户品牌偏好:利用酒店最近一年的所有成交数据,通过协同过滤方法计算酒店的相似度,向用户推荐未订购过的TOP5相似的酒店品牌。
(9)反馈方式偏好