首页 > 试题广场 >

预测用户的交互行为

[数据挖掘题]预测用户的交互行为
点击率是在线广告系统中衡量广告效率的最重要指标之一。我们提供S公司部分用户在APP内11月份的卡片浏览记录,请根据用户历史浏览交互行为预测11月28,29,30日三天的赞,踩交互行为。

数据获取

请点击下载本次比赛的所有数据,"高速下载"的密码为ste5。解压后会得到
1. page_view_data.tar.gz
该文件记录用户在11月份的浏览记录,解压后文件每行通过'\t'分隔,各列字段意义如下
dev_id —用户id
stat_date —日期yyyymmdd
stat_time —时间HHMMSS
post_id —卡片/帖子id
type — 1是S公司卡片数据,2是L社区数据
stat_view — APP内浏览的次数
stat_click — 点击查看详情的次数
每个用户对同一内容可能会有多次记录,表示用户的多次浏览/查看详情行为
2.post_data.txt
该文件提供11月卡片/帖子具体的内容,文件每行通过'\t'分隔,各列字段意义如下
id —帖子id
title —帖子title,可能为空
content --帖子内容
3.train.txt
该文件提供11月份前27天用户的交互记录,文件每行通过'\t'分隔,各列字段意义如下
dev_id —用户id
post_id —卡片/帖子id
praise —1表示赞,2表示踩
time —时间yyyymmddHHMMSS
普通下载 高速下载 测试文件

结果文件上传

根据page_view_data.tar.gz的浏览记录,请预测用户28,29,30日的赞踩行为。提交文件每行应该包含dev_id,post_id,praise三个字段,各个字段通过'\t'分隔。具体请参考sample_submission.txt
注:提交文件最多包含20万行,最大10M
记分规则:
提交数据的记分通过F1-Measure来打分
P 准确率
R 召回率
F1 = 2P*R/(P+R)
上传数据结果文件,格式仅限txt文件

这道题你会答吗?花几分钟告诉大家答案吧!