首页 > 试题广场 >

需求:当前希望分析产品上线两周后,页面的使用人群特点(年龄、

[问答题]
需求:当前希望分析产品上线两周后,页面的使用人群特点(年龄、性别、城市)和页面上不同入口点击率(页面上各种按钮、超链接等等的点击次数/页面访问次数)的关系。
拿到的数据格式为csv格式,每行数据包括:用户操作时间、用户id、用户对应的信息(好几列,年龄、性别、城市)、操作行为(访问、点击)、被操作模块名称(访问行为此列为空,点击行为此列为被点击入口的名称),示例如下
任务:对过去两周产品的使用人群特点和入口点击率进行描述和可视化作图,说明上两周的现状情况。要求:从整体角度描述提到两个指标的变动情况;将不同入口点击率按照人群特点进行划分,描述不同人群的入口点击偏好、对某个入口点击率的差异。
问题1:简述一下拿到这个数据文件后你根据任务所规划的处理步骤(画图or文字描述皆可,文字描述需要写清步骤序号)。
问题2:列出你能够使用以及知道了解的软件名称-对应功能名称-用来处理什么内容(功能名称可以是程序包、具体某个包后插件下的function、使用的图的类型名称等),请把答案是属于“掌握”(知道名字,辅以简单查询后可以自己做出来)还是“了解”(听过这个名字,但没有实践应用过)分成两个部分。
(举例:掌握:excel-图表-柱状图-作图说明不同年龄群有多少人)


1. 数据预处理:重复值,缺失值,异常值等
2. 求出不同入口(笔记,电脑,手机,平板。。。)的点击量分别是多少
3. 对每一个入口对人群特点进行细分:不同年龄段、性别、城市,
4. 看每个入口占比例较大的年龄段、性别、城市,据此判断出每个入口对应的人群特点

掌握:excel-数据透视表-切片器-细分;excel-图表-柱状图,饼图,折线图
掌握: python pandas:pandas.read_csv(), pandas.pivot_table(); matplotlib:hist(), pyplot.plot(), pyplot.pie()
          
发表于 2019-08-18 11:43:38 回复(0)
首先进行数据预处理过程,进行必要的检查,数据重复,缺失值,异常值等问题
分析人群特点:可以按照总体特征的分布情况对人群进行分类,总结人群特点,比如按年龄或者城市分档,也可以两者结合起来作为一个人群特点进行分析。
入口点击率:对总体入口点击率进行趋势分析;然后拆分计算入口点击率,进行细分对比。可以结合人群特点进行分析,挑出重点进行阐述。比如点击率最高的集中是哪个年龄层的用户,某个年龄层内最高的点击率的操作对象是什么,等等。
掌握:excel-图表-柱状图、折线图、甘特图、双层饼图-作图说明用户年龄分层情况和点击率的分布情况
掌握:excel-数据透视表-(切片器)-通过数据透视表进行用户年龄分布和入口点击率的分布情况
掌握:python-matplotlib-hist-作图说明用户人群特点的年龄、城市分布情况
发表于 2019-08-12 11:00:34 回复(0)
问题1:
1.对数据进行检查,去除异常值,将空值记为0;
2.绘制柱状图,横坐标以人群特点(年龄,性别)为指标,将年龄分成不同的年龄段,纵坐标为某个入口的点击率,每个年龄段的柱状图以不同颜***分性别;
3.绘制柱状图,横坐标以人群特点(性别)为指标,纵坐标为某个入口的点击率;
4.绘制柱状图,横坐标以人群特点(城市,性别)为指标,纵坐标为某个入口的点击率,每个年龄段的柱状图以不同颜***分性别;
问题2:
1.掌握:tableau软件,为商业BI,用软件导入该csv格式文件,新建工作簿,行位置拖拽人群特点,列位置拖拽点击率,筛选器拖拽人群特点,绘图行为选择柱状图,新建仪表盘,将图拖拽进入。
2.掌握:excel-图标-柱状图-作图说明不同年龄群有多少人。
3.掌握:Python-matplotlib, pandas, seaborn-read_csv("filepath"), hist(x, y)-作图说明不同年龄群有多少人.

发表于 2019-07-14 21:47:03 回复(0)
第一题:
1、对用户群体特征进行可视化,年龄——直方图,性别——饼图,城市——柱状图
2、计算各模块总的点击率并排序绘制柱状图
3、按照较为合理的划分方式将年龄字段离散化为多个年龄区间(一般4-5个区间足够),对于每一个操作对象,计算不同年龄区间的点击率并排序绘制柱状图
4、按性别进行划分,针对男性用户和女性用户分别计算各操作对象点击率并排序绘制柱状图
5、按操作对象进行划分,针对每个操作对象计算各城市用户点击率并排序绘制柱状图
6、根据可视化图标,得出用户群体总体特征以及总点击率最高的功能模块,同时找出各模块点击率最高的用户群体特征,得出不同人群入口点击偏好
第二题:
掌握:Excel/Python/MySQL - 函数/Pandas库/基础查询 - 表格查询和计算 - 计算不同特征用户人数、各模块点击率
掌握:Excel - 图表 - 柱状图/饼图/直方图 - 作图说明用户群体特征分布、以及不同功能模块各用户群体点击率
掌握:Python - Matplotlib、Seaborn、Bokeh可视化库 - 柱状图/饼图/直方图 - 作图说明用户群体特征分布、以及不同功能模块各用户群体点击率
发表于 2020-02-27 14:39:21 回复(0)
  1. Step1:清洗包括重复值,缺失值,异常值;Step2:按照年龄、性别、城市三个维度对人群细分,统计不同特征的人群人数;也可以将年龄性别组合;或者年龄城市组合;统计不同特征人数;Step3:按照上述维度对人群细分,统计在某个特征人群中,不同入口的人数,及其比例(了解不同人群的入口偏好);Step4:对入口进行细分,统计在某个入口中,不同特征的人数,及其比例;(了解不同入口的用户画像)
  2. 掌握:excel-图表-柱状图/饼图/-作图说明不同年龄群/性别/城市 有多少人;
    掌握:Excel-数据透视表-切片器-动态选择多重特征(年龄层+城市+性别)共同确定时,不同入口的人群分布
    掌握:Python-matplotlib-hist/bar/plot-说明不同年龄群/性别/城市人群分布(直方图/饼图等)
发表于 2020-03-15 19:00:33 回复(0)
不能去掉重复值!因为需求方给出的Excel表最后一列里有“点击次数”的统计要求。
发表于 2019-12-09 10:52:32 回复(1)