在数据分析领域下,总会被提及诸如SQL、Hive,甚至Hadoop、Druid、Spark等这些技术上的词汇。那么作为一名数据领域的产品经理,听着这些不是很常见的产品知识,又应该具备怎样的技术知识呢?我们从“用户行为数据“角度介绍一整套的技术架构以及相关的技术要点。
阅读指南
1、受众人群:数据型产品经理、数据运营等初级岗位;
2、阅读收获:初步了解用户行为分析数据类产品的大致架构;掌握4大环节的数据技术要点;

01
用户行为分析系统
本文将从数据采集、数据接入、数据分析、数据展示等4个重要地方,分别介绍相关涉及的技术知识。这一节主要介绍整体概念。

1.1 概念
用户行为分析系统其实是指用户使用产品过程中,把产生的行为数据通过分析而成的报表工具。此类数据区别于业务数据,大多为公开、有权限获取的,比如一些设备信息、埋点信息等。
目前行业较为人熟知的有百度统计、友盟、神策等,而使用此类产品的主要是数据分析师、数据运营和产品经理等。目的是为了统计埋点、基础指标分析(如PV、UV)等,从而对产品进行体验优化或运营推广。

1.2 数据系统框架

1)数据采集
一般用户使用产品的时候,所填写的信息会经由业务系统加密储存。而行为数据是不会经由这些系统收集,而由专门的采集工具进行采集,这就是SDK。
2) 数据接入
因为SDK采集的数据是非结构化的,所以数据都是以原始数据的方式按批次定期或实时上传。服务端通过接口对这些数据进行解析、加工处理,初步形成结构化的日志数据,并在数据库按表进行存储。
3)数据分析
当数据解析并存储之后,即可通过离线和实时两大方式进行分析。部分指标计算量大且实时要求不高,则会采取T+1、T+2(即第二天、第三天出结果)等离线计算方式。有些指标时效性要求高,如关键指标、日常运营活动(如双十一)等,就需要较高的实时计算方式,以便监测表现。两大方式采用的系统框架会有所差别,后面详解。
4)数据应用
当使用结构化数据进行分析时,就需要可视化的图表进行展示,不管哪种方式,基本就是通过报表网站平台进行展示。比如折线图、表格、柱状图等,甚至还需要提供更多维的分析指标支持用户自主查询。
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务