阅文集团数仓开发校招一面面经
1.项目
2.某行为日志文件路径home/log/aa.txt,占用存储1.5T,用linux完成如下操作
(1)统计该文件有多少行记录
(2)查看第12行到第15行的内容
3.linux清空某个目录下的全部内容
4.统计过留存相关的指标吗,排序函数用过哪些,order by和sort by有什么区别
5.sql题:
现在有一个数据表user_table,里面存了每个人的所有好友,以ARRAY<bigint>存储
表定义如下:
user_id bigint,
friendlist ARRAY<bigint>
数据示例:
1001,[1002,1005,10012]
1002,[1001,1005,10012]
1003,[1001,100523]
1004,[1323,1053,10533,10531,13253]
(1)统计一共有多少个用户
(2)统计有多少个好友超过100的用户个数
6.维度建模的主要步骤,什么是粒度,什么是度量
#阅文集团##面试题目#