#腾讯大数据开发工程师面经#
#大数据开发工程师面经#
#大数据面试

昨天面试腾讯大数据开发,面试题奉上,欢迎大佬指点

问题:
 1.自我介绍
 2.项目细节
 3.题目 有用户对于微信文章表t_user_log,数据量约40亿,t_wx_doc表,数据量约400W,
 表结构信息如下
 create table default.t_user_log (
   ip string comment 'ip',
   ts string comment '时间戳',
   userid string comment '用户id',
   docid string comment '文章id',
   action string comment '用户行为1 阅读,2点赞,3 分享,4 打赏, 5 评论',
   entry  string comment '如口'
 ) partitioned by (
   day string comment ''
 )

create table default.t_wx_doc (
cpid string comment '公众号id',
ts string comment '发文时间戳' ,
docid string comment '文章id',
text string comment '文章内容',
category string comment '文章分类'
)
机器资源有限,(vcore 小与100, &&men<400G)请编程解决下面两个问题
计算框架 算法不限
1 .找出热门的公众号top10
2. 给定一个10000w 大小用户包(userid 字符长度为16)计算他们各自最可能喜欢的5个公众号

4. Flink如何保障在使用kafka的时候是execyly-one的?
5. Flink与spark的区别
6. Flink内存模型
7. Spark内存模型
8. Spark shuffle过程
9. Spark Rdd属性
10. Rdd的那个算子可以重分区但是不用shuffle
11. 问题3热门文章数据量大的时候,出现数据倾斜如何解决

面试完之后感觉要跪了,效果很差。继续加油补知识
全部评论
大佬知道是腾讯哪个事业群吗?
点赞 回复 分享
发布于 2021-01-20 15:24
能问下怎么投的大数据开发吗?校招岗位只有数据分析啊😂
点赞 回复 分享
发布于 2020-07-14 11:10
码一下,我是刚选方向的菜鸡
点赞 回复 分享
发布于 2020-07-14 01:41
感谢分享
点赞 回复 分享
发布于 2020-07-02 12:28

相关推荐

09-05 09:13
已编辑
杭州电子科技大学 Java
虾皮很奇怪,可能面试官工作久了,还以为杭电跟以前一样好进阿里呢感觉虾皮就很神奇,一面几乎纯八股,二面什么都有。小打小闹面试官🤓:你手上有哪些offer或者流程嘛现在我内心😡:笑死,就没敢怎么投实际😊:就八月投了虾皮和字节,因为你们流程推进太快了,我也很有意向所以其他的都没有投(其他的厂如果不卡简历和大厂实习,我能不海投嘛)聊了聊字节和虾皮大概十分钟面试官🤓:谢谢你对虾皮的支持,投了字节和我们,不过我看你是杭州电子科技大🧱的,你们为什么不投阿里呢?内心😡:tmd它不卡23所我包投的,还不如省时间精投,你们以前的互联网红利这么足嘛,我这个垃圾实习和学历怎么能过阿里的初筛的实际🥺:阿里最近政策变动大,部门变更合并频繁,杭州岗位很少,加上我不想留杭(真的不想嘛?只是杭州的互联网厂,电🧱的title不够)后面正式进入面试环节,问,我们比赛项目开展前,人员选择,技术调研等后面半小时全是拷打支付链路,超时,逆流程反问环节先聊一些热热氛围最后就是我:&nbsp;刚刚问的是对应届生的期待,请问对我有什么建议嘛面试官:&nbsp;虾皮这边面完后续需要花一两周时间去不断对比筛选(??我好像没有问什么时候出结果吧)然后我这边不能给你说太多结果。不过感觉你个人不管是工程能力还是基础都很不错,也有自己的见解,我的建议是做项目前可以更多调研一些大企业的一些做法然后再考虑落实。不管了,个人感觉面试过程还ok的
查看3道真题和解析
点赞 评论 收藏
分享
评论
10
26
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务