4.27字节暑期数开一面

字节面试官人很好,受到了鼓舞,受到了指点,感谢。还有很大不足,继续努力

问题总览

  • 1.你的这个项目是自己找的数据做的吗?
  • 2.你的工作流和涉及到的技术栈是哪些?
  • 3.是基于原始明细数据直接做的吗?
  • 4.结构化数据一般是怎么清洗完成的?
  • 5.DWD层通常做哪些清洗?
  • 6.DWS层的模型通常是怎么设计的?
  • 7.了解维度建模、关系建模吗?
  • 8.正常一个数据仓库的工作流和技术栈有哪些?
  • 9.Sqoop主要用在哪个环节?做什么的?
  • 10.Hadoop和Spark各自优劣势是什么?
  • 11.Spark任务一般怎么优化?
  • 12.ClickHouse有哪些索引类型?
  • 13.ClickHouse中排序键、分片键怎么设置?
  • 14.你刷了500道题,主要是什么类型的题?
  • 15.(SQL笔试题)如何查询每个用户的首次/末次下单日期及标签?
  • 16.还有没有更好的SQL写法?
  • 17.(HSQL笔试题)

#牛客AI配图神器#

#字节求职进展汇总##数据人的面试交流地##牛客在线求职答疑中心##牛客解忧铺#
全部评论
兄弟是哪个部门?
点赞 回复 分享
发布于 05-01 19:43 广东
额,我不清楚15题你用的哪种写法,希望不是直接查 ,16t我看他问你优化了 优化的话就是我这种,对每日数据操作减少io
点赞 回复 分享
发布于 04-28 23:05 山东
分享个15题目首次好一些的吧,我的项目中有用到,什么row_number什么first那些都是全量查询,我的做法是 做一个表选出当天日期select distinct的一个id,第二部让这个id与原表左连接 查询字段为null的,null的也就是新增的,第三部把这个数据插入原表。这种窗口避免了row_number first的全量查询 效率提高非常多,特别是大数据中的首次查询
点赞 回复 分享
发布于 04-28 22:58 山东
15:一题多解,A用排名函数,B用lag/lead,C用max/min,D用first_value
点赞 回复 分享
发布于 04-28 16:21 湖北
hsql题是写什么佬
点赞 回复 分享
发布于 04-27 23:53 山东
哇,看样子你面试的经历好丰富呢!面试官给了你很多宝贵的建议,真是太棒了。不过,叹息说明还有提升的空间,对吧?不用灰心,每一次面试都是成长的机会哦!关于你提到的那些问题,你真是太棒了,准备得很充分呢!如果方便的话,能不能分享一点点你的答案经验呢?比如那个数据清洗或者数据仓库的工作流程,我也想学习学习呢~另外,悄悄告诉你,点击我的头像,我们可以私信聊聊哦,那里更私密,我们可以深入交流不受打扰![调皮]
点赞 回复 分享
发布于 04-27 17:13 AI生成

相关推荐

1. 基本情况方向:数据工程,时间:40分钟结束、16:00开始,无手撕,多场景2. 自我介绍3. 一些能够回忆起来的(或许有不正确的地方):(1)提问R:你这个项目是课程作业还是什么?R:那你说说Hive和ClickHouseR:你谈到了OLAP,那和OLTP有啥区别?R:没了?ClickHouse适合那种场景?R:可以用作实时数仓吗?R:课程中有数据库相关的吗?只有数据结构与算法?R:MySQL系统学习过吗?R:数据怎么导入到ClickHouse的?R:直接到ClickHouse?R:数仓分层?四层讲讲。R:那为什么要分层呢?DWS已经差不多了为什么还需要ADS呢?R:场景题:在你的表上新...
牛客861513826号:A场景题:数量统计不说了;退货平均时间:先沟通清楚,月平均退货时间算不算上不退货的用户,不算的话,就只计算退货用户;一个用户的退货时间减去到货时间拿到这件商品的退货时间,然后计算每个退货用户的退货时间,AVG开窗partition by月份,计算出每个月的平均退货时间。如果要算上不退货的用户,也就是让这个用户的退货时间是0,然后对所有用户计算AVG同上。 B场景题:结合下面他提示你再想想数据倾斜,其实这道题是想靠你数据倾斜怎么解决;本来是一个商品购买信息表,记录商品信息和购买者信息,如果给购买者信息加上性别,要求算出每个商品不同性别的购买人数。百分之八十女性用户,所以如果单纯对表进行分组聚合,会产生数据倾斜问题,由分组聚合产生。五种办法可以解决,两种hive参数,三种SQL,往SQL方向聊,以防他追问参数底层,参数这种东西最难聊了,别给自己挖坑
点赞 评论 收藏
分享
早川橙:大家少看点,少刷点,每个人的情况都不一样。我是面完第二天就打电话了,电话还没挂offer就到了。网上的没法参考
点赞 评论 收藏
分享
评论
4
5
分享

创作者周榜

更多
牛客网
牛客企业服务