多点生活 一面 视频会议

#26实习你准备好了吗##26届实习[话题]##大数据面经#
友友们第一次接到这种规模还算可以的公司面试,求指点
面试官:做一下自我介绍
我:面试官您好,我叫XXX,就读与XXXXX(学院本) 软件工程专业数据与软件开发方向 目前是大三,在校期间主要学习了Hadoop Spark 等大数据相关课程 
面试官:hive用的多吗
我:多,我在学校期间主要做的项目就是数据采集 处理分析,其中处理主要就是利用hive
面试官:ok,hive的内部表和外部表有什么区别
我:内部表和外部表主要是对于表结构和具体文件数据的关系,外部表的一些表操作比如删除操作,不会删除文件数据,仅仅是删除表的元数据。而内部表的操作就会影响到具体数据文件
面试官:ok,hive的静态分区和动态分区的区别
我:hive的静态分区主要是在建表的时候就手动指定分区,动态分区是根据表中具体的字段进行分区设置,静态分区之后会产生一个分区列在表结构的最后,但不作为表的具体数据字段。
面试官:ok,动态分区主要运用到哪些场景 可以是其他数据类型吗
我:主要运用到分区像时间这种,每天一份数据放到不同的日期分区里面存储,
这个应该是可以,具体我没有用到过复杂数据类型,不太了解这块
面试官:好,OK我这边没什么问题了,你还有什么需要问的吗
我:咱们公司这个面试流程是怎么样的
我会综合比对一下,如果你过了我这关我后续会联系你的
我:好的,那具体薪资这些我就等后续详细再聊,我也没什么了
结束断开视频会议
全部评论
过了吗
点赞 回复 分享
发布于 07-04 08:46 河北
哇好友善的题目,稳过
点赞 回复 分享
发布于 06-30 17:06 广东
不知道能不能过😅
点赞 回复 分享
发布于 06-29 20:02 甘肃
我也是这些问题
点赞 回复 分享
发布于 06-29 20:01 甘肃

相关推荐

06-30 21:10
门头沟学院 Java
1.自我介绍和技术背景2.问项目,问聚合支付项目是否做过压力测试,能支持多少QPS。问了项目中的熔断做了什么,怎么实现的熔断那里用Hystrix实现,返回保底数据。压力测试我不清楚说多少合适,就说没做过压力测试3.系统困难点和收获困难点我就回答的在一些逻辑设计方面不太完善,有一些设计缺陷导致给后面的开发挖坑需要花时间弥补。4.是否考虑到高并发的场景,怎么优化后续可通过加锁和多级缓存来优化5.如果系统突然变慢了,应该怎么去排查问题出在哪里  (这里答的不太好因为没考虑过这个问题)我回答去分层排查,先看dao层是不是因为某些sql查询时间过长,然后如果是就看情况加索引、优化sql语句。如果是因  为受到攻击导致系统不稳定可进行请求的监控。6.如果程序运行时,进程突然挂掉,应该怎么排查( 这里也没答上来)7.说下AOP原理通过动态代理,jdk或cglib,我讲了讲我看过源码,讲了讲动态代理实现以及AOP的应用(日志、方法运行时间记录)8.线程池的参数和工作原理,应用场景9.做过哪些mysql优化  (我答完后他问我还有吗?可能他想听的我没说出来)慢查询、explain分析、选合适的字段加索引(非空、使用频繁且更新不频繁)、避免索引失效(违反最左前缀、使用模糊查询、隐式类型转换、使用函数等)、批量插入代替单个插入,顺序代替乱序,手动控制事务+批处理,更新时where的条件应匹配索引防止行锁升级为表锁等。10.如何解决redis和数据库数据不一致(答得不够好)我答的更新时先更新数据库再删redis,如果先删除redis的话需要在更新数据库后再删一次。11.缓存雪崩或穿透等解决方案防止大量数据集中过期(增加随机过期时间),使用布隆过滤器防止大量请求访问数据库,防止缓存穿透可缓存空值,对访问数据库加锁(使用信号量进行配额),使用多级缓存,进行数据预热并监控。12.未来学习方向,学习新技术是怎么学的
查看12道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务