字节大数据开发实习一面凉经
大数据方面
1.spark streaming和flink的区别
2.hbase的数据结构
3.LSM树为什么要用布隆过滤器
4.LSM树和B+树做比较
5.HBase的memStore的刷写
6.HBase的大合并和小合并
7.Hbase的HFile的格式
8.Hbase为什么适合写
9.Hbase的大读小写问题(这个压根没听过,应该都记错了,反正是个它会产生的问题,我听都没听过的一个东西)
10.Kafka怎么保证有序性、不丢失、不重复的,生产者怎么做消费者怎么做都讲
11.Kafka设置ack = -1时一定会保证消息不丢失吗
12.如果ISR集合中的所有副本全部挂了会发生什么
13.spark streaming消费kafka的两种方式
Java
1.为什么密码一般都要用char数组来存,而不是String呢
2.String在JVM中的存放形式是怎么样的
3.手写单例
4.为什么要加volatile
5.这里不用volatile会发生什么
6.指令重排会影响什么
7.HashMap、TreeMap、LinkedHashMap的区别,底层都是什么
8.为什么要遗弃hashtable
9.我现在向TreeMap和LinkedHashMap依次插入B,C,A,你遍历打印都会得到什么
10.Java出现了OOM问题时,我怎么去定位它是哪里出现的问题
11.讲一下Spring
MySQL
1.说说你知道的索引
2.联合索引的最左匹配
3.我现在给你一个(a,b,c)联合索引,我where a = 1 and c = 2索引怎么走的,where a = 1 and b like怎么走索引,什么时候索引失效
4.讲一下binlog的组织格式
计网
1.tcp和udp的区别
2.tcp怎么实现可靠的
3.tcp校验码怎么做的
4.说说你知道的校验码都有哪些
5.http状态码204、401、405、407、301、302
6.ping用过吗,说一下ping的数据报格式,字节数
算法
类似于leetcode上合并区间那道题,只是改成了要新加入一个区间,然后插入了这个区间后最终区间会变成什么
还能记起来的就这么多了,面了这么多数开的,第一次被问这么多计网,真的是遇到的最难得一次面试了。唉,查漏补缺叭,差的还好多。
#字节跳动实习##大数据开发工程师#