1、自我介绍2、简历项目深挖3、数据聚合的方式4、etl开发的主要技术栈(八股文)5、python的常用数据类型的区别6、数据结构类型的查询的元素的时间复杂度(分情况而言)7、字典底层的哈希表,如何解决计算哈希值的时候,key值出现冲突问题8、python的gil9、numpy与pandas的向量化操作,性能为什么比python本身的循环快很多10、kafka的核心概念(组件)11、生产者、消费者:(1)kafka里面的消费者的关键概念是什么(2)一个主题有三个分区,现在消费者组有两个消费者,这时候是如何运行(3)两个消费者组在消费同一个主题的数据,在什么场景下会应用到(达到计数或者数据互不干扰)12、ai模型的使用以及认识13、反问