阿里云

收藏
企业服务
10000人以上
上市
杭州
校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
销售类
最新
热门
30分钟 0.自我介绍1.谈了谈有无考公考研的打算2.回归正题 介绍项目(某硅谷的离线实时,还有paimon湖仓)讲了讲ads层指标什么三天登录,用户流向分析之类的,我说这三个项目指标都差不多问了我在哪做的,我说在自己虚拟机上部署的问数据来源,我说是有模拟生成业务库数据和日志数据的jar包,然后讲了一个这两条链路的数据的路径,maxwell,flume,kafka什么的然后问我paimon湖仓 怎么做的  我说paimon湖仓用官方的mysql-paimon的包直接进行同步,代替了maxwell然后我说paimon的snapshot+tag代替了传统离线的拉链表,感觉很方便,问我什么地方做的拉链,我说的用户表,然后我又讲了讲hdfs的小文件,paimon怎么解决的实时写入的小文件问了有没有遇到过什么问题  我说遇到执行任务的时候doris fe节点崩溃,查不到数据,然后我就一直扩大内存,虚拟机也搞得一台25g了3.flink怎么保证数据不丢不重   我答了kafka支持事务,checkpoint记录状态和kafka消费位点,又讲了paimon sink的时候自动清除没有snapshot指向的manifest来删除故障前多读的数据,说了一堆paimon相关的,比如lsm树文件结构,checkpoint时产生snapshot,还有paimon写入文件的大概流程4.数据倾斜  我说的原因就是比如短视频业务下某个视频火了产生热点key,导致某个分区数据特别多,可以用flink的重分区算子,写代码加盐打散,或者自定义kafka的分区逻辑5.sql优化  我说的谓词下推提前过滤,多表join优先join小表,还有starrocks,doris这些olap引擎的CBO优化查询,讲了starrocks物化视图是一个实际读出来的表,可以设置新鲜度来变更读的频率,而且CBO会自动查询sql语句的查询结果是不是某个物化视图的子集,以此来优化,然后这些引擎底层也会帮我们做些优化。6.问我知道paimon的结构化非结构化数据的存储格式吗    不知道,没接触过6.1讲一下什么是湖仓一体 我说是湖的各种数据都能存和仓的规范的,规定好字段名,类型等元数据便于分析的能力的结合,我自己又说了一些什么schema on write,read之类的7.问我还知道什么数据湖技术  我说iceberg,hudi 区别我之前看过,但是忘了,我就记得paimon和flink的集成比较好,比较亲儿子,然后就没问了8.怎么看现在很多人都投身大模型行业   我说的感觉很正常,因为这个ai本身看着就很吸引人()8.1我说我用过那个阿里云的data什么,面试官说dataworks是吧,就是我们之前做的,问我还用过什么,我说阿里云的flink,fluss都用过,也用过神策,然后面试官讲了讲他们的产品8.2说了说我做过的其他东西,我说我搭建过网站,做过抖音小游戏但是上架太麻烦()9.英语好不好  我答:半废   面试官说那海外业务就不考虑你了10.怎么看data+ai (因为我简历上写了了解data+ai)我说的就是从前我们用个什么库只能对文字完成基本情感的正负分析,而引入了大模型就可以做出更精确的判断,比如用在用户直播间识别弹幕给主播提建议,或者金融行业智能agent检测到风险实时邮件通知之类的反问 15分钟1.flink现实市场上用的多不多2.paimon这类数据湖到底用的多不多当时忘录音了(),有的问题记不清了整场面试也是又说有笑,面试体验给到夯()🤠🤠🤠
查看21道真题和解析
点赞 评论 收藏
分享
1.对 Hadoop 各组件之间通信所使用的 RPC协议的具体内容2.Hadoop 中读数据的完整流程(包括客户端发起请求、与 NameNode 交互、与 DataNode交互等各环节)3.在数据传输过程中,若 DataNode 突然挂掉,Hadoop 系统会如何处理(包括任务重试、数据副本恢复等机制)4.HBase 源码的核心模块、关键类及底层实现窪捞轶货嶍瑛冶辑(如数据存储、读写流程等相关源码细节)5.在 HBase 中构建二级索引时,通过何种方式或机制保证索引数据与原始数据的一致性(如事务控制、同步更新策略等6.JVM 的具体架构(包括程序计数器、方法区虚拟机栈、本地方法栈、堆等组成部分);堆内存的划分的原理及适用场景;以及平时实际工作中是否会调整GC算法调整的依据是什么7.JVM 参数中,-Xms(初始堆大小)和-Xmx(最大堆大小)仅设置其中一个,与同时设置两个且值相同的情况下,对 JVM 运行产生的具体区别8.如何通过命令或工具查看当前 Java 进程中内存各代(新生代的 Eden 区、Survivor区,老年代等)的内存占比情况9.用于查看 Java 进程中线程堆栈信息的具体命令(如 jstack 等)及使用方法10.如何查看 Java 进程中某个对象的具体大小包括对象本身及引用的对象所占用的内存),可使用的命令或工具及操作步骤11.排查堆内存泄露的方法,除了将堆内存Dump 出来用MAT(Memory AnalyzerTO01)分析之外,还有哪些更简单直接的排查方式
查看11道真题和解析
点赞 评论 收藏
分享
11-11 04:10
门头沟学院 Java
1. 面试官自我介绍,团队搞防火墙应用的。2. 自我经历盘点3. Rust、go与C++印象最深刻的特性(泛型,实际讲的不好,没串起来)4. 面试官说你懂网络吗,楼主说为了teg腾讯会议组看过一大堆http3面经,让他问问,面试官说看你很懂的样子就不问了。5. 写题:- 层序遍历- 最长有效括号本来以为shopee与pdd的ide就够难用了,阿里云的更是依托,pdd好歹面试官还能一键运行,阿里云的竟然是纯文本编辑器,面试官估计打开了leetcode复制楼主的上去跑,跑了三四遍,每遍出什么错都要口述给楼主debug。6. 智力题100只老虎,1只羊,有以下规则:- 所有老虎都想吃羊,但是更想活下去- 老虎吃羊会变成羊问100只老虎会吃羊吗?楼主从乐子人的角度指出只有有一个老虎吃了羊,其他老虎也会吃,然后系统就会坍缩至一只羊。面试官乐了,但是不对。老虎都是理性老虎,所以要这样分析:1只老虎1只羊,老虎肯定吃羊;2只老虎1只羊,由于理性老虎知道谁先吃谁就死,所以都不吃;3只老虎1只羊,由于任意一只老虎都知道只要吃了羊,系统就会变成2只老虎1只羊,这样就没老虎敢吃了,所以老虎会吃羊;以此类推,奇数只老虎会吃,偶数只老虎不会吃。理性老虎真的是太理性了,楼主都没这么理性。6. 反问:部门:防火墙
查看6道真题和解析
点赞 评论 收藏
分享
11-09 12:10
门头沟学院 Java
1.阿里云转正流程走了吗?我说还没,我说今年从答辩改成四轮面试了(我当时以为整个阿里云都这样,后面才知道只有我们组不答辩,是面试,而且一直以来都是这样),她问是整个阿里云都这样吗?我说不清楚,我找的一个活水面也是要这样面试。2.为什么要找活水面? 当前组业务不赚钱。3.你认为什么样的业务才赚钱?快手那边组是做内部提效软件的,赶紧找补,4.阿里云实习有什么感受?强度不高,但是能学到技术。5.强度不高是具体指?6.微软和阿里云实习有什么区别?喜欢哪个?7.投其他公司了吗?到哪一步了?8.你觉得你对校招岗位最看重的是哪些?普适性和自我提升 团队氛围 钱9.希望薪资?完全没经验,先说了希望25k+10.希望在哪工作?北上杭 >深>其他11.为什么出国?12.出国花费高嘛?13.为什么想回国工作?14.怎么找的第一份实习? 我还嘴贱提了之前本来要去快手的,结果微软来offer就把快手鸽了。15.本科朋友去向咋样?我说都挺好,清华 上交 中科大等等16.为什么没本科工作?家里希望我拿个硕士文凭,怕学历贬值17.学校学习和公司工作区别?我说了学校更循规蹈矩,公司要探索业务。18.你说公司要探索业务,但是你之前有说你是比较任务导向型的,这是不是比较矛盾?我赶紧找补,说前期任务导向效率高,后期业务理解透彻了去探索,19.职业发展规划?技术方面,根据校招第一份工作决定深耕哪方面技术。
查看21道真题和解析
点赞 评论 收藏
分享
11-09 11:15
门头沟学院 Java
1.在阿里云实习怎么做的?组里做的是什么?需求来了你是怎么上手做的? 有什么成长,技术上学到什么?我说了个具体的例子,主要聊了消息队列解耦,还有学习内部技术论坛的帖子。2.什么情况下应该去解耦?3.聊一个技术论坛上看到的最有收获的技术,聊了RocketMQ和Kafka区别,零拷贝,存弭¦一储秣海,高可用,namespace等等4.如果你在一个新团队,你怎么选择用RMQ还是Kafka呢?我主要说看业务场景和企业基础建设。5.https和 http区别。讲了https加密过程,数字证书。反问我那请求时候的url会不会加密呢?6.去哪申请数字证书?了解过有证书颁发机构,具体不知道。7.如果私钥泄漏了该怎么办?我先回答换私钥,他问还有呢?私钥泄漏了中间人就可以拿到数字证书了。然后我回答去废弃老的数字证书。8.tcp和udp区别?聊了udp不可靠,聊了qq之前的实现(用 udp改的,所以QQ聊天会乱序)序)。他问我那想要udp快捷但是不乱序怎么办?能从应用层改吗?我说感觉还是得从传输层改 udp协议。9.synchronized和reentrantlock区别10.hashmap底层11.String怎么保证不可变的?答了字符串常量池(感觉他想让我说 String底层用的 final)12.项目里乐观锁防超卖咋做的?13.gc日志看了什么?14.项目用的哪个垃圾回收器?15.sql注入是什么?怎么防范?我说用安全包防范,他问我包里面那些具体实现。只回答了一个字符串过滤,16.jwt是怎么实现的?聊了无状态,签名算法。他问我签名算法有哪些?保证了什么性质?算法:两个有序list合并
查看17道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务