数据分析师精选面经合集
51家公司
174篇面经
最新 热门
/discuss/609780481067896832/feed/main/detail/15d2ca19211d4eb5bef80d150790a2eb/discuss/609705911371698176
头像
昨天 11:12
Python
腾讯软件工程-数开实习三面
昨天面了腾讯软件工程-数开实习的三面,下面记录一下问题:1.自我介绍,有无实习经历(无),做的两个项目是自己练手的?(是)2.描述了一个场景,有一张员工表,有姓名、年龄、性别,求出所有姓张、年龄小于20的所有女性。口头作答3.刚才你说的这个sql怎么优化?(添加索引、联合索引)4.添加索引有什么副作用?(会占用空间)5.假设表的内容越来越多,比如上千万行,怎么优化表?(分区、缓存)6.怎么缓存到内存?(用redis这种内存数据库)7.内存数据库和非内存数据库的读写差异?(内存数据库读写可以在微妙完成,非内存数据库的读取速度取决于磁盘I/O性能和数据量大小)8.为什么非内存数据库就比较慢(因为存储介质比较慢)9.什么硬盘比较快?(固态硬盘)10.固态硬盘和机械硬盘读写差异有多大(由于固态硬盘使用闪存存储数据,它们具有非常快的读取速度,机械硬盘使用旋转的磁盘和读写头来存储和访问数据,比较慢)11.毫秒级别是什么场景?(操作系统的数据加载、固态硬盘的读写)12.SSD的缺点是什么?(价格贵,容易老化,数据丢失)13.为什么SSD会随着使用时间的增加而性能下降?(写入操作会导致存储单元的磨损,温度也会使性能下降)14.假设表很大,行怎么拆分?(可以考虑用时间分区)15.除了日期,还有什么可以水平拆?(地理位置、实体属性、业务流程)16.年龄性别怎么分?(年龄按年龄段分,性别按男女分)17.怎么评价划分好坏?(属性的区分度要好,分区后的数据尽量要均衡)18.有什么好的分法?19.如果从中国所有人里面搜索,怎么样可以快一点?(按省市区县分区)20.按地域划分的缺点?(分区后数据可能不均衡,比如深圳是千万级城市)21.python跟c++和java的区别是什么?22.linux查看系统资源,cpu怎么看?23.top看到的ioswap是什么原因?24.怎么解决io等待?25.磁盘上部署大量的 I/O 密集型任务,怎么均衡?26.公平调度是什么?27.有什么不公平的方法?28.爬泰山有10000级台阶,每一次只能走1,2,3步,怎么做?(用动态规划)29.这个动态规划的优点和缺点?30.这个动态规划代码的缺点怎么优化?31.自顶向下的记忆化搜索,怎么避免重复计算?32.最擅长的技术今天看到3面过啦!希望hr面顺利
点赞 评论 收藏
转发
/feed/main/detail/1b1ea5ea3b974c84860980f3c19b214e/discuss/609696748545511424/feed/main/detail/f8ecac2ded9444168b63362d6855a2ad/discuss/609490072651485184/discuss/609460934750294016/discuss/609416534775046144/feed/main/detail/18c364dac3ac4a0cacf4bee9b8793acd/discuss/609343321563025408/feed/main/detail/3bb10e39ff3849d3b637052e1275b662/discuss/608994293511970816/discuss/608743858800701440/feed/main/detail/493e7270d13842a3961e7b7fa42235ac/feed/main/detail/ac47cde30c4140b89d260f7fbf64820d/feed/main/detail/22107ad0cb48419d94fac393f09100d0
数据方向必考SQL 连续登录问题
#数据人的面试交流地##数据人##SQL面试#**均为社区同学面试遇到题目**题目:找出连续登录5天的用户图1为模拟数据图2为运行结果Hsql解法如下selectuid,curr,5_dayfrom (        select                 uid,                to_date(`login_date`) curr, --当前日期                last_value(to_date(`login_date`))                         over(partition by uid order by to_date(`login_date`) asc                                 rows BETWEEN  CURRENT ROW and 4 FOLLOWING) as 5_day, -- 当前日期后四天的日期值                DATEDIFF(                last_value(to_date(`login_date`))                         over(partition by uid order by to_date(`login_date`) asc                                 rows BETWEEN  CURRENT ROW and 4 FOLLOWING),                to_date(`login_date`)) AS DRFF_DAY -- 当前日期后四天的日期值 - --当前日期 = 最近五次登录的间隔天数,间隔4才是连续登录5天        from                  (select distinct * from tmp) t1 --一个用户一天可能登录多次,只保留一次) t1 where DRFF_DAY == 4#数据人的面试交流地#更多实战题目及解法思路都在社区!
点赞 评论 收藏
转发
/feed/main/detail/59791848ac6943fab8e77bb92fd838cb/feed/main/detail/692d2f1edd3d4770a0e588a0381e6190/feed/main/detail/df6298a4bbb747e783f80fe3e27220d1
玩命加载中
写面经
发动态
发动态
发帖子
写文章

全站热榜

牛客网
牛客企业服务