联通数科 一面 数据开发

昨天面的,三个面试官。

开始就是自我介绍。

1、第一个面试官问了问我一个数学建模的题目。我自己提了一嘴lstm,问了一下三个门

2、问了个sql题目,id不一样,邮箱有重复,怎么选出来,说用pandas也可以,问我pandas,不过我确实不常用pandas就没答出来

3、场景题,有通讯时间、地点、上网记录,如何判断哪些人是学生。

第二个问我懂不懂kafka、Hbase这些,我说不懂,就结束了。

感觉是不行了,sql这部分让我看代码或者写可能能写出来,不是很熟练。突然问我,我有点紧张,最后想了想说把出现次数大于1的挑出来。

全部评论
第二个问题什么意思,选出来什么
点赞 回复 分享
发布于 2022-11-22 12:13 上海
这公司有毛病,钱很低还要求挺多
点赞 回复 分享
发布于 2022-11-14 02:08 山西
感觉是同一批面试官 我也问的这些
点赞 回复 分享
发布于 2022-11-11 16:24 北京

相关推荐

一·语言方面:由于很多大数据框架都是基于JAVA开发的,个人认为JAVA语言是必不可少的,有余力的话可以去掌握以下PYTHON😊二·数据结构与算法:大二课上没好好学,现在只能再补一遍了,悲😣打算刷完Leetcode的Hot100就先放一边,等秋招再刷别的题😇三·MYSQL:一个关系型数据库管理系统,SQL BOY的开始,初步领略通过建表来管理数据的思想,学完可以去刷一下基础50题和进阶50题(虽然本菜鸡只刷了基础50😓)四·Linux:会安装虚拟机,掌握常见linux常见命令即可五·Hadoop:一个分布式计算框架。所谓分布式,就是将一台电脑无法处理的数据量分散给一个由多台电脑组成的计算机集群来处理,互相分工,彼此合作,形成一个有机整体。框架分为三部分:HDFS(数据存储),MapReduce(数据计算),Yarn(资源调度)。虽然MapReduce已经逐渐被Spark淘汰,但思想依然值得借鉴。高可用机制也应当学习六·Maven:会用即可,打包项目用的七·Hive:也是一种SQL,有了MYSQL的基础应该还算好理解八·Scala和Spark:Spark是用Scala写的,在学习之前得先浏览一遍基本语法。Spark是基于内存的批式计算引擎,已经逐渐取代MapReduce(基于磁盘的计算引擎),APACHE也基本上停止了对MapReduce的更新(经典白学😃)。将来很多离线数仓项目也都是基于SPARK的,可以说非常重要了九·Kafka,Hbase,Flume和ZooKeeper:都是一些小组件,将来面试可能会问到十·Flink:一个流式实时计算引擎,本人JAVA基础较弱,听的时候也是懵懵懂懂当然,仅仅这些肯定远远不够,本人将来还要学Doris,数仓建模理论,数仓项目,八股面经等等。上述理解如有错误还请友好指正(叠甲叠甲叠甲😱)。这些理论也只是匆匆过了一遍(大一太贪玩,大二2月份才开始学),发布笔记也只是记录自己的学习过程,提醒自己不要懈怠(还有当个免费网盘😏)。如果能帮助到你就更好了,虽然我也比较迷茫😖
点赞 评论 收藏
分享
06-26 10:10
已编辑
浙江理工大学 C++
6.20 一面(1小时)1.自我介绍2-?都是c++的基础八股,不难,忘了,提一下记得的,oop三特性,多态,虚函数,动态数组,vector,插入频繁用什么,智能指针,类构造和析构顺序(抢答成员初始化顺序)?+1 合并区间,应该是简单题?+2 设计一个动态数组,包含添加插入删除元素的功能6.24 二面(18分钟???)1.介绍一下校园或者是实习经历(没自我介绍)2.看你客户端,服务端,底层都有涉及,你更倾向于什么,为什么3.说c++八股一面问过了不问,问了爬楼梯4.有个画图功能,需要加入撤销恢复功能怎么设计5.一张a4纸上有若干点,每次查询随机给出一个圆心和半径,如何快速得到所有在圆内的点,答的自底向上的分块,引导自顶向下的分治6. 一枚质地不均匀的硬币,也就是抛出正反面的概率不一样,两个人需要通过抛硬币决定谁赢,怎么设计规则比较公平啊,二面过了,等6.25三面+hr面6.25 cto+hrbp(17分钟)1. 对方自我介绍2.跟2面的2一样3. 没八股,好像是问的项目中的某个问题,一开口就停不下来巴拉巴拉然后被打断了4.刚才提到实习中有搜索相关模块如果背包中有上万种物品,如何进行快速的搜索。5. 现在是能立即到岗吗6.反问7.跟2差不多8.提到习惯为用户考虑,有没有具体的例子9.对业务了解怎么样10.期望薪资11.现在是住在xx区吗12.反问问到引擎熟悉度,坏,破绽了6.26 三面过了,等安排终面
查看38道真题和解析
点赞 评论 收藏
分享
评论
2
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务