回馈牛客,头条日常实习-数据挖掘offer(附一年面经)

  • 头条-Data搜索部(数据挖掘)(牛客内推板块)

一面

自我介绍
question1:
给定数组返回任意满足(当前数大于左右两个数) 要求时间小于O(n)
开始想返回随机数,面试官提示小于O(n)就是logn 就是二分
想了半天放弃了QAQ
question2:
给定random7返回random10
想了半天放弃了
question3:
蛇形打印,前两天刚做过,写完代码说n!=m的情况 改了一下输出没问题
问自己优点
问说自己为啥前两个题没想出来

以为凉了,差点去吃饭

二面

自我介绍
了解STL吗 问map内部实现 红黑树和AVL的区别 为啥是红黑树
有点凌乱
问top n
写题:bfs非递归遍历二叉树
应该是queue<Tree*>q 写成了queue<Tree>q
问熟悉GBDT吗(挣扎了一下,不会 (这个要好好看看了
两面都问平时写啥语言
问你都用啥 那说一下SVM吧 balabala
介绍一下自己会啥 擅长什么(已经懵逼了
让我提问,问啥部门,说是搜索部门


HR面

先确认实习时间保守估计12.24 原因:1.项目交接 2.项目中期答辩
都是学校的项目?
时间4天?5天?
实习多久?6个月
怎么想保研跨专业?编程感兴趣
本科保研踩线
大学精力分配比例?地信学业,ACM(负责校赛),学生工作 计算机占一半,学业1/3
为什么当时做学生工作,CS有学生工作的少
锻炼了什么能力?
分享一个办的精彩的活动?介绍了四六级讲座
对方是否有参加人数要求?对方没要求,我们四级200+人
是否统计都是本学院?
为什么参与人数多?
办活动背景?学习部应该组织,上一届外联部干
负责多少人?20左右
都需要做什么?需要这么多人?
为什么觉得精彩?精力充足

硕士科研多?科研+海报
科研项目做的最好的?DR
DR背景?老师横向课题,实验室没接触过,自己积极想做,想做算法相关的
你负责的?
一共几个人做?师兄做了网页
遇到困难?
通过什么学习?
是否当时看论文?
为什么当时没看?着急要,后来看了论文,公开比赛
未来想做算法,为什么?本科毕设就挑战一下,开始感兴趣
优点什么?勤奋,效率,沟通能力,相处能力
缺点?压力大的时候会着急
爱好?后期,大一开始,因为代码搁浅了,海报有成就感;视频酷炫

如果没问题的话,这周联系
  • 腾讯IEG(数据挖掘部)机器学习 日常实习 (牛客内推板块)

一面

自我介绍(还是有点磕磕巴巴
问SQL优化 简历里的有的那句话 扯说加了索引
介绍视网膜分类,迁移学习,为什么用这个
第一部分和第二部分的对比做了吗?图像多少图片?比例是多少
样本少?你怎么解决的?白噪声 opencv中的函数
旋转怎么做的?视网膜检测对于方向不敏感
特征提取怎么做的?DL没做特征提取,说了一下预处理的亮度归一
准确率能到多少?
两个不同思路?VGG改进了什么?(这个问题以后要好好看,结合VGG论文
dropout是怎么调整参数?
问抽样的方式?(这个问题不会
希望负样本少一些怎么做?
抽样怎么做的?扯到bagging
脑电信号项目中 决策树怎么抽样的?除了随机有什么方法
随机抽不会不均匀吗?
情绪分类中CNN比传统的什么区别?
我说精度高一些?
问是否有对决策树调参数
问是今年做的?时间和简历对不上
结果光速打脸 人家查了博客总结 说16年有别的80+%的
一直揪着决策树……问决策树的原理(好好背吧
说了ID3 C4.5 CART 预剪枝 后剪枝
有真实的场景吗?为什么树的深度会影响过拟合
博客上有redis 其他key-value有知道的吗
说了自己想改oj榜单
有实际使用吗?
问啥学呢?
Python研发工程师什么鬼?(该死的牛客简历
整个精度是多少
想改进方向
基于语义,后面问是啥意思
问我是整个图分类的?(当时我就没听明白
这个不是识别嘛?
那我想做识别?fastrcnn yolo
Fastrcnn是啥?(自己挖坑自己跳吧
经常用的语言 py
py中一段文字找匹配ID多少次?答KMP
两个队列 找多少词是重复的 频率是多少
先说了M*N
先排序 时间复杂度 :排序nlogn
用什么排序 py中
sort原理是什么?(我说是快排 好像不对
python sort函数内部实现原理 - 焦***的随笔*** - 博客园 https://www.cnblogs.com/clement-jiao/p/9243066.html
怎么存重复出现词的频率
问时间复杂度 答:两个指针的是O(m+n)
工作感兴趣的点
什么叫做偏算法的工程
说数据挖掘感兴趣 你做的都是CV啊
算法不局限于CV啊
推荐 NLP不感兴趣
实习时间?实验室不需要出勤吗
就是找工作之前都可以实习吗
问是什么部门?腾讯互动娱乐部门 数据挖掘部门
如果ok 这周会约

二面

问啥啥不会啊 根本不用纠结怎么去商量早实习了 太太太菜了
===================================================
介绍视网膜图像分类(这个项目真的好好看,每次必问!
集成学习都有啥,除了bagging还有什么?
有什么区别?(勉强答上了) stacking忘了
boosting之间有很强的依赖?什么叫做基于上一个分类器,具体讲一下
你说的是adaboost 还有其他boosting的算法吗?
答 梯度提升决策树和adaboost有什么区别?
前者一定是决策树,还有是基于残差进行的训练
什么叫做基于残差的训练?为什么基于残差这么设计?(我就没懂问啥,就是因为基于残差啊……
leaky-ReLU和ReLU的区别?(介绍ReLU拖延时间,
理论上来讲,Leaky ReLU有ReLU的所有优点,外加不会有Dead ReLU问题,但是在实际操作当中,并没有完全证明Leaky ReLU总是好于ReLU。
(我说对了
对这个数据集如何评价的,介绍二次加权Kappa,但是我貌似没介绍二次加权的意思
问脑电信号分类,也用CNN了?提取特征是给CNN的吗?
63*80是什么?
CNN中这个63*80是什么?就相当于是这个图片?用的什么模型?
用的theano?用的tf 然后自己说了v1-v2-v3的区别
接触过hadoop spark?介绍map-reduce的模式?如果有特别多文章,如何用mapreduce处理?
(这个hadoop下周也要开始学了
介绍oj
redis接触过?(估计是看我博客或者上一个面试官写评价这个了 我是不是应该庆幸我博客还没写docker?
LSTM中为什么经常是两层双向LSTM?https://mp.weixin.qq.com/s/0InF2ke1PxhBfqlxIGvKCQ
(为啥是双层的 等我学到那里再说吧
(NLP这个真不熟,门结构都说错了,是输入门,记忆门,输出门
tf或者 theano中如何做到自动求导的构造?
没答上,记得我看过很久以前
tensorflow的函数自动求导是如何实现的? - 知乎 https://www.zhihu.com/question/54554389

三面总监面

确认实习时间 我说一个月之后 实习至少到6月
万年不变的自我介绍(还是说磕磕绊绊的
介绍项目(视网膜图像分类和脑电信号 (所以说 以后要详细的整理项目经历
问为什么用迁移学习(今天回答的第二遍
自己扯出来v1 v2 v3
问脑电信号的背景
问导师是做什么方向的 (其实要是说实验室没人做这个方向是不是显得自己学习能力强?
问现在做的CV也是课题之一?
问传统机器学习都知道啥?监督学习or半监督学习
介绍了一下本科毕设
用了PCA为啥用balabala
说一下SVM(今天回答的第二遍
说一下逻辑回归(这个时候老师进来了,也没搭理老师,师兄说我面试呢
有没有做过推荐?还是不作死说自己没接触过
问了一下本科专业,为啥不学了
平时有钻研过什么吗?用啥学啥吧 最近看论文
问平时玩游戏吗
我坚决否认,发现不对,想起来是IEG,说不怎么玩
毕业方向?互联网?业务领域?
是否排斥游戏,如果需要玩游戏玩吗?玩啊,解释说是自己学业比较忙
问哪里人?深圳是不是远,我说房价稍微低点挺好的
再次确认实习时间
导师没问题?
跟之前面试官在沟通一下……

还是有些慌张,总共20分钟,面试官好像记录的很详细。

HR面(等结果)


确认是去深圳实习
在什么渠道找的内推?牛客网
之前是否实习过
项目经历DR是导师的项目?
班级有多少人?
哈尔滨人?
父母从事什么工作?
独生子女?
平常除了导师的项目还有别的嘛?学生工作balabala
DR这个项目是偏学术还是偏工程?
大的项目组?人不多,其他人是做web
OJ是啥?
知道自己什么岗位吧?
再次确认深圳?
提问?下一步通知什么时候?
3-5天
你有什么情况?项目交接一个月(你可以和业务沟通),中期答辩
对方欣赏这种把手上工作做完
会发邮件,有指定电话

  • 百度秋招霸面

一面

假装自己是提前毕业的同学去凑的热闹==
问本科地信咋回事
问竞赛成绩 咋不是黑龙江赛区
介绍一个自己最熟悉的项目
是否考虑过前后两个实验精度不同是为什么
数据集来源
为什么选择迁移学习
出现问题不应该说是inception框架的问题
用没用resnet?
集成学习的细节
然后就是卡了能有半个多小时的题
html源码结构的DOM模型转成什么样的数据结构存储,其实就是问多叉树怎么存储,我当时就没想到多叉树的存储是存chlid和brother.提示了还卡了辣么久
然后说了我一下代码规范的问题
然后问遍及(原题背景简化以后)然后我一直纠结brother.怎么返回到father.后来发现一个while找自己的brother.就好啦 最开始还忘记return.叶子结点的情况了😂😂
再就是问如何处理过拟合
l1 l2都是啥原理dropout是啥原理
还有啥方法防止过拟合 工程上深度学习的方法有木有
提前终止,扩大数据量,验证集。不知道还有啥
(整理知识点发现还有逐层归一化
集成学习用没用过 bagging boosting.都是咋回事?boosting做预测的过程?(这个没答对)

面试官很耐心很耐心,面试了70分钟,面试体验非常好,虽然答的啥也不是😂😂

二面

自我介绍
介绍一个自己做的好的项目
用来描述精度的二次加权kappa是啥
二次加权
kappa是啥
(当时紧张啥了,真的忘记了,还扯出来一个MSE,醉了醉了)
问inception模型的演变
(这个滴滴 AI lab就问过 真得好好看看了)
估计面试官对我也挺无语的,问啥啥不会
开始写题
I love you转换成you love I咋写?只允许申请O(1)的额外空间
开始以为要计算变换后的位置,和面试官讲了一下发现行不通
然后想了一会儿想出正解了 写完了 面试官没说有错误 问了一下代码意思
第二个题
取top100
开始说大顶堆,发现没办法pop出来最小的
说小顶堆,讲了一下操作。
问时间复杂度,说nlogn,多说了100
发现不对,二叉树就是log级别的
然后让写top5的
写完了,结束了

主要是太太太紧张了,我又去不了紧张个毛线啊==


三面(挂)

这次真的凉了 本来可能是一个小时的 就面了半个小时
问项目中遇到的困难 如何克服
自己引出来了激活函数,问常见激活函数及其特性
sigmoid tanh ReLU Leaky-Relu
讲的很粗略
问sigmoid的导数
真的忘记了
其实可以现想的

问我啥是梯度消失,梯度爆炸
讲的依旧很粗糙

问场景题,问答系统,发现因为语料里面有骂人的,导致学出来的东西人都骂不过,怎么处理
我说人工标注
成本太高
说规定规则
可以
根据规则训练?
可以,然后加少量人工介入
没啥问的了,问怎么看待有压力的工作
我说我喜欢有挑战性的工作
面试官居然笑了???
然后 居然问起来了二面不会的损失函数是啥?MSE是啥

MD这都能忘QAQ
还问我交叉熵

面试官说我得面试完不会的复习一下 啊
然后实在没话说了,估计是觉得我问啥啥不会停尴尬?好像在翻我博客?说设计模式你学过啊?我内心一紧。面试官说我好久没碰了,改日拜读一下,我说见笑了

肯定是挂了,但是心满意足,毕竟今年面了这样大厂的三面了,知足了,

  • 腾讯视频-后台开发 日常实习 内推

一面(挂)

投错了 没看到有算法岗 投了后台开发
果然是大厂,一面问的太特么难了,还好是有录音
先自我介绍,应该提前准备的,有点结巴,对于项目的描述好歹自己做了
Q:维护linux是什么东西?具体?与c++关系
A:c++在linux上 http->https装SSL证书
Q:SQL注入如何防止
A:mysql-escape() 避免表中关键字
Q:如何自己写mysql-escape()
A:mysql关键字加表名和字段 oj不会出现这么巧合出现这些字段
Q:linux系统崩溃?如何定位?
A:查过日志,可以定位系统崩溃前最后执行的文件是哪个php?
Q:那你们的业务逻辑主要都是php?
A:c++主要做判题
Q:这个oj是多机还是单机?
A:是实际用的,用来比赛,考试
Q:是一个服务器还是多个?
A:是一个,业务没那么多,数据量没那么大
Q:简历上的c++守护进程
A:写了一段c++一直跑,查询mysql表中某行初始状态没判题的
Q:进程调试的工作?做了什么?
A:懵……4个进程
Q:多个进程的通信
A:有通信,有加锁
Q:进程如何通信?
A:消息队列
Q:毕设python分类 具体讲一下?
A:balabala
Q:支持向量机和ANN是独立还是合在一起?
A:独立
Q:SVM用了tool?
A:也有,手写的,后来的项目用的tf
Q:写SVM最难的地方?
A:balabala 第一个ML py的项目
Q:这个算法最难的地方?
A:balabala
Q:SVM最核心的思想?
A:最大间隔分类器
Q:特征几维?
A:8->4维
Q:距离咋算的?
A:高斯距离 平方
Q:c++ py熟悉否?
A:
Q:c++的多态熟悉吗?
A:扯到了函数重载 符号重载 虚函数
Q:多态是什么?
A:一个借口,多个方法
Q:函数重载是否编译的时候就知道是哪个函数?
A:编译中是静态联编,也有程序运行是选择的
Q:什么时候用虚函数
A:在暂时不用,以后留着接口用
Q:虚函数的实现原理?c++类继承机制,定义一个函数,传进去父指针,一个指针指向子类1,一个指针指向子类2,
A:菱形继承
Q:对,运行是才知道,实现原理怎么做的?怎么知道调用的是子类1还是子类2
A:唯一一个压根不会的
Q:不局限于标准答案,你想怎么实现
A:想了半天,不会……
Q:结束之后想吧……STL用的多吗?
A:之前比赛用的多
Q:vector大小
A:size()
Q:删除某个值的元素?
A:太尴尬了 这个词不会读……erase但是面试官知道我说的是哪个了……
Q:删除数值3的遍历吗?需要遍历整个vector?性能损耗
A:有损耗,STL慢很多。:知道扩增是两倍长度再找地方,删除的话,内存管理自动完成
Q:vector删除一个元素,后面的会不会往前移动?
A:不用自己手动挪,自动管理?
Q:如何避免?
A:不知道
Q:惯用方法是 先remove到结尾,再删除,会减少移动
A:嗯嗯,后面删除时间短
Q:所以设计vector需要考虑一下
Q:Linux命令和gdb调试
A:熟悉(打脸的一句话
Q:如何查询一个程序的性能消耗在哪里?
A:ps top
Q:这些只能看大概,如何看是哪个函数性能消耗在哪里?
A:答非所问…………
Q:cpu90%-60%如何看哪个操作性能大?
A:不知道
Q:python熟悉吗
A:熟悉
Q:深拷贝和浅拷贝?
A:(感谢数据堂之前问过
import copy中,balabala copy.copy() copy.deepcopy()
Q:直接赋值是深拷贝还是浅拷贝?
A:深拷贝,今天上午刚用过(更正,晚上对象说我深浅说反了,赋值应该是浅拷贝
Q:网络编程接触过吗?
A:oj用了
Q:有用网络模型吗?
A:(懵……
Q:ipo?
A:没接触
Q:oj服务端咋做的?做了什么?
A:(答的不忍直视 放弃了
Q:设计模型,项目中有用到过吗?
A:没特意用过,可能有写了当时不知道的
Q:适配器讲一下?
A:之前的接口再封装,复用现有的类
Q:面向对象中继承链条太长,导致类膨胀?用于解决类膨胀问题?减少类膨胀的速度
A:桥接模型:分离抽象和实现部分;建造者:建造和表示分离
Q:建造者更倾向于维护细节,和工厂一个是抽象一个底层,还有装饰器
Q:编程在linux还是windows,GDB?
A:用的不多
Q:用vs?
A:断点
Q:都可以
Q:视网膜那个项目,tf自己搭建环境?
A:对,自己一个人,从0开始
Q:参考什么搭建的?
A:书,网上资料,官方文档
Q:遇到问题?
A:windows不支持py2 从虚拟机移植到oj服务器中,不能破坏原有的环境,不能冲突
Q:tf具体实现讲一下
A:CNN各个函数conv2d() pooling() dense() loss adam balabala
Q:tf自带函数?
A:对
Q:20年毕业?
A:对
Q:实习时间?研二有课否?
A:没课,项目结束
Q:也就是研二开学能来呗?
A:嗯嗯


滴滴AI lab面试 算法 春招实习

CNN拆成3x1 1x3的优点
c++多线程
智能指针
TensorFlow py转成c++怎么做?makelist
cmake语法


快手春招实习-算法

一面 :不到30分钟

1.快速幂
2.inception系列区别
3.是否看了正则化、优化算法、的论文
4.项目时间分配
5.int a=100 printf("%s",a)

二面:45分钟

1.n个独立同分布方差是什么
2.batchsize选择 大小影响什么 如何描述波动
3.Slim
4.链表快排
这个是最冤的 明明告诉进HR面了 ,没等面到我呢,人招满了


其实还有谷歌的实习面试,不让说面试题(全是手写代码,大概是leetcode中等题偏上的难度,不算太难,但是自己写的慢,第二个题没写完,挂了)
发面经攒人品,求正常能去实习
感谢牛客网!!!!
感谢牛客网!!!!
感谢牛客网!!!!
#实习##面经##算法工程师##字节跳动##腾讯##滴滴##快手#
全部评论
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:08
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:08
联想
校招火热招聘中
官网直投
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:10
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:14
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:21
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 17:29
膜一膜林大研究生学长
点赞 回复
分享
发布于 2018-11-15 16:59
膜一膜林大研究生学姐
点赞 回复
分享
发布于 2018-11-15 17:17
膜拜搞算法的小姐姐
点赞 回复
分享
发布于 2018-11-15 17:26
膜一膜林大漂亮可爱腻害的研究生小姐姐。嘿嘿嘿。快夸我快夸我。
点赞 回复
分享
发布于 2018-11-16 09:42
20届的吗
点赞 回复
分享
发布于 2018-11-16 16:23
你好,想请问一下头条的日常实习是只要两轮技术面+一轮hr面吗?
点赞 回复
分享
发布于 2018-11-18 21:36
找女室友,海淀知春里南侧,元旦以后入住 虽然不是租房子的旺季,还是期望能找到一起租房子的小可爱 本人女,元旦以后要去今日头条入职,希望能找到一个附近合租的女室友QAQ 有意向的可以牛客站内信找我吖 我天天都看呢~~ https://www.nowcoder.com/discuss/143878
点赞 回复
分享
发布于 2018-11-19 20:33
答主头条过了吗
点赞 回复
分享
发布于 2018-11-26 16:32
学姐厉害!Misszhou是我的亲学姐~
点赞 回复
分享
发布于 2018-11-30 13:17
能加个qq吗😮   想请教下 算法岗一般要学c++吗   java  偶不哦可。。
点赞 回复
分享
发布于 2018-12-03 18:34
楼主腾讯二面到三面大概隔了多久欸?我面完一周系统显示复试也没其他通知。。
点赞 回复
分享
发布于 2019-01-26 23:46
学姐,面试是线上还是去公司所在地呢?
点赞 回复
分享
发布于 2019-02-07 11:39
学姐优秀 emmmm 很好奇第一题咋写的啊? 如何O(logn)请问有思路了吗
点赞 回复
分享
发布于 2019-03-17 12:36
学姐最后去了ieg嘛?
点赞 回复
分享
发布于 2019-04-07 17:06

相关推荐

20 191 评论
分享
牛客网
牛客企业服务