百度度秘:(一面挂)

我面的是NLP岗位。

面试形式是微信视频+collabedit编程。

面试官一上来就让我做了几句简单的自我介绍,然后就开始考我代码了。第一个代码题是敏感词检测问题。用户输入query长文本,而系统有个敏感词列表,要求检测用户的query是否有敏感词。我没啥很好的思路,就和面试官尴尬了大概几分钟吧,然后他就换题了。这次换的是二叉搜索树转双向链表,要求在一块空白页面上先自己定义类,再构建树,最后转为双向链表,限时20分钟。我时间到了还是没写完,面试官就让我说一下思路。我简单说了一下,他说我思路是对的,就开始和我聊实习和项目了。感觉面试官对我的实习经历和项目经历不是特别看得起,随便问了一些有的没的,还时不时流露出一股鄙视感。没过多久,他就开始转问我各种机器学习和深度学习的基础了,无非是LR、随机森林、xgboostgbdt之间的那些事情,深度学习就问了点CNN为什么能用在NLP中,激活函数RELUSigmoid之间的区别,优缺点之类的。我答得一塌糊涂,因为还在实习,没有好好复习,甚至都让面试官觉得我是不是才转机器学习的。大哥,你问的这些问题不背是答不出来的啊!后面他就让我说一下有什么想问他的,然后就结束了。唉!难得的一次面试就这么挂了,我实在是太菜了。

最后,求求大佬告诉我第一题的敏感词检测怎么做啊!#百度##算法工程师##内推##秋招##提前批#
全部评论
看来我在贴吧发的贴子30%被删不是没有理由的 百度研发的重心都在敏感词库上了,我的贴子天天莫名其妙中枪
点赞 回复 分享
发布于 2018-08-11 21:04
kmp -> 字典数 -> ac自动机吧
点赞 回复 分享
发布于 2018-08-11 20:58
敏感词可以用字典树,状态机来做
点赞 回复 分享
发布于 2018-08-11 20:51
之间好像见过类似的敏感词检测,用树去存储敏感词,如果第一个字是敏感词就从根节点开始往下找,如果找到符合的支路就证明找到敏感词。可以用hashMap嵌套去实现这个结构,用一个标志作为最内层的结束符。然后用你的数据和这些hashMap去做匹配查找。
点赞 回复 分享
发布于 2018-08-11 20:52
倒排文档?
点赞 回复 分享
发布于 2018-08-13 23:21
我也是一面挂
点赞 回复 分享
发布于 2018-08-12 10:15
你咋知道自己挂了按?
点赞 回复 分享
发布于 2018-08-11 21:29
同度秘nlp一面挂😂今下午刚面的
点赞 回复 分享
发布于 2018-08-11 21:10
楼上正解。。。ac自动机,不过这玩意要手写真要命。
点赞 回复 分享
发布于 2018-08-11 21:01
敏感词检测我也不会,上次面携程机器学习也问到
点赞 回复 分享
发布于 2018-08-11 20:51
楼主在哪实习的
点赞 回复 分享
发布于 2018-08-11 20:42

相关推荐

不愿透露姓名的神秘牛友
07-18 12:01
点赞 评论 收藏
分享
Twilight_m...:表格简历有点难绷。说说个人看法: 1.个人基本情况里好多无意义信息,什么婚姻状况、健康状况、兴趣爱好、户口所在地、身份证号码、邮政编码,不知道的以为你填什么申请表呢。 2.校内实践个人认为对找工作几乎没帮助,建议换成和测开有关的项目,实在没得写留着也行。 3.工作经历完全看不出来是干什么的,起码看着和计算机没啥关系,建议加强描述,写点你在工作期间的实际产出、解决了什么问题。 4.个人简述大而空,看着像AI生成,感觉问题最大。“Python,C,C++成为我打造高效稳定服务的得力工具”、“我渴望凭借自身技术知识与创新能力,推动人工智能技术的应用发展,助力社会实现智能化转型”有种小学作文的美感。而且你确定你个人简述里写的你都会嘛?你AI这块写的什么“深入研究”,发几篇顶会的硕博生都不一定敢这么写。而且你AI这块的能力和软测也完全无关啊。个人简述建议写你对哪些技术栈、哪些语言、哪些生产工具的掌握,写的有条理些,而且最好是和测开强相关的。
点赞 评论 收藏
分享
炫哥_:为什么都读硕士了?项目还是网上的项目(真心发问)
最后再改一次简历
点赞 评论 收藏
分享
评论
点赞
27
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务