科大讯飞飞星计划-AI算法(自然语言处理方向)

6.30一面(40分钟作用)

1.自我介绍

2.jieba分词的原理

3.word2vec的原理,怎么训练的

3.有没有了解chatgpt是怎么训练出来的(项目涉及)

4.简述bert模型

5.pytorch中的train,val模块

6.怎么爬维基百科的,一天能爬多少条

7.在爬数据的时候有遇到哪些反爬的机制

8.MySQL数据库的存储引擎,索引类型(聚簇索引、二级索引)

9.为啥想做AI

10.python中字典的结构,是用啥实现的

11.有一组无序数组,怎么取前10个最大的数

之前看面经说是归并排序,但hr说这不是最快的方法。

12.反问

不太了解nlp的,感觉大概率凉了。。。😥😓

全部评论
为啥会问mysql啊,你是在简历上写了mysql吗
1 回复 分享
发布于 2023-07-05 15:40 四川
是因为没有nlp的项目吗
1 回复 分享
发布于 2023-07-03 12:09 广东
后来进二面了吗
点赞 回复 分享
发布于 2024-08-06 21:17 陕西
uu 最后过了吗?
点赞 回复 分享
发布于 2024-02-17 22:07 广东
求纠正,我认为求k个的话用小顶堆,时间复杂的10*log(10)
点赞 回复 分享
发布于 2023-08-20 00:14 新加坡
我一面二面都没问八股,纯听我讲项目讲了半小时。。。
点赞 回复 分享
发布于 2023-07-07 13:13 北京
有笔试嘛?
点赞 回复 分享
发布于 2023-07-04 16:09 广东
我这就半个小时,题都没问,不知道啥情况
点赞 回复 分享
发布于 2023-07-03 15:10 北京
11题TOPK问题
点赞 回复 分享
发布于 2023-07-03 11:25 上海

相关推荐

比第一次友好很多,大概一个半小时。主要偏向于项目介绍,然后项目的一些细节问题,终于没有全篇问企业场景题了,回归八股舒适区(然而也问到了我不会的八股)算法:1. leetcode146 LRU缓存变种在lru的基础上加了一个阈值k,只有访问次数到达k的才进入最近最少使用的淘汰范围,和原题感觉差别不大2.leetcode56 合并区间也不难,但是在合并之前得先排序,面试官说可以用内置sort方法,但是我不记得那个comparator怎么重写了,寄八股:1. 为什么使用rabbit mq和rocket mq?不用kafka? 你说kafka会丢数据,知道什么情况下会丢吗?2. 微服务相比单体服务有什么优势?3. 微服务可能会有什么劣势?4. 分布式事务的二阶段提交和三阶段提交5. MySQL和hive,redis的区别与使用场景6. Es的倒排索引7. 从hive到mq同步数据,为什么中间要用mq,不能直接同步?8. MySQL是怎么使用binglog的?用于数据同步? 那全量同步和增量同步是什么区别?(寄,给自己挖坑,全量同步是我主动提的然后又不知道)9. MySQL的事物特性以及实现原理10. redolog和undolog是干什么的?事务的每个隔离级别是靠什么实现的?(回答了redolog undolog  mvcc 间隙锁)11. 知道MVCC是怎么用的吗?12. 知道MySQL的底层结构吗?(感觉这个不好回答就主动引到索引了,知道索引的结构)13.为什么用b+树?不用b树和红黑树?14. 会用哈希当索引吗?15. 知道覆盖索引吗?16.覆盖索引有什么好处?17. 描述一下red is的哨兵模式,你知道redis集群吗?18. 你说spring boot用的多,如果spring boot如果要加载一个外部库,它是怎么加载的?可以直接加载吗?(扯了一下类加载器,但是我实在不记得。。寄)19. 看你用的语言很多,你感觉java,python,c++,PHP有什么区别?20. 项目中遇到最有挑战的事情是什么?项目中有哪些让您印象深刻的记忆唉。。。教训是不要啥玩意儿都往简历上写,不然问了你说你只用过不了解原理,会有点尴尬
查看23道真题和解析
点赞 评论 收藏
分享
评论
13
58
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务