用友NLP

1. tokenizer的作用?为什么bert要用专门的tokenizer
Bert有自己的tokenizer,是自己训练好的词表,并且在起止位置都加上了特殊符号
注意:尽管tokenizer翻译为分词器,但功能并不仅限于分词,还包括映射词表,添加特殊符号,统一长度(padding、截断)
2. 相对位置编码的作用?Rope、Abili
1)一定程度上实现长度外推性
2)能够获取文本位置中的相对关系
3. 大模型是怎么训练出来的?
decoder : 预训练
SFT:问答微调
RLHF:人工排序,对齐人类偏好
4. huggingface里面为什么有些方法可以调用,但是不能查看源码实现
面向对象、python的动态特性、导入包、本地方法?
5. 用户怎么获取大模型的有害信息(安全问题,赛博奶奶)
全部评论

相关推荐

06-11 23:37
南京大学 Java
项目相关的就不分享了,但是问的蛮多的。这里主要分享八股一面:1.你可以跟我说一下线程池的一个原理,工作原理。2. 在你日常用的时候,你怎么去评估?应该怎么去设置这个线程池的一个数量呢?(如何设置核心线程数等等)3. 什么时候会让你选择,redis中,你什么时候会用 hash 什么时候会用string?(不知道是不是听错了,不过我回答的是hash和string的区别)4. redission 的那个看门狗机制怎么实现的吗?5. 那并发抢并发请求过来的时候,大家去抢这把锁,怎么去实现这个并发锁的?6. 搜索你觉得分布式锁除了用 redis 的实现,也没有了解过业界其他实现的方案呢?7. redis有了解过它的一些内存淘汰吗?8. 慢SQL分析9. 上述策略都用到了,但是还是很慢,你可以怎么去定位?10. 深分页页怎么解决?11. 在MySQL里面有了解过它底层的一些锁吗?12. TCP三次握手的过程是怎样的?13. 可以跟我介绍一下 aop 吗?14. 你现在有了解到java每个版本它的一些特性吗?15. java 里面类加载的过程是怎么样子的?16. linux怎么去创建一个文件呢?17. 比如说怎么去通过某个关键字去看这个日志里面有没有,日志文件里面有没有出现呢?二面:1. 你对分布式这种微服务这一块的一些知识了解吗?2. 能不能讲讲你了解过现在一些概念呢?为什么有这么一微服是什么回事?有哪些概念你现在了解的?3. 嗯嗯,那那他们如果之间相互之间交互的话,他们会怎么来通信呢?4. java 里面你知道它的那个,你了解 spring 的那个事务传播属性吗?5. 其他的那种几个场景有没有遇到过可以去用的?1. 日志用**NOT_SUPPORTED** 场景**6. 你现在主要在看,就除了微服务还在看哪一些方面的一些技术的知识,或者有关注一些。7. 大模型你研究了哪些东西啊?8. 那有没有关注一些,比如说为什么没有考虑用一些新的 jdk 呢?比如说17或者21,更高级版本呢?
查看25道真题和解析
点赞 评论 收藏
分享
评论
2
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务