智谱大模型应用三面

昨天三面推到了今天,面试官比较忙。
1.自我介绍
2.聊了一会蚂蚁的实习,联邦学习安全之类的,说了一下落地难的情况,面试官感觉对这个也是有了解的,以前面试官基本上都是跳过这个 hh。
3.聊暑期实习的项目。聊了一会。
问我前两面做了题没有,我说没有。
1. 写一个 self atten, 只需要写 forward
触发八股为什么要除以根号 dk?不能是 dk?或者其他的吗?
多头是头越多越好还是越少越好?
头越多计算越快还是越少越快?
2.最长公共子串
反问了
全部评论
啊?现场搓pytorch代码?
点赞 回复 分享
发布于 2025-08-18 00:15 日本
想问下智谱一面结束后大概多久通知二面的呀
点赞 回复 分享
发布于 2024-12-25 14:32 江苏
佬,你智谱这边怎么样了,我这边四轮技术面好像是你的面试官,你现在啥状态呀?
点赞 回复 分享
发布于 2024-09-09 22:33 北京
还没思考过头多少跟计算快慢的问题,头多了可以并行计算,所以快?🤔
点赞 回复 分享
发布于 2024-09-01 00:04 陕西

相关推荐

2025-12-06 01:10
已编辑
哈尔滨工程大学 Java
一面问的真细,二面不知为啥变双机位。9.29快手主站平时怎么学习 AI 的,国内外知名大模型,实习公司都用的什么大模型,怎么评估效果的java池化思想,线程池构造方法的核心参数,线程池中阻塞队列注意事项,submit方法参数和执行逻辑,shutdown和shutdownnow,核心线程允许过期吗threadlocal底层,为什么key是弱引用,key回收了再get或者set这个value会怎样aqs,如何保证公平性java代理java堆划分,新生代还有别的晋升老年代的情况吗,什么时候触发gc,gc失败抛什么异常,如何排查oom,导出dump命令redis数据结构,哪个底层是跳表,和其他数据结构对比布隆过滤器会出现大key问题吗,你咋实现的布隆过滤器你怎么实现redis分布式锁,可重入,续期聚簇索引非聚簇索引select语句会加锁吗,怎么实现的不加锁undolog redolog binlog怎么能让select加锁,update这个范围加的什么锁,update一条呢手撕简单01背包,接雨水10.10快手主站意图识别用的哪个大模型,走到意图和rag的比例,faq是点击的吗自然语言怎么识别的gap一年干啥了,转正怎么样没跟组里提意向吗,研究生研究方向是传统算法吗,会大模型微调吗注册场景为什么用布隆过滤器,原理分布式锁底层的key怎么拼的,value里是什么redis持久化zset底层mysql索引结构,一个表三个字段有主键唯一索引和没索引的字段会有几个b+树,聚簇索引非聚簇索引存的啥无手撕
点赞 评论 收藏
分享
评论
8
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务