小米秋招agent算法一面

一、手撕
题目:给定一个字符串 s 和一个整数 k,每隔 k 个字符反转一次,返回最终字符串。
简单很快就写出来了

二、八股
1.自注意力机制是什么?计算复杂度怎么算?
吟唱: 通过query-key相似度计算权重,对value加权求和,建模长距离依赖。O(n平方)n为序列长度。

2.KV-Cache的如何加速推理?
继续吟唱:生成时缓存已经计算过的kv,避免重复计算。

3.LoRA的原理是什么?与P-Tuning、Adapter的异同点?LoRA的参数选择对模型性能有何影响?
三连吟唱:原理是冻结原始权重,训练低秩矩阵参数。异同在于lora训练参数,p-tuning只优化了prompt嵌入。

4.介绍下RLHF的基本流程,与DPO的差异是什么?
主动吟唱:RLHF三段式,sft用高质量数据集微调,rm训练对比学习模型用于打分,ppo通过rl泛化增强。dpo直接优化偏好数据,省去rm和ppo。

5.分布式训练中的TP、PP、DP分别是什么?
TP按tensor维度拆分,PP按网络层数分段流水线执行,DP数据并行,复制模型副本分散计算

6.flash-attention的原理是什么?
这里回答没太好,只讲了通过内存层次结构什么的减少I/O瓶颈

7.DeepSeek的MoA架构与MoE有何区别?
moe通过门控机制选择专家子网络,参数规模增加但训练难度大。moa则用多个agent回答,通过数据迭代优化,缓解偏科。

8.如何处理数据不均衡问题?
上采样小样本,课程学习

三、项目与实习
1.agent实习主要负责哪些模块?
动作规划,memory经验,evaluation pipeline,后训练,很多模块都参与了,面试官也挺震惊哈哈。这里聊比较多就不po了。
2.记忆系统如何实现视觉-语言特征对齐?
clip映射到联合embbeding上
3.如果视觉模块误判,如何通过语言纠错?
检测矛盾关键字,通过反馈触发重试。
4.具体讲讲怎么构建evaluation pipeline的?
做了数据爬取,版本控制,llm打分
全部评论

相关推荐

一、Go 语言基础值类型与引用类型对值类型和引用类型的理解是什么?引用类型常见的例子有哪些?具体问及 slice和 map分别属于哪种类型?结构体结构体(struct)能直接比较吗?为什么?举例:两个包含相同字段(ID, name)的 User结构体实例能否直接比较?Slice 与数组slice和数组的区别是什么?函数传参行为:将一个全局变量的 slice传入函数并修改,外部的全局变量是否会改变?同样情况下,map的行为又会如何?为什么同是引用类型会有这样的区别?Mapmap的遍历是有序的还是无序的?map是并发安全的吗?如果不是,如何保证并发安全?是否用过 sync包下的并发安全 map?为什么 Go 要区分并发安全和不安全的 map?Channel 与并发如何理解 Go 语言“通过通信来共享内存,而不是通过共享内存来通信”的理念?Channel 关闭:关闭 channel应该在发送端还是接收端?为什么?如果接收端关闭 channel,发送端会知道吗?接收端如何知道生产者已经发送完所有数据?关闭后的 channel还能从中读取数据吗?Goroutine 与 Panic:如果启动的十个 goroutine 中有一个发生 panic,会导致主 goroutine 也 panic 吗?通常如何避免/处理这种情况?Web 框架使用过什么 Go Web 框架?(发言人提到是“定框架”)在该框架中,中间件(Middleware)一般是如何实现的?在路由中定义中间件时,其返回类型通常是什么?二、MySQL 数据库隔离级别MySQL 有哪几种隔离级别?可重复读(Repeatable Read)隔离级别主要解决什么问题?它能完全解决幻读吗?SQL 性能优化如果项目中一条之前运行很快的 SQL 语句变慢了,如何排查原因?索引对 B+Tree 索引的底层有了解吗?能简单说一下它基于什么算法实现的吗?三、Linux 系统文件权限文件权限表示如 755、717通常代表什么意思?进程查看如何查看一个服务(如 MySQL)的进程信息?使用什么命令?(具体追问了 ps、grep等命令的用法)四、计算机网络TCP简述 TCP 建立连接的三次握手过程。五、职业规划与方向专业与岗位选择你的专业是人工智能,为什么不找人工智能方向的岗位?(面试官提及当前 AI 应用、RAG、Agent 等是风口)面试官给出了建议:可以多去了解 AI 与应用后端结合的方向(如智能客服)。小小厂,怎么问这么多语言特性,别的面试基本没考过go语言
查看29道真题和解析
点赞 评论 收藏
分享
9月底,40min1、自我介绍2、RK3588的核心是什么,是ARM几,大核最高工作频率3、结合进程和线程的区别回答一下为什么项目是多进程而不是多线程4、如果让你设计多线程的软件框架,如何调整来保证线程崩溃的话不影响系统运行5、简单解释一下dma-buf6、dma-buf和我们通常的软件的buffer有什么区别,为什么这里使用dma-buf实现零拷贝7、你部署的yolo模型的参数是多少,你的参数是多少8、一边要采集数据,一边要编解码和推流,还要到本地存储,这些都是同步地在做的吗,我们硬件里面编解码存储这些都是很耗资源的,你们有测过系统长时间下他的稳定性,调试的时候有没有会发生卡顿啊,比如说存储的文件有会问题9、有没有对系统做压力测试比如测试他的稳定性,我们这个系统是要部署在环境中,有没有出现什么问题10、在开发的时候有么有遇到过视频流卡顿,你首先能想到的是什么,你的排查思路是什么11、为什么没有认为是编解码的时候出了问题12、硬件ISP和AI ISP是如何两者结合在一块的,他们负责分别做哪些工作,他们的功能,讲一下你当时的设计13、硬件ISP和AI ISP的优先级是怎样的,同时在做还是串流在做14、温度是怎么采集的,温度传感器送出来的数据,有用到ADC吗15、Linux的驱动框架你应该有了解,你能举个例子比如UART,给你一个Linux系统,你要把这个UART的驱动加上去,大概分几步,哪几个步骤16、C为主还是C++为主17、讲一下C++特性上有什么区别,在开发上适合在哪些场合18、static、const、volatile熟悉吗,volatile主要是在哪些场合19、你了解它的原理吗,为什么volatile在这些条件下可以解决这些问题20、你申请的这个岗位叫xxx,你觉得这个岗位的工作内容和要求有没有一定的了解啊,介绍岗位,主要是协议开发21、你如果入职之后可能会学习全新的协议,你讲讲你是怎么开始学习这样的新协议,你在做项目的时候有没有经常逛开源库比如github22、freertos你有了解吗,用过吗23、你做的这三个项目是基于什么考量做的这些项目24、你在学习过程中最熟悉的单片机是什么,介绍一下25、你用的比较熟的外设是什么,uart,这个是干什么的26、建立一个完整的通信需要有哪些配置,或者说怎么去实现一个完整的通信链27、你的程序中是怎样实现接收一个完整的包数据,有什么方式28、你的UART是用什么方式接收,串口有很多接收方式,常用的有哪些知道吗29、串口是你最熟悉的?(太久没用忘了)30、你在校成绩怎么样,在班级里面排在哪个位置
查看29道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务