阿里国际

一面4.3
电话面
项目
意图识别怎么没做
生成有问题怎么反思
rag局限:相似度解决不了泛化性
nni搜了个啥
rag召回不相干数据的原因
解决方式:
 a. 优化检索模型
使用更强大的预训练模型(如 Qwen-14B, GPT-4)。
针对特定领域进行 有监督微调(Fine-Tuning)。
b.改进向量检索算法
使用 HNSW(Hierarchical Navigable Small World)、Approximate Nearest Neighbors(ANN) 等更高效的检索算法。
引入 嵌入空间校正(Embedding Alignment) 技术。
c. 增加重排机制
在检索后使用 Cross-Encoder、BERT-based Reranker 等模型进行精细排序。
d. 提高知识库质量
确保知识库的数据质量与覆盖范围。
e. 添加噪声过滤机制
幻觉缓解:模型更新 rag专业知识 高质量数据
全部评论
佬,你这个是大模型平台研发工程师,还是大模型算法工程师啊?
点赞 回复 分享
发布于 04-10 05:07 美国
目前见到最简单的面试题😂基本都是实操的时候会用到的东西呀
点赞 回复 分享
发布于 04-06 19:23 上海

相关推荐

05-04 15:08
已编辑
武汉大学 Java
阿里国际 研发工程师 - bravo 一面1. 之前的经历2. 在实验室工作的经历   1. Multimodel   2. 实验室的研究方向3. 有了解过大模型吗   1. 不太了解   2. BERT / deBERTa         1. NER   3. MultiAgent4. 面试官讲了一下工作业务   1. 引擎向      1. Java微服务      2. Cuda加速   2. 模型训练5. 有用过cpp吗   1. 实习用过      1. 干了啥         1. webgl         2. webview   2. 有做过Cuda加速吗      1. 有用过gpu,只会cg的gpu渲染      2. 没做过cuda加速,只用过cuda6. 有做过什么高并发的性能优化吗   1. 三级缓存   2. 布隆过滤器的原理      1. 不同性能Hash函数如何选取         1. 计算性能         2. 出现Hash冲突的      2. 互斥锁         1. 机制         2. 性能损耗原因            1. 上下文切换            2. 用户态到内核态切换      3. 优化策略         1. 读写锁         2. CAS         3. 修改布隆过滤器结构         4. 设置多个布隆过滤器   3. 红黑树和AVL树      1. 区别         1. 左右子树高度差         2. 插入时间复杂度      2. 查询复杂度   4. 有了解过 Reactor吗 做过相关工作吗      1. Nginx         1. 为什么能并发这么快            1. 多进程多Reactor模型            2. 非阻塞IO以及IO复用   5. MySQL的索引7. 有参加过ACM或者建模比赛吗二面1. 自我介绍2. 项目问题   1. 1. 限流器怎么做的      2. bloom filter的功能      3. 秒杀的业务逻辑是怎样的   2. 实习介绍      1. 效率优化3. 有了解过大模型开发吗   1. RAG逻辑      1. 怎么快速匹配向量库         1. 匹配聚簇   2. 广告投放4. 项目扩展   1. 怎么做动态限流5. 平时用的语言   1. Java      1. 内存结构      2. 给定内存大小,线程的个数最多是多少,怎么计算6. 反问
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客企业服务