百度大搜日常实习

【职责要求】
-研究生及以上学历
-具有机器学习、深度学习算法的应用经验,能够利用这些技术解决实际问题
-熟悉NLP领域的相关算法和技术,有生成式检索增强项目的经验者优先
-优秀的编程能力,熟练使用Python/C++,并至少精通一种深度学习框架(如PyTorch、TensorFlow或PaddlePaddle)
-具有良好的沟通能力和团队协作精神,能够在团队环境中有效工作
-有意愿并能够快速学习新的技术和方法
-有在相应领域的顶级会议发表论文、参加ACM/ICPC、Kaggle等比赛并获奖者优先

【工作内容】
-参与百度搜索top1生成式问答技术的研究和开发,不断优化用户体验
-在LLM和数据飞轮背景下,参与大模型的数据建设、SFT、对齐等模型优化工作
-利用百度的大规模用户群体和数据资源,推动模型的快速迭代上线和优化
-探索RAG框架下的系统设计和相关算法技术

【岗位亮点】
-背靠百度,享受大数据带来的优势,快速迭代和优化产品
-参与核心业务,直接影响上亿用户的搜索体验
-深入AI领域的前沿技术,不断提升个人能力和技术视野
-多元化的工作方向,既能深耕技术,也有机会参与产品的实际落地

【工作地点】
北京市海淀区西北旺东路百度科技园
全部评论
没有搜索方面的经验可以投吗
点赞 回复 分享
发布于 2024-12-10 17:11 北京
学历别卡太死
点赞 回复 分享
发布于 2024-12-08 07:44 重庆
感兴趣私信
点赞 回复 分享
发布于 2024-12-03 18:04 北京

相关推荐

03-21 04:30
门头沟学院 Java
发点面经攒攒人品~1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?9.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?10.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?11.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?16.针对大规模PDF解析这种任务,你选择多线程还是多进程?17.如何确保Agent返回的结果是标准的JSON格式?如果模型输出中有多余的说明文字,你在后端如何提取?18.场景题:对于RAG,如果检索到了针对同一故障的两份手册,内容相互冲突,请你设计一套逻辑,让模型能够识别冲突并优先选择时效性更高的信息?19.手撕:第k大元素
查看19道真题和解析
点赞 评论 收藏
分享
04-15 23:30
已编辑
广东工业大学 Java
1. 大二有时间出来实习吗?第一个项目(知识分享平台)相关问题1. 分享平台做了多久?几个人做的?2. 定制化的二进制检测技术(SDS)可以具体介绍一下吗?3. 位图(Bitmap)是怎么设计的?4. 为什么使用位图记录用户点赞行为?5. 用户增长后,位图该如何处理?6. 用户如何通过ID找到位图中对应的位?7. 用户ID取模后冲突了该怎么办?8. SDS是用来做什么的?9. 什么时候会触发SDS的更新?10. 定时任务怎么扫、扫什么范围来更新SDS?11. 为什么选择使用binlog来做事件发布?有别的方案吗?12. 点赞系统中的卡夫卡(Kafka)是用来干啥的?和binlog的链路关系是什么?13. 用户频繁点赞再取消,链路会一直发消息,如何确保消息的有序性?14. 灾难回放是什么时候触发的?15. 自定义的热key探测机制可以具体介绍一下吗?16. 怎么样识别哪一篇内容/哪些信息是经常被访问的?17. 如何确保存储和缓存之间的一致性?第二个项目(agent相关)相关问题1. 计划执行校验迭代的机制是怎么实现的?2. 中间的上下文是怎么样共享的?3. 上下文太长了该怎么办?4. 引入的RAG具体引入了一些什么样的信息?5. RAG的准确性该怎么评估?八股1. 电脑上访问一个网页的具体流程是什么?2. 了解TCP吗?3. Redis怎么做持久化?4. 如何结合RDB和AOF让Redis尽可能满足存储诉求?5. 调大模型时的temperature参数了解吗?代码相关问题1. 滑动窗口算法解决日志请求丢弃问题的思路是什么?你看看有什么问题想问我吗?
查看58道真题和解析
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务