中科闻歌 大模型算法岗面经

拷打项目,时长30分钟
1. 微调的数据配比,数据来源
2. 微调的任务类型,轮次
3. Embedding用的什么模型,是分块Embedding吗
4. 数据怎么分块
5. 数据返回的查询top
6. 微调之后对比之前的模型性能提高了多少
7. 数据库实时更新还是离线更新
8. 用的什么数据库
9. 本地部署的框架如何搭建
10. 如何评估rag
11. Qwen2.5 vl架构
12. 有相关的实习吗?实习期间做了什么?
13. 主要做文本还是多模态方向?
14. 做了一些小项目吗?
#大模型面经# #中科闻歌#
全部评论
佬,请问一下是没有手撕吗?
点赞 回复 分享
发布于 2025-11-21 11:21 广东

相关推荐

yolo v8.3.243 发布说明:控制台日志去重、训练遥测增强与部署体验优化1. 控制台 ConsoleLogger 进度条去重与批量刷新这是本次更新中优先级最高的改动。主要表现为:• 抑制训练过程中频繁刷新的进度条输出,仅保留完成信号。• 防止同一个训练阶段重复打印“100%”完成行,例如同一轮 epoch、train、val 或 Class 输出不再多次重复。• 新增按行数或时间批量刷新日志机制,减少控制台刷屏问题。• 日志处理器的清理逻辑更加安全,避免潜在的重复或异常输出。这一改动显著减少了训练日志的噪音,特别适合在 Notebook、CI 或日志被实时转发到外部系统的场景中使用。2. 平台遥测中训练启动事件的元数据增强在训练开始时,上报的运行信息更加完整。新增内容包括:• 环境信息采集:操作系统、Python 版本、主机名、CPU 和 GPU 信息。• 运行上下文信息:启动命令。• 代码版本信息:Git 仓库、分支和提交记录(如可用)。• 模型相关信息:参数量、GFLOPs、类别数量。这些信息会一起作为训练启动事件的数据载荷,用于平台或 HUB 风格的训练跟踪。这大幅提升了实验的可追溯性和复现能力,便于在不同机器、容器或代码分支之间对比训练结果。3. 检查点上传时机调整检查点上传的计时逻辑进行了优化:• 上传计时器在训练开始时初始化。• 第一次检查点上传会延迟大约 15 分钟执行。这样可以避免训练刚开始就触发上传操作,减少早期无意义的带宽消耗,同时避免上传过早、尚不稳定的检查点文件。4. 推荐使用 Headless 版本的安装文档提升文档中明确推荐在服务器、CI 和 Docker 等无界面环境下,使用 headless 版本的 OpenCV:• 建议通过 pip 安装 ultralytics-opencv-headless。这一调整可以有效避免由于缺少图形相关依赖而导致的 libGL 错误,使在纯算力环境中的部署更加顺畅。5. Docker GPU 运行说明更加清晰Docker 使用 CUDA 和 GPU 的示例命令得到了补充和澄清:• 示例中明确加入 --runtime=nvidia 参数。这可以减少用户在容器中遇到“无法识别 GPU”或“GPU 不可用”等常见问题。6. 可选择跳过自动依赖检查新增一个环境变量,用于在受控环境中关闭依赖检查和自动安装逻辑:• 设置 ULTRALYTICS_SKIP_REQUIREMENTS_CHECKS=1 可直接跳过相关检查。该功能非常适合企业级环境、封闭网络或对依赖版本有严格控制的场景。7. 一些小的修正与文档更新• 修正了 Pose 相关损失函数注释中的顺序说明错误。• YOLO-World 文档中新增社区使用提示:在某些情况下,添加一个空字符串作为背景类别,可能会带来更好的效果。
点赞 评论 收藏
分享
评论
2
14
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务