大模型知识库RAG开发实习生

260-380元/天
算法工程师
上海
硕士
5天/周
最少6个月
有转正
岗位关键词
岗位职责
工业RAG系统构建:负责工业检测领域知识库的搭建,处理多模态工业数据(如检测标准文档、设备维修手册、缺陷图像报告等),实现基于大模型的智能问答与辅助决策。 非结构化数据治理:编写ETL脚本,针对工业场景下的复杂格式(CAD图纸说明、PDF标准、Excel检测记录)进行解析、清洗与结构化,提升知识库数据质量。 检索与生成优化:针对工业术语和特定场景,优化向量检索与关键词检索的混合策略(Hybrid Search),引入重排序(Re-ranking)模型,确保检索结果的精准度与合规性。 智能体工作流开发:基于LangChain或LlamaIndex框架,结合工业检测业务流程,开发能够调用外部工具(如查询数据库、调用检测API)的AI Agent。 模型适配与调优:协助进行开源模型(如Qwen, Llama3)的本地化部署,通过Prompt工程或少样本学习(Few-shot Learning)提升模型在工业缺陷识别描述、故障归因分析上的表现。
岗位要求
学历专业:计算机、人工智能、自动化、机械工程等相关专业,本科及以上学历在读,2027届毕业生优先。 编程能力:熟练掌握Python,熟悉FastAPI或Flask等Web框架,具备良好的代码规范。 技术栈:深入理解RAG架构(文档解析、切片、向量化),熟悉向量数据库(Milvus, Chroma等);了解LangChain等开发框架。 领域兴趣:对工业数字化、智能制造有浓厚兴趣,愿意深入理解工业检测业务逻辑与数据处理规范。 综合素质:具备较强的问题分析能力与团队协作精神,能适应工业场景下对数据准确性的高要求。 加分项 多模态经验:有处理图像-文本对(Image-Text Pair)数据经验,或了解多模态大模型(如CLIP, LLaVA)者优先。 平台经验:熟悉Dify、Coze等低代码平台,或有RAGFlow等开源知识库系统二次开发经验者优先。 部署能力:熟悉Linux环境,掌握Docker容器化技术及CUDA加速原理者优先。 行业背景:有制造业、工业质检相关项目经验或实习经历者优先。
徐汇区宜州路188号华鑫慧享城识渊联合实验室
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
粤港澳大湾区数字经济研究院
研究所
不需要融资
深圳
查看其他 24 个职位