实习生招聘

实习生招聘
单位:上海人工智能实验室
地点:上海徐汇
岗位名称:多模态文档理解数据挖掘与应用实习生
岗位职责:
   ▪   参与多模态文档理解数据挖掘,清洗,处理,支持模型训练
   ▪   基于多模态文档理解数据集,构建相应的benchmark,并验证数据集的效果
   ▪   基于已有数据集,结合RAG构建相关文档理解应用
职位要求:
   ▪   熟练掌握数据挖掘清洗,能够处理多种模态的数据并进行评估,构建benchmark
   ▪   熟练掌握python等主流编程语言,熟悉linux开发以及软件开发工程
   ▪   熟悉大模型应用,RAG的构建和评估,熟悉文档理解相关工作,使用langchain,lammaindex开发过应用的优先考虑
   ▪   有较强的主动性,具备良好的学习和沟通能力。
   ▪   能够连续实习六个月,每周线下到岗四天以上者优先考虑

简历投递:maosong@pjlab.org.cn #实习#
全部评论
1
点赞
送花
回复 分享
发布于 05-02 20:48 浙江
已发邮箱,麻烦帮我看下,谢谢!
点赞
送花
回复 分享
发布于 05-05 20:31 江苏
国泰君安
校招火热招聘中
官网直投

相关推荐

这家公司是做AIGC的,主要是做Diffusion相关。在我看来还是非常高大上的,就是抱着试一试的心态去面,过的概率感觉不大。面试是两位面试官,上来先是我的自我介绍(奇怪,上午那个居然没让我自我介绍)。这次面试还是围绕着简历进行的提问。第一个项目:是RAG相关的,问了具体的项目经历,其中问了存储的数据形式,以及调用数据库的触发条件。今天的两个面试都问了数据检索能力,因为之前在开发的时候确实没有定量地测试过准确度,只是看使用者反馈过来的效果(因为认识不多,可能就两位数)。问了数据是否是QA的形式,答:直接把文档embedding后传上去的。此外,还问了一些关于Agent、Prompt相关问题。还问了个COT第二个项目:用到了CNN和Bert。问了Bert和GPT以及两者区别,我就答了个encoder only和decoder only,感觉没答到点上。后面查了一下,应该是回答Bert是双向编码模型,用了一个MLM,GPT是声称是模型,将后面的词Mask掉,他的注意力矩阵是一个三角阵。再贴一个应用场景:GPT:文本生成、对话系统、自动写作(我答的是对于生成任务来说比较好);BERT:文本分类、命名实体识别、问答系统、句子对匹配(我答的是做下游的NLP应用比较好,实质上是做的针对于上下文进行一个embedding。这答得感觉寄了)他们公司是做Diffusion的,这一波下来感觉我的经历切合度不很低,应该寄了。#软件开发2024笔面经##面经#
查看4道真题和解析 软件开发2024笔面经
点赞 评论 收藏
分享
1 收藏 评论
分享
牛客网
牛客企业服务