大模型招后端实习生,全是互联网大佬,入局好机会

后端研发实习生

简历投递请联系我,牛客会屏蔽邮箱

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。

公司介绍:零一万物由李开复先生创建,致力于成为一家由技术愿景驱动、拥有卓越中国工程底蕴的创新企业,推动以基座大模型为突破的AI 2.0掀起技术、平台到应用多个层面的革命。

职位描述

- 在mentor的指导下,建设基于大语言模型的应用和平台;

- 参与系统架构设计和开发,探索AI与应用的技术结合;

- 积极参与产品能力讨论,从研发视角协助产品经理迭代产品能力;

- 参与系统性能优化和迭代,发现系统性能瓶颈,提升用户平台体验;

- 主要使用编程语言为Java/Python/SQL。

职位要求

- 2024届及以后毕业,本科及以上学历在读,计算机相关专业优先;

- 热爱计算机科学和互联网技术,精通至少一门编程语言,包括但不仅限于:Java、C、C++、PHP、 Python、Golang;

- 掌握扎实的计算机基础知识,深入理解数据结构、算法和操作系统知识;

- 有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分;

- 有强烈的求知欲,优秀的学习和沟通能力;

- 每周可实习3天以上,可实习3个月以上。

#实习#
全部评论
投递
点赞 回复
分享
发布于 2023-11-24 22:55 湖南

相关推荐

第一次面大模型的面试, 八股真的是背了也忘, 汗流浃背。1. 自我介绍2. LLAMA 的结构有什么特点?(第一个就汗流浃背, 不知道从哪方面入手说。 我是说 casual lm 的 mask,only decoder, 说 pre layer norm, 说激活函数也不是 relu)2.由上引发的题, 讲一下 LLAMA 的 layer norm, 我忘记 llama 是 pre rms norm 了,一直没说出来。面试官就想问这个。3. 讲一下 LLAMA 的激活函数吧。 汗流浃背,就知道是 swiGLU。 我就说那个 swish 函数为头的门控线型单元吧啦吧啦的,说的结结巴巴。公式也没记住。4. 详细介绍一下 Transformer 的结构。(在 encoder 输入给 decoder 的 K V 我说成了 Q V,然后就说我也记不清是 K 还是 Q 了。。。)5. 为什么计算注意力 QK 分数要除以维度开根号?为什么不能直接除以维度?(就瞎扯容易数据太小, 收敛太慢巴拉巴拉。。。)6.讲一下你对  位置嵌入的了解。(绝对位置相对位置一顿输出)7. 说一下你知道的 tokenizer 的分词办法。(详细说了 bpe, wordpiece 和 unigram 都记不得了,连这两个名词我都说不清)算法题一个, 岛屿数量。
点赞 评论 收藏
转发
点赞 2 评论
分享
牛客网
牛客企业服务