字节实习(可转正)

职位描述
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。

1、打造业界领先的多模态数据湖产品,满足大模型时代的数据处理及应用需求;
2、构建面向NLP、音视频、多模态交互场景的数据处理能力,提升产品竞争力;
3、负责算法开发、数据蒸馏、模型SFT、业内新技术探索与落地。
职位要求
1、2027届硕士及以上学位在读,计算机或相关专业优先;
2、大模型或相关研究方向,领域包括但不限于NLP、视觉、多模态联合处理等;
3、熟练使用Python语言。

base地北上杭都可以。

通过以下链接投递:
https://job.toutiao.com/s/ZYQZ60ceHmU

#实习##字节实习#
全部评论

相关推荐

04-07 17:05
已编辑
西北工业大学 C++
本人西北工业大学软件工程专业大二学生,因为不是很想读研,没有卷绩点综测保研无望,也不是很想考研,希望本科就能就业。然后想问问各位大佬有什么意见。我是比较喜欢钻研技术的,主攻C++,对于C++11及以上的特性还算熟悉。模版也有研究,尝试过一点基础的模板元编程。也学过一些qt,用qt写过简单的小游戏比如扫雷什么的。学校课程写过SFML进行游戏开发,写过大约一万行代码(带注释)的坦克大战,基本由我独自完成。我还专门学习过cmake,我的所有C++项目均使用cmake管理。对于划分多个子模块的稍复杂的项目结构也能管理。我比较喜欢折腾Linux,自己安装并长期使用过ubuntu和arch linux,后面主要使用ubuntu。基础的shell命令和一些配置都熟悉,可以自己从源码编译安装一些开发库和软件。对docker容器的使用还算熟练,使用docker安装配置过一些MySQL之类的软件。除此之外,我也研究过一些大模型和深度学习,我在自己电脑上本地用docker部署了ollama,前端页面以及联网搜索的搜索引擎。我自己使用pytorch训练过一些简单的深度学习网络,比如cifar100的分类训练,十几层的CNN成功率在70%左右。我最近在学习TensorRT,部署了了上面提到的模型,用pytorch导出onnx格式,用c++实现模型编译,预处理,调用api推理,后处理等部分。还尝试部署了yolo,电脑连接摄像头做了一个实时处理,当然这个是使用开源框架TensorRT-YOLO实现的,我就只准备了模型以及用OpenCV标定了一下摄像头并读取摄像头图片传过去。然后我还粗略地学习过ROS1,安装并跑过几个demo,自己也尝试过拿激光雷达做过简单的SLAM建图,但是并不深入。然后也学过一些百度Appolo无人驾驶,最近打算深入学习一下,因为我们学院有一辆这种车,我可以用。然后就是其他的一些应该没啥用的东西。我平时用vim和emacs写代码,花了很多时间做配置,当然其他的像vscode,jetbrains啥的也都用过会用。学习过一点LaTeX,平时喜欢用LaTeX做笔记。自己用github pages搭建过个人博客。各位大佬,我感觉我学的东西虽然比较多但是太杂,东一榔头西一棒槌,没有哪个算是真正深入了的,基本都只是跑demo的水平。我想今年暑假找个实习为以后积累点经验,我想请教一下我应该考虑往哪些方向发展?以及我应该在哪方面再深入一些,做点实际的东西或是学点什么。下面是我做的简历,不知道该怎么填就填了我认为比较有用的两个,求拷打。
点赞 评论 收藏
分享
03-30 20:12
已编辑
东南大学 C++
一、自我介绍 / 基本情况 / 求职意向1.你先做一下简单的自我介绍。2.你在字节实习了多久?3.你怎么进去的?是自己找的,还是同学内推之类的?4.你在字节主要做了什么?5.第一个点是缓存特征优化,这块做了多久?6.这是你一个人做的,还是有人带着你做的?7.代码大部分都是你写的吗?8.你平时主要用什么开发语言?二、C++ 智能指针 / 内存管理10.你们用的什么智能指针?是哪一种?11.你说的这个智能指针,实现原理是什么?12.shared_ptr 用过吗?13.shared_ptr 的实现原理是什么?14.它和你刚刚说的unique_ptr指针有什么区别?15.shared_ptr 是线程安全的吗?16.多线程去用它或者改它呢?17.你怎么证明没有内存泄漏?三、concurrent hashmap / 容器 / 并发结构18.你简历里写的 concurrent hashmap,是 STL 里面的吗?19.它怎么做的?20.它的锁是什么?21.这个 hashmap 是整张表一把锁吗?四、实习项目:缓存优化 / 指标 / SQL 优化22.你这里写 Android 优化 4.8%,这个是什么情况下的?23.你们这个模块本身优化了多少?24.这个优化结果你们取的是平均值,还是 P99?25.你们是怎么测的?测了多少台设备?26.你第二个点写的是 SQL 重复优化,这个我没太看明白。你讲一下。27.你们这个不是用缓存来优化,而是在实现方式上优化,是吗?28.你们缓存的话,怎么控制过期时间?29.如果两次查询一模一样,命中了缓存,就不再到底层查了,是吗?五、右值引用 / 移动语义 / 构造函数class Stringpublic:String(const String &p) {}String(String &&p){}private:char *s;int size;}32.你对右值引用了解吗?33.右值引用的原理是什么?34.它是在编译期还是运行时生效?35.那你把拷贝构造和移动构造写一下吧。36.String(const String &p) 应该怎么写?37.String(String &&p) 应该怎么写?38.拷贝构造和移动构造的区别是什么?39.为什么移动构造里要把源对象置空?40.这里如果只做浅拷贝,会有什么问题?41.这个类需不需要析构函数?为什么?42.如果有析构函数,这个类还应不应该补赋值运算符重载?六、编程题:三个有序数组合并43.有三个已经排好序的数组,现在要把它们合成一个有序数组。44.除了结果本身,额外空间复杂度要求 O(1),你怎么做?45.你这个方案(三指针)的时间复杂度是多少?46.如果三个数组长度分别是 m、n、k,时间复杂度怎么表示?47.如果三个数组长度都记作 N,那复杂度是多少?48.如果我把约束去掉,不限制你额外空间,要求时间尽量快,你会怎么做?49.你为什么会想到优先队列?50.重新放到堆里为什么不一定更快?51.如果我再告诉你,这些 int 数值的取值范围是固定的,你有没有更快一点的方法?52.图里写的 mergeAll(const vector<vector<int>>& inputs) 这种两两合并思路,整体复杂度是多少?七、估算题60.假设上海每年出生人口大概 16 万,你估一下上海大概有多少所小学。
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务