数据研发工程师(北京)

工作内容:
◾ 参与收集、处理、清洗各种渠道的原始文本数据,包括但不限于网页数据、电子书数据等
◾ 与大模型算法团队、数据采集团队、分布式训练工程团队密切合作,建立数据系统迭代流程
◾ 建立针对大模型的数据质量评估方法,持续提高数据质量和多样性,安全性,有用性

任职要求
◾ 有搜索、推荐、广告等业务数据的处理经验
◾ 有⼤规模中文网页数据收集和清洗经验者优先
◾ 有文本数据集搭建和数据质量管理经验者优先
引流
上国象
元胜投资
世纪前沿
同花顺
德劭
金戈量锐
问月
博普
燧石投资
磐通
明崚
涵德
细水投资
双隆
因诺
君拙
盛冠达
赫富
概率
芷瀚
衍复
金湖无量
正定
小惠
玄元
靖奇
稳博
貔坤
黑翼
无涯
中信期货
华钧广汇
悬铃
伯兄
海悦
祥寓
玄信
玉数投资
博益安盈
思勰
高盈国际
盛泉恒元
天算量化
臻财
灏象
泛态
卓识
诚奇
天演
中量投
千禧
集微
坤望
安贤
乾象
或然投资
衍盛
进化论
量游
明汯
非凸
茂源
凯纳
盈赢
博煊
鲁民投
佳期
量道
龙旗
成均
思晔
幂达
量派
念空
锐天
宽德
源晖
艾方
聚宽
顽岩
凯丰
鸣石
珏朔
英仕曼
九坤
卡方
通怡
微观博易
城堡投资
量盈
知至恒
高维
香农
孝庸
千惠
平方和
星阔
鸣熙
蒙玺
元盛资本
龙鳞
上善御富
艾略特
启林
白鹭
神策
虑得
敦和
希格斯
火币
罡兴
仲阳天王星
纽达
大道
量桥
雷根
千象
灵均
衍舟
金鍀
致诚卓远
幻方
高塔
会世
偲科聆
凯读
洛书
全部评论

相关推荐

头像
04-27 15:11
已编辑
华东师范大学 算法工程师
暑期实习从2月开始投,面了两个月,流程该挂的都挂完了,腾讯字节一共号称是1.7w个hc,不知道都发给谁了,估计今年秋招要难顶。Timeline米哈游、美团、蚂蚁、微软等公司直接简历挂穿,没进面。携程:3.3 投递、测评3.12 笔试3.18 一面3.25 二面4.13 ai面(hr面)4.14 英语测评4.23 offer(已拒)腾讯:2.6 测评2.28 wxg一面3.5 wxg二面(挂)3.11 teg一面3.21 teg二面(取消)3.31 teg一面4.10 teg二面(挂)4.21 wxg一面4.24 wxg二面(挂)字节:1.28 aml约面(取消)3.17 火山一面(挂)4.8 aml一面(挂)4.20 抖音data一面(挂)阿里:3.23 投递、测评3.28 笔试3.31 淘天一面4.8 钉钉一面4.9 淘天二面4.10 阿里控股一面4.12 钉钉二面(取消)4.15 淘天hr面4.16 淘天offer(已接)4.21 高德一面(取消)4.22 淘宝闪购一面(取消)面试最大的感触是,现在撞上ai转型,一堆老业务急着转向,新业务非常不成熟,研究型的组bar非常高根本进不去,业务侧挂着算法的岗位干的都是工程活,面试却又要问算法,另外agent的落地也远没有那么广,绝大多数还是那套写死的系统调一下llm api或者做做rag,其余少部分真的在搭agent的,基本不能在线上服务用什么很智能的模型,现阶段成本太高,进去大概率就是给垃圾模型从工程方面兜底,除了业务场景的应用和数据经验以外,技术方面很难有什么提升。算法岗做不了基模的还是去搜广推好,之前判断失误了完全没投,秋招不知道还进不进得去。
嵌入式的小白:不错啊,淘天也是挺好的,恭喜
我的求职进度条
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务