字节跳动搜索校招邀你来投!多个技术岗位热招中!
内推亮点
团队介绍
字节跳动搜索团队主要负责抖音、今日头条(全网搜索)、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括: 1、探索最前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的个性化匹配问题,让搜索更加精准更加懂你; 4、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新; 5、千亿级数据规模的架构:设计和自研业内领先的检索架构,研发面向网页、视频、图文、电商等不同体裁的大规模数据处理平台,构建高吞吐、低延迟、高可用的搜索在线服务。岗位职责
1、参与ByteDance搜索引擎研发工作,用前沿的机器学习深度学习算法、海量的数据,做激动人心的技术、给用户更好的搜索体验;
2、参与抖音/头条/电商/生活服务等产品的搜索研发工作,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验;
3、参与搜索核心算法改进,可选的方向包括:
(1)NLP:利用LLM等技术,研发新的自然语言处理算法和信息检索技术,提高搜索引擎的准确性和智能化程度;
(2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型;
(3)多模态:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;
(4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
(5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。