淘天 NLP 一面

1.自我介绍
2.项目拷打
你们的训练数据怎么构造的?
对话的风格是怎么做的?
遇到 OOC 问题你们一般怎么解决?
还有一些比如说动漫角色这种,可能更难解决,你们怎么做。
模型输出内容太假大空你们怎么做?
记忆怎么做的?

然后问了一个八股
为什么现在大模型输入和输出价格不一样(说的有点结结巴巴,大意就是说输出需要对每个输入都要计算 注意力,输入只需要计算前面的部分。反正就是平均下来输入的成本比输出低。)

代码题
无序序列中位数,用 topk 改了一下。
反问
全部评论
八股这个 应该是gpu资源利用率方面 通信瓶颈+多次forward导致成本gpu利用率低
2 回复 分享
发布于 2024-09-10 18:33 北京
想问下佬投的是算法技术还是业务技术,谢谢
点赞 回复 分享
发布于 2024-09-15 16:43 北京
问问大佬,推进了吗还是在泡
点赞 回复 分享
发布于 2024-09-14 14:02 江苏
学长太强了
点赞 回复 分享
发布于 2024-09-10 18:44 山西

相关推荐

08-11 17:48
辽宁大学 财务
投秋招已经快两周,每天就是投投投到厌倦然后躺床上刷痘印越刷越焦虑
驼瑞驰_招募评论官版...:你把牛客放中间,那你必得offer的
点赞 评论 收藏
分享
DKS233:(1)专业技能:Java8也太旧了,最少也要了解到JDK17吧,可以参考现在SpringBoot支持的Java最低版本,熟悉mysql基本理论具体指啥,是锁这种具体原理还是分库分表这些业务场景,spring这些专业词汇,大小写要写对(全篇简历都有这个问题,显得不严谨),熟悉使用框架进行业务开发就别写了,如果要写,起码要写到框架原理部分吧,比如aop,启动原理什么的,springcloud具体指哪些模块呢,写清楚,网关还是鉴权还是什么,“改造”没必要写吧,你直接说用springcloud开发的不就行了(2)项目经历:首先格式就有大问题,时间怎么能换行呢,调整一下,响应速度那个,如果指的是将部分数据从其他数据库转到redis的提升就别写了,因为这个不算难点,redis可以写写分布式这些,比如容灾怎么实现的,数据库同步怎么做的
点赞 评论 收藏
分享
自学java狠狠赚一...:骗你点star的,港卵公司,记得把star收回去
点赞 评论 收藏
分享
评论
5
20
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务