滴滴agent算法一面

实习+项目:
1. 详细介绍项目背景  结合业务场景
2. 生成的训练数据,具体是怎么生成的?
3. 数据增强是怎么做的?
4. 怎么确保更大更复杂模型的结果,是100%正确的?  有没有量化指标可以确认
5. 怎么样确保,把工具调用的轨迹 ,融入到种子数据集里面, promot是怎么设计的
6. 除了lora以外 ,还了解其它的一些微调方法吗?
7. 为什么lora的微调效果比较好?
8. 切分策略是什么?
9. 语义切分策略和固定大小切块分割策略,效果对比. 有哪些不一样的方面?

八股:
1. transformer的原理
2. attention的公式
3. 为什么除以根号dk

算法:

字符串解码

面试回答的并不好,算法题未a出来。还是要好好沉淀
全部评论

相关推荐

不愿透露姓名的神秘牛友
今天 11:06
兄弟们,我可能下周就要分手了。但我现在还没分。我们俩上周末还约了去吃她最爱那家麻辣烫。然后我大概率会在某一天,找一个不太对的时机,说出那句话。我先把背景交代清楚,佬们帮我看看。我们大三在一起的,到现在两年零三个月。今年春招我冲进了字节,base 北京,我读的某 211 末流,秋招挂得一塌糊涂,春招最后一波临门一脚才进去的,寝室那天给我开了瓶酒。她比较稳,去年寒假就开始准备公考,四月份压线进了面试,五月初公示,老家市直编制内,到手 6k。三方是上周一签的。我自己一个人去的打印店。她周三签的,她爸妈一起陪她去的人社局,她朋友圈发了一张她爸跟她的合照,配文"以后能天天回家吃饭了"。那张图我看了大概十遍。签完那天晚上我们视频,我在公司加班,背景全是工位的灯,我啃着一个鸡蛋灌饼跟她汇报今天 mentor 怎么 push 我。她"嗯嗯"了二十分钟。挂了电话以后我盯着天花板看了很久。我突然意识到一件事:从签三方那天起,我们之间多了一个谁都没说出口的东西——不是异地,是节奏。我往后五年是 KPI、OKR、晋升。她往后五年是科室、年度考核、社保公积金、相亲对象的家长(如果我们分了的话)。我们俩从今往后讨论的世界,已经不是同一个了。牛客有个老哥说"异地恋最怕的不是距离,是你发现你们俩聊天没东西可聊了"。我现在还没到那一步,但我能感觉到——我跟她说我被 leader 夸了,她除了"哇好棒"实在不知道还能说什么。她跟我说她们科里那个姐姐二胎了,我"嗯"了一下。我看了一周的"异地恋怎么撑过第一年"。也看了一周的"毕业季分手怎么不留遗憾"。两个标签的帖子我都点了赞。我也试着算过。北京到她家高铁五个小时,单程二等座 553。我周五加班到十一点根本赶不上末班车,只能周六早上飞回去周日晚上飞回来,一趟来回 2000 多,我一个月顶多去两次。钱不是问题。问题是我很大概率没时间去。字节应届生的周末是被切到分钟的。两天里有一天还在改文档,剩下那天用来洗澡补眠看医生。飞回去这件事,听起来是体力问题,本质是"我每周剩下的那点产能能不能匀给她"——我现在的诚实答案是:基本匀不出来。但这些都不是最难的事。最难的是我没办法跟她说"你别考公了你来北京",因为她爸妈刚把家里那间小屋给她收拾出来当书房;我也没办法跟我妈说"我把字节退了回老家"——我爸去年失业了,这个 offer 是我们家三口人的指望。我们俩都太懂事了。懂事到不敢提任何会让对方为难的方案。但越懂事,越不知道怎么开口提分手。我现在每天通勤的地铁上都在打腹稿。我想过几个版本:- 版本 A:"我们都没错,只是路不一样了,散了吧。"——太冷了,她会哭。- 版本 B:"你先回家吧,半年后我们再看。"——骗她也骗我自己。半年后只会更难开口。- 版本 C:"对不起,是我不够爱你。"——谎话,但是最干净的谎话。我现在卡在 A 和 B 之间。所以我也没什么结论。我只是想问问已经毕业过、已经经历过这一关的佬们:你们当年是谁先开口的?如果重来一次,你会不会选"先试半年"这个看似温柔实则慢性折磨的方案?如果"懂事"是分手的最大障碍,那应该怎么破?下周我大概率会在周末,和她再吃一顿麻辣烫,出门走两步的时候说。为了防止熟人认出,还是匿了
侠客行:鸡蛋灌饼跟编制内麻辣烫合不到一起
记录我的毕业季
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务