招银网络大数据开发一二面

一二面答的自我感觉都还行，结果二面完秒挂。最近有点破防了，加上遇到国庆放假，之前面完的都挂在终面了。鼠鼠真的抑郁了。有没有佬指点一下到底哪出问题了

一面常规八股+sql 20min
Mr的总流程
Spark提交流程
Mysql索引，为什么用b+树
Jvm的垃圾回收算法
Mysql的mvcc
数仓建模理论，为什么分层，分几层，每层的作用是什么
开窗函数，详细说一说sum（） over（）
三个sql：
主键出现次数&gt;1的列个数
连续登录
某直播间最大流量
一面没啥问题，该答的也都答完了，sql也写了。
二面 15min
项目详细介绍：ads层的表，最后分析的指标，ads层中表的每一列详细介绍。
为什么选择大数据开发（实习的时候接触到过sql和etl）
还学过其他什么组件（spark，flink，hvie等等都学过）
数据开发的整个链路知道吗（底层基础平台-etl-数仓-上层的数据分析，数据挖掘）
以后想做那一部分（从下到上每层都做）
对以后职业发展的规划（如上）
反问

全部评论

推荐最新楼层

香菜yx

香港科技大学 Java

可能是没hc了有的人二面就是纯聊天都过了......

点赞回复分享

发布于 2023-10-01 00:07 福建

乌鲁乌鲁

中国人民解放军海军蚌埠士官学校数据分析师

怎么知道秒挂的友友

点赞回复分享

发布于 2023-09-30 22:57 辽宁

Luckda

门头沟学院大数据开发工程师

佬 base哪里

点赞回复分享

发布于 2023-09-29 12:57 江苏

2025-12-30 13:18

门头沟学院 C++

究竟是什么样的前程值得我们如此？

停下来就有负罪感？明明是周末，躺在床上刷手机却觉得心慌； 看到同龄人升职加薪、晒offer，第一反应不是祝福，而是焦虑自己“被落下了”； 潜意识里觉得：如果不优秀，我就不配被爱；如果不成功，我就是个loser。优绩主义给我们编织了一个完美的谎言：只要你努力，就能成功；如果你没成功，那就是你不够努力。但这太残酷了，也太傲慢了。 它忽略了运气、忽略了环境、忽略了起跑线的不同。它让我们变成了在这个系统里疯狂奔跑的仓鼠，不敢停下，生怕被甩出转轮。回看这一年，我像是个被上了发条的玩偶，却不知道开关在哪。 4月： 开始备战实习，焦虑的种子埋下； 实习期： 以为上岸会轻松，结果压力不降反增，每天都在自我怀疑...

我们是不是被“优绩主义”...

点赞评论收藏

2025-12-30 23:31

已编辑

门头沟学院 Java

帮朋友选offer

投票

朋友想回南方，不太想卷。但是又想互联网赚几年，所以很纠结，想看看各位宝贵的意见A:平安产险（深圳薪资：    N*18+2w业务：    后端：但跟AI相关公积金： 单边7%强度:       9-6-5B:京东零售（北京薪资：    (N+10)*20业务：    传统后端公积金： 单边12%强度：    10-10-5

点赞评论收藏

不愿透露姓名的神秘牛友

2025-12-24 16:05

校招offer决赛圈求帮选，字节vs淘天

淘天-阿里妈妈，主要面向广告主，做一些广告投放平台上的ai应用/agent。n*16+3.2*12，职级p5，ai应用开发字节-商业化广告，做广告中台，商家入驻签约、资金、风控之类的开发，涉及到一点与ai结合的内容。(n+7)*15，职级2-1，go开发都是开发岗，base地一样，签字费差不多，年包的话其实算下来差不太多。淘天高薪低职，字节中薪高职，怕绩效压力太大，实在不知道怎么选。求大佬们给点建议，说说原因，非常感谢

点赞评论收藏

2025-12-17 23:25

合肥工业大学算法工程师

蚂蚁大模型Agent算法二面-55min

1.你的 Agent 系统Prompt 是怎么设计和迭代的？有没有做过 Prompt 自动优化？当用户提出不完整的请求时，如何补全用户意图的？2.构建 Agent 的时候，遇到过哪些瓶颈？LangChain 的 memory 默认机制在多3.用户并发中怎么做隔离？你是如何保证线程安全的？4.微调 Llama2 你是怎么选择训练样本的？清洗逻辑是什么？你有没有观察到哪些训练样本质量问题对模型行为有很大影响？举例说明。5.DPO相比 SFT，有哪些优劣？它在 Agent 任务上效果提升明显吗？你怎么构造偏好对？构造逻辑是自动的还是人工？6.你说你服务部署在 vLLM 上，为何选择它？KV-cache 如何帮助推理加速？你自己做过哪些优化？7.假如需要支持 Streaming 输出，但当前服务延迟又超标，你会怎么折中设计？8.多轮对话上下文状态管理是如何做的？如何在高并发场景下保证一致性？9.你做的 Agent 使用了多少个外部工具，在调用链条上如何保障故障容错和超时机制？10.有没有做过工具调用失败后的feedback策略设计？11.训练过程中数据来自用户行为日志，你是如何从这些数据中抽取训练对话的？有没有做过归一化或事件抽象？12.有没有了解过带有时间窗口/偏移限制的对话系统？模型怎么“理解时间”？13.你觉得 Agent 哪些模块最容易在真实业务中出问题？你会如何监控和定位的？

点赞评论收藏

2025-12-24 15:05

门头沟学院 Python

agent开发学什么？

做了个rag教务系统，结果就只会调问答api和embeding的api，我还要深挖哪些地方才能找实习啊😭

牛客60944174...：数据源会是多源，多数据格式（包括多模态、结构化、JSON，graph等），怎么把数据进行加载清洗处理，得到合适的数据，如果一篇文章很长，怎么做分块，是直接分块，还是重叠的分，为什么这个场景要这样，有没有更好的分块或者压缩方法。在召回阶段，你的query要怎么重构，例如用户问题是“这个是什么？”这样就是语义很不清晰的，要怎么把query重构成一个语义清晰的问句，才能在查找的时候提高命中率，以及你算完相似度之后重排和召回有没有什么优化，是直接根据向量相似度排序吗？有没有别的重排参数，这些都可以优化。除此外，你的RAG应该是每次调用LLM都用一次的吧，你能不能针对每一个场景写一个表，然后分别打包成MCP，让LLM自己决定要不要用RAG，用哪个RAG，怎么用RAG，这些都可以深挖，除此外，基于向量数据库的RAG有标准流程，你可以对照每个阶段，都做一些工作。希望我的分享对你有帮助。

点赞评论收藏