同程数科面经

去线下面的,在浦东世纪大道附近
211本 JAVA 半年全栈实习 软件工程专业

### 实习

做的是一个AI图像生成的App,我主要负责工作是App的后端开发,还有我们App运营工具链的全栈开发,主要是写写业务逻辑的接口、结合GPT实现图片生成参数的优化、修改开源的AI绘图工具(StableDiffusion API)的代码实现了支持通过接口调用生成动画、结合redis实现了一个图片缓存、结合ElasticSearch实现了支持400万条的图片搜索,主要是通过参数搜索图片(图片涉及角色,图片风格)等业务逻辑。

# 个人项目
我自己对JAVA一系列技术栈也是很了解,我最近也用SpringBoot结合GPT开发了一个 `智能数据可视化系统`,它主要的任务是:用户上传一个Excel数据,异步提交任务到队列,服务根据任务的数据,结合我们自己的prompt模板调用GPT的API生成图表的echartsJSON,接着返回前端渲染,扣除用户积分,失败不扣积分。

其中用Redis实现了集群共享登录状态、用分表加速数据读取、一开始用线程池实现了异步任务调度,后来扩展为集群,选择了消息队#列、以及实现了一个分布式限流,防止AI服务被频繁访问刷流量、以及做了幂等防止用户积分重复扣费。

面试官:chatgpt用来做了什么
面试官:为什么要限流

1. java新特性
2. Int几个字节几个比特
3. int Integer默认值?等值比较问题
4. hashCode可以干嘛?
5. hashmap线程不安全的案例,对应的线程安全的?
6. concurrentHashMap原理
7. threadlocal的用途,有什么风险,他的map的是什么map
8. 事务四大特性,事务传播,隔离级别
9. 索引为什么快,数据结构是,非主键索引和主键索引区别?
10. 索引失效的情况有什么
11. http请求都有什么内容组成
12. https为什么安全
13. 对称加密和非对称加密
14. 设计模式及大类型
15. Spring设计模式有哪些
16. Spring拦截器是什么设计模式
17. 异常的理解
18. try catch finally执行问题,如果在try返回了,finally还会执行吗
19. java重入锁
20. synchronized锁升级过程
21. 反问
全部评论
必须先实习吗
2 回复 分享
发布于 2023-10-22 15:52 上海
yupiBI项目嘛
1 回复 分享
发布于 2023-10-22 15:24 广东
楼主,线下面试感觉怎么样?几个人面试你?有现场手撕代码吗?
点赞 回复 分享
发布于 2024-02-21 14:56 上海
老哥去嘛
点赞 回复 分享
发布于 2023-11-10 21:44 上海
老哥,有结果了嘛
点赞 回复 分享
发布于 2023-11-06 09:35 上海
现在还能投吗
点赞 回复 分享
发布于 2023-11-04 11:15 北京
面试官有问期望薪资吗
点赞 回复 分享
发布于 2023-11-02 13:17 上海
老哥结果怎么样样,通过了吗
点赞 回复 分享
发布于 2023-10-24 03:19 上海
专业和hr面,一共两面吗?HR面多久?
点赞 回复 分享
发布于 2023-10-22 23:52 上海

相关推荐

03-29 21:35
已编辑
中山大学 算法工程师
1️⃣讲一下强化学习 reward 函数设计。(1)可验证奖励( RLVR ):对有确定答案的任务(数学、代码),用 ground - truth 结果验证(正确+1,错误0/-1)。(2)奖励模型( RM - based Reward ):对主观任务(对话、写作),训练 RM 从偏好数据学习打分。(3)规则奖励:对特定安全/格式要求,用硬规则直接判断。2️⃣现有 Embedding 模型相比 CLIP 的区别?(1)训练目标不同: CLIP 用 InfoNCE 做图文对比,目标是让匹配图文对相似;专用模型用 SimCSE /三元组损失/ NLI 监督/多任务,目标是精确捕捉文本语义的细粒度差异。(2)数据质量不同:专用模型训练于高质量语义标注对,语义标注精准; CLIP 训练于网络爬取图文对,文本侧噪声大、以短标题为主,不利于文本语义建模。(3)性能对比: MTEB 基准上, BGE - Base /E5- Base 等在文本检索、语义相似度等任务上大幅领先 CLIP ;但 CLIP 在图文检索上仍有独特优势。3️⃣ GRPO 和 PPO 的区别。(1)架构差异: PPO 需要四个模型(策略模型π t _0、旧策略、奖励模型 RM 、价值模型 Critic ),显存占用大, Critic 的估计偏差还可能干扰 advantage 计算。 GRPO 只需策略模型,对每个 prompt 采样 G 个输出,用组内平均奖励作为 baseline 替代 Critic ,去掉了价值模型的全部开销。(2) Baseline 设计: PPO 的 baseline 是 Critic 预测的状态价值; GRPO 的 baseline 是当前 prompt 下同组 G 个 rollout 的均值。(3)适用场景: GRPO 对"组内多样性"要求高,特别适合有可验证奖励的推理任务; PPO 更通用但更复杂,适合需要精确价值估计的场景。4️⃣大模型训练流程。(1)预训练( Pre - training ):目标是从海量无标注文本(万亿 token 级别)学习语言统计规律和世界知识,任务是 next - token prediction 。(2)监督微调( SFT ):用高质量( instruction , response )对让模型学会遵循指令。(3)对齐训练( RLHF / DPO / GRPO ):让模型输出符合人类偏好,通过奖励模型反馈或直接偏好优化进一步提升质量和安全性。5️⃣微调大模型如何卡阈值。可验证任务(数学/代码)用"正确性"作为硬阈值(只要正确的);生成任务用 RM 综合分数阈值。6️⃣为什么 CLIP 的嵌入效果不好?①文本编码器仅支持77 tokens (基于 GPT -2架构),无法处理长文本;② nfoNCE 对比目标只要求"匹配图文对靠近",不需要区分文本之间的细粒度语义差异,嵌入空间对文本相似度分辨能力弱;③预训练数据以互联网短标题为主,语义噪声大,文本侧质量不足;④对文本扰动敏感(微小改动可能导致检索排序大变)。7️⃣[代码题]手撕了 InfoNCE 代码 InfoNCE loss 的实现﹣﹣计算相似度矩阵(点积/余弦)、温度缩放、对角线为正样本的 cross - entropy loss ,批次内负样本。📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看7道真题和解析
点赞 评论 收藏
分享
一面 一、数据库相关1. 数据库的索引是什么?为什么使用索引?InnoDB的数据索引基于什么实现?2. B+树和B树的差异?3. B+树查询一次的时间复杂度是多少?4. 哈希数据结构的查询时间复杂度?5. MySQL为什么不使用哈希结构?6. 主键设计为什么一般用自增ID,而非身份证号等业务字段?二、进程、线程、协程相关1. 进程、线程、协程的定义?为什么需要协程?2. 两个线程修改共享变量的线程安全问题如何解决?3. 悲观锁和乐观锁的差别?三、TCP/UDP网络相关1. TCP和UDP的核心区别及应用场景?2. 滑动窗口机制的原理?3. 已发送但未收到ACK的问题如何解决?4. TCP三次握手能否改为两次,加超时重试?四、登录系统设计相关1. 支持30天免登录的数据库表设计(表数量、作用、主键、索引)?2. 前端与客户端交互中如何实现30天免登录?3. 是否了解SSO?4. 用户登录态的设计实现有哪几种?是否了解JWT?五、限流与缓存相关1. 高峰期如何避免流量打挂服务/底层存储(从限流和缓存角度)?2. 是否了解令牌桶和漏桶算法的实现、区别及适用场景?3. 缓存击穿和缓存穿透的区别及解决方法?4. 布隆过滤器的原理及误判解决/降低方法?六、Redis相关1. Redis的基本数据类型有哪些?2. set和zset的区别?3. zset的原理?七、其他技术相关1. 是否了解AI Coding(如OpenAI工具、Spectacle Coding、Web Coding)?Spectacle Coding解决了哪些问题?2. 是否接触过Go语言?
查看26道真题和解析
点赞 评论 收藏
分享
03-24 12:36
门头沟学院 Java
秋招跑了大半年,前前后后做了几十家公司的笔试,从互联网大厂到量化私募,从国企总行到游戏公司,真的见识了什么叫 “没有最难,只有更难”。1. 头部量化私募(九坤、幻方、灵均、宽德)难度天花板,没有之一,能完整做完的都是真大神。难在哪里:题型极其硬核,完全不是互联网笔试的量级。除了超难的算法题(普遍是 LeetCode Hard + 难度,还会涉及竞赛题),还有大量的概率论、线性代数、随机过程、高数证明题,甚至还有 C++ 底层原理、Linux 内核相关的硬核选择题,对数学和编程功底的要求拉到极致。真实体感:我做九坤的笔试,120 分钟,10 道选择 + 3 道编程 + 2 道证明题,选择题一半靠蒙,编程题一道没完整 AC,证明题直接空着,考完直接怀疑人生,非科班 + 数学功底弱的,直接会被劝退。2. 华为「天才少年计划」/ 高端岗位笔试普通 OD 岗的笔试难度就不低,天才少年 / 高端研发岗的笔试,更是地狱级。难在哪里:题量超大,难度拉满,对代码的时间、空间复杂度要求极其严格。通常是 5 道算法题,150 分钟,几乎全是 Hard 难度,涉及动态规划、图论、复杂模拟、数据结构设计,很多题都有隐藏坑,暴力解法直接超时,必须想到最优解才能 AC。真实体感:身边的 985 硕学长,刷了 600 多道 LeetCode,做华为高端岗的笔试,也只 AC 了 2 道半,对边界情况的处理、代码优化能力的要求,远比普通大厂高得多。3. 腾讯游戏 / 米哈游 游戏客户端 / 引擎开发岗笔试游戏圈的笔试,是出了名的难,完全是另一个维度的考核。难在哪里:不只是考算法,更是考游戏开发的硬核功底。题型覆盖 C++ 底层原理、计算机图形学、OpenGL/DirectX、物理引擎、数据结构、操作系统,还有超难的算法编程题,很多题都是针对游戏开发场景设计的,没接触过的话,连题干都读不懂。真实体感:做米哈游的客户端开发笔试,选择题一半都是图形学和 C++ 内存管理的硬核题,编程题考了游戏里的碰撞检测算法,完全没接触过的话,根本无从下手,非游戏开发方向的,大概率会直接交白卷。4. 字节跳动 算法岗 / 后端开发岗笔试互联网大厂里,字节的笔试难度是公认的第一梯队,虐哭了无数校招生。难在哪里:题量超大,时间极紧,难度梯度离谱。通常是 40 道行测 + 4 道算法题,120 分钟完成。行测题烧脑耗时间,算法题 2 道中等 + 2 道 Hard,几乎没有送分题,对做题速度和心态都是极致的考验,很多人行测就耗掉了一大半时间,算法题根本没时间写。真实体感:秋招做字节的后端笔试,行测就做了 50 分钟,剩下的时间 4 道算法题,只 AC 了 1 道半,身边很多同学都是全程被按在地上摩擦,能 AC3 道以上的,都能被称为大神。5. 六大行总行 / 政策性银行 科技岗笔试非技术岗里的地狱难度,难在离谱的题量和无所不包的考点。难在哪里:和互联网公司完全不同,不只是考编程,考点覆盖行测、英语、计算机专业知识(计算机网络、操作系统、数据库、组成原理、C++/Java)、金融知识、时政、常识,甚至还有性格测试,题量能到 200 多道,考试时间 3 个小时,全程手不停,做到最后眼睛都花了。真实体感:做某国有大行总行的科技岗笔试,3 个小时,200 多道题,英语还有 10 道完形填空 + 5 篇阅读理解,计算机专业知识考得又偏又细,做到最后手都酸了,连蒙带猜才勉强做完,考完直接脑子一片空白。最后想跟牛友们说,笔试只是秋招的一关,哪怕考崩了也不用自我否定,很多笔试的通过率本来就极低,不是你不够优秀。
你做过最难的笔试是哪家公...
点赞 评论 收藏
分享
评论
12
34
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务