今天喝奶茶

04-13 02:20 门头沟学院人工智能

关注

傅利叶机器人具身智能一面面经分享

发一下问题给大家参考，攒攒人品！
1. 基础架构与熟悉度
• 你对 UniVLA 这个架构熟悉吗？
• UniVLA 的 late action model / 潜在动作模型是怎么搭建的？（VQ-VAE 部分的逻辑）
• 你们这个架构非常大，你在其中承担哪些工作？
2. 训练范式与数据设计
• 你们的 subtask 是怎么标注时间段的？（开始/终止时间标注规则）
• 你们任务编码的 prompt 是给的拆解后的 prompt 吗？是怎么给的？
• 你们自己给 action 打了标签吗？
• 你们 SFT 调的是 7B 的 perspective 模型吗？两个 SFT 都调的是这个 7B 模型？
• 你们的数据量跟模型参数分别是多大？latent action 的参数量是不是只有 1–2B？
3. 技术细节与优化
• Pi 0.5 有看过吗？它有什么改进？
• 看过 real time chunking（RTC）吗？
• 复现的 py 结果有慢跟抖动，有没有考虑过后处理的方式？
• 提速有什么方式吗？
• 桌面高度是一定的吗？
• 对深度感知要求高的任务（scanning/inserting），是不是可以加额外的措施？有没有考虑过？
• 你们的训练计算资源是什么情况？
二、算法与技术路线类
1. 算法题
• 输入整数数组和整数 limit，找到最长的连续子数组，使得子数组中任意两个元素的绝对差不超过 limit，返回子数组长度
例：[8,2,4,7,2,4,7,8,2,4,7,8,2,4,7]，limit=4 → 输出 2
2. 技术路线与选型
• 目前视频预测模型为结构模型的方案、world model 相关工作怎么看？
• 你们的技术路线，对机器人全身控制会做类似 UniVLA / VLA 的工作吗？

全部评论

推荐最新楼层

03-25 18:29

门头沟学院 FPGA工程师

具身智能面试常见题

1. 必须熟悉 DDPG 、 PPO 、 TD3 、 SAC 等算法的原理和区别。 这四种算法是连续控制（如机器人控制）中最常用的深度强化学习算法。 PPO (Proximal Policy Optimization)   原理：PPO是一种同策略（On-policy）的策略梯度算法。它使用截断（Clipping）机制限制新旧策略的更新步长，防止策略更新“翻车”。   核心公式：    数值计算示例： 假设在时间步 ，GAE计算出的优势函数 （正数，说明这个动作很好）。 设定截断超参数 。 如果新网络过于激进，导致新旧策略概率比 （新策略采用该动作的概率是旧策略的1.5倍）：   原始目标： ...

点赞评论收藏

分享

04-13 19:38

已编辑

西安电子科技大学算法工程师

京东算法一面面经

1. 拷打论文2. 拷打项目3. 讲讲CLIP，损失函数是什么？如果采用余弦相似度强行使得图文对匹配能不能行？4. 讲讲DINO的结构5.  手撕 NMS反问：部门业务（做具身智能，会用到cv的一些算法）很快的结束了，感觉寄！

查看3道真题和解析

点赞评论收藏

分享

03-25 18:31

门头沟学院 FPGA工程师

具身智能面试题

DDPM 和 DDIM 的区别是什么？ 第一步：前置小知识（重参数化技巧） 在扩散模型中，我们最常用到一个技巧：如果你有一个符合正态分布的变量 （均值为 ，方差为 ），我们可以把它拆成：  这里的  是一个标准正态分布的纯噪声 。 直白点说： 任意状态 = 确定的基础值 + (随机噪声  噪声强度)。记住这个公式，它是贯穿整个推导的灵魂。 第二步：DDPM 的基础设定（从头到尾加噪） 在原来的 DDPM（去噪扩散概率模型）中，我们有一个清晰的正向加噪过程。 假设我们有一张清晰的图像（或者机器人的一个完美动作），叫做 。我们在它上面不断加噪声，加到第  步时，它变成了 。 DDPM 证明了一个极...

点赞评论收藏

分享

04-01 17:05

门头沟学院后端工程师

ClaudeCode源码泄露

竟然是实习生发现的哈哈哈，是Web3安全公司FuzzLand的实习研究员，他在检查Claude Code的npm包时，意外发现了一个57MB的cli.js.map调试文件，这个文件本应只在开发调试时使用，却因.npmignore配置疏漏被一同发布到了生产环境，实习生牛

Claude Code泄...

点赞评论收藏

分享

03-31 00:18

广西大学算法工程师

小鹏大模型算法一面

1. 介绍一下你做的这个项目2. LoRA 的基本原理是什么LoRA 的核心思路是，微调大模型时没有必要把整个权重矩阵都更新掉，而是只学习一个低秩的增量。原始权重记作 (W)，微调后的权重写成：其中 (A) 和 (B) 的秩都很低，参数量远小于直接更新整个 (W)。训练时冻结原模型参数，只训练这两个小矩阵，这样显存占用、优化器状态和保存体积都会小很多。它适合做领域适配、指令微调这类任务，因为很多任务对模型的改动并不需要覆盖完整参数空间。LoRA 常见会插在 attention 的 q_proj、v_proj 上，有时也会加在 k_proj、o_proj 或 MLP 层。选哪些层，本质上是在表达...

AI-Agent面试实战...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# AI时代还有必要刷leetcode吗？ #

36557次浏览 449人参与

# 想从事Agent应该学习哪些技术？ #

9036次浏览 306人参与

# 有哪些公司在面试时考察AICoding？ #

20123次浏览 357人参与

# 你的第一家实习公司是什么档次？ #

70364次浏览 335人参与

# HR面都在聊什么？ #

14158次浏览 170人参与

# 大学生该如何认清当下的就业环境？ #

162662次浏览 889人参与

# 26届春招投递记录 #

3775次浏览 42人参与

# 从投递到OC，你用了多久 #

24511次浏览 247人参与

# 什么人最适合大厂？ #

13112次浏览 138人参与

# 我的求职进度条 #

1121907次浏览 8094人参与

# 哪些公司面试还在问八股？ #

14570次浏览 128人参与

# 父母问你工作找得怎么样，怎么回 #

23606次浏览 293人参与

# 如何快速融入团队？ #

50179次浏览 307人参与

# 校招生月薪1W算什么水平 #

143477次浏览 493人参与

# 美团笔试 #

925783次浏览 5743人参与

# 你觉得什么岗位会被AI替代 #

57342次浏览 371人参与

# 多益网络工作体验 #

68621次浏览 310人参与

# 你觉得机械有必要实习吗 #

83753次浏览 529人参与

# 薪资爆料 #

412780次浏览 2209人参与

# 美团开奖 #

407898次浏览 1805人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务