02-27 22:09 已编辑门头沟学院自动驾驶系统工程师发布于上海

关注

deepseek与自动驾驶

没时间解释了，快上车！🚗 我是开车的阿Q，今天带你们飙进自动驾驶的“脑回路”——当视觉语言模型（VLM）撞上思维链CoT，AI如何用“鹰眼+碎碎念”搞定路上那些离谱Concern Case？ 系好安全带，前方高能！

一、先看一个“鬼畜路况”：假人从天而降！

去年我们团队测试自动驾驶系统时，遇到一个“阴间场景”：前车突然掉下来一个假人模特（别问，问就是友商在搞压力测试）。传统感知系统当场懵圈：

摄像头：检测到“人形物体”，但置信度只有60%（心想：这兄弟姿势咋像瑜伽教练？）；
激光雷达：反射信号弱鸡（假人材质太塑料，雷达内心OS：这怕不是个幽灵？）；
规控模块：疯狂纠结“刹不刹？绕不绕？刹了被追尾咋办？”——结果车愣是怼上去了！

老板怒吼：“这AI开车还不如驾校教练！” 于是我们连夜给系统加装了两大神器：VLM（视觉语言模型）当“鹰眼”+CoT（思维链）当“碎碎念指挥官”。

二、VLM+CoT组合拳：从“睁眼瞎”到“福尔摩斯”

1. VLM：给AI装上一双“会唠嗑的眼睛”

传统视觉模型看假人：

“检测到物体：人（置信度72.3%）→ 输出：障碍物”

VLM的骚操作：

Step1：看图说话→“前方10米路面有倒地人形物体，四肢僵硬、无热信号、材质反光”；
Step2：联想知识库→“符合‘假人测试道具’特征，历史数据中相似案例80%为测试干扰”；
Step3：输出带标签的语义信息→“疑似非生物威胁，建议谨慎验证”。

这就好比驾校教练不仅看到障碍，还嘀咕：“这假人头发太假，鞋底都没泥，肯定是剧组道具！”

2. CoT：让AI学会“内心戏”分步推理

有了VLM的“线索”，CoT开始疯狂加戏：

【思维链启动！】  
Step1：物体属性分析  
- 视觉特征：人形但无生命体征（红外传感器确认）  
- 运动轨迹：突然从前方车辆掉落，无预兆  
→ 结论：90%概率为静态非生物体  

Step2：风险等级评估  
- 若急刹：后方有车距1.2米，追尾风险高  
- 若绕行：左侧车道空闲，但需跨越虚线  
→ 结论：变道风险低于急刹  

Step3：决策执行  
- 打转向灯，向左缓速变道  
- 同步上报云端：“检测到疑似测试道具，坐标已记录”

用户看完系统日志笑疯：“这AI的内心戏比甄嬛传还精彩！”

三、实战名场面：VLM+CoT如何化身“马路戏精”

Case 1：识别“碰瓷专业户”

某次路测遇到大爷躺引擎盖碰瓷，VLM直接触发“语义警报”：

“检测到人体：姿态异常（平躺）、表情夸张、手持‘专业道具’（破旧收音机）”
CoT秒接招：“历史碰瓷案例匹配度87%，建议：锁车门+报警+全程录像”

Case 2：破解“幽灵广告牌”

夜间行驶时，路边LED屏播放“汉堡王广告——巨型汉堡坠落动画”，传统系统吓得猛打方向盘。VLM+CoT组合：

VLM：“动态图像，光源来自右侧广告屏，无实体投影”
CoT：“判定为光学干扰，维持车道，同时标记此位置为‘视觉陷阱’”

老板狂喜：“这套路，连好莱坞特效团队都能忽悠过去！”

四、行业黑话时间：为啥VLM+CoT是绝配？

VLM的“视觉唠嗑力”：把像素翻译成“人话”（比如“这不是真腿，是电线杆影子！”），解决传统感知的“语义鸿沟”；
CoT的“分步甩锅术”：遇到争议决策时，把黑锅（划掉）把责任拆解成“感知背锅30%+规控背锅70%”，方便事后复盘；
组合技的“反内卷Buff”：让算法团队少加班（因为AI自己能解释为啥撞了假人：“都怪VLM没认出假发！”）。

五、未来脑洞：自动驾驶的“剧本杀模式”

想象一下，未来你的车会这样跟你唠嗑：

VLM：“报告！右前方疑似流浪狗，但尾巴摆动频率像扫地机器人。”
CoT：“建议方案：
减速至30km/h
用车载喇叭播放《喵喵之歌》测试反应
若对方跳《极乐净土》，确认为机器人，直接碾过（注：开玩笑的）”

当然，真要实现还得攻克：如何让AI分清“假人”和“穿COS服的真人”（漫展附近慎用自动驾驶）、怎么防止CoT过度推理（比如把云朵脑补成外星人）…但别忘了，阿Q我当年倒车入库都蹭墙，现在不照样秋名山漂移？

到站了！ 如果你想让AI学会“一边看路一边唠嗑”，赶紧关注开车的阿Q，

（注：文中测试场景均为虚构，但假人可能真的在盯着你开车...）

#聊聊我眼中的AI##牛客创作赏金赛#

自动驾驶上车指北文章被收录于专栏

没时间解释了，自动驾驶来了，速速上车

全部评论

推荐最新楼层

07-02 18:43

海康威视_自动化开发工程师(准入职员工)

海康威视内推

分享一下自己对海康的感受，也在海康总部的3期。 之前看了网上的评论实属是有点吓人的，但是百闻不如一见自己终究是亲自感受了一下。 这可能是我国内外大大小小加起来的第6段实习或者工作。 海康首先给我的感觉是人真的好多，尤其食堂的人，我可能上学都没有见过这么多人，还有电梯，我每次坐是一头雾水。当然这些对于我来说都不是很重要。 可能很多人最关心的就是海康的工作强度和时间是不是真如网上说的那么严重，而通过这段时间的感受，我觉得海康可能是我节奏最慢的一次体验，完成了任务就可以开开心心的回家了，根本不需要无效加班，如果自己想学点产品类的知识还是可以在公司里多学一点的。 关于部门小组氛围，我一开始是有点惊讶的...

海康威视公司氛围 471人发布

点赞评论收藏

分享

不愿透露姓名的神秘牛友

07-02 12:11

女友问我为什么进字节后不理她了

我最近都有点不想活了，天天早10晚11的，还问我爱不爱她目前的状态别说爱谁了，没扇谁就不错了。是不是大家都是一进节子，只有工作没有爱情了

熬夜脱发码农：字节强度确实太大了。但是我没字节offer也没谈过女朋友

实习吐槽大会

点赞评论收藏

分享

06-09 11:28

湖北师范大学 Java

醉蟀：你不干有的是人干

点赞评论收藏

分享

06-14 14:21

成都东软学院人工智能

求锐评，求拷打

普通二本人智找不到实习😢

废物一个0offer：认真的吗二本本科找人工智能岗位

点赞评论收藏

分享

07-02 17:15

已编辑

衢州学院软件测试

鼠鼠还是喜欢住在下水道里舒舒服服的活

双非小二本，想投测试或者运维，问题是学校里压根没教过啊，求大佬看看怎么改简历，现在是该去熟悉测试用例啊还是干什么，投简历想吐了，全是已读不回

实习，不懂就问

点赞评论收藏

分享

评论

点赞

2

招聘动态

快手

快Star-X特别技术人才计划启动

现代汽车前瞻技术研发中心

京东TET

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 百度工作体验 #

227387次浏览 1999人参与

# 机械人与华为的爱恨情仇 #

117968次浏览 951人参与

# 现代汽车前瞻技术研发急速编程挑战赛 #

34951次浏览 260人参与

# 非技术岗投递进展 #

143755次浏览 1264人参与

# 发工资后，你做的第一件事是什么 #

68834次浏览 232人参与

# 没有合适的工作，你会先找个干着，还是考公考研 #

115379次浏览 1133人参与

# 材料进Fab厂真的劝退吗？ #

42559次浏览 184人参与

# 工作中，努力重要还是选择重要？ #

137651次浏览 1685人参与

# 秋招什么时候开投比较合适？ #

29713次浏览 358人参与

# 如果你有一天可以担任公司的CEO，你会做哪三件事？ #

29212次浏览 471人参与

# 平台or薪资硬件uu更看重哪个 #

128017次浏览 595人参与

# 工作中哪个瞬间让你想离职 #

26518次浏览 179人参与

# 银行笔面经互助 #

134459次浏览 1170人参与

# 毕业旅行去哪玩儿 #

6995次浏览 117人参与

# 不考虑转正，实习多久合适 #

32768次浏览 159人参与

# 金融财会交流会 #

110650次浏览 380人参与

# 如何准备秋招 #

23060次浏览 429人参与

# 上班到公司第一件事做什么？ #

58922次浏览 506人参与

# 机械人集合！你是什么工程师？ #

16461次浏览 89人参与

# 正在实习的你，几点下班 #

170730次浏览 1174人参与

# 设计人如何选offer #

119469次浏览 742人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务