vivo 暑期一面 凉
影像算法 岗位
大哥人不错,上来先自我介绍
聊项目。
行人遮挡,人员密集的场景怎么处理?没有考虑这样的场景。
为什么选择llava或者qwen-VL,选型的思路?
code:(不写leetcode)
手撕 softmax,要求写成nn.module,前向传播的形式。
有意思的是反问环节。
影像算法这块会用到什么多模态的内容?
开集检测,像grounding dino这样的,找到人像,背景虚化这样的内容。
vivo的工作强度如何?
比互联网好的多得多,八小时打卡下班,因为工作设备不让带出工区,所以下班了就真是下班了。
晋升怎么样?
一年一次,低职级的晋升会比较顺利。
(所以高级别的就需要人情世故了对吗。)
昨天出的gpt-4o文生图,这边有没有什么类似的计划或者想法,因为我看咱们这边也是偏相机拍照这一块,有没有考虑用大模型来p图美化相关的计划?
超过7B的大模型就很难上端侧了,所以暂时没有大模型相关的想法。更多的会在云端进行调用。