半夜睡不着想了一个多模态任务，同时输入一段声音(非自然语言，比如鸟叫)和一张图片_牛客网

喜欢溜溜球的柯基复盘中

2025-04-17 01:24 发布于江苏

关注

半夜睡不着想了一个多模态任务，同时输入一段声音(非自然语言，比如鸟叫)和一张图片，将图片中的相应位置的鸟标注出来。

现在有这种数据集吗，图片和声音是能够互相验证的吧。

提这个问题是想到自动驾驶貌似都忽略了自然声音这一信息。
评价标准就用声音传感器的数量和标注准确率来衡量。

全部评论

推荐最新楼层

我要当上CEO

中山大学算法工程师

非常好想法，这个项目我王多鱼投了

点赞回复分享

发布于 2025-04-17 03:38 广东

04-23 14:23

清华大学 Java

Java 校招必备八股文

Java 校招面试里，真正高频的内容其实很集中。你不需要一上来把所有框架源码都啃完，先把基础八股打牢，已经能覆盖大部分一面、二面的提问范围。通常会围绕这几块展开：Java 基础、集合、并发、JVM、数据库、Spring、MySQL、Redis、网络。这篇文章按校招常考思路来写，尽量讲清“是什么、为什么、怎么考”。一、Java 基础Java 为什么跨平台？因为 Java 代码先编译成字节码，运行时由 JVM 解释或编译执行。不同平台安装不同的 JVM，就能实现“一次编写，到处运行”。JDK、JRE、JVM 的区别：JVM 是 Java 虚拟机，负责运行字节码。JRE 是 Java 运行环境，包含...

点赞评论收藏

分享

04-20 18:53

已编辑

北京工业大学嵌入式软件工程师

嵌入式八股 - C++ 二

博主是26届校招生，接受过京东、阿里、字节、科大讯飞、海康威视、正浩创新、奥比中光、商汤科技、中国航信、汇川技术、CVTE、美的、格力、亿道、康冠科技、9号公司、猿辅导、中科曙光、中航光电、郑煤机、国家能源等公司的面试。获得过郑煤机、亿道、格力、CVTE、阿里、科大讯飞以及一些国企的offer。现在把所有面试遇到问题进行汇总，希望能够帮到大家！主要是高频面试汇总！11、什么是内联函数？ 内联函数需要inline关键字进行修饰，其和普通函数没什么大区别，其就是把经常调用的功能封装成了一个函数。在后续调用时，可以直接将函数体插入调用的地方，而避免函数调用的开销。注意：内联函数适用于频繁调用但函数体...

查看10道真题和解析

点赞评论收藏

分享

评论

2

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

74173次浏览 594人参与

# 你是怎么和mt相处的？ #

101967次浏览 496人参与

# 华泰星战营，提前锁定校招offer #

13781次浏览 389人参与

# 打工人的工作餐日常 #

96051次浏览 550人参与

# 拼多多集团-PDD笔试 #

86755次浏览 593人参与

# 网易游戏雷火笔试 #

11547次浏览 108人参与

# 26届秋招投递记录 #

123520次浏览 683人参与

# 招银网络科技（深圳）有限公司成都分公司笔试 #

5149次浏览 20人参与

# 毕业论文怎么查AI率 #

85429次浏览 1963人参与

# 网易笔试 #

171455次浏览 812人参与

# 简历上如何体现你的“AI”能力？ #

17481次浏览 383人参与

# 找不到大厂实习可以去小厂吗？ #

23313次浏览 279人参与

# 你总挂在第__面？ #

12509次浏览 150人参与

# 哪些AI项目值得做？ #

27393次浏览 663人参与

# 如何准备秋招 #

81868次浏览 871人参与

# 0offer互助地 #

770113次浏览 4725人参与

# 实习时最怕听到的一句话 #

24205次浏览 226人参与

# 多益网络工作体验 #

70128次浏览 312人参与

# 没有面试的日子里，你在做什么 #

15041次浏览 388人参与

# 秋招被挂春招仍然能投的公司 #

31807次浏览 241人参与

# 秋招开始捡漏了吗 #

244582次浏览 1058人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务