首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
首页 /
模仿学习
#
模仿学习
#
7228次浏览
60人互动
收藏话题
分享
此刻你想和大家分享什么
热门
最新
2024-11-28 21:04
已编辑
仙台白百合女子大学 嵌入式工程师
小米具身智能算法岗实习一面
第一个帖子给第一次面试,攒攒人品。课题:强化学习和模仿学习怎么在任务里结合的,为什么要用这两个。模仿学习收集数据怎么收集。强化学习奖励函数的设置,以及需要多少次迭代。末端力如果有噪声怎么办。实体的强化学习效果怎么样。对大模型有没有了解。对Serl有没有了解。竞赛:在竞赛中承担什么样的角色做了什么工作。八股:model-base和model-free的区别,马尔可夫性解释,为什么最优值函数就是最优策略,策略迭代和值迭代区别。代码:合并区间。感受:虽然迟到了但是面试官非常温柔,而且问的也很对口,就是我很容易说别的废话呜呜呜,第一次面试函数名用了拼音,写的时候感觉就不太好但是突然脑子里没有英文名。hr建议:多跟进最新进展成果,不要专注于两三年前的东西。如果有会大模型的也建议投一下,面试官说那边比较缺人。#
查看13道真题和解析
点赞
评论
收藏
分享
2023-06-29 11:46
阿里巴巴_算法工程师
强化学习面试必知必答[10]:模仿学习、行为克隆、逆强化学习
强化学习从基础到进阶--案例与实践含面试必知必答[10]:模仿学习、行为克隆、逆强化学习、第三人称视角模仿学习、序列生成和聊天机器人 模仿学习(imitation learning,IL) 讨论的问题是,假设我们连奖励都没有,要怎么进行更新以及让智能体与环境交互呢?模仿学习又被称为示范学习(learning from demonstration),学徒学习(apprenticeship learning),观察学习(learning by watching)。在模仿学习中,有一些专家的示范,智能体也可以与环境交互,但它无法从环境里得到任何的奖励,它只能通过专家的示范来学习什么是好的,什么是不好...
强化学习(原理+项目)
点赞
评论
收藏
分享
玩命加载中
创作者周榜
更多
热议话题
更多
1
...
你的实习产出是真实的还是包装的?
0
2
...
中国电信笔试
0
1
...
开放七大实习专项,百度暑期实习值得冲吗
3
...
春招至今,你的战绩如何?
0
4
...
如果秋招能重来,我会____
0
5
...
一张图晒出你司的标语
0
1
...
米连集团26产品管培生项目
6
...
i人适合做什么工作
0
7
...
我是面试官,请用一句话让我破防
0
8
...
金三银四,你的春招进行到哪个阶段了?
0
9
...
哪些公司真双非友好?
0
10
...
投递几十家公司,到现在0offer,大家都一样吗
0
牛客网
牛客网在线编程
牛客网题解
牛客企业服务