算法天才们,谁能解决
设计一个架构或模型,用于在“猜动作”游戏中通过迭代优化动作描述的输入,使得模型返回的相似度评分逐步提高,最终达到 > 0.7 的阈值。
给定条件
输入:用户提供的动作描述(自然语言文本,如“一个人在跑步”)。
评测函数,多模态的余弦相似度:
输入动作描述,输出一个相似度分数(范围 [0, 1])。
分数越高,表示描述与目标动作越接近。
交互方式:
允许多次尝试,每次根据历史反馈调整输入描述。
目标是通过策略优化,使相似度最终 > 0.7。
给定条件
输入:用户提供的动作描述(自然语言文本,如“一个人在跑步”)。
评测函数,多模态的余弦相似度:
输入动作描述,输出一个相似度分数(范围 [0, 1])。
分数越高,表示描述与目标动作越接近。
交互方式:
允许多次尝试,每次根据历史反馈调整输入描述。
目标是通过策略优化,使相似度最终 > 0.7。
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享