算法天才们,谁能解决

设计一个架构或模型,用于在“猜动作”游戏中通过迭代优化动作描述的输入,使得模型返回的相似度评分逐步提高,最终达到 > 0.7 的阈值。

给定条件
输入:用户提供的动作描述(自然语言文本,如“一个人在跑步”)。

评测函数,多模态的余弦相似度:

输入动作描述,输出一个相似度分数(范围 [0, 1])。

分数越高,表示描述与目标动作越接近。

交互方式:

允许多次尝试,每次根据历史反馈调整输入描述。

目标是通过策略优化,使相似度最终 > 0.7。
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务