面试题简述MMoE 和 PLE 分别是为了解决什么问题的?最大的区别在哪里?面试官想听的1、MMoE = 多专家 + gating2、PLE = 专家分层 + 共享/专属塔3、能解释为什么 PLE 更适合缓解任务冲突4、能说清楚结构差异面试回答举例MMoE, Multi-gate Mixture-of-Experts, 是一个经典的多任务学习结构,用于解决多个任务之间存在差异但又共享部分知识的问题。它的核心结构是多个专家网络,每个任务都有自己的 gating 网络,用门控分配各 expert 输出权重。简单来说,它是把多个任务排到不同的专家面前,由 gating 决定每个任务从哪些专家那里学习...