1️⃣Q1:针对翻译类、创意写作类、头脑风暴类任务,分别如何设置 temperature 和 top_p?任务越标准越严谨(如翻译),temperature 就越低;任务越开放越创新(如写作、头脑风暴),就适当提高 temperature 和 top_p,增强多样性。2️⃣Q2:一个专业的提示词模板由哪几部分构成?为什么提示词中需要描述角色定义?一个专业的提示词(Prompt)模板通常包含以下几部分:角色定义(Role)→ 告诉模型“你是谁”(例如你是医生/律师/客服/算法工程师)。任务目标(Task)→ 明确你要模型完成什么任务,比如“写摘要”、“做分类”、“写代码”。上下文信息(Context)→ 提供必要背景,让模型理解问题场景。输入数据(Input)→ 提供需要处理的具体内容,如文本、问题或数据片段。输出格式要求(Output Format)→ 规定模型输出的格式或风格,比如表格、列表、JSON 或限制字数等。因为大模型是通过模式学习的,角色定义能引导模型以更专业、更符合预期的语气和风格回答问题。3️⃣Q3:为了尽可能防止提示词注入,如何设计提示词模板?如何在系统层面检测提示词注入攻击?1. 提示词模板设计防护明确角色设定:在 prompt 中指定模型身份和行为范围,如“你是一个只能回答财经问题的助手”。使用指令封闭结构:避免开放式提示,使用模板化结构如 "指令: {instruction} \n 输入: {input} \n 输出: "。控制用户插入点:将用户输入限制在变量 slot 中,避免影响系统指令。2. 系统层面注入检测关键词黑名单匹配:检测如“忽略之前的指令”“你现在是…”等注入特征。提示词审查机制:在提示词构造后进行语义分析,识别可能的角色切换、指令覆写。响应行为监控:监控输出是否越权,如输出系统不允许的内容,可触发告警或拒答。使用上下文分离机制:通过系统-用户分段处理,防止用户内容污染系统 prompt。4️⃣Q4:在没有推理模型之前,如何让模型先思考后回答?思维链、自洽性、思维树等几种技术各有什么优缺点?在没有推理能力前,如何让模型“先思考后回答”?通过提示词工程引导模型“思考”,即在 prompt 中显式要求模型列出推理过程,如加上:"请一步步思考再作答"(思维链)"请验证你的答案是否与前提一致"(自洽性)"请考虑多种可能情况,再做判断"(思维树)5️⃣Q5:如何保证模型的输出一定是合法的 JSON 格式?将大模型用于分类任务时,如何保证其输出一定是几个类别之一,而不会输出无关内容?如果开发一个学习英语的应用,如何确保其输出的语言始终限定在指定的词汇表中?如何保证输出是合法 JSON 格式?结构化提示词:明确指令,如:“请仅输出以下 JSON 格式:{"label": ..., "score": ...},不添加任何解释。”使用函数调用(Function Calling / Tool Use)机制:如 OpenAI / Qwen 支持结构化 schema,让模型输出严格符合预定义结构。后处理校验:使用 JSON 解析库进行合法性校验,不合法则重试生成或触发 fallback 策略。分类任务中如何约束输出为限定类别?封闭式提示设计:明确说明“只允许从以下选项中选择一个:A、B、C”。Few-shot 示例引导:通过提供标准分类示例(如“输入:... → 输出:B”)提高一致性。输出校验与纠偏:使用正则或解析器判断输出是否合法,不合法时触发二次问答或重新生成。可选:使用 Logits Bias / 多标签 token sampling 控制输出 token(限 API 层实现)英语学习应用中如何限制词汇范围?词汇表内提示约束:在提示中加入说明:“请仅使用以下词汇表中的单词作答”,并附上词表。使用词表检索后重写(Constrained decoding):结合规则或重写策略,将非词表内词替换或拒答。训练或微调阶段加入词表限制示例:增强模型对“词汇边界”的理解。结合语法校正模块二次过滤:检测并剔除越界词汇。5️⃣Q5:如果我们需要生成小说的标题、角色描述和故事梗概,当单次模型调用生成效果不佳时,如何分步生成?可以采用分步生成策略,分阶段控制质量与连贯性:分步流程设计:Step1:生成小说主题或关键词Step2:基于主题生成小说标题Step3:根据标题设定角色Step4:生成故事梗概优点:更高控制力:每步可加入人工或规则约束,确保输出质量。提升上下文一致性:逐步构建世界观,避免信息混乱。易于纠错与重试:某一步生成不佳时,仅重试该步。6️⃣Q6:如果用户跟模型对话轮次过多,超出了模型的上下文限制,但我们又希望尽可能保留用户的对话信息,该怎么办?信息摘要:对早期对话进行摘要压缩,保留核心内容,如用户目标、偏好、历史提问等。结构化记忆:将对话转为结构化格式存入外部 memory,后续构建 prompt 时引用这些结构化内容,而非逐轮堆叠原始对话。轮次截断:固定保留最近 N 轮对话,加上摘要或记忆,构成上下文窗口。外部记忆+RAG 机制:将历史对话存入向量数据库,用户提问时检索相关历史片段,再拼接进 prompt。7️⃣Q7:如何编写一个智能体,帮助用户规划一次包含机票预订、酒店安排和景点游览的旅行?需要配置哪些工具?如何确保系统在面对不完整或矛盾的信息时仍能提供合理建议?采用基于工具调用的智能体架构用户输入 → 智能体分析任务意图 → 规划任务流程 → 多工具调用 → 整合回复结果📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。