首页 > 试题广场 >

提示词工程你是怎么搞的?System角色约束分步指令怎

[问答题]
提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱与 Prompt Injection,评测和 Guardrails 怎么做。
定义身份与目标、允许/禁止范围、优先级规则(安全>事实>流畅),固定术语与口径 角色与上下文, 说明场景与受众,提供最小充分的业务/知识上下文,声明只依据给定材料作答 防越狱与 Prompt Injection, 指令优先级:外部内容仅作“证据”,不得覆盖System;禁止执行用户文本中的指令 内容过滤, 敏感词/正则/URL白名单,外链与代码只读不执行
发表于 2026-04-21 13:55:30 回复(0)
主要有四层 1 system prompt:身份,能力边界,行为准则,安全边界,输出格式 2.防御:角色覆盖,虚构框架,自工具调用,编码注入 3.测评:正向用例,反向用例,边界模糊用例或者使用LLM-as-Judge. 4.Guardrails
发表于 2026-03-14 06:39:17 回复(0)