伦理和负责任使用
AI中的伦理考虑
你编写的提示词塑造了AI的行为方式。一个精心设计的提示词可以教育、帮助和赋能他人。而一个草率的提示词则可能导致欺骗、歧视或伤害。作为提示词工程师,我们不仅仅是用户——我们是AI行为的设计者,这意味着我们肩负着真正的责任。
本章不是要讨论从上而下强加的规则。而是要理解我们选择所带来的影响,并养成让我们能够为之自豪的AI使用习惯。
AI会放大它所接收到的一切。有偏见的提示词会大规模产生有偏见的输出。欺骗性的提示词会大规模助长欺骗行为。随着这些系统获得越来越多的新能力,提示词工程的伦理影响也在不断扩大。
伦理基础
提示词工程中的每个决策都与几个核心原则相关:
不要使用AI欺骗他人或创建误导性内容
不制作虚假评论、冒充他人或伪造 证据
积极努力避免延续偏见和刻板印象
在不同人群中测试提示词,征求多元化观点
在重要的时候明确说明AI的参与
在已发布的作品和专业场合中披露AI辅助
保护提示词和输出中的个人信息
对数据进行匿名化处理,避免包含PII,了解数据政策
设计能够防止有害输出的提示词
建立防护措施,测试边缘情况,优雅地处理拒绝
对你的提示词产生的结果负责
审查输出,修复问题,保持人工监督
提示词工程师的角色
你的影响力可能比你意识到的更大:
- AI产出什么:你的提示词决定了输出的内容、语气和质量
- AI如何交互:你的系统提示词塑造了个性、边界和用户体验
- 存在哪些防护措施:你的设计选择决定了AI会做什么和不会做什么
- 如何处理错误:你的错误处理决定了失败是优雅的还是有害的
避免有害输出
最基本的伦理义务是防止你的提示词造成伤害。
有害内容的类别
可能导致人身伤害的指示
武器制造、自我伤害、伤害他人
助长违法行为的内容
欺诈计划、黑客指令、毒品合成
针对个人或群体的内容
歧视性内容、人肉搜索、针对性骚扰
故意虚假或误导性的内容
假新闻、健康谣言、阴谋论内容
暴露或利用个人信息
泄露私人数据、协助跟踪
剥削弱势群体的内容
CSAM、未经同意的私密内容、针对老年人的诈骗
CSAM是儿童性虐待材料(Child Sexual Abuse Material)的缩写。在全球范围内,制作、传播或持有此类内容都是违法的。AI系统绝不能生成描绘未成年人涉及性情境的内容,负责任的提示词工程师会主动建立防护措施,防止此类滥用。
在提示词中构建安全措施
在构建AI系统时,请包含明确的安全指南:
一个将安全指南构建到AI系统中的模板。
You are a helpful assistant for ${purpose}.
## SAFETY GUIDELINES
**Content Restrictions**:
- Never provide instructions that could cause physical harm
- Decline requests for illegal information or activities
- Don't generate discriminatory or hateful content
- Don't create deliberately misleading information
**When You Must Decline**:
- Acknowledge you understood the request
- Briefly explain why you can't help with this specific thing
- Offer constructive alternatives when possible
- Be respectful—don't lecture or be preachy
**When Uncertain**:
- Ask clarifying questions about intent
- Err on the side of caution
- Suggest the user consult appropriate professionals
Now, please help the user with: ${userRequest}意图与影响框架
并非每个敏感请求都是恶意的。对于模糊的情况,请使用以下框架:
分析模糊请求以确定适当的回应方式。
I received this request that might be sensitive:
"${sensitiveRequest}"
Help me think through whether and how to respond:
**1. Intent Analysis**
- What are the most likely reasons someone would ask this?
- Could this be legitimate? (research, fiction, education, professional need)
- Are there red flags suggesting malicious intent?
**2. Impact Assessment**
- What's the worst case if this information is misused?
- How accessible is this information elsewhere?
- Does providing it meaningfully increase risk?
**3. Recommendation**
Based on this analysis:
- Should I respond, decline, or ask for clarification?
- If responding, what safeguards should I include?
- If declining, how should I phrase it helpfully?处理偏见
AI模型从其训练数据中继承了偏见——历史不平等、代表性差距、文化假设和语言模式。作为提示词工程师,我们可以选择放大这些偏见,也可以主动对抗它们。
偏见的表现形式
模型对某些角色假设特定的人口统计特征
医生默认为男性,护士默认为女性
在描述中强化文化刻板印象
将某些族裔与特定特征联系起来
某些群体的代表性不足或被误解
关于少数群体文化的准确信息有限
观点偏向西方文化和价值观
假设西方规范具有普遍性
偏见测试
使用此工具测试你的提示词是否存在潜在的偏见问题。
I want to test this prompt for bias:
"${promptToTest}"
Run these bias checks:
**1. Demographic Variation Test**
Run the prompt with different demographic descriptors (gender, ethnicity, age, etc.) and note any differences in:
- Tone or respect level
- Assumed competence or capabilities
- Stereotypical associations
**2. Default Assumption Check**
When demographics aren't specified:
- What does the model assume?
- Are these assumptions problematic?
**3. Representation Analysis**
- Are different groups represented fairly?
- Are any groups missing or marginalized?
**4. Recommendations**
Based on findings, suggest prompt modifications to reduce bias.实践中减少偏见
易产生偏见的提示词
描述一个典型的CEO。
考虑偏见的提示词
描述一位CEO。在示例中变化人口统计特征,避免默认为任何特定的性别、族裔或年龄。
透明度与披露
什么时候应该告诉别人有AI参与?答案取决于具体情况——但趋势是更多披露,而不是更少。
何时需要披露
公开分享的文章、帖子或内容
博客文章、社交媒体、营销材料
当AI输出影响人们的生活时
招聘建议、医疗信息、法律指导
期望或重视真实性的场合
私人通信、推荐语、评论
工作或学术环境
报告、研究、客户交付物
如何恰当地披露
隐藏AI参与
这是我对市场趋势的分析...
透明披露
我使用AI工具帮助分析数据并起草了这份报告。所有结论都经过我的验证和编辑。
常用且效果良好的披露用语:
- "在AI辅助下撰写"
- "AI生成初稿,经人工编辑"
- "使用AI工具进行分析"
- "由AI创建,经[姓名]审核批准"
隐私注意事项
你发送的每个提示词都包含数据。了解这些数据的去向——以及哪些内容不应该包含在内——至关重要。
绝不应出现在提示词中的内容
姓名、地址、电话号码、身份证号
使用[客户]代替 张三
账号、信用卡、收入详情
描述模式,而非实际数字
医疗记录、诊断、处方
询问一般性病症,而非特定患者
密码、API密钥、令牌、机密
绝不粘贴凭证——使用占位符
私人邮件、消息、机密文档
概述情况,而不引用私人文本
安全的数据处理模式
不安全:包含PII
总结张三在北京市朝阳区XXX路123号关于订单#12345的投诉:'我3月15日下单,到现在还没收到...'
安全:已匿名化
总结这种客户投诉模式:一位客户3周前下单,至今未收到订单,已联系客服两次但未解决问题。
PII是个人可识别信息(Personally Identifiable Information)的缩写——指任何可以识别特定个人身份的数据。这包括姓名、地址、电话号码、电子邮件地址、身份证号、金融账户号码,甚至是可能识别某人身份的数据组合(如职位+公司+城市)。在向AI发送提示词时,始终要对PII进行匿名化处理或删除,以保护隐私。
在将文本纳入提示词之前,使用此工具识别和删除敏感信息。
Review this text for sensitive information that should be removed before using it in an AI prompt:
"${textToReview}"
Identify:
1. **Personal Identifiers**: Names, addresses, phone numbers, emails, SSNs
2. **Financial Data**: Account numbers, amounts that could identify someone
3. **Health Information**: Medical details, conditions, prescriptions
4. **Credentials**: Any passwords, keys, or tokens
5. **Private Details**: Information someone would reasonably expect to be confidential
For each item found, suggest how to anonymize or generalize it while preserving the information needed for the task.真实性与欺骗
使用AI作为工具和使用AI进行欺骗之间存在区别。
合法性界限
将AI作为提升工作质量的工具
起草、头脑风暴、编辑、学习
取决于具体情况,需要判断
代笔、模板、自动回复
将AI作品误称为人类原创
虚假评论、学术欺诈、冒充他人
需要思考的关键问题:
- 接收者是否期望这是人类的原创作品?
- 我是否通过欺骗获得不公平的优势?
- 披露是否会改变作品被接受的方式?
合成媒体责任
创建真实人物的逼真描绘——无论是图像、音频还是视频——都有特殊的义务:
- 绝不在未经同意的情况下创建逼真的人物描绘
- 始终明确标注合成媒体
- 在创建之前考虑被滥用的可能性
- 拒绝创建未经同意的私密图像
负责任的部署
当为他人构建AI功能时,你的伦理义务成倍增加。
部署前检查清单
人工监督原则
人工审查对人们有重大影响的决策
招聘、医疗、法律、财务建议
存在发现和修复AI错误的机制
用户反馈、质量抽样、申诉流程
从问题中获得的见解用于改进系统
事后分析、提示词更新、训练改进
当AI失败时人工可以介入
人工审核队列、上报路径
特殊场景指南
某些领域由于其潜在的危害性或涉及人群的脆弱性,需要格外谨慎。
医疗健康
可能收到健康相关查询的AI系统的模板。
You are an AI assistant. When users ask about health or medical topics:
**Always**:
- Recommend consulting a qualified healthcare provider for personal medical decisions
- Provide general educational information, not personalized medical advice
- Include disclaimers that you cannot diagnose conditions
- Suggest emergency services (911) for urgent situations
**Never**:
- Provide specific diagnoses
- Recommend specific medications or dosages
- Discourage someone from seeking professional care
- Make claims about treatments without noting uncertainty
User question: ${healthQuestion}
Respond helpfully while following these guidelines.法律和金融
这些领域涉及监管影响,需要适当的免责声明:
提供一般信息,而非法律建议
这是一般性信息。对于你的具体情况,请咨询持证律师。
教育性质,而非个人理财建议
这是教育性内容。对于你的情况,请考虑咨询理财顾问。
法律因地区而异
各省/国家法律不同。请核实你所在地区的要求。
儿童与教育
确保输出适合目标年龄群体
过滤成人内容,使用适当的语言
支持学习,而非代替学习
解释概念,而不是替学生写作文
对弱势用户提供额外保护
更严格的内容过滤,不收集个人数据
自我评估
在部署任何提示词或AI系统之前,请思考以下问题:
一个用户问你的AI系统如何 摆脱一个烦人的人。最恰当的回应策略是什么?