隐私与 PII 案例
本章聚焦隐私场景下的信息抽取与过滤。
从聊天记录中提取 PII
query = f"""从以下聊天记录中提取所有个人身份信息:
聊天记录: \"{chat_log}\"
姓名: {g(name="name", desc="full name of the person")}
地址: {g(name="address", desc="physical address")}
邮箱: {g.e_mail(name="email")}
电话: {g.phone_number(name="phone")}
银行卡号: {g(name="card", desc="credit card number", regex=r"[\d-]{13,19}")}"""
result = model(query, use_gim_prompt=True)
PII 脱敏
query = f"""对以下文本中的个人信息进行脱敏,用占位符替换:
文本: \"{text}\"
脱敏后: {g(name="redacted", desc="the full text with PII replaced by placeholders")}"""
result = model(query, use_gim_prompt=True)
隐私风险分类
query = f"""对以下文本的隐私风险等级进行分类:
文本: \"{text}\"
风险等级: {g.select(name="risk", choices=["无", "低", "中", "高"])}
原因: {g(name="reason", desc="brief reason for the risk level")}"""
result = model(query, use_gim_prompt=True)
Agent Memory 安全上传过滤
query = f"""从以下用户消息中,仅提取可安全存储到 Agent 记忆的信息。不要包含 PII。
文本: \"{user_message}\"
公司: {g(name="company", desc="company name")}
职位: {g(name="role", desc="job title or role")}
兴趣: {g(name="interests", desc="work interests or preferences")}"""
result = model(query, use_gim_prompt=True)