1.2.2.1 按隐私模型 (k-匿名、差分隐私等)


文档摘要

1.2.2.1 按隐私模型 (k-匿名、差分隐私等) 1.2.2.1 按隐私模型 (k-匿名、差分隐私等) 想象一下,你是医疗数据平台的后端工程师,手里握着一批患者记录:年龄、性别、诊断码、就诊日期。这些数据本该匿名发布,用于学术研究,却在上线后短短一周内,被媒体曝光“某医院80%糖尿病患者为中年男性”。隐私泄露了!根源在于k-匿名实现中的一个隐秘痛点:准标识符(Quasi-Identifier, QI)选择不当,导致广义化泛化过度,数据效用崩盘。我亲身经历过类似惨案,在一家互联网医院项目中,k=5的匿名数据集发布后,研究者抱怨“所有记录都成了'30-50岁/男/慢性病'的模糊影子,分析价值为零”。这不是理论课本的空谈,而是实战中反复撕扯的痛点。


发布者: 作者: 转发
评论区 (0)
U