- +1
当你的个人信息被明码标价:深度伪造带来的数据隐私危机
韩国又出大事!曾一度令世界震惊的“N号房事件”出现了升级版,这一次,犯罪的魔爪甚至伸向了未成年人!
韩国女性在全球各大社交平台上发帖求助,嫌疑人利用深度伪造(Deep Fake)技术将受害者的照片进行AI换脸,生成色情图片及视频,和受害者的个人信息一起通过社交媒体平台传播。#N号房2.0#、#Deepfake催发韩国新版N号房#等话题纷纷占据热搜行列。
不同于以往别的国家的AI换脸事件针对对象多为明星网红,这次韩国AI换脸的受害者更多的是普通女性,她们在不知情的情况下,姓名、电话、就读学校、家庭住址等个人信息被传遍多个聊天室。据报道称,这些聊天群的参与人数高达22.7万,参与者只需上传熟人照片,付费后5秒内就能生成裸体合成图。
8月30日,韩国抗议者举行示威,活动人士佩戴面具,举着写有“深度伪造性犯罪反复出现,国家也是共犯”的标语牌。
“韩国N号房2.0”事件中所涉及到的“深度伪造技术”(Deep Fake),是一项通过人工智能技术,特别是深度学习算法,实现的声音、图像或视频内容的篡改和伪造技术。这种技术能够实现人脸替换、表情模仿、语音模仿等效果,使得伪造的内容在视觉和听觉上具有很强的欺骗性。除了照片和视频换脸,现在已经有技术可以达到只需提供一段原声,就能生成几乎完全还原的AI语音。
只需一张照片,视频都能被“换脸”
网络时代,人们的隐私无处可藏。娱乐明星的、政坛领袖的、权贵名流的、普通素人的隐私,身体的、家族的、亲密关系的、五官面部的、日常行为的隐私,被出版的、被报道的、被播放的、被上传的、被观看的隐私。随着技术的发展,“隐私”被明码标价,越发成为了一门生意。
美国布鲁克林法学教授艾米·盖达(Amy Gajda)在她的著作《寻找与隐匿》中,讲述了隐私的变迁史和隐私权的多重面向。以诸多法律案例事件、大法官与法学家的辩论为例,讲述北美大陆隐私权的观念如何建立、如何入法、如何不断扩大保护范畴,同时也指出了主张隐私权时与其他公民权利存在的冲突以博弈。以下是第十七章《回顾凯特·纳什》的节选,艾米·盖达从她自身的经历出发,探讨有关“数据隐私”的问题。
艾米·盖达(Amy Gajda)
《寻找与隐匿》Seek and Hide: The Tangled History of the Right to Privacy被《纽约时报》评为2022年度TOP100好书
《寻找与隐匿:隐私权史的多重面向》
Seek and Hide: The Tangled History of the Right to Privacy
[美]艾米·盖达(Amy Gajda)著
覃卓 译
定价:78.00元
东方出版中心2024年5月
ISBN:9787547323441
第十七章《回顾凯特·纳什》(数据隐私)节选
尽管我的生活相对平静,没有犯罪记录、破产、取消抵押品赎回权或驱逐的情况,如果有人真的想了解我的情况,他们不会发现什么引人注目的东西。我雇用了一名私人侦探,看看他能找到什么,调查结果给了我一份200多页的数据。
这些资料包括一些基本信息,大部分是公众所知道的,比如我的现住地址。传统上,这类信息并不受到保护,因为它是公共信息,一般来说很多人都知道。
但随后我档案的内容却拐到了令人不安的方向。它包括了我从小到大住过的几乎每个地址,许多房子都有购买价格和面积,有些还附有内部照片和平面图。对于我们现在拥有的房产,有抵押贷款的信息;对于我们已经出售的房产,有当前业主的姓名,有时还有他们的抵押贷款利率和出售时的欠款。
资料中还包括我的出生日期、社会保险号码以及十年前的选民登记记录。还有我一生中所用过的电话号码的记录。驾驶记录和驾驶执照照片也在其中。还有一张从网上搜集的我的照片。这里还有我们现在的车辆(包括车牌号码)以及我们十多年前报废的车辆,还有它们的新车主、新地址以及最近的车牌号码。
我的姓氏经常被拼错,所以有一个列出我别名的列表。还有一个列出我亲戚的名单,包括我的直系亲属和他们的出生日期(按月和年),还包括侄女、侄子和其他亲戚(比如,我嫂子的弟弟,虽然我可能只在婚礼上见过他一次),以及他们社会保险号码的前五位数字、目前的电子邮件地址、目前和过去的电话号码,以及目前和过去的地址。对于我“可能的”“很有可能的”同事名单上的人也是如此,其中许多人都是邻居,否则我可能根本不认识他们。
对于他们来说,最麻烦的是—尤其是那些相对友好的家庭成员和邻居—报告还包括他们自己的破产、留置权、判决和犯罪历史等信息。甚至我的所谓“可能的”同事也会被这样揭露出来。
我还有关于其他名叫艾米·盖达的人的关键信息(根据我的报告,在美国有三个人使用这个名字),以及他们的直系亲属。这包括一个人的最后已知互联网协议地址,这是与她的个人电脑或家庭相关的一系列数字,即使她使用假名,也可以用来追踪她的在线活动。
最后,我还有社交媒体报告,尽管我从一开始就避免使用社交媒体,考虑到隐私利益的重要性,但这似乎无济于事。调查我的存在于脸书和其他平台的公司向那些对了解目标人物的帖子感兴趣的人承诺:“通过一次搜索,您可以发现关于对象的更多数字身份信息,这些信息在其他形式的公共记录数据中很难获取,我这边可以帮助您更有效地收集信息和评估风险。”
所有这些并不需要太多费用。最近我进行了一次背景调查,包括以上所有内容,价格为150美元。与我和美国大多数人类似的数据,包括出生日期、亲属、当前和过去的地址、据称的年薪和净资产、据称的就业情况、据称的种族和宗教信仰,都可以在互联网上找到,只需要调查者承诺“不会利用这些信息跟踪任何人”,“不会公开他们的信息或传播流言”。其中一些信息可能是错误的,但其中许多是正确的。
更令人不安的是,一些调查公司承诺,如果价格合适,他们可以获取更多的数据。据说医疗记录的价格为450美元;处方信息为400美元;学校成绩单为450美元。信用卡活动费用为每月150美元;银行账户活动也是如此。最昂贵的搜索费用为600美元及以上,其中包括国际银行记录、保险信息和带有工资的就业历史。据说,从登机口密码到酒店账单再到普通旅客账户数据,几乎所有信息都可以通过支付费用获得。
如果这让人感到不安,请考虑一个更现代的转变:亚马逊知道我有一只斗牛犬,尽管我从未告诉过亚马逊我有一只斗牛犬,但是不知怎么的亚马逊就是知道关于我的这一情况。如果亚马逊知道这些,想象一下还有什么其他信息与我们中的任何一个联系在一起,在某种程度上。阅读亚马逊多年来收集的关于我的数据后,我开始意识到亚马逊对我们的个人信息有多感兴趣。(这得归功于《加州消费者隐私法》,这是一项2020年的法律,赋予加州消费者要求企业收集他们的“个人信息的类别和具体内容”的权利。考虑到这种法律被认为将成为全球趋势,一些公司会向任何提出请求的人提供这些数据。此外,对于许多公司来说,这些数据请求是家常便饭;自2018年起,根据《通用数据保护条例》,欧洲人已拥有这一权利。)
当人们向亚马逊请求他们的数据时,该公司发送了大约80个文件夹,每个文件夹都有自己的子文件夹,其中许多都有着专业的标题,比如“Retail.CustomerAttributes.zip”“Digital.PrimeVideo.Viewinghistory.zip”和“PaymentOptions.1.AmazonPayBrowserBehaviorData.zip”。在这些文件夹中,就像我的数据文件中的俄罗斯套娃一样,出现了“HomeServices.HomeInnovationTechnology.Pets.1.zip”。在该文件夹中有一个被标记为“宠物”的子文件夹,其中包含一个同样被标记为“宠物”的Excel电子表格。在该文件中,有四个词:“斗牛犬”“你的宠物”“狗”“活跃”。上述这些内容都是真实的。
亚马逊如何得知这些信息仍然是一个谜。我联系了该公司,但从未成功与任何知情人士取得联系。也许亚马逊是从我的互联网浏览器的Cookie中得知我有一只狗(回想起来,我想我可能在某个时候在一个宠物网站上购买药物或注册她的微芯片时提供了有关她品种的信息;我朋友是一位网站隐私官员,她通过网络跟踪器获得了免费婴儿配方奶粉样品的到期日期,尽管她从未告诉该公司她怀孕了),或者也许我的斗牛犬信息来自一家数据收集公司,他们以某种方式了解到这些信息。
2021年亚马逊在其公开的监管备案文件中称,卢森堡数据保护局判定,亚马逊对个人数据的处理不符合欧盟通用数据保护条例(General Data Protection Regulation,简称GDPR),因此对亚马逊罚款7.46亿欧元(约合人民币57.2亿元),创下历史纪录。
如今,在数据隐私方面,对此关注的美国人已经增长到98%。人肉搜索已经成为一个常见词汇,它是“Dropping Documents”(放下文件)的缩写,指的是在互联网上公开披露个人的身份信息(例如,家庭地址),以对“被曝光”的人进行报复和骚扰。国会的听证会议题也转向了脸书、社交媒体隐私以及数据的使用和滥用。此外,美国法律协会推出了一个名为“数据隐私的法律原则”的新法律改革项目。
对数据的担忧已经渗透到现代法院的裁决中,尤其是在最近几年,大数据引发了涉及隐私问题和对隐私有重大影响的案例。一家法院审理了剑桥分析公司在2016年总统选举前利用脸书数据投放政治广告引发的隐私案件,指出个人照片和视频、所观看的视频、宗教信仰、政治观点和社交关系信息,即使在社交媒体上与朋友的分享,也应被视为私人信息。法院表示:“当您与有限的受众分享敏感信息时(尤其是明确声明您的受众是有限的情况下),您保留了隐私权,可以起诉某人侵犯这些权利。”另一家法院指出,社交媒体公司可能会受到限制,不能仅仅为了识别目的而扫描照片中的人脸,因为这种使用可能侵犯隐私权。该法院强调,普通法和“对隐私的字面理解”都包括对个人“信息的控制”,甚至包括个人的面部外貌。出生日期已受到某些法院的保护,手机号码、社会保险号码以及互联网浏览记录也都受到法律的保护。
最近,一家联邦法院决定允许一项诉讼继续进行,原因是出版商被告将原告的“个人阅读信息”(包括他的期刊订阅信息)发布给“数据挖掘公司”,后者随后将其与包括姓名、年龄、性别、收入、雇主和“家庭住址”在内的“私密且高度详细的人口统计和个人信息”进行汇总。同样,在2021年,一位联邦法官也允许继续进行一起涉及“从摇篮到坟墓的详细档案”以及个人助理中的语音激活和语音拦截数据隐私权的诉讼。早在2004年,一家联邦上诉法院就认定在编辑过的堕胎记录中的个人隐私应受到保护。法院指出:即使无法从编辑过的医疗报告中了解病人的身份,一旦公开将构成隐私侵犯。
其中一些法院的裁决基于生物识别隐私的利益,例如视网膜或虹膜扫描、指纹、声纹、手或脸部几何形状扫描等生物特征的隐私。这些内容在《2008年伊利诺伊州生物识别信息隐私法案》中得到明确列出,这是第一个保护此类信息的法规。当时的立法者担心,社会保险号码等受损数据可以更改,但生物识别技术对个人在生物学上是唯一的,因此一旦受损就无法挽回。基于伊利诺伊州法律的效力,用户最近获得了针对脸书“标签建议”功能涉及6.5亿美元的和解方案,该功能在照片中寻找并识别人脸。监督该案的联邦法庭法官称这是“一个具有里程碑意义的结果”,在激烈竞争的数字隐私领域为消费者赢得了重大胜利。
伊利诺伊州是这方面的一个案例,而其他一些州,包括特拉华州、纽约州、得克萨斯州和华盛顿州,已经颁布了某种生物识别隐私法规,或正在制定相关立法,可能会在生物识别数据和其他类型数据的保护方面提供某种程度的隐私保障。在加利福尼亚州,立法者对生物识别信息的定义包括视网膜、虹膜、指纹、面部、掌纹、静脉模式和语音记录的图像,还包括个人的生理、生物或行为特征、击键模式或节奏、步态模式或节奏,以及睡眠、健康或运动数据。国会也曾试图制定国家生物统计学隐私法。
这些法律的存在可能会限制某些涉及隐私的人工智能工作。最近的一起诉讼声称,在网络上抓取个人照片并提取某些生物识别信息以识别个人,“侵犯了隐私并影响言论自由”。据称,涉及的人工智能公司拥有一个数据库,其中包含超过30亿张从社交媒体和其他网站上获取并识别的个人照片,据说该公司与有意识别某些人身份的执法机构分享这些信息。一位知名媒体辩护律师在代表该人工智能公司时,以一种引人深思的平行方式辩称,该公司的行为完全受到《第一修正案》的保护。与此同时,另一家公司为所有用户提供了免费扫描互联网上某个人脸部的能力,到2021年,这一工具“在希望在网络上基本追踪妇女的陌生人中广泛流行”。一位技术研究员告诉《华盛顿邮报》:“这些妇女和其他人,这些将他们的照片放在互联网上的人—他们的孩子、他们的父母、他们生活中可能是脆弱的人,他们这样做不是为了给公司提供可以获利的数据库。”
这带来了一种迂回的方式,即深度伪造技术。在涉及视频的案件中,双方很可能就隐私和言论自由展开争论。这些视频看起来像是他们本人,实际上是由“深度学习”人工智能生成的逼真视频。这种未经授权使用他人面孔和身份的做法曾引起克利夫兰和艾比·罗伯逊的关注。
科勒·卡戴珊(Khloé Kardashian)
也许,所有关于生物识别器、互联网扫描照片和深度伪造的讨论能够让名人更容易理解对未经授权照片中隐私的需求。电视真人秀明星科勒·卡戴珊(Khloé Kardashian)曾提出这样的论点:“当有人在光线不好的情况下给你拍了一张不讨喜的照片,或者没有拍到你的身体……你应该有权利要求不与他人分享这种照片。”她在这种情况下是指一张未经她允许的比基尼照片被发布到照片墙上。“我的身体、我的形象,我有权选择如何呈现,我有权选择分享什么内容是属于我的选择。”
《寻找与隐匿:隐私权史的多重面向》
Seek and Hide: The Tangled History of the Right to Privacy
[美]艾米·盖达(Amy Gajda)著
覃卓 译
定价:78.00元
东方出版中心2024年5月
ISBN:9787547323441
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。
- 报料热线: 021-962866
- 报料邮箱: news@thepaper.cn
互联网新闻信息服务许可证:31120170006
增值电信业务经营许可证:沪B2-2017116
© 2014-2024 上海东方报业有限公司