隐私计算给数据披上保护的外衣 | 锌声 矩阵元谢红军

Posted September 11, 2019 in . view . Tagged: none.

文:陈海宁

编辑:邓龙

近日,美国有一桩旧案宣判了。

美国联邦地区法院法官高兰惠否决了雅虎提出的一份集体诉讼案和解协议,据雅虎披露,其数据泄露涉及的用户数量逾30亿名,将近全世界一半的人遭殃,是有史以来规模最大的数据泄露事件之一。

据腾讯发布的《信息泄露:2018企业信息安全头号威胁报告》显示,目前数据泄露已形成产业链条,并催生了三大变现途径:精准诈骗、撞库攻击以及撒网式诈骗,有可能产生严重的次生风险。

可以说,在日益发达的互联网前,每一个用户不仅宛如“裸奔”,还要随时应对数据泄露带来的风险。

然而,完全将数据闭塞不共享本身既不现实,也不利于经济价值的发掘。

矩阵元COO谢红军提出,许多机构认为这是一种交易,你享受免费服务,就应该提供数据。然而,这是个逻辑的悖论,未来在隐私性和便利性之间,一定有一个平衡。

在日前结束的“锌火燎原——2019产业区块链生态沙龙”深圳站上,谢红军结合密码学和区块链的特性,给出解决方案。他说,“把所有数据的交易和计算,用电路的形式来表达,就回归到计算和这个世界的本源:加法、乘法算术门的算术电路问题,以及与、或、非以及异或逻辑门的布尔电路问题。”

(以下是根据谢红军演讲原文整理,内容有删减)

对于数字世界而言,隐私计算是很重要的。

首先,随着互联网尤其是移动互联网的发展,数据泄漏问题变得司空见惯,成了所有个人与机构最头疼的问题。列举2018年的案例:

图片来源于嘉宾演讲PPT

很多都是亿级的数据,5亿,1.3亿,3亿。什么概念?整个我们中国也就十来亿人口,全世界有七十亿,也就是我们所有人的信息,被不同的机构、公司反复去卖。

这是当下互联网的通病,它是一个流量经济,是基于大数据进行开发、挖掘的。

我查了Facebook和Google的年报,广告收入在90%以上,Facebook更高一些。扎克伯格出席欧盟和美国的听证会时,议员在问他,Facebook的盈利模式是什么?扎克伯格思考了十秒钟,最后说“广告”。

的确,他的收入就是广告。广告的来源是什么?是数据。数据的来源呢?就是我们在互联网上享受的所谓的免费服务,个人或终端在享受服务的同时,你的信息也被收集了,他们认为这是一种交易,你享受免费服务,就应该提供数据。

实际上,这是个逻辑的悖论,未来在隐私性和便利性之间,一定有一个平衡。

那么如何来解决?2018年,全国人大把“人格权”写入民法,它包含了隐私权,这是很有意义的。我们强烈呼吁,国家层面进行隐私立法研究。

2018年10月19号,网信办发布的区块链信息服务管理规定征求意见稿,要求所有的区块链服务的企业和机构以及区块链提供的服务,都要进行备案或登记。当所有区块链的企业和服务,都要进行备案时,合规性就极其重要了。

11月30日,网络安全保卫局发布了互联网个人信息安全保护指引征收意见稿,明确的提出了隐私的销毁。一旦用户对隐私权很敏感的时候,有权要求平台销毁数据。

其次是大数据,也就是科学数据,很难利用。贵阳大数据交易所在《2016年中国大数据交易产业白皮书》里,对大数据交易以及大数据利用难点进行了分析:

一.数据流通与可交易的范围难以界定;二.数据的使用权与所有权定义难;三.数据质量评估和定价难。

但这是很大的市场,2018年大数据交易市场规模预计为200亿元。

不论政府还是其他大机构,都只拥有数据的一部分。这些数据在使用时是远远不够的,要进行交换,才能进行科学计算。所以,机构必须要进行数据的流动和交易,这是未来的数字世界的本源和真相。

然而,出于数据泄漏和自身利益考虑,机构一般不愿共享数据。

我们把隐私权定义为两种:个人隐私数据的隐私权,与科学数据隐私权,即大数据交易的所有权。

我从一篇学术论文中总结了隐私计算的范畴及发展范围:隐私计算是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。

在传统的数据保护和利用中会比较复杂,那么在密码学+区块链中,我们如何来进行保护?

我们做了一个下一代计算架构的基础架构:把所有数据的交易以及计算、利用,用电路的形式来表达,这就回归到计算和这个世界的本源:与、或、非以及异或的逻辑关系和0和1的算术关系。

图片来源于嘉宾演讲PPT

把复杂世界简单化,回归到真正的计算的本源。这是我们深圳80多人的开发团队正在进行技术攻关的一件事儿。

简单地讲,我们把密码学的一些技术集成在相关的架构上,进行不同隐私保护相关的分类、硬件加速、控件开发,让机构和个人用户使用。例如,安全多方计算、代理重加密、同态加密、零知识证明等。

图片来源于嘉宾演讲PPT

以安全多方计算为例,简单地说,两个人比谁的存款多,过去的做法是把数字写出来,大家直接比较。还有一种做法,我们信任另外一个人,把数字告诉他,他再告诉我们谁多。

我们的做法,也就是“安全多方计算”,我的银行的余额在我的卡上,你的银行余额在你的卡上,我们不需要知道具体数据,只要通过基于安全多方计算的计算,最后比较出大小。

举个在传统金融领域应用的例子,两个机构之间有黑名单和白名单的差异,他们并不乐意交换,因为有顾虑。这个用安全多方计算就能很容易解决,不要分享白名单和黑名单,只需要分享计算的结果就可以了,这就可以用我们的安全多方计算的工具来协同计算某一个人在我们两个机构之间到底是什么样的。

数字世界是丰富多彩的,传统领域都可以做,供应链金融,广告,汽车物联网等,这些事情都可以利用区块链+密码学的技术去做。

在医疗和保险,用户通过代理重加密对数据进行授权。数据分析公司用AI技术对模型进行训练,然后基于MPC和下游企业如医院等,进行数据共享,形成一个良性经济生态。用户分享数据,也得到一定的利益。

图片来源于嘉宾演讲PPT

征信和广告也类似,用不同的密码学技术对个人数据进行筛选处理,满足不同机构的需求,最后的收益要在链上进行记录和分发。各取所得,个人用户、机构等都有不同的利益分享,形成一个可持续的生态。

图片来源于嘉宾演讲PPT

还有AI+隐私计算的结合,给企业寻找合理的数据,一定要把数据的价值兑现了。

图片来源于嘉宾演讲PPT

物联网和车联网也是一样,用户包括车辆、车厂,还有穿戴设备等,可以串起来很多生态企业与用户。

图片来源于嘉宾演讲PPT

如果能真正把我们研究的密码学技术、区块链技术与这些应用场景结合起来,才是真真正正地为产业或者实体经济服务。

在寒冬中,我们应该把技术落实到实体经济中,才能让政府机构、实体经济的合作伙伴看到我们的价值。区块链不能再玩虚的了。

评论已关闭