【区块链数据产业】跨越隐私高山:大数据产业的破局之法

“新基建”阐明了2020年新一轮的技术风口,随之而来的便是其中各行业的爆发式增长,尤其是大数据行业,在新冠疫情当中,各个巨头以及其所储备的数据库相关连通,为高效防疫奠定了坚实的基础,同时也向世人昭示了“大数据”所蕴藏的强大实力。

更值得注意的是,伴随着物联网、5G、云计算、人工智能等数字技术的突破,数据源头得以广泛开拓,数据标准趋于一致化、规范化,数据传输能力、处理能力、分析能力更是迎来突破性发展,大数据产业发展已势不可挡。

《【区块链数据产业】跨越隐私高山:大数据产业的破局之法》

不过,任何产业的发展都需遵循客观发展规律,大数据产业也不例外,在他的发展道路上,数据隐私安全仍是需要翻越的一座高山。

一、大数据隐私之殇,何为破解之法?

隐私是大数据行业绕不开的技术话题,前有欧盟“史上最严格的个人数据保护条例”《一般数据保护条例》出台,后有中国国家互联网信息办公室在今年五月发出的《数据安全管理办法》,种种措施已经将用户隐私安全置于极高位置。同时,隐私泄露案件也触动了用户的安全底线,如Facebook的惊天一案迫使着用户的隐私意识得以真正觉醒,关注隐私数据的去向。

在日益严峻的隐私保护监管措施下,科技公司不得不对服务和隐私政策作出修改,其好处在于更大程度上保障了信息的隐私性和安全性,降低了信息泄露乃至滥用的风险;但也给蓬勃发展的大数据行业带来不便,数据获取成本保存成本都大幅提高,但是可应用领域、使用方式却受到局限,长此以往,必不利于大数据技术发展。兼顾隐私保护与数据利用自然成为发展核心症结,隐私计算也就此诞生。

隐私计算本是伴随着数据隐私保护问题而生,其核心价值在于为隐私信息提供全生命周期保护的计算理论和方法,也就是说,隐私计算能够贯穿数据产生、收集、保存、分析、利用直至销毁全过程,并在此过程中对其进行保护,使其规避隐私泄露的风险。

在隐私计算过程中,同样面临着诸多挑战:首先是数据收集、存储环节,目前大量隐私数据的收集和存储均依托于中心化第三方机构,虽保证了低成本、高效率的数据使用,但随着数据量不断增大,安全风险随之上升,这无疑将是隐私数据中的潜在威胁之一;其次是隐私数据分析利用环节,大规模的加密数据处理会导致计算性能下降,而非加密数据处理又将提高隐私信息的泄露风险。

因此,开发者不断革新隐私计算方式,在传统的数据脱敏、匿名算法、差分隐私三项手段外,又基于密码学涌现出同台验证、安全多方计算、零知识证明等多种新型方案,以适应大数据时代的隐私计算需求。方案优缺点各异,更多情况下还是需要回归到具体商业场景中选定,同时也不排除会有更加先进的隐私计算方案问世。

二、多元融合,隐私计算+区块链

区块链与隐私技术的关联由来已久,Monero、 Zcash以及今年上半年火热的Grin等公链均基本实现了交易过程中的隐私保护,既保障了交易双方身份的隐私,又保障了交易数额的隐私;但是交易隐私只是隐私计算涉及的一小部分,区块链与隐私计算存在更广阔的的结合空间。

从场景应用角度而言,隐私计算能够延展区块链场景落地的范围。

区块链搭建了不可篡改的分布式账本系统,所有交易记录都能够在网络中得以复现,一定程度上牺牲了数据的隐私性,并最终限制了智能合约应用范围。通过链上地址交易频次、时间等信息仍有很大概率推断出该地址的线下主体,这对区块链应用而言存在较大风险——链上数据一旦被破译,很有可能导致生产资料的泄露。

以2018年“毒疫苗”事件中引发舆论风暴的文章《疫苗之王》为例,这一文章被永久写入到以太坊、EOS主网上,基于区块链网络特性,上传者真实身份并未被真实暴露,但是如果通过一系列的区块链大数据分析,将有可能挖掘出这一账户关联的现实主体,这无疑将成为极大的隐患。

尤其是区块链场景频繁落地之后,区块链网络与现实世界的关联性将更加密切,通过隐私计算手段真正保障交易双方、交易过程中隐私安全将格外重要。当隐私计算与区块链技术结合之后,用户完全可以实现在不公开数据的前提下进行计算合作,这将极大程度上延展区块链网络的应用场景。浙江大学教授、中国工程院院士陈纯曾在公开演讲中指出,区块链商业应用需要平台业务数据隐私保护,同时还需要更细粒度的隐私交易机制,实现交易可验证但是不可?。隐私保护对区块链场景落地重要性可见一斑。

而从数据角度而言,隐私计算将使原本过于隐私的数据上链成为可能。

隐私计算能够帮助数据在保持加密状态的前提下进行确认并处理,并实现在不泄露原始敏感信息数据前提下利用区块链技术的信息验证并追溯的功能。同时由于隐私计算“为数据加密”的特性能够提高数据解析的难度,降低黑客攻击的风险,提高区块链数据安全性。

除却区块链领域,隐私计算还将广泛融入到金融、医疗通等领域当中。首先是金融行业,隐私计算能够在保证用户隐私安全条件下,打破各金融机构间的数据孤岛,降低金融风险同时提供更多元化、精准化的营销方案。其次是医疗行业,隐私计算将打破医疗机构间信息流通不畅的状态,提高诊断精准性;同时降低患者信息泄露的担忧,适当缓和医患矛盾。

不可否认,隐私计算具备优良的市场前景,但是我们也要看到隐私计算大规模商用仍面临诸多挑战:

一是数据质量问题,在现实中,参与方数据来源、格式差异明显,且容易存在数据冗余、数据缺值等问题,提高原始数据质量是隐私计算发展的基本前提。

二是技术成本问题,目前新兴起的同台加密、多方安全计算、零知识证明都存在着开发成本高,可应用场景不足的问题,从业者需要降低技术开发门槛并提高方案兼容性,使其适应多元化应用场合。

隐私始终是大数据时代的关键问题之一,而信息爆炸增长速度则却远远超过人类心理成熟速度,这也就导致了绝大多数用户在大数据时代对隐私的天然迟钝;但在一系列隐私泄露事件的驱使下,用户对隐私的敏感度正不断增强,并将最终推动大数据行业的变革。

点赞