清华大学段斯斯:区块链及隐私计算在新经济产业的应用

时间:2023-06-06            浏览量:2172            打印

本文根据清华大学高等研究院研究员,北京国家研究中心成员段斯斯博士在“清华大学两岸新经济产业发展研讨会”上发表的主旨演讲内容整理,以飨读者。


一、区块链的分层

区块链是什么呢?它其实有很多关键词,区块链它的本质其实是由密码技术、分布式系统安全协议以及软件工程等技术综合起来的一项技术。

它的关键的核心是做了一个安全的分布式系统,这个系统它实现的一个性质也是我们经常在网络安全上面讲的CIA三大目标中的这个I和A,就是高完整性和可用性。这个可用性指的是服务器遭到网络攻击,或者是敌手的攻击,比如各类的木马攻击、网络攻击等等,在这种前提下,整个系统提供的服务还是高度可用的,这个链上的服务是一直存续的,并且是正确的。另一个性质是完整性,也就是上链的数据不可篡改,这样的一种特性,也就是我们所说的完整性。也就是说区块链是利用了一些关键的技术,构造了一套高可用的服务,在这套服务上实现的所有的应用,它都是相对来讲,在安全假设前提下,安全可信的。

1686038546687000865.jpg

从关键的技术角度来讲,区块链可以被分为三层.底层是“共识协议”,再往上是“智能合约”,最上层是“服务”,就可以面向各类不同领域中做关键的落地应用。

区块链的发展其实经历了很多年。这个词最早的出现是来自于比特币,可能很多在场的同仁大家都会非常熟悉,加密货币的经济学概念最早来自于诺贝尔经济学奖得主哈耶克在70年代的时候提出的货币非国有化概念,那在技术上面是由比特币把它带到了现实生活中,构造了这样的一套分布式系统。

1686038570801004305.jpg

随着比特币的出现,区块链这个词也出现了,但是区块链并不等于比特币。区块链的关键技术,来自于80年代图灵奖得主Leslie Lamport,他提出的拜占庭将军问题,经历了四十年发展,逐渐从理论走向实用。

在区块链应用越来越多落地的情况下,很多关键技术逐渐地从理论层面、论文层面走向现实生活。我们先讲容错算法(共识协议),它解决的是什么问题?共识其实在现实生活中很多技术层面,我们经常会听到一个词叫“异地容灾”,简单来讲其实就是“灾备”概念的延伸。比如在北京的一个数据中心,我们会存一些数据,为了防止数据可能因服务器坏掉丢失或者是被敌手篡改,在这种情况下我们会在异地做“灾备”,比如可能在贵州大数据中心会备份,或者是在天津大数据中心备份。这个简单的备份会带来很多的安全问题。简单来说就是数据还是可能被篡改,区块链的共识其实就是在这个基础上保证了数据在灾备的情况下,没有办法被篡改的这样的一种性质。

不同的区块链其实是有不同的共识协议构成。我们经常听到所谓挖矿类的共识,它其实是最早比特币的PoW共识的变种,它的缺点是耗电量会比较大,这也是我们国家禁用挖矿类区块链的一个原因。和挖矿类共识相比,传统经典的拜占庭共识,能耗比较低,交易确认的时间非常快,效率整体来讲非常高,也是现在联盟链主要的一个技术路线。

1686038589776029477.jpg

在共识算法的基础上,可以保证数据不能被篡改,但我们怎么才能让这个数据用起来、活起来呢?我们可以在上面叠加智能合约的技术。智能合约技术本质上就是一段的代码,可以在这个数据的基础上发挥它的价值,比如用它来做数据交易,或者是数据分析等等,其实都可以通过代码的方式去实现,在不停服的情况下让区块链拥有更多的功能,把这个数据用起来。也就是说共识加上智能合约,就可以构造一套完备的数据服务,可以做任何的数据服务,在理论上来讲它是一个图灵完备的服务,也就是我们想让它做什么就可以做到什么,让这个数据在安全的基础上变得可用。

1686038612916035789.jpg


二、区块链共识

我们过去几年在共识方面做了非常多的工作,说它实现的这个安全目标,给一个比较具象的想法,就是所谓的高可用性到底指的是什么。一般来讲我们会有一些灾备,前面讲过,数据可以在不同的数据中心进行灾备,我们其实最关注的是数据在正确的服务器之间是不是一致。

举一个例子,如果我们想要维持一个账本,比如正确的两个服务器,北京一个,天津一个,开始它们的数据余额都是100,在进行了两个交易之后,数据最后的余额是正确的,正确的节点之间是一致的,余额可能都是180,那就是达成了我们共识所需要的条件。

1686038636621027033.jpg

但是如果我们把两个交易在不同的数据之间反过来,就会造成两个正确的服务器,北京的数据和天津的数据变得不一样了,这就会产生比较大的问题,我们不知道到底哪一个是对的。现实生活中的很多应用,我们也可以接受数据的不一致,但是在区块链的领域里面,这种高度的一致性是非常必要的。比如说假设某一个交易,它可能是一个百万级、千万级的交易,一致性其实非常重要。如果我们简单地通过把两个数据修改成一致,那就会导致一些关键客户会损失一笔高额交易的实施权,会产生一些比较严重的问题,区块链其实本质解决的就是这种数据不一致的问题。

1686038660569000340.jpg

其实不同的区块链系统中,由于大家采用的技术路线不太一样,所用的架构,比如共识的算法或者密码技术等等都略有不同。但其实从共识的角度来讲,它们实现的关键目标是完全一致的,也就是前面讲到的这个数据在正确的节点之间必须要高度一致,在这个高度一致的情况下,我们才知道哪一条数据是对的,在这个数据的基础上我们才可以做进一步的操作。

我们团队在过去的一些年做了非常多技术上的研究,比如我们提出的Dyno的共识,它是第一个动态的拜占庭共识,在联盟链的环境当中可以支持,可证明安全的动态节点管理,包含联盟成员的加入、旧的联盟成员的离开,支撑这样的一些功能。Dyno共识也是目前在迪诺链的区块链系统当中落地应用,去年的时候,它刷新了中国信息通信研究院BFT类的性能记录测评,目前也是这个记录的保持者,实现了6.8万每秒处理事务的能力,远超现在的国际领先水平。

1686038691896005394.jpg

另一个工作是我们和央行数字货币研究所一起联合研发的大圣和STAR的共识。这个共识其实是利用了不同的投票的门线之间的切换,实现了最低可以支持1/3投票,就可以达成共识的这样的一种特性,实现了高延展、高性能、高安全、低延迟的一种特性。目前的这个工作也是被应用在多边央行数字货币桥当中,支撑跨境交易支付等一些关键的场景。

1686038721923060622.jpg


三、隐私计算

前面说过,共识其实就是保证了数据的一致性,在数据的一致性基础上,又可以做数据的服务,实现在不同机构之间的数据共享或者是数据处理等等的这样的一种功能。但是现实生活中,会有很多数据合规的要求、数据隐私的要求,这个隐私计算很好地补充了这一点。

举一个简单的例子,假设说我们如果想在这个区块链上面做一个投票,现场所有人投票选举出一个大会主席。在现实生活中我们需要的隐私是什么呢?比如投票的规则是透明的,要知道到底收集多少票才能选出这个大会主席。投票人必须是透明的,必须是我们允许投票的合法的用户才可以投票。但是我们想实现的隐私是什么呢?就是我们想要知道最后投票的结果,但是我们不想让别人知道我们到底投了谁,这个所谓的到底投了谁,就是数据的隐私。在这个智能合约的世界里面,这个隐私计算其实是可以实现的,我们可以通过将这个所谓的代码公开发布,让所有人都可以查看,并且审计它的投票规则。同时在投票的过程中,利用一些隐私计算的技术实现这个投票内容的透明,而最后的结果能够保证它的正确性,也就实现了基于区块链的隐私计算。

1686038752807077994.jpg

在这个技术路线上面,隐私计算其实是有很多的技术路线的,利用一些可信的硬件技术,比如可信执行环境技术。同时我们也可以利用一些密码学的技术,比如说同态加密、安全多方计算、零知识证明等等的都可以实现一些可用的隐私计算,这也是我们过去几年中的探索。比如我们可以基于可信执行环境,把计算过程放到一个硬件的盒子里面,它的执行结果可以保证是正确的,也可以保证这个计算是来自于这个可信硬件当中的,同时它的计算过程、中间人投票的内容完全可以对外保密。

同时基于密码学可证明安全的方法,也可以实现一些可用的隐私计算技术。举一个例子,我们将合约代码放到这个区块链上,它就可以保证合约代码的正确性、安全性,也就是所谓的数据安全性。合约状态是通过密码技术或者可信执行环境进行隐藏,所有中间计算结果都可以对外完全的保密,实现隐私计算的效果。

1686038775554013112.jpg


四、区块链及隐私计算在新经济产业的应用

过去几年,我们在区块链数字经济领域有一些探索。前面说过,区块链是一个比较集成的技术,它结合了密码学技术、分布式系统安全协议技术,所以区块链技术是有一定成本的。虽然它的性能已经很不错,但是它仍然会和中心化服务相比有一定的性能损耗。所以它最适用的场景是什么?简单来说,就是数据越重要的场景,可能越会需要这种安全的密码技术来保证它的安全性。比如一些关键的金融领域数据、政务领域的数据,数据本身价值比较高,如果损失或者是被篡改,会带来比较大的经济危害,这是最适合区块链应用的场景。所以,目前区块链落地的主要场景,其实都聚焦在一些金融领域,还有政务领域等等。

1686038803628081981.jpg

在其它领域,我们对区域链技术的应用也做了一些探索。比如与福鼎进行合作开展的白茶溯源项目。白茶是当地的特色产品,也是有较高附加值的产品,市面上的各类白茶参差不齐,真假难辨。所以福鼎白茶的数据保真,或者是白茶产品的溯源是非常关键的。在这种场景中,我们研发了白茶溯源系统,可以将生产过程、运输包装过程以及销售过程中所有的数据进行链上存储。同时,为了保障源头数据的真实有效性,我们也在白茶的包装上贴了密码芯片,用户可以简单的通过扫描密码芯片,在区块链上面进行真实性的查询,以及经手人、茶企的包装人员等所有的信息,甚至一些关键图片和视频的信息都可以在链上进行查询,从而实现全链条的真实有效性。同时我们也有APP,可以进行销售查询等等。

1686038827358033303.jpg

另一个是我们和清华大学长庚医院合作的医疗领域的应用场景。现在医疗领域的一个比较大的趋势就是关于数据所有权的问题。我们会认为数据所有权应归每一个病人,但医疗领域的现状是,当我们到了一家新的医院或到了另一个城市,我们是没有办法从原来的医院获取个人数据,很多的检查可能都要重新来做一遍,这其实是一种资源浪费。但是在医疗领域,由于数据合规性等要求,其实没有办法轻易离开原始的医院,或者原始的区域。我们在北京市卫健委的指导下,与清华长庚医院合作,打通北京市医疗数据。这个场景的设定基于病人的数据属于个人,包含我们个人在药店购药的数据,在医院做手术的数据、出院之后康复诊疗的数据,在逻辑上都应该属于个人。但是如果我们从技术上实现这点,其实没有这么容易。如果基于区块链技术,就可以实现一个非常高效的数据确权,我们可以马上从链上获取个人电子健康的完整画像。在我们去一个新的医院的时候,只需要在区块链上进行一个授权,然后新的医院的医生就可以获取这个病人过去的所有的诊疗记录。目前这套系统服务于北京天北社区,取得了很好的效果,实现了高效的数据流转。

1686038848139088098.jpg

我们目前是将天北社区的三甲医院和下面的一些二级医院数据打通,未来期待可以把全北京市的数据打通,通过北京市健康云,连接全市的所有的数据,甚至可以包含一些健康管理机构的数据。在逻辑上我们都可以在链上进行查询,所有的数据的分享过程也可以在链上进行审计,在数据产生争议或者滥用的情况下,可以通过区块链进行实时的查询,并且利用这个证据作为解决争议的事实。

1686038870252023137.jpg

介绍了一些应用场景以后,最后做一下简单的总结。其实区块链的技术目前在技术上面仍然有一些需要解决的问题,比如计算效率的问题,包含隐私计算效率的一些问题。但是总的来说,这套技术在未来不管是Web3的领域、各类政务、医疗的领域,其实都有非常多的应用场景。包含我们现在支持的河南链的建设、省链、政务链这种大平台建设。总的来说,我们认为它在未来是可以很高效地发挥应用价值,支撑高效的数据流转和数据在不同机构之间的交换。

1686038889871086868.jpg

(本文图片由演讲嘉宾提供)


2023年4月17日-18日,由清华大学两岸发展研究院主办的“清华大学两岸新经济产业发展研讨会”在福州成功举行。本次研讨会以“共享中国式现代化新机遇”为主题,旨在探讨中国式现代化进程中,两岸新经济产业的前景、挑战和机遇,促进两岸企业向智能、数字、绿色等方向提质升级、 创新发展, 推动两岸在新兴产业领域的深度融合。来自两岸的百余位专家、学者和企业家参会,共同为两岸新经济产业繁荣发展集思广益,建言献策。