成本可控、产业可落地 数据流通迎来密态时代
【环球网科技报道 记者 李文瑶】数据流通领域有望迎来新的发展机遇。10月22日,中关村实验室、蚂蚁集团、北京大学、南方科技大学等产学研机构联合对外发布聚焦安全可信底层技术的开源系统软件栈 ——“星绽”(Asterinas),并向全球开发者开源。
在接受环球网科技采访时,蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬表示,密态算力将是数据可信流通的主要算力形态。只有当真正解决好安全问题以后,数据方才愿意提供数据,而在真正把数据价值验证好以后,数据流通将成为水到渠成的事情。
此前,数据流通领域往往面临着“不敢流通、不愿流通、不会流通”的问题。例如,在数据安全层面,数据离开原运维域后,缺乏可以依赖的信任体系,接收方可能会复制或滥用数据,导致数据持有权、使用权和经营权受损。同时,不同主体之间的数据安全能力参差不齐,一旦某个环节的主体安全能力不足,可能导致数据泄露。在数据泄露后,也很难追溯到具体的泄露点,责任通常归咎于数据源,增加了数据提供者的法律和财务风险。
从经济层面来看,数据流通后,由于数据容易被复制和传播,企业可能无法从后续的交易中获得持续的收益,从而影响企业的市场竞争力。
此外,在流通层面仍然面临着技术难题。韦韬举例称,传统上实现数据安全流通的技术复杂,尤其是全链路的跨域安全保护,需要复杂的技术保障和高昂的成本。同时,不同企业和机构之间数据格式和标准不统一,导致数据难以互通和整合。
这些问题都导致数据流通受堵。“安全保不住的时候,数据就提供不出。”在韦韬看来,数据供给在本质上是要解决数据安全的问题。
两年前,蚂蚁集团提出“数据流通将进入密态时代”的看法,即实现数据流通的全链路密态,以确保数据的安全性。
此次,对外发布的“星绽”系统软件栈旗下包括星绽OS和星绽机密计算两大项目,分别面向通用执行环境和可信执行环境提供安全原生的系统软件,为云计算、数据可信流通、人工智能等安全攸关的计算场景,构建安全可信的技术底座。
其中,机密计算,作为一种以保护数据使用中安全为首要目标的技术,正逐渐获得云计算巨头的青睐。近年来,各大云计算公司如亚马逊、谷歌、微软等都在积极布局机密计算,以提供数据全生命周期保护。
机密计算作为隐私计算三大技术路线之一,利用可信执行环境(TEE),通过环境隔离和可信验证机制完成安全计算,以保证敏感数据在CPU和内存使用中不被窃取的一种前沿技术。
值得关注的是,随着“星绽”的发布和开源,在CPU硬件厂商的支持下,解决方案能够更好的通过可信执行环境(TEE)技术,解决数据在运行时的安全问题。特别是在云计算和隐私计算等场景中,机密计算技术通过硬件支持,确保数据和代码在运行时的机密性与完整性,有效防止了未经授权的访问和数据泄露。
韦韬透露,在成本方面,一旦有了可信根和可信执行环境(TEE),可以将密态计算的成本控制在明文分布式计算的2倍以内。即使对于特别高价值、高敏感度的数据,通过可信密态计算可以将成本控制在明文分布式计算的10倍以内,这对于产业来说是完全可执行落地的。
海光信息技术股份有限公司副总裁应志伟对环球网科技表示,通过在CPU中实现可信执行环境,确保数据和代码在运行时的安全,即使云管理员也无法访问到这些敏感信息。同时,机密计算的应用能够给通过加密和隔离技术,确保数据在传输和计算过程中不被泄露,保护各方的隐私。
海光在机密计算方面做了大量投入,从安全性上支持全面的国密标准,确保数据在运行时的安全。应志伟说道:“目前可以看到机密计算或者说可信执行环境,相比其他的多方安全计算和联邦学习等隐私计算方法,在安全、性能、大规模商用等方面具有比较大的优势。”
据了解。目前,“星绽机密计算”已经积累了丰富的产业实践,广泛应用于政务、金融、大数据交易、医疗等诸多场景。例如,基于星绽机密计算、区块链等技术的“反诈联盟可信协作网络”,协同相关部门和运营商等解决风险信息共享难题,共享黑产数据高达数千万条;在金融风控领域,已为数百万金融客户的风控指标计算提供了高安全、高可用的服务。
其中,基于星绽机密计算的“农户秒贷”项目,在今年5月入选了国家数据局首批“数据要素x”典型金融案例。该项目由农业农村部大数据发展中心与网商银行发起,安全融合多方时空数据,实现海量数据实时分析,掌握农户经营情况,手机一点就能“秒贷秒批、随借随还”。截至今年5月份,超600万农户获得贷款额度,其中约8成农户种植面积不到10亩,助力农业农村数字普惠金融。
韦韬认为,由机密计算支撑的低成本密态计算体系,能够很好地完成数据安全流通,让成本降低。他说道:“我们一直在呼吁通过全链路的密态保障能力进行数据价值快速挖掘和验证,为此构建配套的基础设施和产业共同协作是至关重要的。”
此外,海光信息技术股份有限公司副总裁应志伟还对记者表示,从技术的角度来看,目前,大模型计算对数据流通有较大影响,需要将机密计算扩展到GPU,以支持大模型和大数据的处理。同时客户操作系统版本不一致,导致每次适配都需要重新配置,增加了工作量和复杂性。他表示:“虽然在CPU和安全行业内对机密计算有所了解,但在更广泛的行业中,对CPU的TEE(可信执行环境)了解较少,其价值尚未完全发掘。”
当数据进入大规模流通的时代,亟需新的技术基础设施,更需要产学研界的共同努力。
对此,北京大学讲席教授,北京大学计算机学院软件科学与工程系主任谢涛介绍,此次“星绽”的发布体现了从具体场景出发寻找解决方案的模式,而不是单纯的技术导向。这种模式需要支持,特别是在当前很多重要场景需要“产学研用”协同攻关的情况下。他表示:“通过企业和高校之间的联合科研创新联合体,可以更有效地解决问题。”
在这样的合作中,建设和维护开源社区成为各方共同的目标。如倪光南在现场表示,开源已经成为信息技术生态构建的主流趋势,成为全球协同创新推动信息技术发展的强大动力。
“两年前,我们面向全球开发者开源了隐语可信隐私计算技术栈。今天,我们联合产学研合作伙伴一起发布星绽开源系统软件栈,致力于共建安全可信的技术底座。未来还有很多的工作要做,我们希望与产学研的伙伴一起,持续推动系统软件技术的发展和应用,”韦韬说。