党的十九届四中全会指出:“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”,首次将数据增列为新的生产要素。数据作为关键的生产要素之一,通过跨地域、跨行业、跨领域、跨机构的数据流通释放价值。然而,近几年数据泄露和滥用的上升趋势表明,数据流通仍存在诸多问题。如何在安全风险可防控的前提下,实现数据的高效流通和交易成为当前数据价值释放面临的首要任务。
数据流通具有双面性:数据价值越高,流通过程中的风险越大。如何让大规模高价值数据进行可信流通,成为数据要素市场发展的核心议题。传统的数据安全问题是数据流通内循环问题:数据持有方,也是系统的运维管理方,对自己的数据安全负全责。随着数据要素市场的发展,数据流通外循环是更为关键的问题。外循环指的是,数据要素离开了数据持有方的安全域进行流通,此时数据持有方和系统运维方不同。这给数据流通带来全新的挑战:流通链路上相关运维管理方有窃取数据的动机和可能,则原有的、依赖运维管理方构建的安全防御措施全部失效,数据持有方难以有效保护和管控自己的数据。这也是导致数据持有方不敢提供数据、不愿参与数据流通的重要原因。
隐私计算有多个起源,目前在工业界广泛使用的隐私计算 特指 隐私保护计算(Privacy-preserving computing, PPC),也称为 隐私增强计算(Privacy-enhancing computing, PEC),在工业界习惯性简称为隐私计算。广义隐私计算是面向隐私信息全生命周期保护的计算理论和方法,涵盖信息所有者、信息转发者、信息接收者,在信息采集、存储、处理、发布(含变换)、销毁等全生命周期过程的所有计算操作,是在保护隐私安全的前提下,实现数据I安全共享的一系列技术。隐私计算为数据外循环提供全流程可信保障,并已经成为促进数据要素跨域流通和应用的核心技术领域,广泛应用于金融、政务、医疗、能源、制造等诸多行业。2020 年 4 月,《工业和信息化部关于工业大数据发展的指导意见》提出激发工业数据市场活力,支持开展数据流动关键技术攻关,建设可信的工业数据流通环境。2021 年 5 月印发的《全国一体化大数据中心协同创新体系算力枢纽实施方案》提出,促进数据有序流通,试验多方安全计算、区块链、隐私计算、数据沙箱等技术模式,构建数据可信流通环境,提高数据流通效率。2022 年 10 月国务院办公厅印发的《全国一体化政务大数据体系建设指南》提出探索利用核查、模型分析、隐私计算等多种手段,有效支撑地方数据资源深度开发利用。
隐私计算技术可以在保护隐私安全的前提下实现数据可信流通,最小化数据泄露的可能性,从而极大地促进数据流通的发展和降低安全风险,实现整体社会价值最大化。然而,在实际应用中,各场景中的参与方信任程度不同、数据类型不同,各方在不同场景里需要达到的数据可控程度也是不同的,一味追求绝对安全或者忽视安全都是不可取的。所以,隐私计算产品需要安全分级方法,为实际产品选型提供指导。一方面,隐私计算技术路线众多,且不断有新的技术涌现,使用方难以评估这些技术的安全程度。另一方面,由于部分隐私计算技术性能较低,市场上存在牺牲安全性换取性能的产品。在不明实况的情况下,使用方可能会更青睐这些产品,从而出现劣币驱逐良币的现象。目前,虽然针对单一技术路线已经有一些安全分级标准,但是不同技术路线的分级标准完全无法对应,用户无法对所有的产品进行横向比较,这些标准也不适用于新出现的技术路线。因此,适用所有技术路线的通用安全分级思路亟需明确,来引导数据跨域流通全领域的安全评估工作,进而推进更宽广的隐私计算运用,加速数据可信流通的发展。
建立统一的安全分级体系来评估数据流通链路的安全性需要多行业各方参与,久久为功。以前针对单一隐私计算技术路线进行分级时,可以依靠技术特征来分级。但是,隐私计算包含的分支技术各自有不同的安全根基,技术特征完全不同,无法沿用该思路进行通用安全分级。如何对这些原理完全不同的技术进行统一分级,是十分有挑战的。更进一步,中间变量泄露如何量化、半诚实密码协议的实际安全效果如何、侧信道攻击对可信环境的安全影响有多大,这些内容的量化仍然缺乏有效方法或者存在争议。从另一个方面考虑,目前的一些分级方法侧重于评估技术原理和方案设计。但是,从“设计安全”到“真正安全”仍然有较大距离,即,实现环节的安全性。若分级标准缺乏对“实现环节的安全性”的度量,产品获得的等级与实际攻防效果将不匹配,导致安全隐患或成本过高。此外,除了隐私计算核心技术模块,通信框架、访问控制系统、主机系统、管理系统、部署系统等都会影响产品整体的安全性,安全分级应该包括这些内容,系统整体的安全性应由其中最薄弱的环节来界定。本《白皮书》旨在逐一讨论隐私计算安全分级面临的诸多难点,包括技术路线特征不同难以进行统一分级、部分重要的安全能力难以被分级和量化、安全是系统性问题涉及的维度多、范围广。本文针对以上挑战,给出通用安全分级的设计思路,包括按照攻防效果分级来屏蔽不同技术路线差异,在“可证安全”和“不安全”之间增加一个“抵御已知攻击”的分级水位,引入软件信誉度等更多维度量化“实现安全”,明确所有技术特征与安全分级的对应关系。
当前,围绕隐私计算安全标准化与安全分级问题,中国通信标准化协会CCSA 已推动完成了包括 YD/T 4690-2024《隐私计算 多方安全计算产品安全要求和测试方法》、YD/T 4691-2024《隐私计算 联邦学习产品安全要求和测试方法》、YD/T 4947-2024《隐私计算 可信执行环境产品安全要求》三项针对隐私计算细分技术安全的行业标准,对各分支技术路线的安全风险进行了全面梳理。基于隐私计算安全分级标准需求的紧迫性,由深圳国家金融科技测评中心牵头,联合北京银联金卡科技有限公司、蚂蚁科技集团股份有限公司、杭州高新区(滨江)区块链与数据安全研究院、北京冲量在线科技有限公司、深圳市洞见智慧科技有限公司、天翼电子商务有限公司、深圳市纽创信安科技开发有限公司、杭州超限数动科技有限公司共同编制的Q/NFEC 0001—2024《隐私计算产品安全能力分级要求》标准于 2024 年 2 月正式发布实施,该标准是国际上首个适用于不同隐私计算技术路线的通用安全分级标准,根据攻防效果结合不同应用场景安全需求对安全等级进行了五
级划分并提出了具体要求。
本文将在《隐私计算产品安全能力分级要求》标准的基础上,对隐私计算产品通用安全分级涉及的一系列问题与解决思路展开介绍。
一、隐私计算技术背景与概览
⚫ 数据要素流通为社会经济创造巨大价值,也对数据安全与隐私保护等方面提出了更高要求。隐私计算技术作为保障数据可信流通的有效方式,已逐渐成为促进数据要素跨域流通和应用的核心技术。
⚫ 隐私计算主要分为算法类、可信类、融合类三大类技术,本章对隐私计算主流技术路线进行简要介绍。
二、隐私计算产品通用安全分级的挑战与思路
⚫ 介绍制定隐私计算安全分级面临的诸多难点,包括技术路线特征不IV同难以进行统一分级、部分重要安全能力难以被分级和量化、安全是系统性问题涉及的维度多、范围广等。
⚫ 针对以上挑战,本章介绍了通用安全分级设计思路,包括按照攻防效果分级来屏蔽不同技术路线的差异,在“可证安全”和“不安全”之间增加一个“抵御已知攻击”的分级水位,引入软件信誉度等更多维度来量化“实现安全”,明确所有技术特征与安全分级的对应关系。
三、隐私计算产品通用安全分级介绍
⚫ 本章分不同维度详细介绍了各个等级的安全要求,包括所有隐私计算技术产品都要遵守的通用要求,以及算法类技术产品和可信类技术产品各自要遵守的扩展要求。
⚫ 同时将中间结果细分为直接中间结果和间接中间结果,提出基于自由度和基于熵两种量化中间结果泄露程度的方法。
四、隐私计算产品通用安全的场景应用
⚫ 通用安全分级在实际应用中,各场景对应的参与方信任程度不同、数据类型不同,各参与方需要达到的数据可控程度也是不同的。来自金融、通信、教育等行业的数据安全应用需求方参与了本《白皮书》的编制,并结合实践阐述针对具体应用场景的安全需求。本章对基于不同业务场景的安全水位要求应该采用的安全等级提出了建议。
五、总结和展望
⚫ 总结通用安全分级在分级思路、涵盖范围、特定问题的度量方法上都有突破创新,实现对不同技术路线、不同产品形态进行统一分级的目标,便于使用方根据实际的应用场景进行产品选型。