面向人工智能的数据治理实践指南(1.0)
出版单位CCSA TC601 大数据技术标准推进委员会
资料下载
编写单位
大数据技术标准推进委员会、中国联合网络通信集团有限公司、联通数字科技有限公司、中电信人工智能科技(北京)有限公司、中国联合网络通信有限公司软件研究院、中国人民大学、南京大学研究中心、广州信安数据有限公司、星环信息科技(上海)股份有限公司、交通银行股份有限公司、北京神州绿盟科技有限公司、央视频融媒体发展有限公司、亚信科技(中国)有限公司、广州小鹏汽车科技有限公司、新华三技术有限公司、北京枫清科技有限公司、华为云技术有限公司、腾讯云计算(北京)有限责任公司、普元信息技术股份有限公司、软通智慧科技有限公司、讯飞智元信息科技有限公司、中电科大数据研究院有限公司、电科云(北京)科技有限公司、上海浦东发展银行、创意信息技术股份有限公司、山东犀盐数据科技有限公司、芜湖明瞳数字健康科技有限公司、深圳市明源云科技有限公司、北京中软国际信息技术有限公司、中国移动紫金(江苏)创新研究院有限公司、杭州比智科技有限公司、云赛智联股份有限公司、湖北数据集团、北京卓信智恒数据科技股份有限公司、海南数造科技有限公司、一汽大众汽车有限公司
出版时间2024-06-29
摘要介绍
 
        自 1988 年由麻省理工学院的学者启动了全面数据质量管理计划(TDQM)以来,随着大数据技术的迅猛发展,企业内数据量急剧上升,数据治理的内涵也在不断地变化和丰富。2021 年,随着以大模型为代表的生成式人工智能技术席卷全球,对人类的生产和生活都带来了革命性的变化,人工智能的发展从以模型为中心转变为了以数据为中心。以数据为中心的人工智能理论认为,好的人工智能需要高质量、大规模和多样性的数据。但在实践过程中,数据科学家们往往会遇到数据安全与隐私泄露、内容输出偏见与歧视以及数据“高量低质”的问题。如果放任这些问题不加管制,将会阻碍人工智能技术的进一步发展,甚至会危害个人、企业甚至国家的安全。
 
       为了应对这些挑战,开发出更负责任、更可控的人工智能应用,面向人工智能的数据治理(DG4AI,Data Governance for Artificial Intelligence)概念应运而生。
 
      当前,DG4AI 的需求极其迫切,其研究与实践还处于起步阶段,概念和实践方法论尚未形成。为凝聚共识、开宗明义,大数据技术标准推进委员会(CCSA TC601)组织大型银行、通信运营商、头部互联网公司共同编写《面向人工智能的数据治理(DG4AI)实践指南(1.0)》,旨在推动 DG4AI 理念的广泛应用。本指南第一章从数据治理的发展、面向人工智能的数据治理定义、治理主要阶段以及价值等明确人工智能数据治理的概念。第二章从治理的方法和技术对5DG4AI 的重点工作进行说明。第三章提出了一种 DG4AI 的数据治理步骤,为业界抛砖引玉,提供参考。最后在第四章提出了展望。在附录中我们以美国为主要研究对象,对比了中美在 DG4AI 在国家战略、法律类法规以及标准建设上的现状。
 
     本指南在细节和深度上仍有较大提升空间,希望业界更多的专家能够不吝赐教,提出宝贵的修改意见。工作组将持续不断地完善这一指南,对我国 DG4AI 这一研究领域尽绵薄之力。