交通运输政务数据分类分级方法
对于防范数据安全风险,提升数据深度开发利用具有重要意义。
近年来,数据泄露、过度采集滥用和非法交易等事件频发,数据安全面临着严峻的挑战。交通运输政务数据涉及大量重要数据和个人敏感信息,对数据进行有效分类和分级是加强数据精细化管理、平衡数据安全和共享使用的关键。
美国政府在20世纪就出台了数据分类分级的相关政策,克林顿、小布什、奥巴马政府先后发布了关于国家安全信息分类的总统令,修正并完善数据分类分级法案。美国对于政府涉密数据和政府非涉密但敏感数据的分类分级管理对我国政府数据实施分类分级管理具有很强的借鉴意义。
我国高度重视数据分类分级工作,法规政策及相关标准中对于数据的分类分级给出了通用的方法论。国家标准《信息技术大数据 数据分类指南》提出了数据通用的分类方法论,包括分类过程、分类视角、分类维度和分类方法。
《中华人民共和国数据安全法《以下简称《数据安全法》明确提出,数据级别主要取决于数据发生泄露、篡改、丢失或滥用后的影响对象、影响广度、影响深度等因素。国家标准《信息安全技术 网络数据分类分级要求(征求意见稿)》明确了数据分类分级的原则、方法,界定关键概念的范围,提出通用的数据分类分级保护要求。
李玉亮从数据分类分级制度以及政务金融、工业等行业的分类分级实践总结了数据分类分级的现状与发展,并给出制度和技术上的建议。
陈兵等人以《数据安全法》为中心,提出依据数据特征,统筹数据的发展和安全,做好数据的分类分级及其制度实施。
张琼丽等人和袁康等人认为数据分类分级工作应以满足网络安全等级保护等合规工作为基础进行开展。
陈杰等人以汽车数据为案例,提出企业在数据保护建设中的数据分类分级管理路径和数据全生命周期进行分类分级管理的建议。
此外,学者们对教育数据、港口数据、 计量大数据、司法数据等不同行业数据的分类分级方法和制度进行了深入的研究。
交通运输政务数据的分类分级研究仍处于探索阶段。尽管对数据分类分级方法有了一定的研究,且多个行业已经开展数据分类分级实践。但由于分类分级工作与业务的强相关性,其他行业的成功经验很难直接应用到交通运输行业。
因此,开展交通运输政务数据分类分级工作对于防范数据安全风险,提升数据深度开发利用具有重要意义。
1 交通运输政务数据分类方法研究
为了满足应用和实践要求,本文在分类上立足于业务应用视角,以交通运输领域部门职责及相关业务数据为基础,采用面线结合的混合分类法搭建数据分类框架,如图1所示:
交通运输政务数据分类类别
本文针对交通运输行业公路交通、道路运输、城市交通、水路交通、综合管理和其他行业管理等业务领域的管理职责,以自上而下、面线分类相结合进行业务分类,包括公路建设管理、道路客运管理、水运管理、海事管理和其他管理等41项分类,其中结合交通运输新业态发展,细化了收费公路、轨道交通行车组织、轨道交通客运组织等业务类别,增加了互联网共享自行车、小微型客车租赁等新业务类别。
在业务范围内从管理对象、业务行为的主题和数据的信息类别3个不同维度分别进行分类。具体类别如表1所示。
交通运输政务数据分类实例
以道路运输行业为例,进行交通政务数据分类,常见的道路运输政务数据分类结果如表2所示。
2 交通运输政务数据分级方法研究
分级对象
交通运输政务数据的管理对象主要为字段、数据表或数据文件,分级应该考虑字段和数据表或文件2种层级。
本文将政务数据安全分级最小颗粒度定为字段,一般情况下数据表或数据文件的整体安全级别应不低于所包含字段最高级别,同时综合考虑数据所包含字段关联后的影响、数据规模、数据范围、数据时效性等因素,确定数据安全级别。
分级原则
按照数据分级保护的思路,交通运输政务数据应按照“边界清晰、就高从严、综合研判、动态更新”的分级原则进行,如表3所示。
分级要素
交通运输政务数据按照“规模、精度、深度”3个分级要素,综合判定数据一旦遭到泄露、篡改、非法使用或共享所危害的对象及程度。由于数据分级与业务的强相关,本文仅给出具体要素含义和常见的考虑因素及示例,供业务部门在定级时参考,如表4所示。
分级模型
◼ 安全风险分析
在数据定级要素分析的基础上,通过定量与定性相结合的方式综合评估数据安全风险,确定数据级别。
安全风险指数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用、非法共享,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,包括国家安全风险、公共利益风险、个人合法权益风险、组织合法权益风险等。危害程度从低到高可分为无危害、轻微危害、一般危害、严重危害。
◼ 分级规则安全风险分析
交通运输政务数据涵盖范围广、覆盖领域多,为满足数据的安全精细管控需求,本文在一般数据、重要数据、核心数据的分级基础上,将一般数据进一步细分为3个级别,数据级别判定条件如表5所示。数据级别与安全风险的判定关系如表6所示。
◼ 个人信息定级
个人信息定级应优先判定是否属于敏感个人信息,个人基本信息的家庭住址、个人财产信息、个人轨迹位置信息、未公开的个人违规违法信息、个人生理健康信息、身份鉴别信息应作为敏感个人信息进行管理,个人身份信息在能够与敏感个人信息关联的情况下也应视为敏感个人信息。
个人信息定级在遵循上述分级规则基础上还应遵循以下原则:
1)超过100万人以上的个人信息数据集首先应判定是否为重要数据、核心数据,如不属于重要数据,其数据集的安全级别不低于一般数据3级;
2)敏感个人信息数据安全级别不低于一般数据3级;
3)一般个人信息数据安全级别通常不低于一般数据2级。
◼ 衍生数据定级
衍生数据是指原始数据经过不同程度加工程度后的数据,可分为脱敏数据、标签数据、统计数据、融合数据等。
衍生数据级别原则上依据就高从严原则,对照加工的原始数据集级别进行定级,同时按照数据加工程度也可进行升级或降级调整。脱敏数据、标签数据、统计数据级别一般比原始数据级别低;统计数据如涉及大规模群体特征或行动轨迹、未公开的统计数据级别应升高;融合数据根据数据规模、敏感程度和标识化程度等判定级别。
◼ 重新定级
数据级别确定后,若因数据的内容、规模、时效性、应用场景、加工处理方式等发生变化,或因国家或行业主管部门要求导致原定的数据级别不再适用时,应对数据级别及时进行更新。数据发生变化导致安全级别变化的规则如表7所示。
◼ 定级步骤
数据项定级按照国家核心数据和重要数据目录及有关识别要求,依次判定数据是否为重要数据、核心数据;如数据不是重要数据或核心数据定为一般数据,参考定级模型确定一般数据的细分等级。
数据集定级应在确定数据项级别基础上,按照就高从严原则定级,同时考虑数据集的数据规模、数据范围、数据时效、数据项之间的关联效应等各类因素。定级步骤如图2所示。
交通运输政务数据分级实例
1)个人信息定级示例安全风险分析。
交通运输政务数据中的典型个人信息定级示例如表8所示。
2)重要数据示例。
交通运输政务数据中重要数据示例如表9所示。
3 结论
本文基于交通运输新业态发展、交通运输领域部门职责及相关业务数据,采用面线结合的混合分类法搭建了“业务领域、具体业务、管理对象、行为主题、信息类别”5个维度的数据分类框架,完善了数据分类体系;按照“边界清晰、就高从严、综合研判、动态更新”的分级原则,以及交通运输政务数据分级要素“规模、精度、深度”,形成了基于数据安全风险分析的数据分级模型。
按照本文提出的分类方法和分级模型给出示例,研究成果支撑交通运输主管部门制定的《公路水路交通运输数据分类分级指南》在行业中应用,解决信息资源分级保护没有依据的难题,为提升交通运输政务数据安全治理水平奠定了基础。
作者简介:白紫秀 王 涛 郭明多 曹剑东 尚赞娣,交通运输部科学研究院
未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明等材料,与我们联系,我们将及时沟通与处理。