分享

收藏

点赞

  1. 主页 > 资讯 > 智慧公路

基于高精数字底图的高速公路行业数据治理探索与实践

统一思想、业务先行、以终为始

微信截图_20240528104714.png

近年来,国家出台了相关政策,旨在加强对数据要素的管理与利用,推动数字经济发展。利通科技通过“高精度数字底图”项目,率先在高速公路行业践行数据治理工作,并取得了阶段性的成果。

一、「背景」底图项目缘起

数据是数字化时代的关键要素。近年来,国家出台了一篮子激励政策,旨在加强对数据要素的管理与利用,推动数字经济发展,体现了国家对激发数据潜能、创新发展模式、培育经济发展新动能的决心。

党的十九届四中全会首次提出将数据作为新的生产要素。这一重大创新意味着数据将和土地、劳动力、资本、技术等传统要素一样,参与到价值创造过程中,并发挥重要作用。

数据二十条的发布,提出了“加快构建数据基础制度体系,充分发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能,做强做优做大数字经济”。

国家数据局发布《“数据要素×”三年行动计划(2024—2026年)》,旨在充分发挥数据要素乘数效应,赋能经济社会发展。

在国家相关政策的要求下,广东交通集团积极响应国家的政策要求,充分利用我们多年积累的数据,激活数据要素,并将其应用到高速公路管理的生产工作当中,在这样的背景下我们开启了数字化转型项目工作。

微信截图_20240528105755.png

高清数字地图是指以高精度地图数据为基础,结合高速公路行业数据面向高速公路行业的基础支撑平台,是广东交通集团构建数字孪生公路体系的重要基础。

广东省交通集团积极响应国家的政策,在2023年开始构建集团高速公路的“高精度数字底图”,该项目是集团数字化转型的重点任务,主要实现高速公路基础设备设施数字化。最终实现高速公路的业务都在高精度底图上开展,实现“问题图上说,方案图上提,业务图上管”。

微信截图_20240528105800.png

项目的实施思路是将已经投入使用的各业务系统统一接入到集团数据中心。数据可分为两大类,一类是非实时数据,如设备基础数据、设施基础数据、用户、组织架构等实时性要求不高数据,主要采用ETL工具实现采集;另一类是实时数据,主要是收费流水、设备(交通信号灯、风机、情报板等)状态数据,主要采用流计算模块进行实时处理。

数据中心可对数据进行分类存储,并根据上层应用的需要对全集团的业务数据进行管理以及对外提供服务,还能够管理集团云平台的资源,以便对外提供基础IT设备服务。

数据治理工作主要是在数据中心进行,高精度数字底图主要接入治理后的数据,同时建设三维地图,通过图业融合中台向上层提供服务,目前已基本实现路网设备管养、道路设施养护、路网运行及应急指挥和道路动态资产呈现四大应用。

微信截图_20240528105812.png

我们以“数据+服务+应用”的模式,打造高效稳定运行的高精度数字底图,为集团数字化转型这辆高速列车赋能。

我们用车辆来类比高精度数字底图,将数据比作“燃料”,这里的数据指包括高速公路业务开展的所有数据,如人、车、路、环境的数据,开展业务的各类数据等;图比作“发动机”,包括数据融合统计后的图标、高精度地图、业务图层灵活组合的地图;应用场景比作“方向盘”,通过应用场景最终实现地图与业务的统一。

微信截图_20240528105818.png

在当前数据应用的过程中,面临协同难、管不好、拿不到等问题。数据协同方面,各部门数据孤岛普遍,缺乏整体数据认知。

首先是系统不通。各业务系统主要是为了解决具体的业务问题,在建设时并未考虑相互打通。如收费系统生成的收费流水,主要是为了解决收费系统的问题,无法直接为路网监测或其他业务赋能。

其次是网络不通。不同的系统运行的网络中,无法直接打通,如收费系统在收费网中运行,而监控系统在监控网中运行,无法直接打通数据。

第三是数据不统一。同一类数据在多个系统中存在,但彼此都是独立的系统,如收费站、隧道、服务区等基础数据,在多个系统都存在,且有各自的编码,无法实现统一。

最后是数据不兼容。系统建设缺乏统一规划,如由于历史原因,同一类型的系统是由不同的厂家在不同时期进行建设,因此存在数据格式、数据粒度不一致的情况,无法统一。

数据获取方面,由于缺乏统一的数据标准,因此较难实现数据共享。数据“拿不到”体现在两个方面,一方面是对实体的定义不一致,即各业务系统对同一个实体的命名不一致,如对南沙大桥这一实体,在部分系统中名称为南沙大桥,而在另一部分系统中的名称为虎门二桥。

另一方面是对实体的粒度划分不一致,即不同系统对实体管理要求不一致导致划分粒度不一致。如对于一个收费广场,个别路段则只有一条数据,个别路段则分为出入口,共两条数据,而个别路段在划分出入口的基础上再划分为内广场、外广场,共四条数据。

数据管理方面,由于数据质量缺乏管控,因此数据安全无法保证。“管不好”体现在以下三方面,一是数据不规范,业务开展过程中缺乏统一的填报规范。如设备设施数据存在营运桩号与建设桩号混用的现象,导致无法直接应用。

二是数据不及时,数据存在更新不及时的情况。如个别路段对应用系统的使用不足,主要通过离线文件对数据进行维护,因此系统中存在的数据为多年前录入的数据。

三是核心字段缺失,主要是指缺少核心的业务字段。例如高速公路的设备(摄像枪、情报板等)缺少国家高速、桩号、路段方向属性数据,导致无法上图。

因此为解决这些问题,开展数据治理,解决数据问题成为当务之急。由于行业和企业管理的特殊性,缺乏成熟的数据治理经验参考,同时,由于高速公路行业的业务较为复杂,需要研究的系统以及数据较多,存在非常大的挑战。

二、「规划」构筑架构蓝图

首先,我们提出了数据治理的三个目标,即通数据、提质量和保安全。通数据即打破系统壁垒,实现数据互通,实现高速公路设备设施的数据在地图上统一展示。如摄像枪数据在监控系统、运维系统中存在,监控系统主要是看视频,运维系统主要是对设备进行运维,但在高精度数字底图中需要在查看视频的同时,还能看到运维信息,这就需要进行数据打通。

我们通过开展主数据管理工作,打通高精度底图涉及到的收费、监控、养护、机电、路政等系统。主数据管理要求统一平台、统一标准、统一模型、统一编码、统一共享。

微信截图_20240528110106.png

提质量即提升数据的质量,开展数据核实,并建立质量规则,通过质量规则生成数据质量报告,并提供给业务方进行整改,从而解决数据质量问题。举个例子,设备数据上图主要依赖设备的安装位置,如国家高速的行程编码、桩号、上下行等数据,如果数据存在重要字段缺失或异常,则无法正常上图,因此数据质量的提升直接关系项目的成败。

我们的质量管理建设思路包括建立质量规则、根据质量评估模型生成质量报告并依据质量报告提供给业务方对数据进行整改。

微信截图_20240528110113.png

保安全即严控数据策略,确保数据安全。涉及到上图的数据开展实施分类分级,并根据安全级别对数据进行管控。

如下图所示,机电设备除了在地图上可以看到三维模型,还可以看到涉及的数据。对于这一问题,我们主要开展的工作包括数据资源分类、数据安全分级、数据安全管控等。

微信截图_20240528110146.png

三、「实施」数据治理实施

数据治理的具体工作采用“全面蓝图规划,以场景为导向”的原则开展实施工作,可以总结归纳为“理、规、治、用”四方面工作,即需求梳理、制定数据标准、主数据治理行动和数据上图。

微信截图_20240528110236.png

“理”即需求梳理。我们主要开展了业务场景的梳理以及数据、业务需求收集工作,评估所需数据,涵盖内容、质量、获取方式及应用方式等。

由于业务是实现数据价值的重要手段,且业务是验证数据治理成果的主要方法,如果没有围绕业务场景,就可能导致无法验证数据治理的成果。因此业务场景梳理是整个数据治理中的核心工作,关系到数据治理的成败。

以应急指挥调度为例,通过产品分析可以发现,整个业务场景可划分为事前、事中、事后,另外根据业务的需求涉及辅助决策以及基础数据的管理,每一块数据都来自不同的业务系统。

事前主要是实现对路网的监测、预警,数据主要来自前端监测系统,如视频平台、隧道感知设备管理软件等;事中主要是对交通事故进行填报以及协调路政、养护进行处理,数据主要也是分布在监控、路政、养护系统;事后主要是对数据进行统计分析,主要是来自数据集市的分析数据。

微信截图_20240528110303.png

基于以上场景,我们针对每一个场景提出数据需求,通过对应急指挥调度、机电运维管理、道路养护等各项业务进行梳理,数据来自监控、收费、养护、机电等业务系统。总共梳理了数字化场景52个,并基于此细化为数据需求270项,其中包括53项基础数据、188项交易数据以及29项外场设备数据。总共接入道路基础数据、业务数据、实时动态数据共270项,数据量约2亿条。

微信截图_20240528111225.png

“规”即制定数据标准、规范。在数据采集完成后,对数据进行盘点,包括业务域、主体域、业务对象、实体逻辑、属性等,其中业务域、主体域、业务对象构成了数据的分类,业务对象、实体逻辑、属性等构成了数据的特征。

我们参考了行业通用的标准制作方式搭建了标准制作的整体框架,包含标准规划、标准实施,实施包括标准制定、标准执行、标准维护、监控考核等。数据标准方面,目前我们主要完成了主数据标准、元数据标准、数据分类分级标准。数据规范方面,主要完成了主数据管理细则、数据质量管理细则,其他目前正在编制中。

微信截图_20240528111338.png

主数据标准制定流程包含以下几方面工作,一是现场调研访谈与收集资料,主要是了解业务以及数据情况,收集样例数据、数据库说明书、系统操作说明书、业务系统说明等。

二是对访谈资料进行分析,包括集团业务现状分析、集团信息化现状分析、集团主数据管理需求分析。

三是识别主数据,主要识别出主数据,并形成UC矩阵。四是针对主数据模型、主数据编码、主数据管控、主数据产品进行设计。五是实施规划,编写主数据的实施规划方案。最后是组织对主数据标准进行修编以及评审。

在标准制定过程中,我们除了完成《主数据标准》之外,在编制过程中还完成了《主数据现状调研及分析报告》、《主数据模型设计》、《主数据应用方案和管理产品规划》等相关文档。

微信截图_20240528111412.png

“治”即主数据治理行动。本项目的主数据采用联邦式管理,即各业务系统主数据统一汇总至集团数据中心,经标准化编码、清洗转换及映射整合后,再统一分发至各业务系统使用,确保数据一致性、准确性和高效利用。实施过程包括数据采集、数据清洗、数据初始化、数据集成和数据应用。

微信截图_20240528111421.png

通过主数据的治理行动,总共生成主数据63项,共计61万条,共打通收费、养护、监控、机电运维、救援、出行服务、路政7个主题业务系统的数据梳理与数据互通。

同时,我们建立了主数据的推广策略,要求未来新建和改造的系统统一使用主数据,即涉及主数据部分的统一使用平台分发的主数据的编码以及内容,对于存量系统通过建立主数据与业务系统数据的标识符映射的方式实现。

微信截图_20240528111455.png

以体现“建设成效”为依据,我们结合高精度底图数据治理的特点,主要使用以下三个指标对上图的数据质量进行评价。只有匹配率、覆盖率和准确率达标的数据才能更好地上图应用。因此,数据质量提升工作主要围绕提升这三个质量评价指标开展。

匹配率基于主数据的空间位置信息与地图模型空间数据的匹配程度进行交叉对比、验证;覆盖率是主数据与实际道路设备设施资产的覆盖比例,即业务系统管理的数据覆盖情况;准确率即数据的业务属性与实体真实情况的差异。

微信截图_20240528105603.png

涉及上图的数据在治理之前,主要存在覆盖不齐全、准确率不高、匹配率不高等问题。我们在数据治理过程中开展了大量工作,如在制定质量规则的过程中,除了从业务方收集质量要求,同时也组织对试点路段进行人工核实,从而挖掘数据规律以及建立质量规则。经过治理后,覆盖率、准确率和匹配率得到了大幅提高。

微信截图_20240528105550.png

在数据治理过程中,还涉及数据安全治理行动。我们依据《广东省交通集团有限公司数据分类分级指南》开展数据安全治理行动,并遵循“谁调用谁负责,谁保管谁负责,谁提供谁负责”的数据安全防护原则实现对集团的数据进行全方位防护,主要工作包括数据资源分类、数据安全分级、制定管控策略以及实施安全控制。

目前我们已完成270项数据的数据资源分类以及数据安全分级,并部署到数据治理工具中对数据进行持续防护,并自动生成各类数据安全防护报告。

“用”即数据上图。主要实现地图上三维模型与业务数据的关联关系,实现业务数据在三维地图上共享。这项工作可分为三个阶段,一是对空间数据进行分析,挖掘数据存在问题;二是通过国家高速、桩号、路段方向与地图空间数据实现自动化挂接;三是对于无法通过自动化挂接的数据,通过人工逐个在地图上进行挂接。目前,我们已完成分析空间数据103万条、标签叠加27.2万条,上图数据5.5万条。

微信截图_20240528105523.png

四、「效果」项目实施效果

目前我们完成了数字化业务场景梳理52个,完成数据需求270项,重点修编了《主数据标准》、《元数据》标准2份标准,完成主数据建模并接入主数据63项,清洗转换数据33万条,主要是对主数据进行清洗转换以及多源映射整合。

在治理过程中,我们开发了自主研发的数据治理平台,可实现数据采集、数据管理、流程处理、数据服务等功能。平台实现了对高速公路道路资产数据全部分类,内置高速公路行业标准库,实现对主数据标准的电子化管理;内置了611条数据质量规则库,可实现对高速公路道路资产数据安全分级。

微信截图_20240528105258.png

同时,我们形成了我们的一套数据治理方法服务,包含相关标准制定等,在项目实践中逐步形成适合高速公路行业的数据管理体系,并在数字化转型的过程中逐步进化。

微信截图_20240528105249.png

数据治理通过重新梳理业务场景打破部门壁垒和信息孤岛,促进了高速公路管理各部门间的信息共享和协同工作,提升管理效率和整体效能,构建高效协同的管理体系。

如下图所示,治理前每个系统都是独立存在,例如视频监控、应急指挥调度、路网设备控制、对外信息发布都是独立的系统,现场的工作人员需要再工作上同时访问4-5台电脑才能开展工作。

在数据治理之后,实现了跨部门、跨业务打通,统一在高速公路高精度数字底图上即可实现应急指挥调度的操作,工作效率及事件的响应速度都得到极大的提高。

微信截图_20240528105049.png

数据治理工作刚刚起步,虽然在一些方面取得了初步成果,但整体而言仍有大量工作待完成。数据治理是一项长期的工作,它与业务系统的持续发展保持着动态的平衡,我们将按照既定计划逐步推进各项工作,确保数据治理全面、深入、有效。

微信截图_20240528105039.png

在项目开展的过程中,我们也走过一些弯路,并总结了相关的经验和教训。

数据治理工作涉及的系统多,干系人也多,包括建设单位、实施单位、运维单位、开发单位和大量的数据提供单位。如果所有干系人不能形成共识,不能向着同一个目标发力,数据治理工作就会陷入举步维艰的境地,甚至半途而废,因此,“统一思想”是这项工作能否顺利完成的前提。

数据治理的价值最终要通过业务系统来实现,因此一定要围绕业务场景来开展工作,也就是在开展这项工作的时候,一定要明确项目要达成的业务目标和成效,这样大家才知道共同往哪个方向发力。

通过明确目标与路径、强调业务需求的核心地位并且持续验证与调整,使我们可以确保数据治理活动始终与业务需求紧密相连,为企业创造真正的价值。因此,“业务先行、以终为始”是数据治理取得良好成效的关键。

最后用十二个字来进行总结,统一思想、业务先行、以终为始。

*文章内容是赛文交通网根据广东利通科技投资有限公司智能交通研究院院长吴穗湘分享的《基于高精数字底图的高速公路行业数据治理探索与实践》主题报告整理所得,有删减(文章经过本人审核)。

未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明等材料,与我们联系,我们将及时沟通与处理。

加载中~

你可能也喜欢这些文章




稿
意见反馈0
商务合作

商务合作 扫码联系

返回顶部