分享

收藏

点赞

  1. 主页 > 资讯 > 智慧城市

“AI+交通”新时代下的行业机遇与挑战

AI从科学家的专属,到专业领域的博士专长,到现在小学生都会用的过程,真正意义上实现了科技平权

编者按:此前,由赛文交通网主办的第十四届(2025)智能交通市场年会在苏州举办。在“2025智能交通市场经济管理论坛(暨智能交通产业领袖论坛)”上,北京卓视智通科技有限责任公司CEO吴柯维作了《“AI+交通”新时代下的行业机遇与挑战》主题演讲。

该报告从智能交通及人工智能行业资深从业者的角度剖析了AI技术的最新进展和时代特征。吴柯维认为,AI从科学家的专属,到专业领域的博士专长,到现在小学生都会用的过程,真正意义上实现了科技平权。

01

AI技术的最新进展

近年来,以大模型为代表的人工智能技术发展迅猛,掀起一波席卷全球的人工智能发展热潮。2022年,以ChatGPT为代表的大模型横空出世,从最初的备受质疑到现在走向全民应用,其内在技术及应用也发生了一系列变化。

一是从单语言模型走向多模态。从去年开始,多模态大模型逐渐走进了智能交通行业,为行业带来了显著的应用价值。

二是从大语言模型走向推理大模型。近年来爆火的Deepseek、OpenAI等大模型为用户带来了全新的体验。

三是从软件形态走向具身智能。今年春晚结束后,宇树机器人成为热门话题,迅速走红网络。可以预见,大模型与机器人的结合也将成为未来的发展方向之一。

四是从二维平面走向空间智能。相信这也将为智能交通行业带来更多新的进展。

微信图片_20250415165532.png

下图是Gartner发布的2023和2024年度新兴技术成熟度曲线,从图中可以看出,通用人工智能正处于发展的高峰阶段。综合来看,我们将AI新时代的特征总结为:AI,从科学家的专属,到专业领域的博士专长,到现在小学生都会用实现了科技平权。

2d484e6a046dde86a4e7a46e1f01a341.png

回顾过往,卓视智通也在持续积极地拥抱AI变革,开展了一系列探索工作。自2008年开始,我们围绕模式识别进行应用;2014-2022年,开展了很多关于卷积神经网络方面的工作;2023-2024年,在语言大模型方面开展了相关应用;今年,我们计划在多模态大模型领域开展更多新的探索。

99037fde5e3179c53b149b04ff7856ea.png

AI发展至今,已有二十余年的历程,我总结这是一段螺旋式进化之路。最初的电警卡口系统采用工控机+高清相机的架构;随着技术的发展,计算能力集成至摄像机内部;2014年深度学习算法兴起时,受限于算力需求,计算任务又不得不回迁至后端服务器;直到2018年前后,随着专用AI芯片的突破,算法再次实现了前端化部署

进入大模型时代初期,受限于算力需求,模型部署普遍采用云端集中式计算架构。如今,以DeepSeek为代表的大模型已逐渐具备边缘部署能力。这一螺旋式发展过程颇具启示性,未来计算架构或将在集中与分布之间持续演进。

599758b11247dd16c4b6e66f8851403f.png

02

DeepSeek为什么这么火?

DeepSeek为什么这么火?对于这个问题,我也分享一下自己的思考。首先,DeepSeek是完全开源的。以往很多大模型公司也做了开源的工作,但通常存在两个问题。一是多数厂商给用户使用的是“阉割版”产品,试图通过这种方式进行收费,最后很容易被用户抛弃。二是国外的产品在使用时总会存在断供的风险。DeepSeek能够将最原始的模型开放给用户,用户在使用时也完全没有后顾之忧。

其次是思维链的展示。近年来行业一直在对思维链技术进行研究和探索,这类似于小学生做加减乘除的计算题,会从上至下展现计算过程,DeepSeek能够很好地将这一过程进行展示,用户可以从过程中看到究竟哪个步骤是对的,哪个步骤出现了错误,体验感有了极大的提升。

第三是边缘部署。在2024年合肥的高速公路信息化大会上,我们推出了“智通卓识”大模型,将大模型部署在一台机器上。很多客户看到后都很惊讶,认为大模型怎么可能部署在机器上。那么今年,相信大家都能够很好的理解这件事情了。

第四是政治需要。虽然国内很多其他的大模型性能都非常优秀,但DeepSeek做到了国产芯片的全面兼容。

68eddddbb253cf395aa5408d88e48f6c.png

虽然当下DeepSeek十分火热,但不可否认,其也并非全能,也存在一定的不足之处,我们总结为以下几点:一是图像理解(图生文)能力较差;二是图像生成(文生图)能力有所欠缺;三是幻觉问题未完全解决;四是推理浅层化、逻辑不够稳定;五是推理速度太慢,无法满足实时性需求。

当然瑕不掩瑜,我们也期待未来通用人工智能够完成从认知学习,到归纳总结、研判决策,再到感知识别、执行反馈等一系列能力的综合应用。

认知学习主要面向个人,现阶段大模型在认识层面已经得到了很好的应用;设计创作方面,大模型正在从文本创作、图像创作向短视频等方面纵深发展。

在交通领域,感知识别更多应用于智慧交通、智慧警务、智慧城市、智能工厂、智慧工地等场景,我们希望能够在这些场景中更好地发挥、利用大模型的归纳总结、研判决策以及执行反馈等能力。

c7e6a166092dc43c1ed5b7114974f9f6.png

03

卓视智通在大模型领域的探索与实践

卓视智通在大模型领域也开展了诸多的探索工作。通过对大模型产品进行迭代,AI大模型也在不断为卓视智通的各类AI软硬件产品进行全栈赋能。

2024年3月,我们发布了首个大模型——“智通卓识”多模态大模型。以山体滑坡检测为例,传统方法受限于样本不足,难以通过传统的记忆学习和深度学习进行有效训练。而“智通卓识”大模型成功克服了这一难题,为地质灾害预警提供了很好的解决方案。

在物体检测、识别方面,传统深度学习方法通常局限于数十到上百个类别的识别。而我们的万物识别技术能够将识别范围扩展至上万类别,基本覆盖人类日常认知的所有物体范畴。同时,我们创新性地开发了万物分割与跨模态检索功能,支持图搜万物、文搜万物,用户可通过任意图像或文字描述实现精准检索。

0f6d550ce412d63544625ab31965d3b5.png

2024年11月,我们发布了“智通卓识”多模态大模型2.0。升级后的大模型2.0产品支持交通事件告警、图文理解审核、路况态势风险全域感知、自动生成数据报表。

我们发现利用大模型进行交通事件的二次审核能够取得很好地效果,如以前依靠人工审核的突发、连续事件,利用大模型能够减少误报,且更加高效。

二是实现路况态势风险全域感知。利用大模型技术可实现数百个路口摄像头数据的并行处理,精准识别施工、团雾、塌方、积水、拥堵等多种道路异常事件。可基于多源视频数据进行车流密度分析,进行交通态势综合研判、拥堵识别、流量预测和通行能力评估。

三是基于知识问题,自动生成报表。决策者可以实时掌握全域交通态势,进行多维度的数据分析。例如,能够精准对比特定路口或路段的同期车流量变化,为交通规划和管理决策提供数据支撑,这也是未来很好的应用方向之一。

81d60fb808cc852411fe194ef91998c4.png

卓视智通在交通领域开展了很多探索,在此我也分享一下自己对于行业未来发展的相关理解。当前,国内的头部企业在人工智能方面已经开展了非常先进且丰富的探索,那么对于卓视智通这类新型的AI公司而言,要去挖掘新的研究方向,打造差异化产品。

我们如今主要沿着多目、多波段和多自由度、移动两个方向在开展相关研究工作。行业目前普遍追求实现高精度检测,希望能够为未来的智能汽车提供技术支持。为此,我们开发了多光谱技术,重点解决夜间环境下的图像质量问题。为实现全天候工作,我们研发了多目多波段产品,确保无论在白天还是夜晚,系统都能稳定运行,可满足复杂环境下的检测需求。同时我们也认为,多目、多波段、高自由度的升维发展将是未来的大势所趋。

此外,AI技术的突破性发展显著提升了移动场景的识别能力。相较于传统的固定摄像头和球机,无人机、车载设备等移动平台为多自由度AI识别开辟了新路径。基于这一认知,我们研发了车载、无人机等多平台智能感知系统,并研发了隧道检测机器人等产品。

fe97641205e96d9556ba78a2d636ea7d.png

任何新技术在发展初期阶段都会迎来热潮。以交通行业为例,互联网技术发展了二十余年,但如今很多隧道监控系统使用的还是90年代的技术框架。即使在移动互联网时代,我们也没有将所有的系统都移植到移动互联网上,互联网也并未完全颠覆交通行业。在人工智能发展如此迅速的当下,我们一定不要舍弃原有的技术,同时也要冷静、理性的看待大模型计算,深入思考它能为我们带来哪些改变。

综合来看,我认为,将AI多模态大模型和小模型结合使用,会产生更好的效果。

7a2e6a416c46fdb299c98fd09b9826d3.png

交通行业的图像数据资源量非常庞大,但当前大模型的处理速度还是较慢,因此要将二者进行深度结合。我们过去打造了车辆识别、视频结构化、行人识别、物体识别、文字识别、大数据等一系列小模型,积累了200+项成熟的算法种类,已实现100+项人车识别特征,自有已标记图片数据超5000万,自建AI算力中心超10P。

车辆识别方面,我们已实现了多种车型的准确识别,在高速公路领域得到了广泛的运用,能够实现图像的全域拼接、轮轴数量的准确识别、危化品车身的文字识别等。

同时我们也基于这些信息,利用生成式大模型构建了车辆的三维建模。并基于车辆识别,实现快速更新迭代,争取覆盖目前道路上99%的车辆款式,每月进行更新。

万物识别方面,我们实现了从传统的人车识别到道路全要素感知的突破。以车辆事故为例,系统不仅能识别事故形态,还能精准判断车内装载物,为事故处置和应急救援提供重要依据。

193c4235998e9253bc8c164ac8618241.png

基于上述内容,我们如今已构建了超20类交通事件检测、超10种交通流量监测事件类型、超百种维度特征识别以及超38种交管违法取证能力。

8456c41f105a9688b0deb298bc2c4f15.png

AI时代下,交通行业也迎来了良好的发展机遇,我们总结为以下五点。一是企业数智化。交通领域的数据非常分散,且企业内部各级业务部门过度依赖人工,流程复杂,可基于AI实现高度自动化。

二是公路数字化。大模型能够为高速公路提供精准交通感知、交通事件检测、道路数字孪生及收费车型识别;帮助高速公路管理单位及运营方减少人力支出、降本增效。

三是交管数智化。中国各大城市安装了数以万计的摄像头,但大部分没有AI能力,算法迭代速度远快于摄像头。城市道路提供精准交通感知、道路人车及非机动车识别和管控、大数据分析研判等功能;为存量摄像头提供AI分析模块,减少警力部署、缓解拥堵。

四是车路云一体化。车路云一体化领域普遍被认为存在潜在万亿级增量市场,是自动驾驶和辅助驾驶落地的加速器。

五是收费无人化。汽车保有量激增导致车位供需严重不平衡,利用AI可使用户及时了解停车场车位占用状态信息。

高速公路领域,卓视智通能够提供公路数字化转型业全场景解决方案。我们在智慧站点构建了小神瞳车型识别,云鹰收费站拥堵监测系统、云鹰挛生收费站系统,可实现收费站拥堵检测机车辆出入收费站的孪生构建。

围绕干线通道主动管控,我们构建了云鹰-智慧服务区2.0、交安哨卫等哨兵系统;围绕一张网出行服务,我们构建了智慧服务区、空中地磁-车位感知服务,能够精准识别当前服务器的排队车辆、排队等待时间。所有车辆进出服务区时,高位小神瞳都将进行复核,如遇车辆逃费等情况,在进入服务区时会第一时间发出告警;围绕一张网出行服务,我们构建了云哨·车主电话触达,并能够基于智能座舱进行信息推送。

400978edff20866333b5dac7a22f7dd7.png

在基础设施安全增效方面,我们打造了边坡监测系统、智慧隧道机器人等产品,利用AI大模型实现检测与管理。在运行安全管控监测方面,我们围绕路网运行监测预警、重点车辆主动预警应用了云析-车脸识别、云瞳-车辆大数据平台、阿瞳目-轮毂测温、小神瞳危化品车辆识别系统。

在推动体制机制创新方面,我们也开展了诸多探索,同时希望基于大模型,赋能企业数据资产入表,帮助企业实现数据资产变现。

智慧交管领域,卓视智通也构建了交管智能化全场景解决方案。首先在中心端实现AI+。原先中心端搭建了很多AI平台,但不可能一次性全部替代,因此我们通过AI+将更多的功能进行叠加,实现应用的快速落地。特别是在交互层面,能够将原先的搜索框升级为AI式语音交互,动态生成多种报表。

其次,在边缘端进行充分利旧。我们基于国产化芯片研发了一系列AI智能终端设备。这些设备不仅实现了视频图像的智能识别与二次分析,还具备设备智能运维能力。同时,我们创新性地开发了图搜万物功能,支持车辆、行人等目标的模糊检索,并可自动生成违法数据报告,为执法取证提供智能化支持。

第三,在车载端省钱省力。我们打造了一系列移动端的车载设备,可基于摩托车、汽车进行违法行为的抓拍识别,花小钱办大事。

15cfe9d69bcc80c3adb0849e6488c17c.png

第四,在路端构建交安哨兵、哨卫。可实现国省干道的路口预警提醒。这在去年也得到了广泛应用,显著降低了交通事故的死亡率。

最后,在警务终端实现大模型赋能。这方面,我们推出了智能头盔等创新产品。同时我们也认为,未来,AI将重塑警务终端形态。以交通事故非现场处理为例,当前警务人员需要手动填写处理单,流程繁琐。未来,通过集成大模型的能力可实现自动化文书生成和智能语音交互(类似豆包),大幅提升警务效率。基于此,我们正在构建覆盖全场景的智能化警务解决方案,希望能够为现代警务工作提供核心技术支持。

尽管行业争议颇多,但个人认为,智能网联(车路云一体化)的机会将要来临,市场前景还是非常广阔的。特别是随着比亚迪全系车型搭载高阶智驾,智能驾驶将逐渐进入普及时代。全民普及智能驾驶将催生道路风险数据的需求,路侧感知数据的商业变现将成为现实。

这方面,我也观察到在车路云一体化领域,业界普遍将低时延作为关键技术指标。但服务于辅助驾驶车辆,<200ms的感知时延是一定需要吗?部分方案甚至要求在路口部署基于Orin等大算力芯片的边缘计算终端,单路口成本高达数十万元,这显然超出了地方政府的实际承受能力。从技术发展规律来看,AI确实推动了汽车智能化的升级,以小米为代表的科技企业正在积极推进端到端自动驾驶方案,使车辆在50米范围内的自主决策能力显著提升。然而,对于某些特殊场景,如驾驶员疲劳驾驶导致的事故,现有技术仍存在局限性。道路上的变化始终是层出不穷的,因此我认为行业还是应该将关注点聚焦在精度上,研究如何将精度提高、将覆盖率提高。

当前为实现低时延而大规模增加路口智能化改造的做法,不仅推高了建设成本,也偏离了车辆对路侧感知的真实需求。车辆更需要的是精准、可靠的全天候全要素环境信息。基于此,卓视智通也打造了多光谱雷视一体机等产品,能够根据长短焦组合实现全天候、全态势、全要素感知。

a85b41e6f60b3c280ab605e1d98a965f.png

结合这么多年的AI发展经验来看,我们认为车路云一体化未来的商业落地必须与交管数智化深度融合,当前的工作重点应是服务于交通管理部门的实际需求。通过实地调研发现,许多地区的交管系统已严重老化,亟需升级改造。这些部门也期待获得资金支持来实现系统现代化。然而,当前部分车路协同项目的投入与交管部门的实际需求存在脱节,造成了资源浪费。

04

AI新时代下带给行业哪些挑战

下面分享一下我对于AI新时代下带给行业哪些挑战的一些思考。首先,交通行业的数据分散,数字化程度不足。行业数据大多分散在各单位的各系统当中,不像互联网行业,有非常好的结构化数据能够进行训练。

二是预算不足,资金紧张;三是内部消化,即逆市场化进程,由于外部环境持续承压,大家都希望能够将资金内部消化,但这对于民营企业来说也是一个非常大的挑战。四是技术变革导致的竞争加剧;五是AI降本增效与人员安置的冲突。

我对于应当如何应对AI带来的这些挑战也进行了一些思考。当务之急,是要加快行动,将数据集中收集进行云化服务,做好互联网+的工作。

其次,要充分利旧,实现小切口大收益。将原先拥有的资产利用AI等新技术进行再造、再利用,能够产生非常大的价值。

第三,混改联营,资本协同,对于内部消化、逆市场化是个很好的解决思路。

第四,创新驱动,软硬结合,这也是AI时代下科技企业必须要做的事情

最后是利用机制创新创造新就业岗位,以高速公路收费员为例,随着ETC等技术的普及,我们可以将这些人员转岗至服务区,从事充电桩运维、用户引导等服务性工作。特别是在节假日充电高峰期间,这种人力资源的重新配置既能缓解充电压力,又能提升用户体验。从长远来看,技术变革虽然会替代部分传统岗位,但同时也将创造新的就业机会。

最后简要介绍一下卓视智通。卓视智通是国内最早探索人工智能与数字孪生产业落地的科技公司之一,专注于视频识别及智能分析、多模态融合感知、多模态大模型等前沿人工智能技术的探索,获得了交通行业龙头央企中国交通建设集团旗下中交资本战略投资,近年来还连续获得了腾讯、高通创投、耀途资本、海贝资本、灏硕资本(科技部国家科技成果转化基金旗下子基金)等多轮投资,在去年也荣获2024年度第六批国家级“专精特新”小巨人企业认定。

卓视智通的定位是通过AI实现道路、人、车、环境的精准融合感知识别,为监管部门及道路管理者提供平台及数字化工具,为车主及自动驾驶汽车提供实时信息服务。

8c3f182662c6b56a89c233ddb9c84d16.png

卓视智通的核心能力是基于AI提供全系列AI多模态感知、计算摄影测量、视频语义理解、实时孪生重建、仿真推演、应急处置等全栈能力,我们希望通过相关技术及产品为交通提供AI引擎,为汽车构建上帝视角;让机器看懂世界,赋能交通与安全。

未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明等材料,与我们联系,我们将及时沟通与处理。

加载中~

你可能也喜欢这些文章




稿
意见反馈0
商务合作

商务合作 扫码联系

返回顶部