2024「大模型+交通」鏖战第二场

什么样的企业能脱颖而出？

微信截图_20240410165149.png

在刚刚结束的“第十三届（2024）智能交通市场年会”上，有两个话题几乎是企业间见面必聊的。其一是出海，国内市场收缩，大量企业将目光放在海外企图寻求新的增长点。

其二是人工智能和大模型，去年交通大模型产品集中性爆发的时候，行业对于大模型的态度都还处在观望与不信任的叠加态，短短几个月之后交通大模型论坛一跃成为了各个分会场中最火爆的一个，各类分享中的“人工智能”含量直线上升，甚至催生某种焦虑的氛围。

小企业怕因此掉队，头部厂商在担心因技术力、产品力问题无法在这个风口继续保持优势。风向转变的如此之快，令人有些猝不及防。

从质疑到加入，大模型的行业风向变化背后，是“大模型+交通”一阶段的探索与反思已经结束，随着大模型展现出多模态感知能力并与交通私域业务进一步融合，应用手段开始从表象的互动反馈向更深层次发展。

2024，“大模型+交通”第二场激战正酣......

1、人工智能的政策驱动

在讨论大模型现状之前要先明确的一点是，在GPT爆火定义大模型概念之前，人工智能与模型技术已经在交通行业存在了相当长的时间。例如常见于各个交通场景中的视频结构化和交通视觉检测，从当下大模型的视角来看就可以划分为一种基于视觉做理解的图文匹配大模型。

早在2017年，国务院就印发《新一代人工智能发展规划》，提出抢抓人工智能发展的重大战略机遇，构筑我国人工智能发展的先发优势，加快建设创新型国家和世界科技强国。这也是我国首个人工智能国家级战略，奠定了推动中国成为全球主要的人工智能创新中心的主基调。

2022年末，ChatGPT横空出世，重新定义了大模型技术，并将生成式大模型水平拔高到了一个全新的纬度。为规范大模型发展，国家互联网信息办公室次年发布关于《生成式人工智能服务管理办法（征求意见稿）》，办法提出国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作，鼓励优先采用安全可信的软件、工具、计算和数据资源。

除此之外北京、上海、深圳等更多地方政府出台推动大模型技术发展政策举措，推进大模型创新算法及关键技术研究

在热度和需求的刺激下，互联网厂商率先开始了对大模型技术领域的探索，很快国内通用大模型数量快速增长，各细分行业领域也开始畅想基于大模型的应用。

2、交通大模型初探索

2023长沙中国道路交通安全创新与合作大会上，百度发布“基于交通大模型的全域信控缓堵解决方案”，打响了“大模型+交通”应用的第一枪。

佳都科技、海信网络科技等传统智能交通企业，商汤等科技大厂，以及北京交通大学、北京航空航天大学、东南大学等高校，深圳市城市交通规划设计研究中心等科研院所及高校也迅速跟进，发布了相关研究进展。至此“大模型+交通”一阶段的探索拉开大幕。

这一阶段，交通行业大模型比较成熟的应用场景主要集中在人机交互、方案、报告生成方面，包括数字人、专业知识问答、智能AI助手等。相比以往固定问题的交互方式，交通大模型开源基于底层大模型可以提供开放、以及更加准确的交互体验。以交管业务助手为例，交通大模型可以提供拥堵路口、预计拥堵时间、拥堵原因等问答和分析，助力交管用户业务处理。

第二十五届中国高速公路信息化大会上，河北高速集团联合百度发布了行业首个智慧公路AI数字人——“简璐璐”，其拥有对话式交互系统，结合语音语义理解能力形成全新交互模式，通过对话完成业务处理，依托大模型的知识增强能力与内容生成能力，简璐璐能智能生产需要的内容，并自动撰写高速公路事件处理报告，百度将其定位为高速业务智能助手。

但很快有观点指出，信息的查询与交互只能算得上大模型的表征应用，或者说是对交通领域原有智能功能的优化和完善，仅调用了大模型的语义理解功能。因此，大模型技术究竟能为智能交通带来哪些实质的赋能，此时答案还是模糊的。

另一方面，此前提出的交通垂域大模型构想也遭遇了瓶颈。因为训练垂域大模型所需要的数据非常庞大，而对交通这样一个TO G的行业来说大量且高质量的数据几乎无法获得的，所以想发布一个真正的交通垂域的大模型是几乎是不可能的。

想要在智能交通行业继续深耕，企业就必须想办法强化大模型的行业属性，挖掘更多应用场景。

3、大模型的第二场

有行业专家在今年1月赛文交通网主办的智能交通行业年终盛典上表示：“大模型对交通行业的价值取决于其是否能够解决传统AI不擅长、不能够解决的交通问题。如果这点不能满足的话，那么大模型很可能只是披着创新外壳的概念炒作。”

大模型究竟擅长什么，能解决什么问题？当前行业似乎找到了一些答案。

作为智能交通的底座，感知也是最早应用了人工智能技术的交通场景之一。此前，经过训练的人工智能小模型，已经具备识别单一要素的能力，被广泛应用于道路抛洒物，积雪积水，压导流线，拥堵，违规变道等交通行为识别。

但小模型使用中也发现了很多问题。首先是上面提到的，针对特定场景的训练数据稀缺。其次，小模型的通用性、泛化性也不高，导致每个场景都需要进行单独的模型训练和优化，为此，需要不断地更新维护一个非常庞大的模型算法仓，此前就有人工智能企业的算法仓中的小模型算法多达30余个，导致维护工作复杂且繁琐。

而通过大模型技术则可以使用一个预训练的大模型来代替很多小作坊式的针对特定场景训练的小模型，再通过模型迁移蒸馏等技术，将能力投射到具体场景当中。通过大模型具有极强的推理能力和泛化能力可以让小模型使用少量的数据集就能达到原来的水平，同时也能够很好地解决小模型的碎片化问题。

例如2023年上海擎翌智能科技推出的基于多模态交通大模型的算法 QYTraffic-GPT，该算法适配4D毫米波成像雷达、激光雷达、摄像头等多种交通感知终端融合算法，可利用目标检测-分割-识别-跟踪-行为全算法推理单元，完成对物理世界事件的全面理解与交通事件推理，达成识别一切的目的。

微信截图_20240410165438.png

除感知场景外，基于大模型理解与认知能力的提升，行业也开始尝试用大模型赋能仿真、建模、空间计算等场景。但探索的路也不是一帆风顺的，虽然已经明确了发力的方向，但“大模型+交通”之路仍有很多困难亟需面对。

尽管算力在不断发展，数据要素市场在不断完善，但大模型不是简单的将大量的数据放到海量的算力里就能解决工程应用上的问题，算法的逻辑与应用上的创新同样至关重要，尤其是在把基础大模型的能力投射到行业里面的时候。

此外，在大模型出现之前，每类问题都有其对应的解决方案，因此用户会对基于大模型的解决方案和原先的解决方案在性价比上有所考量，尤其是在近几年公共预算相对紧张的情况下，这更是用户关心的重点。

基于上述原因，如果说2023年对大模型技术的探索考验的是想象力与底层技术能力，那么现阶段交通大模型开发企业面临就是对行业理解水平和产业上下游整合能力的全方位挑战。在这场挑战中，什么样的企业更有可能脱颖而出呢？

4、什么样的企业能脱颖而出

年会之前，赛文交通网与上海擎翌智能科技就大模型现阶段的这些问题进行了交流，这家成立于2014年的企业在2016年的时候发布了AI交通信控机S1以及国产信控平台SUN V1.0，并在之后上海信号机国产化替代浪潮中凭借优秀的算法机制与兼容能力获得了交警业主的高度认可。

2020-2022年间，擎翌智能基于自身AI产研的底层能力，开始全面拥抱人工智能技术。2023年拿下了上海市道运中心AI事件检测揭榜挂帅第1名、上海市云路中心数字孪生揭榜挂帅第1名的成绩，并发布了交通决策大模型“QY-GPT”，算得上国内最早一批投身人工智能技术研发的交通企业。

作为交通解决方案厂商，擎翌智能深耕上海信控市场多年，提升产研能力的同时也对行业需求形成了独特的认知。作为上海最早的国产化信号机厂商之一，其也具备较强的上下游整合能力，与多家国产芯片厂商有较好的合作，在之后大模型技术普世推广过程中的或将带来关键助力。

微信截图_20240410165458.png

大模型时代来临之际，擎翌智能提出了“交通感知大模型”、“城市级大场景空间计算”、“国标安全驱动”三大底座，继续深耕交通行业。

擎翌智能首席科学家陆肖元表示，尽管当前大模型在应用层面仍存在不完美之处，但其相较传统智能交通技术在场景与应用的理解能力上更具潜力，所以人工智能颠覆与重构智能交通生态的过程是必然的，也是不可逆的，擎翌智能相信谁先去拥抱这个过程，谁就能站在这个行业的尖端。

5、写在最后

2024是“大模型+交通”二阶段代表产品批量化走向落地的关键之年，目前已知的年内还会有多个与行业需求紧密结合的交通大模型产品发布，面对大量同类竞争和用户被不断拉高的期待值，新生的大模型产品还有很多硬仗要打。

有媒体曾用“人间一日，AI十年”的比喻来形容当前人工智能的软硬件发展速度，如今看来这调侃竟然多了几分写实的意味。

2024年3月18日，芯片巨头英伟达在GTC技术大会上正式推出采用Blackwell 架构的型号为B200的新一代AI图形处理器（图左），该芯片与CPU协同运作，在最新大语言模型上的推理性能较上一代主流GPU H100（图右）提升了高达7倍，且在成本和能耗效率上取得了革命性改进，仅为H100的四分之一，以前要 90 天内训练一个 1.8 万亿参数的 MoE 架构 GPT 模型，需要8000 个H100 ，但现在，有 2000 个B200就够了。而此时距离H100这张被誉为“changed the world”的上一代算力神卡上市仅仅过去了一年半的时间。

微信截图_20240410165515.png

3月29日，超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX，它采用了细粒度MoE架构，而且每次输入仅使用360亿参数，实现了更快的每秒token吞吐量，超越了Mixtral和Grok-1，推理速度比LLaMA 2-70B快了2倍，全球最强开源模型，一夜易主。而DBRX整个训练过程只用了2个月，1000万美元，和3100块H100。

微信截图_20240410165602.png