作者 | 书正
[摘要]研究交通场景的运转原理、智能驾驶系统工作原理,需要看到系统的整体,系统中:
还要看到系统的客观性、普适性、唯一性。本文要给读者传递一个理念:是一套系统支撑着交通场景/驾驶系统的运转,AI模型只能是这套系统中的一个或几个组件。孤立的研究AI是理念的错误,无论AI有多么强大不可能独立支撑起交通服务的安全要求。事实上人们对当前的智能驾驶技术并没有多少信心,智能驾驶产业缺少基本公信力。
关键词:系统、秩序、不可解释性、普适性、唯一性。
理解本文需要同步阅读论文《智能驾驶系统实时校验机制的研究》(已在知网/汽车工程期刊2025.7刊出)和《全新的视角理解智能驾驶系统运行原理与安全(一)》同步交叉阅读,才能确保逻辑的连续和完整。
如果智能驾驶产业普及成功,像电梯、移动网络等产业走进人们的生产生活,影响着千家灯火万家炊烟,为人们提供的服务呈现什么状态,满足什么样的基本诉求?一定是没有L3、L4的概念,也不需要人们关注什么条件下接管等。
服务的基本诉求:
回答读者提问:
确实有描述不严谨的地方,恐怕在用方程抽象和准确描述该研究之前无法回避的问题。针对读者提出典型问题回答如下:
说明:本文中一些观点、解释并不是业界共识,一定程度依赖作者“直觉”。所以,读者可以理性的质疑、批判。
试图用一种新的方法论,理解交通场景、智能驾驶系统的运转原理,看到微观世界的本质、基本逻辑和底层规律。
1.1. 超越感观和经验“看”到本质
例一,我们看到五颜六色的世界,本质是大脑对不同波长的光进行编码和整合,形成的主观认识。同样的物理世界蜜蜂和老鹰看到的“色彩”会更丰富。
图1 颜色与光波
例二,在硬件设计领域,我们在示波器、以及在各种资料看到的高低电平,本质是分布在频域的一组能量波的分布结构呈现。在电子设备的微观世界(电磁场)就没有电平这种事物。
图2 电平与能量波
例三,在交通场景中一辆车看似随意的运动,其实是一种秩序(物理规律和交通法规)主导其运动轨迹的形成。在一个特定的时空范围内(道路),秩序如何主导交通参与者运动轨迹:
图3 交通状态与秩序
1.2. 物理本质与系统的发现过程
“看”到物理世界的本质后,到发现一个客观的系统是一个反复抽象的过程,一般用到的演绎、归纳、直觉等推理方式,如图4。这种系统很难一种方式测试验证。
需要把物理世界客观的要素抽象成系统的组件、机制、计算、以及遵守的规律,一定要与功能要求形成逻辑自洽。如果能有数学方程描述更好。
图4 发现系统的过程
本文讨论的都是主导物理世界中一些、一类场景体系运行的系统,和我们工作中一些具体的逻辑系统的概念有差别。
1.3. 系统的理解
除了组件、机制、计算与系统②的功能逻辑自洽,还应该这样理解系统:
1.4. 系统解析信息的结果属性
由于信息系统本身的工作原理,整体系统、或其中的一个组件解析信息,输出的结果遵守的属性有三种:统计属性、逻辑属性、函数属性。这是作者的理解。
①交通法规背后也是自然规律、人性规律的具体化呈现,方便执行;
②业界普遍认可德内拉.梅多斯对系统的定义:系统的整体大于部分之和,任何一个系统都包括三种构成要件:要素、目标、关联。系统具有适应性、动态性、目的性,并可以自我维护和演进。但是作者一直在寻找信息解析系统的针对性定义。
经过论文《智能驾驶系统实时校验机制的研究》和博文《全新视角理解智能驾驶系统运行原理与安全》,可以直接抽象出如图5所示的驾驶系统工作原理框图。
图5 驾驶系统工作原理
驾驶者的任务就是实时解析交通场景的状态信息和秩序信息,自己可以和谐、协调的融入其中。站在系统运行的角度理解,驾驶系统包括上图的全部组件和流程。当前大家理解的驾驶系统是图5右侧部分,本质是一个信息解析单元。
无论是有人驾驶还是机器驾驶,信息处理过程和工作原理都一样,下面详细介绍。
2.1. 驾驶系统中的组件解释和属性描述
描述和解释驾驶系统中所有的组件、机制、计算、规律,以及他们的属性。与《全新视角理解智能驾驶系统运行原理与安全》第二章中重复的概念只简单概述,除非有新的解释视角。
2.1.1. 交通场景
分存在状态和交通秩序两个层面理解交通场景。
存在状态,是在一个孤立的时间点和对应的静态空间范围,研究交通要素的分布形态;
交通秩序,在一段连续的时间和对应的动态空间范围,研究交通要素分布规律;
属性:
存在状态,所有要素(信息含义)是静态的、独立的、确定的;
交通秩序,所有要素(信息含义)是动态的、相互关联和影响的、不确定的;
另一重要属性,交通场景是宏观的物理世界,其动态变化是宏观低速的;而信息解析单元是微观数字世界,其计算是微观高速的。
2.1.2. 光
实际工程开发中除了自然光、有激光、毫米波声、波等,本文理论概述简化为光。
光与交通场景作用后,光的频率、幅值、相位形成了特定的排列组合,这种排列组合隐藏了交通场景所有的状态信息和秩序信息。也可以认为,光与交通场景作用后将宏观世界编码到微观世界里面。
属性:场景信息编码到排列组合中并传递到硅基信息解析单元的过程中,信息含义遵守统计属性。外界环境的干扰无法用函数、逻辑描述,只能是统计属性。
2.1.3. 秩序③
是一个抽象定义,内部包括了理解交通场景中要素的模版、主导交通场景运转的交通秩序以及时空的理解。无论是人脑还是AI神经网络,都是在学习/训练过程中将模版、秩序、理解埋藏到海量的参数中。每个参数或多或少、或直接或间接影响秩序的功能、性能,但是任意一个参数都不会主导秩序。
属性:不可解释性。由于其不可解释的属性才能应对交通场景的动态性、复杂性、不确定性。
2.1.4. 数字世界
也是一个抽象定义,分既有数字现实和创造数字现实。在结构化数组中或流动的信息中结构中,可以体现与物理世界一致的状态分布和交通秩序变化,就是既有数字世界。创造数字现实是系统产生新的信息,呈现确定的序列并与既有数字现实协调一致,这就是系统能提供服务的原因。
属性:假设系统是理想的,既有数字现实与交通场景(物理世界)完全一致的,创造数字现实与交通场景和谐协调。
2.1.5. 机制
是横跨数字世界和物理世界的一种运行逻辑,有反馈机制和校验机制,工作原理是对比物理世界的真值和系统计算值。
属性:对比结果遵守逻辑属性;
2.1.6. 计算方式(解析信息)方式
在信息解析流程上分析,有如下几种计算方式:
排列组合,光编码宏观世界的方式;
统计,秩序提取物理世界有效信息的方式;
分类,将有效信息组装成一个既有数字世界,再创造一个数字世界(行车路径);
属性:以上三种计算方式一定遵守统计属性。解释一下统计和分类过程,秩序中的模型训练的完善一些,各种模版与进来的信息适配性好一些,损失的信息含义也少一些,过程中不可能有逻辑关系和函数关系描述,只能是统计属性。
对比,是实时校验机制和反馈机制的计算方;
属性:其结果遵守逻辑属性。
2.1.7. 规律与法规
这里只介绍规律,因为交通法规本质也是底层规律、人性基本需求、社会秩序制定的。我们一定要理解像交通系统、交通体系这样复杂系统的构建和运行,一定有背后的规律④主导”,工程师写代码、调参数是让具体系统有遵守规律的能力。
守恒与对称,一方面在系统构建阶段主导着模型内部埋藏的秩序与物理世界中的交通秩序一致,另一方面在系统运行阶段主导着既有数字现实与交通场景完全一致。
时空不重叠,主导着创造数字现实的产生,即行车路径的产生。
2.2. 信息解析过程
本节站在信息解析的角度,详细说明驾驶系统的工作原理。
2.2.1. 系统建构阶段
系统建构过程和原理详细看论文《智能驾驶系统实时校验机制的研究》中的2.3.1,需要注意的是论文中的概念和本文描述的秩序是一个东西。
2.2.2. 系统承载服务运行阶段
驾驶系统在解析信息流程、原理可以参考图6。将交通场景用状态和规律两个层面的信息解释是前提条件。最终由于设计实时校验机制将一个统计系统转变成一个逻辑系统,才能实现服务的安全。
图6驾驶系统工作原理框图
信息处理过程和系统工作原理描述如下:
a)光与交通场景作用后,将交通场景的存在状态和运行规律编码到光波的排列组合中;
b)系统中的秩序实时统计有意义的信息,并分类出一个数字世界,数字世界包括既有数字现实和创造数字现实;
说明1:假如是理想系统,既有数字现实和物理世界(交通场景)将完全一致,创造的数字现实与物理世界和谐协调。本质是被两条物理法则主导,守恒与对称、宏观世界时空不重叠;
说明2:以上过程的排列组合、统计、分类,其结果都遵守统计属性;
c)另一个逻辑独立的通道实时提取交通场景的状态信息和数字世界的状态信息,并对比;
说明3:对比遵守逻辑属性,因为状态值是确定的,有明确的阈值限制;
d)如果对比状态一致,继续达成服务;如果对比状态不一致,则立即采取措施(在事故之前),停止服务;
这样的系统在理论上,可以规避交通事故。满足服务的基本述求,也就是满足人性述求。具体落地方案看论文《智能驾驶实时校验机制的研究》中所描述。
2.3. 人类驾驶系统工作原理
简单说明关于大脑处理视觉、声音信息的过程与原理,试图理解人类驾驶的工作原理。这部分已经有猜想的成分,读者谨慎采纳。
人类大脑处理视觉信息过程非常复杂,大脑内部组织基本都参与。关键说明两点:
图7 大脑处理驾驶场景原理
另外解释一点,人类只要理性驾驶(不过劳、不冒险、不侥幸等)是可以完全避免交通事故。机器驾驶出交通事故就是能力问题。
其实人、动物在遇到危险、刺激时候,都是先于大脑对事件的理解就做出规避动作,保护身体、生命安全,最典型的有一些陆地动物通过双耳定位空中危险。就是说大脑里面有两个或多个信息传输通道,应对不同的事件、状况。感兴趣的读者可以阅读脑科学相关书籍。
这部分猜测性解释想说明,即使人类驾驶也有实时校验机制(应急机制类似实时校验机制),整个处理过程、原理和图6类似。智能驾驶系统用两个独立的通道采集不同属性的信息是合理的、必要的。
2.4. 总结
我们应该“看”到无论是有人驾驶还是智能驾驶,支撑交通场景运转的是一个逻辑自洽的系统,其中只有很少的组件、计算、机制、规律,有机的组合。AI只是某些组件、计算的承载方式。唯有如此,智能驾驶才能有序走向安全,智慧交通体系才能呈现弹性。
无论多么强大的AI不可能支撑起复杂、动态变化的交通系统,他一定是刚性的,承载的服务充满不确定性。当前不少厂家也在做智能驾驶系统的兜底规则、安全设计,系统架构不对不可能实现安全,下一篇博文会重点描述安全。
③秩序,是作者为统一电子系统、通信系统、智能驾驶系统中解析信息的组件引入的一个概念。
④守恒与对称是最基本的物理法则之一,不仅粒子和场遵守,也支配着宇宙中物理系统的行为。
---- FEYNMAN R,LEIGHTON R,SANDS M.The Feynman Lectures on Physics Volume Ⅰ 52-1
系统应该是物理规律之上,支持物理世界中各种复杂场景、体系化场景运转的客观逻辑存在。本节继续用电子系统和通信系统来佐证其普适性和唯一性。
本研究局限在信息解析系统领域,针对可以驱动一个场景运转的系统。电子系统和通信系统显然不能完成全部流程环节,只完成了信息统计环节,其他环节需要人去配合完成。但是也能体现出系统运转的基本原理。
3.1. 电子系统
如图8所示,本文所说的电子系统本质是传输信号的一个信道,现实工程设计中所有的电路单板在传输信号的通道都有各种通信协议,读者注意基本概念区分。前提条件,需要把每个信号单元用结构和含义描述,结构就是信号含义在频域的存在状态。详细见《全新视角理解智能驾驶系统运行原理与安全》中对信息定义描述。
图8 电子系统工作原理框图
信号分量统计:
一个信道设计过程,本质是设计一个滤波器,只能让特性频率的一组波完整的通过。由于信道的必然不完美,以及外部干扰等因素,实际信号分量在传递过程中遵守统计属性。因为图8中信号A和B的分量关系不可能用逻辑或函数去描述。
信号校验机制:
电子系统设计校验机制的基本手段就是探测电平,电平本质是一组波形的结构属性体现。所以电子系统的校验机制本质是对比系统两侧一组波在频域上的分布状态。
3.2. 通信系统
如图9所示,通信系统以报文单位处理信息。前提条件也需要把每个报文分为结构和含义描述,结构就是信号含义在时间轴上的存在状态。
图9 通信系统工作原理框图
报文分量统计:
报文分量分布在时间轴上不同的时隙。通信协议最基本的逻辑,让一组信道按照时间序列工作,让报文中的分量可以完美通过。由于信道的必然不完美、外部干扰等因素、以及通信系统时序不完美,实际报文分量在传递过程中遵守统计属性。因为图9中声音序列A和B的分量关系不可能用逻辑或函数去描述。
报文校验机制:
通信系统设计校验机制的基本手段就是CRC等,CRC可以对A和B序列中:
所以通信系统的校验机制本质是对比系统两侧报文在时间轴上的分布状态。
3.3. 关于不可解释性
做过电子系统和通信系统的工程师都清楚,系统如果产生错误,分析错误的根本原因都很难,往往通过一些规避措施解决。所谓电平异常、CRC错误,都是实时校验机制探测到的错误表现。所以,可以认为不可解释性是所有系统解析信息的基本属性。而且随着系统解析信息的维度越来越高,用的解析方式越来越复杂(内部参数多),可解释性越来越低,如图10所示。
图10 可解释性对比
反复提及不可解释性,就是告诉读者不要去追求AI的工作原理,不可解释性是其基本属性,这是客观的物理现实。而是要看到一个整体系统,即增加实时校验机制让系统整体可解释。
3.4. 普适性和唯一性的解释
电子系统和通信系统在专递、解析信息过程也遵守统计属性。所以要想广泛应用并承载一些安全服务,必须有校验机制,其校验机制本质也是将系统计算值的状态属性和物理世界真值的状态属性做对比。所以电子系统、通信系统、智能驾驶系统的基本框架和逻辑是一致的。
关于普适性、唯一性作者的解释:
或许我们理解这个世界的方式不对,改造世界的方案也就不合理。先“看”到交通场景运转的全貌和客观存在的系统框架,再把AI放在这个框架中完成某些组件的功能,替代人类的工作。
很难想象有一种无所不能能力可以独自支撑交通体系的运转,因为交通体系是开放的、动态的、不确定的。在一个特定的环节或具体的、很小的范围有可能用一种特定能力应对。
让一个逻辑自洽的系统去支撑交通场景的运转,既可以满足人的基本安全述求,又会建立公信力,产业有序发展。
参考引用