硕士论文摘要——基于车牌数据的行程时间特征研究

导师 石小法 教授

同济大学 交通运输工程

2016年2月

在城镇化、机动化快速发展的现实背景下,城市交通正在发生一系列质的变化,不仅对交通基础设施网络产生了新的需求冲击,也使得发展过程远远超出了传统经验可以把握的范畴。在快速发展的大背景下,相比于保证分析的精确性,城市交通管理者和决策者更需要快速获取城市交通状态的大致轮廓和演变脉络,把握演变过程中的“模糊征兆”,保证决策判断的及时有效。在众多交通指标中,行程时间获取简单,且最易被非专业人士理解,具有极大的应用价值。本文依托于深圳市的车牌识别数据,利用车牌号码能唯一标识车辆的特点,以行程时间为核心,提出了针对车牌数据的一套数据处理方法,最终将原始数据转化为深圳市核心路段的行程时间特征曲线,并进行初步的特征挖掘。

首先,对车牌照数据进行数据剖析,在应用于更深层次的分析前,对数据质量进行评估,对数据的可行性、可靠性进行技术验证。在此基础上,提出车牌照数据的数据预处理方法以及行程时间提取算法。分析原始数据的组成结构,包括有效数据、重复数据、错误数据等,在数据预处理中,对车牌识别原始数据中的有效数据成分进行完整地提取。成功提取出来的有效数据样本是车牌识别系统每个检测点的单点数据,即断面位置、车牌号码、通过时刻等信息。利用有效数据样本,提出行程时间提取算法,将车牌单点数据通过路段匹配原则转化为行程时间数据,即每个研究路段的行程时间样本。

其次,对车辆通行的连续性进行判断。原始行程时间样本包括非连续通行的数据样本,无法准确获取车辆连续行驶完某路段的实际行程时间,不能直接进行特征分析。识别车辆通行是否连续,传统方法是针对样本分布提出一个固定的比例阈值,对非连续通行样本进行筛选。本文则基于实际道路状态环境,借鉴数据分类器的思想,利用样本数据一阶差分稳定的特性对问题数据进行筛选。筛选结果表明,在4min车程范围内的路段,99%的车辆都是以连续通行为目的的。

第三部分,对行程时间特征曲线进行提取,并由此对行程时间特征进行分析。传统的行程时间分析方法是以所有的连续通行样本为全体,对行程时间特征进行描述,既包含有正常状态下的样本,也包含发生事故或偶发性阻塞等意外情况下的样本,难以刻画路段真正的行程时间特征。本文利用小波分析技术,了多尺度处理曲线的滤波器功能,在合适的小波尺度下,原有行程时间样本可以有效地过滤掉事故、阻塞等意外,使其呈现出正常状态下路段的行程时间分布。

在小波分析技术的协助下,每条路段每天的样本数据都可以转化为一条行程时间的时变曲线,表示路段行程时间在一天中不同时刻的变化情况。从城市交通管理决策的角度来看,数据分析层面向决策应用层面转化的过程中,必须要完成数据的整理和简化,以便能够快速响应管理决策应用的数据支持需求。所以,对于每条路段而言,可以利用统计特征值和概率分布情况,将多条曲线整合为一条曲线来表征该路段的行程时间固有特征,即行程时间特征曲线。

行程时间特征曲线在已知路段长度的前提下可以转化为行程速度特征曲线,两条曲线作为路段的属性之一,结合道路类型、区位、用地类型等其他属性特征,进行聚类分析,可以挖掘出更多的关于机动车使用人群的有价值的结论。本文以深圳市为案例,对行程时间特征曲线的应用价值进行了初步挖掘,分析得出深圳市三条东西向主干道的机动车使用特征,以及部分区域的用地和交通的交互特征。

最后,对论文进行梳理总结,同时就进一步的研究方向进行了简要讨论。一方面,本文提出了行程时间特征的分析方法,对车辆的连续通行问题、分析样本清洗方法以及行程时间特征描述方法进行了探讨;另一方面,以数据为切入点,通过详细的数据剖析,以小见大,反映城市交通分析新数据环境的共性,能够为后续研究启示与借鉴。

 

关键词:车牌识别数据,行程时间,通行连续性,小波分析,特征曲线