一种多源数据结构下优化交通事故数据的方法
成果类型:: 发明专利
发布时间: 2023-09-15 14:41:55
本发明公开了一种多源数据结构下优化交通事故数据的方法,包括如下步骤:(1)多源交通数据采集;(2)构建符合多源数据形态分布的生成模型;(3)平衡交通事故数据结构;(4)优化数据的验证与评价。本发明首先对多源交通事故数据进行采集与汇总,分别确定每一种交通数据类型的分布形态,其次基于数据分布形态构建事故数据生成模型,最后基于道路安全分析模型对优化后的数据集进行验证与评价。本发明方法能够大幅度减少不平衡交通事故数据结构对安全分析模型的影响,获得准确可靠的交通安全评价结果。
本发明所要解决的技术问题是:提供一种多源数据结构下优化交通事故数据的方法,能够大幅度减少不平衡交通事故数据结构对安全分析模型的影响,获得准确可靠的交通安全评价结果。本发明为解决上述技术问题采用以下技术方案:一种多源数据结构下优化交通事故数据的方法,包括如下步骤:步骤1,采集多源交通数据,即获取多源交通安全影响因素数据;步骤2,构建符合多源交通数据形态分布的生成模型,即为步骤1获取的各个影响因素构建分布形态函数;步骤3,基于步骤2构建的生成模型对步骤1采集的多源交通数据进行增生优化处理,使得处理后的多源交通数据中事故样本的数量与零事故样本的数量比例为1:4。作为本发明的进一步方案,所述优化交通事故数据的方法还包括步骤4,构建交通安全分析模型,并根据模型的拟合指标对增生优化结果进行验证。作为本发明的优选方案,步骤1所述多源交通安全影响因素包括:路段年交通事故总数量N、路段长度L、路段日平均交通量Q、路段平均车速V、路段的交通节点密度S、道路等级A、道路路幅宽度W、道路车道数K以及
近几年构建道路安全事故分析模型成为了交通安全领域的研究热点,然而模型的表现很大程度上依赖于交通事故数据结构的有效性。交通事故作为一种小概率事件,特别是严重性事故,经常会导致事故数据结构不平衡,即事故数据样本远远小于零事故样本(即零过多现象)。目前在科研领域与专利应用领域,大多数的研究都是基于传统的统计分析模型,如零膨胀泊松回归模型、自举重采样等。随着先进的数据挖掘技术发展,上采样与下采样技术开始用于数据结构平衡优化,如合成少数类过采样技术、生成式对抗网络等。
然而上述方法在生成新的数据集时往往赋予所有变量共同的似然函数,忽略了不同变量之间的异质性,从而影响了模型的拟合效果和安全因素的识别。因此,为保证数据生成的有效性,保证准确可靠的安全评估结果的获取,需要针对不同变量数据分别构建符合各自形态分布的似然函数,生成新的数据集,使得事故数据结构平衡。
此技术为东南大学郭延永研发,培养高等学历人才,促进科技文化发展。文学类、工学类、医学类和管理学类学科高等专科学历教育经济学类、法学类、文学类、理学类、工学类、医学类和管理学类学科本科学历教育哲学类、经济学类、法学类、教育学类、文学类、理学类、工学类、医学类和管理学类学科硕士研究生学历教育哲学类、文学类、理学类、工学类和管理学类学科博士研究生学历教育博士后培养相关科学研究、继续教育、专业培训、学术交流与咨询服务
本发明与现有技术相比,具有以下技术效果:1、本发明提出一种多源数据结构下优化交通事故数据的方法,分别确定每一种交通数据类型的分布形态,基于数据分布形态构建事故数据生成模型,并基于道路安全分析模型对优化后的数据集进行验证与评价,大幅度减少了不平衡交通事故数据结构对安全分析模型的影响,使得交通安全评价结果更加准确可靠。
2、本发明针对不同变量数据,构建符合各自分布的似然函数,从而保证了数据生成的有效性,保证了准确可靠的安全评估结果的获取。
技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接此项目。