来源:数据分析师 CPDA | 时间:2015-12-09 | 作者:admin
堵!堵!堵!这是来北京后所有人对北京的映像,而随着今年冬天持续“雾霾”天的出现,“汽车尾气排放是北京雾霾产生重要的原因”的论调也居高不下,而北京的道路拥堵成为人们口中汽车尾气排放增长的罪魁祸首,解决汽车拥堵也就成了降低汽车尾气排放的重中之重,间接的也成为解决“雾霾”的手段。
在北京,如果有人对导航下达“半个小时后出发到中关村,请根据当时的路况规划线路。”的命令,那么估计所有导航软件都会被难道,这个问题的难点就在于谁也不知道半个小时后中关村大街堵不堵,需不需要绕道。
但大数据可以。
浙江省交通运输厅正在开展一项新的试点:将高速历史数据、实时数据与路网状况结合,基于阿里云大数据计算能力,预测出未来1小时内的路况。结果显示,预测准确率稳定在91%以上。
浙江省交通信息中心主任韩海航表示,通过对未来路况的预测,交通部门可以更好地进行交通引导,用户也可以做出更优的路线选择。
阿里云大数据计算服务(odps)为项目提供了分析支持,并有多位资深数据科学家参与了联合研发。来自阿里云的闵万里博士介绍,对于浙江省内近1300公里的高速路段,odps的强大计算能力可以在20分钟完成历史数据分析,10秒钟完成实时数据分析。
用手机信号计算实时路况
要想预测未来,首先需要了解当下。实时路况的检测,一直是个难题。由于受采集技术的制约,实时交通数据的更新时间普遍较长,有的高达15分钟。且传统铺设线圈的方式,硬件投资巨大。为此,浙江省交通运输厅引入了新的技术:将手机信令数据同道路通行数据进行关联。在城市道路上,一般每隔500米一个运营商基站,在市郊高速路上大约为2公里。当手机用户经过基站时,形成的信令数据可以较准确地反映出单位时间内通过该路段的实时路况变化。比如,检测到样本车辆在高速公路上停止行驶,而同路段大部分车辆速度下降,那么就可以判断这一路段上可能出现事故或拥堵。
韩海航介绍,从成本投入来说,相比较于传统传感器采集高速路况数据,这种方式至少可以降低90%的成本。建设周期也大大缩短,2至3个月即可完成。
意义重大,算得准是关键
粗略估计,驾驶员通过选择合适的出行路线和出行时间,可以缩短5%至10%的出行时间,减少2%至10%的燃油消耗成本。对未来路况的预测,也可用于支持无人驾驶技术。无人驾驶汽车除了通过各种传感器对“眼下”的数据进行快速判断外,还需要了解10分钟、20分钟后即将到达的路段状况,提前做出路线选择。闵万里表示,路况预测的应用价值很高,但关键在准确性,需要“算得准、算得快、算得起”。如果仅仅基于历史平均数据来做简单预测,那并没有实际意义。
此前,微软曾联合巴西一所大学进行了相似的尝试,准确率为80%。微软希望在加入更多数据源后,将这一成绩提升到90%。
“路网关系、上下游事件,甚至天气等外部综合因素都应该加入进来。但当这些海量数据纳入到全网路况的时空演变模型后,对云平台的大数据计算能力就提出了很高的要求”。闵万里介绍。
据了解,阿里云在sortbenchmark排序竞赛中,用不到7分钟(377秒)就完成了100tb的数据排序,成为世界冠军。sortbenchmark被认为是大数据界的奥运会,每年全球顶尖公司和学术机构都会带着他们最新的研究成果来参加,以评估他们的研究成果