

如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
基于GPS轨迹数据的深圳市居民出行热点研究 一、前言 深圳市是我国改革开放的先行者之一,也是中国的创新之城,在发展过程中,交通运输是社会发展的重要支撑。近年来,随着移动互联网时代的到来,人们的出行方式也发生了巨大变化,移动支付、智能公交、共享单车、网约车等新兴服务迅速崛起,使得出行更为便捷和智能化。本文选取深圳市居民出行热点作为研究对象,探讨基于GPS轨迹数据的出行行为,从而为城市交通规划提供参考。 二、数据来源 本文选取了深圳市交通运输局2016年GxF计划数据集,包含10万名居民的出行轨迹数据,以及相关属性信息如性别、年龄、职业等。为保护用户隐私,数据经过脱敏处理。 三、数据预处理 在对数据进行分析之前,需要对数据进行初步预处理。本文采用的预处理方法主要包括去噪、路网匹配、众包标注、地理编码等。 1)去噪 GPS轨迹数据是由GPS设备记录的一系列时空数据点组成的,由于GPS信号容易受到环境的影响,导致数据中存在误差点,需要进行噪声过滤。本文采用的方法是基于密度的聚类算法,将轨迹点分为噪声点和有效点。 2)路网匹配 GPS轨迹数据是基于地球坐标系的经纬度数据,需要转换为道路网上的点。本文采用的方法是把道路网划分为一系列小区域,每个小区域都有一个对应的道路网上的点,然后根据轨迹数据点的位置信息把它们转化为对应的道路网上的点。 3)众包标注 由于人类出行行为的复杂性,只依靠机器算法无法准确地识别出行模式,需要进行人工标注。本文采用的方法是众包标注,即将标注任务发布到互联网上,由多个标注人员完成标注任务。 4)地理编码 在进行数据分析前,需要将经纬度信息转化为行政区名称。本文采用的方法是百度地图API,将所有点的经纬度转化为对应行政区。 四、数据分析 在对数据进行分析时,本文主要采用了聚类分析和热力图分析两种方法。 1)聚类分析 聚类分析是一种无监督学习算法,将数据点分成若干组,每组内部的点相似度高,组与组之间的相似度尽量低。在本文中,我们采用了K-Means算法对出行轨迹进行聚类分析,得出了不同出行模式的轨迹簇。 2)热力图分析 热力图是一种地理信息可视化技术,将数据集中在地图上的空间分布用色彩深浅的方式展现出来,便于直观地观察空间分布的热度。在本文中,我们根据K-Means聚类的结果,利用ArcGIS软件绘制出不同出行模式的热力图。 五、实验结果 本次研究的实验结果主要包括以下几个方面: 1)人口统计学特征分析 在深圳市居民出行热点中,男性的出行比例略高于女性;年龄在25-45岁的居民出行频次较高;白领和灰领的出行频次较高。 2)出行模式分析 通过K-Means聚类分析,将所有出行轨迹分为10类。其中,代步类出行占比最高,包括了步行、骑行和公共交通等模式;私家车类出行占比最低,包括了私家车、出租车等模式。经过比较分析,发现不同聚类簇的出行方式和出行时间存在显著差异。 3)热力图分析 绘制轨迹热力图后,发现代步类出行的轨迹热度最高,主要集中在市区的商业中心和住宅区域,私家车类出行的轨迹热度相对较低,主要集中在较为偏远的郊区和工业区。 六、结论 从本文研究结果来看,深圳市居民出行热点主要集中在市区的商业中心和住宅区域。代步类出行占比最高,私家车类出行占比最低。通过研究不同聚类簇的出行模式和出行时间,可以为城市交通规划提供参考。

快乐****蜜蜂
实名认证
内容提供者


最近下载