陶然

同专业博导

同专业硕导

微信扫描

当前位置: 中文主页 > 科学研究

    方向一:地理空间人工智能(GeoAI)与空间统计(spatial statistics)新模型与新方法

    1.1. 地理高斯过程回归GGPR

    提出一种新型空间机器学习模型,即地理高斯过程回归(Geographical Gaussian Process Regression,GGPR)。GGPR 在传统高斯过程回归(GPR)的基础上,引入了“地理学第三定律”中的核心概念“空间相似性”原则进行校准,可同时用于空间预测(Spatial Prediction)与探索性空间数据分析(Exploratory Spatial Data Analysis, ESDA)。

    Fig6_GGPR.jpg

    图注:GGPR 模型框架

    引用:Zhenzhi Jiao, Ran Tao*. (2025). Geographical Gaussian Process Regression: A Spatial Machine Learning Model Based on Spatial Similarity. Geographical Analysis https://doi.org/10.1111/gean.12423


    1.2. 地理图注意力网络 GeoGATs

    通过融合改进的空间相似性与因果注意力机制,开发了两个子模型:用于空间预测任务的GeoGAT-P和用于ESDA任务的GeoGAT-E。通过美国县级选举和谋杀率数据集的实验表明:GeoGAT-P在10%小样本条件下,预测误差与现有模型相比至少分别降低50%和30%;GeoGAT-E通过构建局部相似加权邻域和因果注意力机制,其对抗局部异常值和解释能力优于传统方法。

    图注:GeoGATs 模型框架

    引用:Zhenzhi Jiao, Ran Tao*. (2025). Geographical Graph Attention Networks: Spatial Deep Learning Models Based on Spatial Similarity. Transactions in GIS. http://dx.doi.org/10.1111/tgis.70029


    1.3. Local BiT空间统计方法

    二元空间相关性是指两个变量在空间邻近中的关系,其强弱程度是由两个变量在局部空间内的相似程度所决定,而与变量本身值的高低无关。现有的二元空间统计方法过度关注由极端值构成的模式,即所谓的“高-高”、“低-低”、“高-低”和“低-高”模式,而忽略了那些由非极值形成的模式。本研究中提出了local BiT方法来更准确的检测二元空间相关性的局部模式,且不受变量本身值的高低或概率分布类型所影响。此外,local BiT 的对称性设计确保计算时变量的顺序不会影响计算结果。同时,它还避免了当一个变量为极值、另一个为非极值时产生的伪显著错误。 

    Fig8_localBiT.jpg

    图注:Local BiT分析北卡州Mecklenburg县成人受高等教育的程度与小学生学业表现之间的空间关系

    引用:Ran Tao, Jean-Claude Thill. (2025). A Reciprocal Statistic for Detecting the Full Range of Local Patterns of Bivariate Spatial Association. Annals of the American Association of Geographers, 1-22. https://doi.org/10.1080/24694452.2025.2477675


    1.4. 同一地区不同时期的LISA结果的比较方法

    提出一种改进LISA统计量的解决方案,旨在实现对空间过程绝对分布动态的检验。本文论证了传统基于LISA的横截面比较分析仅能表征相对分布动态,这种局限性使其难以全面反映空间过程的真实演变。研究发现,许多已发表论文在进行跨时期LISA结果比较时均未意识到这一局限。然而,获取绝对分布动态对于补充相对视角至关重要,特别是在追踪局部层面空间过程的时序演变时。本研究开发的解决方案通过改进纵向数据LISA分析的显著性检验方法,可有效揭示并可视化绝对分布动态。实验采用蒙古国牲畜数据和卢旺达人口数据展开验证。

    Fig9_LISA Mongolian Goat.jpg

    图注:比较多个时期的LISA结果:以蒙古牲畜分布数据为例

    引用:Ran Tao, Yuzhou Chen. (2023). Applying Local Indicators of Spatial Association (LISA) to Analyze Longitudinal Data: The Absolute Perspective. Geographical Analysis 55(2): 225-238.


    1.5. 多模态大模型(LMM) 在地图学与GIS领域的应用

    探索利用大模型:a)制作专业地图;b)阅读并分析地图。

    GPT4mapping.jpg  GPTmapAnalysis.jpg

    图注:用ChatGPT制作专业地图的流程;用GPT4V分析地图里的有效信息

    引用:

    Ran Tao, Jinwen Xu. (2023). Mapping with ChatGPT. ISPRS International Journal of Geo-Information 12(7): 284

    Jinwen Xu, Ran Tao*. (2024). Map Reading and Analysis with GPT-4V(ision). ISPRS International Journal of Geo-Information. 13(4), 127.



    方向二:地理流大数据时空分析、挖掘与建模

    背景:地理流数据(geographical flow或spatial flow)近年来被广泛应用在交通、旅游、公共卫生、城市规划等领域。针对地理流数据的时空分析、挖掘与建模是当前国际地理信息科学特别是时空大数据领域的前沿热门方向。区别于传统的点、线、面、体等静态空间对象数据,地理流注重描述地区之间空间交互的动态地理过程,如人口流动、商品贸易、信息交换等。常见的地理流数据既包含了个体层级的离散流,也包含了地区之间的集合地理流。随着多种空间位置传感网的普及应用,产生了海量、多类别、细粒度、实时更新的地理流大数据,为相关行业应用提供了可行的数据支撑,也拓深了地理流数据分析的理论和方法发展潜力。由于其独特的个体粒度、高时空分辨率、语义信息丰富等优势,地理流大数据能为地理信息科学的空间交互、人类移动性等核心问题研究提供新的分析视角。

    本人长期致力于地理流大数据的基础理论与领域应用研究,建立了一套地理流空间测度的方法体系,包括流距离和流的时空权重矩阵。并以此为基础提出了一系列针对地理流的探索式空间分析方法,包括流的空间分布模式检测、空间自相关性检测、空间依赖性检测、聚类分析等方法,突破了地理流大数据时空动态规律提取难的瓶颈。

    2.1. 离散地理流的空间分布模式检测方法:flow K-function 以及 flow cross K-function

    flow K-function将经典的Ripley’s K函数的适用范围从点数据拓展到流数据,是地理信息科学领域内较早的检测流空间分布模式(离散、聚集、或随机)的工作之一。flow K-function具备多种优势,包括可在多个连续尺度下检测离散流在局部空间内的空间分布模式,以及其简单易用性。在flow K-function工作的基础上,进一步提出了flow cross K-function,用于分析两种不同的离散流之间的空间依赖性并检测其空间分布模式,如在一种流的空间临近区域内是否在统计意义上更容易观测到另外一种流。

    Fig1_flowKfunction.jpgFig2_FlowCrossKfunction.jpg

    图注:flow K-function分析盗车犯罪流、flow cross K-function分析出租车流的示例

    引用:

    Ran Tao, Jean-Claude Thill. (2016). Spatial Cluster Detection in Spatial Flow Data. Geographical Analysis 48(4): 355–372.

    Ran Tao, Jean-Claude Thill. (2019). Flow Cross K-function: A Bivariate Flow Analytical Method. International Journal of Geographical Information Science: 1–17.


    2.2. 集合流的空间自相关性检测方法:FlowLISA, BiFLowLISA, Space-Time FlowLISA

    将“地理学第一定律”的核心概念,即空间自相关性拓展到地理流,明确定义了流的空间自相关性(flow autocorrelation),并将其与网络自相关性(network autocorrelation)比较、区分。将经典的空间自相关性检测方法,即局部莫兰指数(local Moran’s I)拓展为针对地理流的FlowLISA方法。该方法可以检测局部空间内地理流的空间自相关性显著模式,如 “high-high”,“low-low”的空间极值聚类(空间异质性),以及“high-low”,“low-high”的空间异常值聚类。应用FlowLISA方法挖掘国内地级市之间的搜索流和出行流之间的关系,并总结出对旅游业、节假日大范围出行具有指导性意义的结论。

    进一步定义二元流的空间依赖性,即两种地理流在同一局部空间内的共存或互斥程度,并提出流的空间自相关性和检测方法BiFlowLISA。该方法可用来检测两种地理流的空间共存或互斥现象,具有重要应用价值,例如将其应用于检测纽约市出租车和网约车公司的乘客接送流之间的空间自相关性,判断在不同城区的出行市场是否由某一公司独占,或是由两个公司激烈竞争。结果表示出租车在中央公园附近仍为居民出行的主要选择,而在曼哈顿中南部等其他地区则不如网约车受欢迎。

    进一步定义流的时空相关性,并提出了相应的检测方法Space-Time FlowLISA。相比于仅限于空间纬度的FlowLISA,Space-Time FlowLISA综合考虑了流的时间自相关性以及空间自相关性,因此其结果受流的长度的影响较小,且能检测出具有时间敏感性的结果。将其应用在研究美国过去近二十年内跨州迁徙流的时空分布模式,检测出多类典型性迁徙行为特征,例如在飓风卡特里娜之后的三年内以路易斯安那州为中心的迁出-迁回的局部特征。

    Fig4_BiFlowLISA.jpgFig5_SpaceTimeFlowLISA.jpeg

    图注:BiFlowLISA对比纽约市出租车和网约车客流分布;Space-Time FlowLISA分析美国近二十年人口迁徙流

    引用:

    Ran Tao, Jean-Claude Thill. (2020). BiFlowLISA: Measuring Spatial Association for Bivariate Flow Data. Computer, Environment and Urban Systems 83: 101519.

    Ran Tao, Yuzhou Chen, Jean-Claude Thill. (2023). Spatiotemporal Association in Flow Data: A Space-Time Flow LISA Approach. Computer, Environment and Urban Systems 106: 102042

    Yuzhou Chen, Zhaoya Gong, Qiwei Ma, Ran Tao*(2023). Exploring the Spatiotemporal Relationships Between Search Flows and Travel Flows. Transactions in GIS 27(5): 1338-1356.


    2.3. 流聚类方法:flowAMOEBA,flowDBSCAN, flowHDBSCAN

    flowAMOEBA方法是一种自下而上的基于动态优化策略的流聚类方法。该方法突破了传统聚类方法对行政区划等既定地理界限的限制,可检测出两个有不规则边界的区域之间的强交互关系,并准确提取强交互流的起终点空间范围。

    此外,从空间数据挖掘的角度,分别提出了基于密度和层次的地理流非监督聚类方法flowDBSCAN和flowHDBSCAN。此类方法可将大量地理流快速分类并提取其层次结构,为地理流的可视化分析提供基础。

    Fig3_flowAMOEBA.jpg

    图注:flowAMOEBA算法工作原理,即自下而上提取流的不规则边界的起终区域

    引用:

    Ran Tao, Jean-Claude Thill. (2019). flowAMOEBA: Identifying Regions of Anomalous Spatial Interactions. Geographical Analysis 51(1): 111–130.

    Ran Tao, Jean-Claude Thill, Craig Depken, II, Mona Kashiha. (2017). Flow HDBSCAN: A Hierarchical and Density-Based Spatial Flow Cluster Analysis Method. In Proceedings of UrbanGIS'17:3rd ACM SIGSPATIAL Workshop on Smart Cities and Urban Analytics. Redondo Beach, CA, USA.

    Ran Tao, Jean-Claude Thill. (2016). A Density-Based Spatial Flow Cluster Detection Method. In the Ninth International Conference on Geographic Information Science (GIScience2016) Short Paper Proceedings. Montreal, Canada: 288–291.


    2.4. 新型空间交互模型

    提出新的空间交互模型,解决了包括边界效应、固定效应、空间尺度不对称性、流矩阵稀疏性、流数据长尾分布等关键问题,提高了模型的预测精度以及关键变量的可解释性。在经典重力模型的基础上设计了基于起-终点对(OD pair)的流固定效应专项。通过不同地区、尺度的迁徙流和交通流的实证研究,证明了该方法的效果明显优于此前分别基于O和D的流固定效应处理方法(即所有从O出发的流具有相同的固定效应,所有到达D的流也具有相同的固定效应)。该方法不仅提高了模型表现的各项指标,其提取的固定效应本身也具有很强的可解读性和政策指导性。同时,该模型可被应用于提取和分析地理流的边界效应,如疫情期间我国跨省市的出行流受出发地、目的地、甚至途经地的行政边界处的交通管制的影响。结合百度地图人口流动大数据,量化分析了疫情前后国内跨省出行所受的边界效应影响的变化,为不同地区在特殊时期制定跨界交通管制方案提供了科学依据。

    bottom_flow2020.jpg top_flow2020.jpg

    图示:检测疫情期间(2020年)省界对人口流动的边界效应:最低和最高的20个OD pairs

    引用:

    Yuzhou Chen, Qiwei Ma, Ran Tao*. (2025). Addressing the Fixed Effects in Gravity Model based on Origin-Destination Pairs. International Journal of Geographical Information Science, 1-21.

    Qiwei Ma, Anqi Liu, Yuzhou Chen, Ran Tao*. (2024). Border Effects for Domestic Travel in China during COVID-19 Pandemic. Journal of Transport Geography, 116, 103857.


    方向三:交通、健康、人口、城市方面的实证研究

    3.1. 收缩城市的人口与资本外流

    收缩城市的定义常被简化为人口流失地,而其在城市网络中的真实功能却往往被忽视。研究利用百度迁徙数据与企业跨城市投资数据,构建了人口资本的双流网络,系统性地分析了55个收缩城市在全国城市网络中所扮演的角色。

    citiesFig2.jpg CitiesFig3.jpg

    图注:收缩城市的人口外流和资本外流情况

    引用:

    Yuzhou Chen, Ran Tao*, Qiwei Ma, Mingshu Wang. (2025). Shrinking cities in China's urban network: a data-driven exploration of migration and investment flows. Applied Geography, 180, 103664. https://doi.org/10.1016/j.apgeog.2025.103664

    Yuzhou Chen, Ran Tao*. (2025). Exploring the Coordinated Development of China's Shrinking Cities through the Lens of Migration and Investment Flows. Urban Informatics. 4(1): 14. https://doi.org/10.1007/s44212-025-00078-8


    3.2. 美国电动车与充电桩的空间关联

    采用多项逻辑混合模型(MLM)、广义线性混合模型(GLMM)、可解释的机器学习模型(XGBoost+SHAP)分析佛罗里达州居民的电动汽车购买意愿的空间差异性。分析结果显示显著的人口统计学差异、社交网络和气候变化认知对电动汽车采纳意愿具有关键影响。基于研究结果的政策启示包括:需要通过针对性营销和财政激励措施解决人口差异问题,扩大社交网络影响力以推动普及,同时提升公众对电动汽车相关政策及基础设施的认知度和可获得性,从而促进更公平的电动交通转型。

    Fig12_EV_Charging_Florida.jpg  EV_XGBoost.jpg

    图注:佛罗里达州充电桩分布;电车购买意愿的影响因素

    引用:

    Ran Tao, Xiankui Yang, Feng Hao, Peng Chen. (2024). Demographic Disparity and Influences in Electric Vehicle Adoption: A Florida Case Study. Transportation Research Part D: Transport and Environment. 136: 104465.

    Peng Chen, Xiankui Yang, Feng Hao, Ran Tao*. (2025). Decoding Electric Vehicle Adoption using XGBoost and SHAP Analysis. Travel Behaviour and Society.