时空数据挖掘及其在交通出行决策系统的应用研究

VIP免费
3.0 赵德峰 2024-11-19 4 4 979.12KB 77 页 15积分
侵权投诉
摘 要
时空数据挖掘是数据挖掘中的重要研究内容。随着时空信息数据的大规模增
长和数据挖掘理论的不断发展,时空数据挖掘已经成为计算机和地理信息系统领
域中研究的热点。传统的数据挖掘技术已经不能处理和反映时间和空间对象的历
史信息变化,因此时空数据挖掘技术迅速发展起来。在交通信息领域,人们不单
要求实现数据的存储和基本信息查询,更需要利用时空数据挖掘技术来帮助理解
时空对象间的联系以及潜在的时空知识。时空数据挖掘技术可以同时为对象提供
有效的时态和空间上的分析管理与支持更新,因此在很多领域有着广泛的应用前
景。
城市交通管理是时空数据挖掘的一个主要的应用领域,为城市交通信息管理、
交通出行决策疏导等提供了很好的技术支持。随着城市交通出行需求的不断增长,
人们对出行决策服务的要求也越来越强烈。出行决策服务的研究与发展,依赖于
数据挖掘技术、导航定位技术、自动控制技术、图像分析技术以及计算机网络技
术等的发展应用,集中体现了智能交通系统的服务理念。
本文首先介绍了时空数据挖掘的基本理论包括三种时空数据建模理论,时态
和空间数据挖掘的理论方法,以此为前提引出对时空数据挖掘技术的进一步研究
和讨论。其次,本文给出了时空数据挖掘的体系结构,在此基础上研究探讨了时
空数据挖掘的目标知识类型、一般挖掘过程和研究策略。然后,对常见的时空数
据挖掘的算法进行研究和分析比较,并对 Apriori 算法提出了改进,提出了含有时
空约束的 Apriori 算法。根据面向城市交通领域的特殊要求,本文还研究论述了
BP 神经网络预测算法。最后在研究分析了城市交通出行决策系统的体系结构和其
时空数据建模方法的基础上,把含有时空约束的 Apriori 算法和 BP 神经网络预测
算法应用到交通流预测的实例中进行分析研究,并分析总结了该应用领域的发展
前景和待解决的问题。
关键词:时空数据挖掘,时空建模,时空一体化,时空数据挖掘算法,
交通出行决策服务
ABSTRACT
Spatio-Temporal Data Mining (STDM) is the important content of data mining
research. With the massive growth of temporal and spatial information, the theory of
data mining is still keep developing, and STDM has become to the hot field of
computers science and GIS research. Traditional data mining cannot process and react
to the historical change of temporal and spatial objects, thus STDM is developed for
solving this issue. In the traffic information industry, we’re not only required for data
storage and basic analysis, but also need STDM technique which can help us
understand the relationship between objects and potential knowledge. STDM has a
broad applied future in many areas because it can provide the effective management
and updates to spatio-temporal object.
Traffic management is a major applied area of STDM, because it can provide a
great support to urban traffic information management and transportation decision.
With the growing demand of urban transportation decision service, we have more
requirements. The research and development of transportation decision service relies
on data mining technology, navigational position technology, automatic control
technology, image analysis technology and computer network technology, and
embodies the concept of Intelligent Transportation Systems (ITS).
Firstly, this paper introduces the basic theory of STDM, including three
spatio-temporal data modeling theory, temporal and spatial data mining theory. We
lead to the study and discussion of STDM techniques under this premise. Secondly,
this paper presents the architecture of STDM, the type of target knowledge, general
process and research strategy. Then we learn three common algorithm of STDM, give
the further analysis and comparison of them, improve on the Apriori algorithm, and
give a new Apriori algorithm which contains the restriction of spatio-temporal
relationship. According to the special requirements from the field of urban
transportation, we also discuss about the BP neural network algorithm. Then based on
the research on the architecture of urban transportation decision system and the method
of spatio-temporal date modeling, we apply the new Apriori algorithm and BP neural
network algorithm to predict the trffic flow. At last, we conclude the future and
problem of this area.
Key WordSpatio-Temporal Data Mining, Spatio-Temporal modeling,
Spatio-Temporal integration, STDM algorithms, Transportation
decision service
目 录
摘 要
ABSTRACT
第一章 绪论 .............................................................................................................1
§1.1 时空数据挖掘的历史背景 ......................................................................1
§1.2 时空数据挖掘的研究现状 ......................................................................2
§1.2.1 空间数据挖掘的研究现状 ...........................................................2
§1.2.2 时态数据挖掘的研究现状 ...........................................................4
§1.2.3 时空数据挖掘的研究现状 ...........................................................5
§1.3 时空数据挖掘的发展趋势 ......................................................................6
§1.4 本文的主要内容和结构组织 ..................................................................6
§1.4.1 研究的主要内容 ...........................................................................6
§1.4.2 本文的组织结构 ...........................................................................7
第二章 时空数据挖掘的基本理论 .........................................................................8
§2.1 时空建模的理论与方法 ..........................................................................8
§2.1.1 时空数据建模 ...............................................................................8
§2.1.2 时空系统建模 .............................................................................12
§2.1.3 时空本体建模 .............................................................................14
§2.2 时空数据挖掘的理论与方法 ................................................................15
§2.2.1 时态数据挖掘 .............................................................................15
§2.2.2 空间数据挖掘 .............................................................................18
§2.2.3 时空数据挖掘 .............................................................................20
§2.3 本章小结 ................................................................................................21
第三章 时空数据挖掘方法研究 ...........................................................................22
§3.1 时空数据挖掘体系结构 ........................................................................22
§3.2 通用的时空数据挖掘 ............................................................................23
§3.2.1 时空数据挖掘的目标知识类型 .................................................23
§3.2.2 时空数据挖掘的过程 .................................................................24
§3.2.3 时空数据挖掘的研究方法与策略 .............................................25
§3.3 基于本体的时空数据挖掘 ....................................................................26
§3.4 面向领域的时空数据挖掘 ....................................................................28
§3.4.1 面向领域的时空数据挖掘的方法与过程 .................................28
§3.4.2 面向城市交通领域的时空数据挖掘 .........................................29
§3.5 本章小结 ................................................................................................31
第四章 时空数据挖掘算法的研究 .......................................................................32
§4.1 常见的时空数据挖掘算法 ....................................................................32
§4.1.1 Apriori 算法 ................................................................................. 32
§4.1.2 K-Means 算法 ..............................................................................34
§4.1.3 K 最邻近分类算法 ......................................................................36
§4.2 时空数据挖掘算法的分析与比较 ........................................................38
§4.3 Apriori 算法的改进与研究 .................................................................... 39
§4.3.1 Apriori 算法的改进 ..................................................................... 39
§4.3.2 时空关系的拓扑划分 .................................................................41
§4.3.3 含有时空约束的 Apriori 算法的研究 .......................................43
§4.4 BP 神经网络预测算法 ...........................................................................45
§4.5 本章小结 ................................................................................................46
第五章 时空数据挖掘在交通出行决策中的应用 ...............................................48
§5.1 交通出行决策系统的研究现状 ............................................................48
§5.2 交通出行决策系统的体系结构 ............................................................49
§5.2.1 交通出行决策系统的基本架构 .................................................49
§5.2.2 可扩展的时空数据挖掘平台体系结构 .....................................50
§5.3 面向城市交通领域的时空建模 ............................................................51
§5.3.1 综合的导航定位数据模型 .........................................................52
§5.3.2 面向对象的导航数据时空建模 ..................................................52
§5.4 城市交通流的时空数据挖掘 ................................................................56
§5.4.1 交通流的时空数据挖掘方法 .....................................................56
§5.4.2 基于关联规则的路段流量之间关系的挖掘 .............................57
§5.4.3 基于 BP 神经网络的交通流量预测 ..........................................60
§5.4.4 时空数据挖掘在城市交通领域的应用前景 .............................63
§5.5 目前交通出行决策系统存在的问题 ....................................................65
§5.6 本章小结 ................................................................................................66
第六章 总结和展望 ...............................................................................................67
§6.1 论文工作总结 ........................................................................................67
§6.2 后续工作展望 ........................................................................................68
参考文献 .................................................................................................................69
在读期间公开发表的论文和承担科研项目及取得成果 .....................................73
第一章 绪论
1
第一章 绪论
本文研究时空数据挖掘及其在交通出行决策系统中的应用。本章首先介绍时
空数据挖掘的历史、现状及发展;然后引入交通出行决策问题等应用背景进行分
析,说明时空数据挖掘技术的发展趋势;最后给出本文研究的主要内容,组织结
构和各章节的安排。
§1.1 时空数据挖掘的历史背景
时空数据挖掘是数据挖掘中的重要研究内容。随着时空信息数据的大规模增
长,数据挖掘理论的不断发展,时空数据挖掘已经成为计算机和地理信息系统领
域中研究的热点。传统的数据挖掘技术已经不能处理和反映时间和空间对象历史
信息的变化,而时空数据挖掘技术就是以此为前提发展起来的。时空数据挖掘技
术可以同时为对象提供有效的时态和空间上的管理支持,因此在很多领域有着广
泛的应用前景。
研究时空数据挖掘技术的发展历史不得不追溯到数据挖掘和空间数据挖掘的
发展历史。数据挖掘是海量数据快速增长的产物。20 世纪 60 年代以数字方式采集
数据就已经实现。
20 世纪 80 年代,随着能够适应动态按需分析数据的结构化查询
语言(Structured Query Language, SQL)的发展,关系数据库的研究应用也迅速发
展起来。数据仓库开始用来存储大量的数据,由于面临处理数据仓库中大量数据
的挑战,于是数据挖掘应运而生,对于这些问题,它的主要方法是数据统计分析
和人工智能搜索技术。在 1989 年举行的第一届 KDD 国际学术会议上,数据库中
的知识发现(KDD, Knowledge Discovery in Database[1]这一概念首次被提出。近
年来,KDD 国际研讨会的研究重点从发现方法转向系统应用,并越来越重视多种
发现策略与技术的集成以及多学科间的相互渗透。KDD96 国际会议上,Fayyad
Piatetsky-Shapiro Smyth 给出了 DM KDD 的具体定义:KDD 是指从数据库中
发现知识的全过程;Data Mining 则是整个过程中的一个特定步骤[2]。通常不会
将二者明确区别开来,它们都指的是从数据中挖掘知识的过程。
目前,大部分数据挖掘的研究工作都是基于关系型和事务型数据库来展开的。
然而随着空间数据采集和处理能力在地理信息系统、交通决策系统、医疗影像系
统和环境监测系统等方面的广泛应用和体现,使得空间数据挖掘技术也在数据挖
掘 领 域 内 占 有 越 来 越 重 要 的 地 位 。 空 间 数 据 挖 掘 ( Spatial Data Mining and
Knowledge Discovery, SDMKD/SDM)有别于传统意义上的数据挖掘,需要综合利
时空数据挖掘及其在交通出行决策系统的应用研究
2
用统计学方法、人工智能方法、模式识别技术、神经网络技术等理论知识来分析
获取可靠的,新颖的,可理解的和所需要的知识信息,从而揭示出蕴含在数据中
的规律、内在的联系和发展的趋势[3-5]。空间数据挖掘利用空间数据结构,空间推
理,计算机几何学等技术,把传统的数据挖掘技术扩展到空间数据库中,并提出
了很多新的有效的空间数据挖掘方法。空间数据挖掘技术与地理信息系统的结合,
更使得 GIS 系统成为能够自动学习,自动获取知识的真正的智能空间信息系统[6]
大部分的空间数据挖掘只针对空间对象的空间特征进行研究,而并未考虑到
时间特性对于数据挖掘研究的影响。但是在很多应用领域内,对各种问题求解的
过程中越来越需要考虑时间因素的影响,例如交通决策,地震救援,环境监测等。
很多空间现象是随着时间来动态变化的,只有将时间纳入到空间系统中来研究空
间数据随着时间变化的规律,才能更好地重现历史,跟踪变化和预测未来[7]因此,
近年来时空数据挖掘已经越来越受到国际学术界和工业界的广泛关注,将空间对
象的时间和空间信息一体化处理来进行的时空数据挖掘Spatio-Temporal Data
Mining, STDM)是一项非常重要且很有实际意义的研究。时空数据挖掘作为数据
挖掘的重要组成部分,是一种动态的空间数据挖掘。以时空信息的认知和数据模
型的研究为基础的时空数据挖掘研究,主要受到空间数据挖掘和时态数据挖掘研
究的影响,并在经典数据挖掘理论的支持下对时空知识和规则进行挖掘。
§1.2 时空数据挖掘的研究现状
时空数据挖掘的研究工作是在空间数据挖掘和时态数据挖掘的基础上展开
的,因此,需要先简要综述空间数据挖掘和时态数据挖掘的研究现状。
§1.2.1 空间数据挖掘的研究现状
空间数据挖掘是按照一定的度量值从空间数据库中提取空间知识,以及进行
相关的预处理、抽样和数据变换的过程,可用于理解空间数据、发现空间与非空
间数据间的关系、构建空间知识库、优化查询和重组空间数据库等。
空间数据挖掘的应用案例可以追溯到 17 世纪中期,例如,
1855 年亚细亚霍乱
横扫英国伦敦,一位流行病学家在地图上标识了所有疾病肆虐的位置,发现这些
位置以水井为中心形成聚集,该重要知识发现促使政府采取了积极合理的应对措
施,埋掉了这些水井,使得霍乱渐渐平息[8]而现在的空间数据挖掘技术应用领域
也越来越广泛,如地震监测、交通决策、区域分析和环境监测等。目前,热衷于
空间数据挖掘研究的学者分为两类:一类是计算机领域的研究人员,如加拿大的
第一章 绪论
3
西蒙佛雷泽大学、德国的慕尼黑大学、芬兰的赫尔辛基大学以及美国、澳大利亚
等国家的许多所大学和研究所,这些学者把空间数据挖掘视为传统数据挖掘技术
在空间领域内的应用,其研究的重点应是以提高原有数据挖掘算法在空间数据库
中的执行效率为目的;另一类是地理学领域的研究人员,这类学者已经在特征提
取,模式识别等领域做了很多的数据挖掘工作,但是却很少将这些研究工作上升
到数据挖掘和知识发现的高度来进行深入研究。
空间数据挖掘的主要研究成果集中体现在原型系统开发和各种空间数据挖掘
算法的实现和改进上。在原型系统开发方面,加拿大的西蒙弗雷泽大学开发出了
一种空间数据挖掘系统原型 GeoMiner[9]该系统在空间数据库建模中使用了 SAND
体系结构,包括空间数据立方体建构模块、空间联机分析处理OLAP模块和空
间数据挖掘模块,对空间数据挖掘做了一些探讨和扩展。在算法的实现和改进方
面,主要包括了对空间关联规则、空间分类和聚类、空间特征规则、空间预测和
演变规则以及空间异常点检测等的研究和改进,从而提出了一些依赖于数据表示
的空间数据挖掘算法。
Ester 等人最早提出了一种空间对象分类方法,该方法采用了引入领域图
Neighborhood Graphs概念的 ID3 算法,同时考虑了被分类对象及其邻接对象
的非空间属性。但是,该算法的不足是缺少对邻接对象非空间属性聚合值进行相
关分析的能力,且忽略了空间属性和非空间属性之间可能存在的概念层次关系[10]
为了改进该算法,Koperski Han[11]提出了空间数据的两步决策分类法:第一步,
通过较少代价的空间计算获得一个近似的空间谓词,并同时进行相关分析来提高
决策树的质量;第二步,对模型进行进一步的精化计算即逐步求精,不仅大大降
低了计算的复杂度,而且能够获得一个更小和更精确的决策树。另外,石云,孙
玉芳[12]还提出了一种基于 Rough Set 的空间数据分类方法,采用 Rough Set 方法进
行空间对象分类,可以较好地反映空间数据和非空间数据之间的关系。
空间聚类分析是根据某些特征把空间数据库中的对象划分成具有不同意义的
子类,同一个子类中的对象具有高度相似的特征,并且不同子类之间在特征上有
着明显差异。迄今为止,已经提出的空间聚类算法有:基于分割K-平均算法、
K-中心点算法和 CLARANS 算法;基于层次的 BIRCH 算法和 CURE 算法;基于
密度的 DBSCAN 算法、OPTICS 算法、GDBSCAN 算法、DBRS 算法和 DENCLUE
算法;基于网格的 STING 算法、WaveCluster 算法和 CLIQUE 算法[13]
空间关联规则是在传统数据挖掘中关联规则上的扩展,指的是空邻接图中对
象之间的关联。目前已经提出的空间关联规则的算法有:Koperski[14]提出一种五个
步骤的空间关联规则挖掘算法;Malcrba[15]等人提出了一种归纳逻辑程序设计方法
摘要:

摘要时空数据挖掘是数据挖掘中的重要研究内容。随着时空信息数据的大规模增长和数据挖掘理论的不断发展,时空数据挖掘已经成为计算机和地理信息系统领域中研究的热点。传统的数据挖掘技术已经不能处理和反映时间和空间对象的历史信息变化,因此时空数据挖掘技术迅速发展起来。在交通信息领域,人们不单要求实现数据的存储和基本信息查询,更需要利用时空数据挖掘技术来帮助理解时空对象间的联系以及潜在的时空知识。时空数据挖掘技术可以同时为对象提供有效的时态和空间上的分析管理与支持更新,因此在很多领域有着广泛的应用前景。城市交通管理是时空数据挖掘的一个主要的应用领域,为城市交通信息管理、交通出行决策疏导等提供了很好的技术支持...

展开>> 收起<<
时空数据挖掘及其在交通出行决策系统的应用研究.pdf

共77页,预览8页

还剩页未读, 继续阅读

作者:赵德峰 分类:高等教育资料 价格:15积分 属性:77 页 大小:979.12KB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 77
客服
关注