基于复杂网络的中国教育网研究

VIP免费
3.0 牛悦 2024-11-19 5 4 1.86MB 71 页 15积分
侵权投诉
摘 要
近年来,复杂网络作为复杂系统的一般抽象和描述方式,其研究得到了深入
的发展,国内外学者从网络结构、网络上的动力学、网络演化等角度对复杂系统
做了大量的实证研究,并取得了一系列理论研究成果。以复杂网络形式研究复
系统,可以加深人们对系统结构的深入了解。中国教育网(囊括了中国各个高校
的校园网信息)是一个很典型的信息网络。近年来随着互联网的快速发展以及高
校的发展,中国教育网也得到了很大的发展并形成了一个复杂系统。
迄今为止,国内大多数人都是进行因特网的研究,很少有人从复杂网络的角
进行万维网的网络结构研究。本文采用复杂网络系统理论的思想,SQL Server
2000 作为后台数据库,VC 作为前台的数据计算工具,进行中国教育网的网络拓扑
结构实证研究。
本文首先收集了中国教育网在 2008 年各个高校所含静态网页和这些网页间链
接。通过近一个月的数据收集,总共获得 2528708 个网页和 30853157 个链接。
依此构造了 2008 年的中国教育网,其网络中网页和网页间的链接分别构成中国教
育网中的节点和有向边。其次,对中国教育网的网络统计特性进行了分析,包括
其网络度分布,群聚系数等。通过对中国教育网的网络特性的分析证实中国教育
网为一个具有小世界特性的无标度复杂有向网络。同时,由于实际网络中网页和
链接在不断的变化,本文对中国教育网在不同的时间点的网络拓扑结构、蝶形结
图进行了分析比较。通过比较发现中国教育网在其网络规模上有着很大的变化,
但是在其内部的结构上变化比较小。最显著的变化就是网络分层的层数变得更多。
然后,针对中国教育网的网络特点,提出了一个基于地区的社团结构划分算法,
并利用收集的数据进行实证分析证实了该算法的有效性。最后,对本文的工作进
行了总结,并对进一步深入研究中国教育网进行了展望。
关键词:复杂网络 中国教育网 小世界 无标度 社团结构 大规模网络
ABSTRACT
As the general abstract method and description way of complex system, complex
networks research gained great progress. Scholars at home and aboard have did a lot of
empirical researches on complex systems in the view of network structure, dynamics on
the network, network evolving, et al, and have obtained a series of theoretical research
results. Analyzing the complex system by using the method of complex network can
deepen people’s further understanding of the system structure. China Education
Network, involving all the pages of China’s universities, is a typical information
network. In recent years, with the rapid development of the Internet as well as the
development of colleges and universities, China Education Network has obtained a
great deal of development and turned to be a complex system.
So far, most of domestic scholars have been focus on Internet research. Barely
researches are about WWW network structure from the view of complex network. This
thesis, basing on the complex network system theory, analysis and study the topological
structure of China Education Network by using SQL Server2000 Database as the
background Database and Visual C++ as the calculation tool.
In the first place, this thesis has collected all the pages in static state of China
Education Network in 2008 and the links between these pages. We have obtained
2528708 pages and 30853157 links, which had cost about a month to be collected. And
basing on these data, we have constructed the China Education Network in 2008, in
which the pages and links between pages of universities network refer to the nodes and
direct edges, respectively. Second, this thesis has analyzed the statistic characteristics of
China Education Network, including the degree distribution of the network, the
clustering coefficient and so on. According to the analysis of network specialties, it can
be confirmed that China Education Network is a free scale complex direct network with
small world characters. Meanwhile, as the pages and links in the actual networks have
been changing in time, this thesis has compared the network topological structure and
bow tie pictures of China Education Network in different time. The result indicates that
the scope of China Education Network had changed tremendously. But the change in the
internal structure is not comparatively small. The most distinct change is that there are
more levels in the network. Then, a community structure analysis algorithm have been
presented, aimed to analysis the community structure of China Education Network and
the validity of the algorithm have been proved by using the practical data of China
Education Network. Last, several expectations have been come up for the further
analysis of China Education Network’s structure.
Key Words: complex networks, China Education Network, small world,
scale free, community structure, large-scale network
目 录
摘 要
ABSTRACT
第一章 绪 论 ............................................................................................................1
§1.1 研究背景 ....................................................................................................1
§1.2 研究的目的和意义 ....................................................................................2
§1.3 研究任务与论文内容安排 ........................................................................3
第二章 复杂网络研究概述 ......................................................................................5
§2.1 引言 ............................................................................................................5
§2.2 复杂网络实证研究的现状与发展 ............................................................8
§2.3 万维网以及教育网的研究情况 ................................................................9
§2.4 复杂网络静态特性概述 ..........................................................................10
§2.4.1 度及其相关属性 ............................................................................10
§2.4.2 平均路径长度以及距离分布 ........................................................12
§2.4.3 群聚系数及其相关性 ....................................................................13
§2.5 社团结构研究概述 ..................................................................................13
§2.5.1 社团结构分析 ................................................................................14
§2.5.2 社团结构划分方法 .........................................................................15
第三章 中国教育网拓扑结构分析 ........................................................................17
§3.1 中国教育网概述 ......................................................................................17
§3.2 中国教育网网络的构建 ..........................................................................17
§3.2.1 中国教育网网络数据的选取 ........................................................17
§3.2.2 中国教育网网络数据库的建立 ....................................................18
§3.2.3 中国教育网网络的建立 ................................................................20
§3.3 中国教育网的统计属性 ..........................................................................21
§3.3.1 节点度及其相关属性 ....................................................................21
§3.3.2 平均最短路径 ................................................................................23
§3.3.3 群聚系数及其相关性 ....................................................................26
§3.4 中国教育网在不同时间点的结构对比 ..................................................27
§3.4.1 度分布比较 ....................................................................................28
§3.4.2 抽取十所学校的子网对比 ............................................................29
§3.4.3 中国教育网的蝶形结图 ................................................................30
§3.4.4 小结 ................................................................................................32
§3.5 本章小结 ..................................................................................................33
第四章 中国教育网社团结构分析 ........................................................................34
§4.1 引言 ...........................................................................................................34
§4.2 一种针对中国教育网实际情况的社团划分算法 ..................................35
§4.2.1 背景介绍 ........................................................................................35
§4.2.2 算法介绍 ........................................................................................35
§4.3 实验分析 ..................................................................................................38
§4.3.1 实验数据 ........................................................................................38
§4.3.2 子网社团结构分析 ........................................................................39
§4.3.3 最终结果分析 ................................................................................45
§4.4 本章小结 ..................................................................................................47
第五章 总结与展望 ................................................................................................49
§5.1 论文总结 ..................................................................................................49
§5.2 展望 ..........................................................................................................50
......................................................................................................................52
参考文献 ..................................................................................................................62
在读期间公开发表论文和承担科研项目及取得的成果 ......................................67
........................................................................................................................68
第一章 绪 论
1
第一章 绪 论
§1.1 研究背景
我们生活在一个充满了各种网络的世界中,如通信网、各种交通运输网、合作
网、社会关系网络等。这些网络都属于复杂网络的研究领域。近年来在复杂动力
网络的研究中有两项比较重要的发现:小世界 (Small-world)
(Scale-free)网络模型。前者指貌似庞大的网络其实是个小世界,即网络中大多数节
点间有较短的连接(路径);后者指复杂网络的连接度分布呈某种幂率指数形式。
研究表明,现实世界中许多复杂网络都是具有小世界或无标度特性的网络:从生
物体中的大脑结构到各种新陈代谢网络、从因特网到万维网、从大型电力网络到
全球交通网络、从科研合作网络到各种政治、经济、社会关系网络等等,数不胜
数。因此,复杂动力网络的研究引起了不同学科的广泛重视和关注。今天,复杂
动力网络的研究正从数学和工程技术科学渗透到社会科学、物理学、以及医学、
生物学等众多不同的学科。对网络复杂性的定量计算与定性特征的科学理解以及
对网络拓扑结构如何影响其动力学行为的研究已成为一项极其重要而富有挑战性
的科研课题。
近几年来,复杂动力网络研究之所以受到了不同学科的广泛关注并取得了比
较重大的进展,其主要原因在于:1)随着大型和快速计算能力的日益提高,世
界上已逐步建立起了一些有关大型复杂网络的拓扑结构的数据库,进而激发起了
人们从理论、仿真和实际数据验证三方面研究复杂网络的浓厚兴趣。2学科
间的相互交叉和融合趋势在不断加强,使得人们有能力在对各种不同类型网络的
数据分析的基础上,揭示复杂动力网络的一些共有的特征和性质。3)人们认识
到传统的分解方法试图把对复杂动力网络的研究分割为对各个孤立单元(独立的
动力系统)的研究尽管取得了很大的成功,但却存在明显的局部分析的局限性。
以分割法和组合论相结合为特色的复杂性科学的兴起促使人们开始用复杂性理论
与研究复杂动力网络的拓扑结构、产生机理、以及动力学行为。4)大量的数据
和观察表明,复杂网络与非线性动力学理论分不开。以因特网为例,网络拥塞控
制系统事实上会因控制不当而产生复杂的分岔和混沌行为,这使得结构上复杂的
网络变得行为上也复杂,从而对研究工作产生更大的挑战性。
复杂动力网络研究工作的迅猛发展表明:非线性、连接性、以及复杂问题的
研究已经使人类对自然界的认识产生了新的飞跃,并取得了重要的进展。如何把
基于复杂网络的中国教育网研究
2
复杂网络理论、动力系统理论和现代控制理论三种科学理论有机地结合起来,深
入地研究复杂动力网络的分析与控制方法,是十分重要的。人们预言21世纪是复
杂性的世纪,复杂性研究将在新世纪获得重大的突破,并将展示美好的应用前景。
而复杂动力网络的研究涉及到广泛的交叉学科,也是复杂性理论研究的一部分,
它将是新世纪科学研究的前沿课题之一。
§1.2 研究的目的和意义
随着国际互联网的高速发展,万维网的规模在不断增加,为人们提供了便捷
的信息交换和通信服务,成为各个领域的研究重点。目前对万维网的研究主要集
中在其拓扑结构和演化模型两个方面。了解万维网的结构及其演化规律对理论研
究有许多实际意义。对其拓扑结构理解得越深刻就越有可能设计出更好的搜索策
略以进行分组和分类、改善浏览时间、改进搜索引擎的功能,还可提出更符合实
际的模型来描述万维网的演变,从而产生新的演化算法思路。
但是,单独对万维网来说,其规模之庞大,难以想象,而其中网页及其链接
的变化也瞬息万变。中国教育网囊括各个大学的学校网络信息,可以看作是万维
网的一个分支。将复杂网络理论应用于网络信息领域,不仅可以为复杂网络理论
研究提供应用背景,丰富复杂网络理论研究的实证基础;还可为中国教育业的研
究提供新的思路,从而加强基础教育研究以及复杂网络理论、系统科学等基础科
学的交叉融合。甚或,通过研究现实网络的静态统计特性来寻求现实网络具有的
共性及其发展规律。因此,本文选取中国教育网为研究对象,运用复杂网络的
想和方法对中国教育网的结构进行研究。
除此之外,中国教育网的拓扑结构研究同样也具有现实意义。近期,中国科
学评价研究中心在武汉发布“中国一流大学排行榜”,首次明确提出“中国一流大
学”的概念和标准,并首次引入大学网络影响力指标代替社会声誉指标。在该评
价指标体系中,该中心引入“大学网络影响力”指标替代“社会声誉”三级指标,
占学校声誉指标的 50%。该指标包括学校的网站规模、网站被链接数、网络显示
度、网站内容丰富度和网络学术影响力等 5个四级指标。这充分体现了网络对于
社会影响力的逐渐增加。同时也体现了中国教育网的蓬勃发展。而本文对中国教
育网的研究中也包含对学校网站规模和网站被链接数的分析,即各学校所含网页
数及链接数与网站的出度和入度数的分析。一定程度上,网络的规模、其度的大
小以及学校间网络的链接体现了一个学校的发展状况。通过对中国教育网的研究,
有助于学校找到学校发展过程中的不足,有助于学生了解各个学校之间的差异,
第一章 绪 论
3
也有助于加深教育界对中国教育情况的了解。
因此,对中国教育网这样一个典型的规模庞大的复杂网络系统的研究是非常
必要的。作者花费了近一个月的时间,同时在几台机器上进行中国教育网的数据
收集,最终获得中国教育网 2528708 个网页和 30853157 个链接。并依次对中国教
育网的拓扑结构进行了详细的实证分析以及对中国教育网在几年之间的结构变化
进行了一系列的对比分析。
同时,由于中国教育网的网络规模非常庞大以及计算机的物理限制,以往的
社团结构划分算法不足以对中国教育网进行分析。以各个学校为单位,中国教育
网中学校之间网页的链接相对于各个学校内部网页的链接来说是非常少的。针对
这一特点,本文提出了一个基于地理分区的社团结构并行算法,解决了计算机的
物理问题,同时也提高了中国教育网社团结构划分所需时间的问题。该算法同样
适用于类似中国教育网这样大规模的,可以被划分为几个子网,且子网间的节点
连接较少,子网内部的链接非常多的网络。
§1.3 研究任务与论文内容安排
本课题主要是对中国教育网网络结构的实证分析及算法分析。为了更好的获
取中国教育网的网络数据,我们实时的使用网络爬虫并运用深度优先搜索算法进
行中国教育网的数据搜集更新。我们使用了复杂网络的方法,对中国教育网的各
种静态特性和社团结构进行了分析比较。并提出了一个针对中国教育网网络结构
的快速的社团结构划分算法。
论文的内容将作如下安排:
第一章阐述了论文的研究背景、目的和意义,并提出了研究任务和全文的结
构安排。
第二章首先系统概述了当前复杂网络的发展和实证研究的现状。其次介绍了
复杂网络的一些静态统计特性,包括网络的度及其相关属性、网络的平均路径长
度以及距离分布和网络的群聚系数。最后概述了复杂网络社团结构的研究情况以
及划分社团结构的一些算法。
第三章和第四章是本文的重点。本文第三章对中国教育网的构成和复杂网络
静态统计特性进行了分析。首先,详细介绍了中国教育网的构造过程以及中国教
育网的各项统计特性。其次,对中国教育网的拓扑结构进行了分析。通过理论分
析和统计数据表明,中国教育网是一个具有小世界特性的无标度网络。最后,对
不同时间点的中国教育网的网络结构和一些统计特性进行了比较分析。通过对不
摘要:

摘要近年来,复杂网络作为复杂系统的一般抽象和描述方式,其研究得到了深入的发展,国内外学者从网络结构、网络上的动力学、网络演化等角度对复杂系统做了大量的实证研究,并取得了一系列理论研究成果。以复杂网络形式研究复杂系统,可以加深人们对系统结构的深入了解。中国教育网(囊括了中国各个高校的校园网信息)是一个很典型的信息网络。近年来随着互联网的快速发展以及高校的发展,中国教育网也得到了很大的发展并形成了一个复杂系统。迄今为止,国内大多数人都是进行因特网的研究,很少有人从复杂网络的角度进行万维网的网络结构研究。本文采用复杂网络系统理论的思想,以SQLServer2000作为后台数据库,VC作为前台的数据计...

展开>> 收起<<
基于复杂网络的中国教育网研究.pdf

共71页,预览8页

还剩页未读, 继续阅读

作者:牛悦 分类:高等教育资料 价格:15积分 属性:71 页 大小:1.86MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 71
客服
关注