从图书借阅看人类群体和个体行为的动力学机制

VIP免费
3.0 侯斌 2024-11-19 5 4 3.22MB 72 页 15积分
侵权投诉
摘 要
多种多样的人类行为是纷繁世界中万物发展变化的内在驱动力,定量研究人
类行为有助于从复杂纷纭的现象中揭示人类行为的普遍规律。过去,基于泊松过
程假设,人们认为人类行为的发生是均匀的。随着在电子邮件和传统书信通信中
发现人类行为具有阵发和重尾特征,这种传统假设遭到了质疑,对人类行为的大
量定量研究成果相继产生,由此开创了“人类动力学”的新研究方向,并迅速
起了不同领域学者的密切关注。研究工作的迅猛发展使人类对自然界和人类本身
的认识产生了质的飞跃。
本学位论文首先介绍了人类动力学研究中的基本概念和数学模型,不仅总结
了人类行为在通信、使用网络、工作、自身生理活动和空间迁移中表现出的时空
标度规律,更重要的是指出了一些在现有的研究中被其它学者忽视的内容。然后
以两所图书馆的真实借阅记录为研究对象从群体和个体两个层面分析了读者的借
阅行为,并由此推断人类行为内在的一些普适特征,得出以下结论:
图书的借阅时间在群体层面和个体层面分别服从指数分布和幂律分布;而对
于借还书的间隔时间,群体行为和个体行为都服从幂律分布,且幂指数在 13
之间,并且前者的幂指数要大于后者。说明图书借阅行为具有偏离泊松的阵发和
重尾特征,并且当个体行为叠加形成群体行为时,会使统计规律发生一定的变化。
用重标极差法计算了以借阅量为观测值构成的时间序列的 Hurst 指数和非周
期循环长度,发现人类行为具有长期正相关性和持续性,记忆效应对借阅行为有
强烈影响,并与时间标度有关。群体用户的分形特征表现较为明显,而个体用户
的时间序列中则有一定的波动性;并且不同的用户群之间,以及同一个数据集中
的不同用户之间表现出了显著的个体差异。
通过可视算法将人类行为的时间序列和复杂网络结合在一起,计算了由时间
序列转化得到的复杂网络的拓扑参数,发现群体用户的网络具有无标度特征、小
世界效应和等级结构,而个体用户的网络则只具有以上部分性质。可以认为,人
类的重复性行为发生的时间序列中各个观测值之间存在潜在的密切联系,特别是
对于日常生活中的某些重要时刻。我们还发现只有部分的个体行为网络具有分形
结构和自相似的特征。此外,本文的分析也对于找寻时间序列和复杂网络之间的
关系、网络属性之间的关系以及网络分形结构的起源具有一定的借鉴意义。
关键词:人类动力学 时间标度律 时间序列 分形 可视图 复杂网络
ABSTRACT
Various human behaviors are the intrinsic driving force of the development of
fantastic real world. Quantitative analysis of human behaviors is of great help to reveal
the universal law of human society and the origin of complexity. In the early years, it is
assumed that human behaviors emerge in a homogeneous way. As the characteristics of
bursts and heavy tails being found in human daily actions such as E-mail and post
correspondence, the conventional assumption above has been questioned. From then on,
plenty of achievements have been obtained on the new direction, namely human
dynamics, which attracts much interest from scholars in different fields. The rapid
developments of the study on human behaviors promote the understanding of the nature
and human itself.
In this thesis, some basic concepts and mathematical models are introduced firstly.
We sum up the temporal scaling law in human communication, web access, working
and circadian patterns as well as spatial scaling law in human mobility. More
importantly, some contents being ignored by other scholars are pointed out. After that,
the book-borrowing behaviors are investigated based on the datasets of libraries in two
universities from both collective and individual levels. Some universal characters of
human behaviors are deduced as follows:
The distributions of interval time between borrowing and returning behave
exponential and power-law shapes in collective and individual levels respectively, and
the inter-event time of consecutive borrowing or returning follows power-law
distributions with exponents in range of 1 to 3 in both collective and individual levels. It
is showed that the behaviors of book-borrowing exhibit the property of bursts and heavy
tails which derived from Poisson Process. The statistical law may diverge when
individual behaviors converge into collective behaviors.
The Hurst exponents and length of non-periodic cycles of time series constructed
from the amount of library loans are calculated through Rescaled Range Analysis. The
results indicate that the time series of human behaviors is fractal with long-term
correlation, within which memory plays an important role depending on time scale. The
fractal property appear more obviously in collective behaviors, however, time series of
individual users exhibit fluctuation at a certain extent. Distinct diversity is observed
between the two datasets and among different users in the same dataset.
The time series of human behaviors is bridged with complex network via the
so-called visibility algorithm. Then we studied the topological structure of networks
converted from time series. It is found that the networks obtained from collective users
show the scale-free property, small-world effect and hierarchical structure, meanwhile
the individual networks only have some of the features above. The results imply that
close relationships may exist between the amounts of repetitious actions performed by
people during certain periods of time, especially for some important days in real life.
Furthermore, only parts of networks of individual users show the fractal structure and
self-similar property. Our research may also be helpful for the study of the relationship
between time series and complex network, among the statistical characteristics of
complex network as well as the origin of fractal structure.
Key Word: human dynamics time scaling law, time series, fractal,
visibility algorithm, complex network
目 录
中文摘要
ABSTRACT
第一章 绪论..........................................................1
§1.1 选题背景及研究意义...........................................1
§1.2 本文主要工作.................................................2
第二章 人类动力学研究中的基本概念和数学模型..........................5
§2.1 人类动力学研究中涉及到的分布规律.............................5
§2.2 人类行为动力学模型简介.......................................8
§2.2.1 基于优先权决策的排队模型................................8
§2.2.2 截止时间的影响..........................................9
§2.2.3 基于兴趣的人类动力学模型................................10
§2.2.4 非齐次泊松过程模型......................................11
第三章 人类行为的时空标度规律.......................................13
§3.1 人类行为的时间标度规律......................................13
§3.1.1 人类通信模式............................................13
§3.1.2 计算机网络使用模式......................................15
§3.1.3 人与社会环境的交互模式..................................16
§3.1.4 人类自身的生理活动模式..................................18
§3.1.5 人类行为的时间特征......................................19
§3.2 人类行为的空间标度规律......................................20
§3.2.1 人类的空间迁移活动及数学模型............................20
§3.2.2 人类行为的空间特征......................................22
第四章 基于图书借阅的人类行为标度律分析.............................24
§4.1 数据来源与统计方法..........................................24
§4.2 群体用户借阅行为的统计特征..................................24
§4.2.1 群体用户图书借阅时间的概率分布..........................24
§4.2.2 群体用户借、还书的间隔时间的概率分布....................26
§4.3 个体用户借阅行为的统计特征.................. ................28
§4.3.1 个体用户图书借阅时间的概率分布.................. .......28
§4.3.2 个体用户借、还书的间隔时间的概率分布....................29
§4.4 本章小节.................. .................. ...............31
第五章 基于图书借阅的人类行为分形分析.................. .............32
§5.1 数据说明.................. .................. ...............32
§5.2 图书借阅量的时间序列分析.................. ..................32
§5.2.1
/R S
分析法与 Hurst 指数.................. ...............33
§5.2.2 借阅行为时间序列的 Hurst 指数与非周期循环长度............34
§5.3 图书借阅量可视图的拓扑分析.................. ................37
§5.3.1 可视算法的基本原理.................. ...................37
§5.3.2 借阅行为可视图的统计特征.................. .............38
§5.4 图书借阅量可视图的分形分析.................. ................44
§5.5 本章小结.................. .................. ...............46
第六章 个体用户借阅行为的分形分析.................. .................48
§6.1 个体用户的选取.................. .................. .........48
§6.2 个体借阅行为的时间序列分析.................. ................50
§6.3 个体借阅行为的网络拓扑分析.................. ................51
§6.4 个体借阅行为的网络分形分析.................. ................54
§6.5 本章小节.................. .................. ...............56
第七章 结束语.................. .................. ..................57
参考文献.................. .................. ......................60
在读期间公开发表的论文和承担科研项目及取得成果.....................68
致谢.................. .................. .................. ........69
第一章 绪论
1
第一章 绪论
本章首先简要介绍了本课题的选题背景以及人类动力学的研究意义,然后
绍了关于图书借阅的研究现状和本硕士论文的研究工作和组织结构。
§1.1 选题背景及研究意义
人类行为是一种纷繁复杂的现象,从人猿相揖别起就经历了复杂而漫长的自
然变化和社会变化过程,能够全面深刻地认识自身行为特征一直是人们不懈努力
的一个方向。由于人类行为千差万别,加之影响人的行为的因素也是多种多样的,
单一学科无法完成解释人类行为的重任。长久以来,对人类行为的研究吸引了包
括心理学、社会学、社会心理学、人类学在内的众多学科的共同关注,得到了大
量的定性研究成果[1]这些研究成果有助于揭示人类行为的普遍规律,以便对其进
行有效控制和预测,使人按照一定的社会生产和生活的需要来行动,既能维持社
会生活的正常秩序,又能更好地促进社会和人类自身的发展[2]
由于人是一个系统的存在,而这个系统又可以继续划分为人的个体性和社会
性两个子系统,因此人类行为的发出不仅与个体的生理、心理、认知、情感因素
相关联,还受包括家庭、单位、民族、制度等要素影响[3]“整个世界是相互联
系的”正是系统理论的一个核心观点,因此利用系统理论和复杂性科学解释人
行为成了一个新兴的研究热点。
过去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、
交通部门想要模拟交通流量的模式或事故发生频率、以及网络和街区零售业意欲
改进仓储和服务设置时,人们往往用齐次泊松过程来描述这些问题。2005
Barabasi 发表在 Nature 上的一篇文章[4]却显示人类行为的时间规律具有高度的非均
匀性:在非常长的时间内可能了无一事,而这些长长的空白与空白之间则被阵发
的密集活动所填充。
Barabasi 等人的工作开创了“人类动力学”的新研究方向。尽管这个方向问世
时间很短,但是由于其理论和应用上的双重价值,很快就吸引了数学、系统科学、
统计物理和非线性科学等领域科学家的大量关注,对现实生活、工作中人类活动
的大量定量研究成果不断面世,如商业交易[5]、网页浏览[6-10]、电影点播[11]、在线
游戏[12]、手机短信[13]、邮件通信[14]等,均得到了人类行为发生的间隔时间服从幂
律分布的结论,且幂指数大多分布在 13之间。
随着时间的推进,人类动力学研究不断向着多元化方向发展。各个领域学者
从图书借阅看人类群体和个体行为的动力学机
2
关注的方向不再仅仅局限在人类行为的时间规律上,而是扩展到了空间规律,特
别是人类的迁移规律上;研究的角度也从个体行为层面扩展到了宏观的组织行为
层面和微观的生理现象层面,更加关注人作为一个复杂系统其内部各个要素之间
的联系以及系统与外部环境的相互作用和影响。更重要的是,在实证研究的基础
上进行了大量的理论分析,提出了多种模型来解释这种非泊松统计特征出现的原
因。
人类动力学研究在国际上呈现蓬勃发展之势,国内学者同样给予了足够的重
视,取得了丰硕的成果,包括网页浏览[8-10]书信通信[15]等个体行为,以及图书借
[16]、物流运输[17,18]、医疗就诊[19]、订单采购[20]等群体或组织行为进行了实证分
析和理论研究[21-23]
§1.2 本文主要工作
自古以来,图书就是人类获取信息的重要来源,而图书馆是人类精神财富的
宝库,是人类精神文明的重要组成部分,是人类取之不尽、用之不竭的知识资源。
图书借阅行为是一种重要的人类活动,象征了人类对于信息和知识的追求。分析
图书借阅行为有助于理解人类行为特征,进而为图书馆以及图书借阅系统的设计
提供理论依据。因此,本学位论文将以图书馆用户的借阅行为为研究对象,考察
人类行为的规律和特征。
对于用户的图书借阅行为已有中外学者从不同角度给予了研究,下面几项具
有一定的代表性。Vazquez 等人[5]对圣母大学全体教工的借阅行为进行了统计分析,
得出借阅行为的间隔时间服从指数为 1的幂律分布的结论;傅林华等人[24]和洪少
[25]分别建立了图书借阅关系网,分析了度分布和聚类系数,结果各项统计值均
服从指数分布,而不是人类动力学研究中更常见的幂律分布;李楠楠等人[26]
了图书借阅网的二分图,同样发现项目大小、节点项目度以及节点强度服从指数
分布的统计规律。
纵观现有的人类动力学实证研究,要么是基于单纯的个体行为,如个体用户
的书信或短消息通信,要么是基于汇聚的群体行为,如不区分个体用户的网页访
问。那么个体行为和群体行为之间是什么关系?个体行为如何汇聚为并影响群体
行为?群体行为是否是个体行为的简单叠加?本文将尝试通过对图书借阅行为进
行实证来回答这些问题,因此所有章节的分析将从个体和群体两个层面着手进行
研究。而近年来,一些学者先后在短信通信[27]、股票交易[28,29]和生理活动[30]上发
现了人类行为的分形特征,本文也将从时间序列和复杂网络的角度挖掘图书借阅
行为中十分存在分形特征。
第一章 绪论
3
全文的内容和结构安排如下:
第二章,人类行为动力学研究中的基本概念和数学模型。首先介绍了人类动
力学中阵发和重尾特征的定义,从数学上解释了重尾分布和幂律分布以及其它具
有重尾特征的分布形式。然后介绍了几种人类行为动力学模型,并指出了各种模
型的优点和缺陷。
第三章,人类行为的时空标度规律。从通信、访问网络、工作和自身生理特
征四个方面总结了人类行为的时间标度特征,以及在迁移活动中表现出的空间标
度特征,概括了人类行为中体现的一些普遍规律。
第四章,基于图书借阅的人类行为标度律分析。统计了人类行为同类事件发
生的持续时间——图书借阅时间和同类事件发生的间隔时间——借还书间隔时
间,发现除群体用户的借阅时间外其它统计量都服从幂律分布,说明人类行为具
有显著的非均匀性,并且这种非均匀性与行为个体的活跃程度成正比。
第五章,基于图书借阅的人类行为分形分析。人类每天都要进行大量的重复
性行为,以图书借阅的重复行为在一定时间单位内发生的次数为观测值构造时间
序列,采用重标极差法计算时间序列的 Hurst 指数和非周期循环长度,发现人类行
为具有分形特征;然后用可视算法将时间序列转化为复杂网络,计算了网络的拓
扑参数,发现网络具有无标度特征、小世界效应和等级结构,但不是分形网络
也不具有自相似性。
第六章,个体用户借阅行为的分形分析。从每个数据集中选择部分个体用户
进行分析,方法沿用第五章的重标极差法、可视算法和盒覆盖法,结果发现图书
借阅的个体行为和群体行为具有不同的分形特征,且在表现了显著的个体差异性。
第七章,结束语。概述了本文的主要结论,指出不足之处,同时展望人类动
力学的未来发展方向,期待更进一步地深入学习和研究。
本硕士论文内容安排图如下:
摘要:

摘要多种多样的人类行为是纷繁世界中万物发展变化的内在驱动力,定量研究人类行为有助于从复杂纷纭的现象中揭示人类行为的普遍规律。过去,基于泊松过程假设,人们认为人类行为的发生是均匀的。随着在电子邮件和传统书信通信中发现人类行为具有阵发和重尾特征,这种传统假设遭到了质疑,对人类行为的大量定量研究成果相继产生,由此开创了“人类动力学”的新研究方向,并迅速引起了不同领域学者的密切关注。研究工作的迅猛发展使人类对自然界和人类本身的认识产生了质的飞跃。本学位论文首先介绍了人类动力学研究中的基本概念和数学模型,不仅总结了人类行为在通信、使用网络、工作、自身生理活动和空间迁移中表现出的时空标度规律,更重要的是指...

展开>> 收起<<
从图书借阅看人类群体和个体行为的动力学机制.pdf

共72页,预览8页

还剩页未读, 继续阅读

作者:侯斌 分类:高等教育资料 价格:15积分 属性:72 页 大小:3.22MB 格式:PDF 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 72
客服
关注