类型b
这篇综述文章由Saeid Ghafouri和Seyed Hossein Khasteh撰写,他们来自伊朗德黑兰的K. N. Toosi科技大学计算机工程学院。该文章于2020年4月6日发表在《PeerJ Computer Science》上,题为”A survey on exponential random graph models: an application perspective”(指数随机图模型的应用视角综述)。
本文旨在介绍指数随机图模型(Exponential Random Graph Models, ERGMs),并探讨其在多个研究领域的应用。ERGM是一种用于分析网络数据的统计方法,其目标是通过特定特征来呈现一组网络的统计分布。这些特征通常包括重复子图的数量和其他图属性。近年来,由于现实世界现象中的不确定性,许多问题被建模为网络,因此统计分析网络化问题受到了研究人员的特别关注。
主要观点一:ERGM的基本概念和历史背景 ERGM最早由Frank和Strauss在1986年提出,当时被称为马尔可夫图。ERGM的核心思想是通过概率分布函数表示图的存在可能性。每个图都与一个概率相关联,这个概率反映了该图在一类图的概率分布中的可能性。ERGM模型还包括图配置(graph configurations)及其对应的参数。配置是指图中某些节点和边的重复结构,例如三角形或任意长度的环。此外,任何其他图的普查,如边密度,也可以视为图的统计特征之一。Robins等人(2007a)和Lusher、Koskinen及Robins(2012)详细介绍了ERGM的历史和数学背景。
主要观点二:ERGM的估计方法 ERGM模型的参数估计是一个关键步骤。文章讨论了多种估计方法,包括重要性采样(Importance Sampling)、随机逼近(Stochastic Approximation)以及一些新提出的方法。MCMC(Markov Chain Monte Carlo)是最常用的采样方法之一,用于从给定图分布中抽取样本。Metropolis-Hasting算法是MCMC的一种衍生方法,在ERGM研究中广泛使用。此外,Bouranis等人(2017, 2018)提出了基于伪似然估计的新方法,以克服计算复杂性问题。Thiemichen和Kauermann(2017)则提出了一种新的子采样模型,以减少大型图建模的时间消耗。
主要观点三:ERGM的变体 除了基本定义外,ERGM还有多种变体。例如,时间ERGM(Temporal ERGM, TERGM)可以捕捉动态环境中的网络信息,适用于社交网络等随时间变化的网络。广义ERGM(GERGM)和Krivitsky(2012)提出的模型则能够处理加权图。多层网络或多路网络的ERGM扩展模型也被提出,用于处理具有多层次关系的网络。Wang等人(2013)提出了一种适用于多级网络的ERGM模型,考虑了各层级之间的关系。
主要观点四:ERGM的应用领域 ERGM在多个学科中得到了广泛应用。在医学成像领域,Sinke等人(2016)利用ERGM建模脑神经网络,研究不同年龄段大脑网络统计量的变化。在医疗保健领域,Caimo等人(2017)使用ERGM分析医院间患者转诊网络。在经济学和管理学领域,Williams和Hristov(2018)研究了目的地营销组织(DMOs)的网络。在政治科学领域,大量研究使用ERGM进行建模,例如Gallemore和Jespersen(2016)研究了资助部门与资金需求方之间的关系网络。此外,ERGM还被应用于无线网络建模、社会科学研究以及其他领域。
主要观点五:工具和库 为了便于ERGM的应用,文章介绍了几种有用的工具和库。PNet及其扩展MPNet和XPNet是由Wang、Robins和Pattison(2006)开发的独立软件,适合编程背景较少的用户。Statnet是一个R语言包,实现了大多数最先进的ERGM方法和算法,并提供了丰富的可视化选项。此外,Caimo和Friel(2012)将贝叶斯ERGM集成到Statnet库中。
本文的意义和价值 本文全面回顾了ERGM的研究进展及其在多个学科中的应用,为跨学科研究提供了宝贵的见解。尽管已有大量研究探讨了ERGM的应用,但在特定领域的深入研究仍需进一步开展。本文不仅为初学者提供了ERGM方法和应用的入门知识,还指出了未来研究的方向。例如,结合深度学习方法改进ERGM估计,开发Python版ERGM库,以及比较ERGM与新提出的生成图模型(如NetGAN)。本文为推动ERGM在更多领域的应用奠定了基础,具有重要的学术和应用价值。