ERGM 是什么?
指数随机图模型 (Exponential random graph models,ERGMs) 是一种用于解释社会网络(或图网络)结构特点及其形成因素的统计模型。如果研究中涉及到网络图,同时有一些针对网络结构因素的假设待验证,应用 ERGM 方法将有助于研究者厘清这些结构因素在网络中所起的作用。
ERGM 某种程度上有点类似于统计中的回归模型,构建并发现多个解释变量(independent variables)与被解释变量(dependent variable)之间的关系,通过回归模型我们可以量化解释变量对被解释变量的影响大小及显著性(the size and significance of the effect of each variable)。
为更好学习并掌握该方法的使用,将中英文常用资料来源列示如下,以作备查。
ERGM 学习资源
中文资源
英文资源
introducing the ergm package The paper introduces the ergm package by Hunter et al., the package developers,该论文目前已下载在移动硬盘
hands-on tutorial on ERGM Benjamin Lind’s blog over at Bad Hessian on using ERGMs to model the hookup network on the TV show Grey’s Anatomy.
An introduction to exponential random graph (p*) models for social networks Socia Networks 期刊上关于 ERGM 方法与应用的特刊,便于对方法原理、应用场景的了解。
Markov Chain Monte Carlo Estimation of Exponential Random Graph Models Tom Snijders goes into more detail on estimation methodology, and includes an appendix with a much better estimation algorithm. 对 ERGM 模型中使用的 MCMC 估算算法的深入介绍
Implementing an ERGM from scratch in Python 作者用 python 手写代码实现简单的 ERGM ,以加深对模型算法的了解
QAP检验:计算两个网络的关联 当知道一组个体之间的两种关系网络,可以计算这个两个关系网络之间的相关程度,使用 R 中的 sna 包来计算网络相关系数(调用 qaptest 函数完成),示例代码如下:
# R程序11-8:计算网络的皮尔逊相关系数
install.packages("statnet")
library(statnet)
# 首先随机生成3个由10个节点构成的有向网络
g=array(dim=c(3,10,10))
g[1,,] = rgraph(10)
g[2,,] = rgraph(10,tprob=g[1,,]*0.8) # 设置g1和g2两个网络强相关
g[3,,] = 1; g[3,1,2] = 0 # g3接近于一个派系(clique)
# 绘制这3个网络
par(mfrow=c(1,3))
for(i in 1:3) {
gplot(g[i,,],usecurv=TRUE, mode = "fruchtermanreingold",
vertex.sides=3:8)}
#计算网络的相关矩阵
gcor(g)
# R程序11-9:矩阵的随机置换方法
j = rgraph(5) # 随机生成一个网络
j #看一下这个网络的矩阵形式
rmperm(j) #随机置换后的网络的矩阵形式
# R程序11-10:QAP检验
q.12 = qaptest(g, gcor, g1 = 1, g2 = 2)
q.13 = qaptest(g, gcor, g1 = 1, g2 = 3)
# 看一下QAP输出的结果
par(mfrow=c(1,2))
summary(q.12)
plot(q.12)
# 拒绝原假设,图1和图2显著相关
summary(q.13)
plot(q.13)
# 接受原假设,图1和图3不相关
- qdap Package Vignette qdap (Rinker, 2013) is an R package designed to assist in quantitative discourse analysis. The package stands as a bridge between qualitative transcripts of dialogue and statistical analysis and visualization.