Post on 11-Jul-2020
Introducción al análisis de redesparte 2
Propiedades globales de redes
Modelos de redes
Clustering en redes
Características topológicas de redes
Diámetro
El diámetro dm de un grafo es la máxima distancia entre
cualquier par de nodos:
dm = max(d
uv)
Distancia media
La distancia media o longitud característica de un grafo es la
distancia promedio entre todos los pares de nodos:
d = <duv
>
Cuando hay distancias infinitas, se calcula la eficiencia,
utilizando las inversas de las distancias:
1/duv
→ 0 para duv
→ ∞ y, deff
= <1/duv
>
Características topológicas de redes
Distribución del grado
Los gráficos y análisis de las curvas de distribución de
grado son una herramienta habitual para analizar la
topología de redes.
Se puede graficar el histograma de la frecuencia, o
probabilidad, de que un nodo tenga grado k:
p(k) : probabilidad de que el grado de un nodo sea k
Características topológicas de redes
Distribución del grado
Características topológicas de redes
Por cuestiones computacionales un gráfico usual que reemplaza al anterior es el de grados de los nodos vs. los nodos ordenados (rankeados) por rango:
En redes muy inhomogéneas* el calculo de la
distribución de p(k) via histogramas es
imprecisa y se dificulta la interpretación
En estos casos funciona mejor la distribución
acumulada del grado, es decir, la probabilidad
de que un nodo tenga un grado mayor que k.
Características topológicas de redes
*: una red es inhomogenea cuando los nodos tienden a agruparse de acuerdo a su grado.
Características topológicas de redes
Mezclado selectivo (assortive mixing)
red no selectiva (disassortive)
Los vértices con alto grado se conectan
preferencialmente con nodos de bajo grado.
red selectiva (assortative)
Los nodos de alto grado se asocian con otros
nodos de alto grado, y los de bajo grado se asocian
entre si.
Las redes sociales tienden a ser selectivas; y las redes biológicas y físicas no selectivas
Mezclado selectivo (assortive mixing)
Correlación de grados
La correlación de grados se puede obtener a partir de la
distribución conjunta p(ki, k
j) de que los nodos i,j tengan
grados ki y k
j.
Para grados no correlacionados la probabilidad conjunta
está dada por el producto de las distribuciones
marginales p(ki, k
j) = p(k
i).p(k
j)
La estimación directa de p(ki, k
j) es computacionalmente
demandante. Es más directo usar el coeficiente de
correlación de Pearson entre el grado de nodos
adyacentes.
Mezclado selectivo (assortive mixing)
Correlación de grados
El coeficiente de correlación o “selectividad” varía entre
-1 y +1:
r < 0 → red no selectiva
r > 0 → red selectiva
Este coeficiente falla para redes muy inhomogéneas,
por ejemplo, redes selectivas para nodos de grado bajo
y no selectivas para nodos de grado alto.
R= - 0.137
Asociación entre grados de vecinos en una red no selectiva
Mezclado selectivo (assortive mixing)
Correlación de grados
Otra medida para evaluar la correlación de grados es el
grado medio de los vecinos (gmv). Para cada nodo i:
Después se puede graficar, por ejemplo, gmv vs. k, o
<gmv> vs. k
Para grafos dirigidos se calcula también la correlación
entre ki
in y los kj
out de los vecinos; o la correlación ki
out
con los kj
in de los vecinos.
gmv=1
∣N i∣ ∑j∈N i
k jN(i): vecinos de I
kj: grado de j
Asociación entre grados y grado medio de los vecinos
Asociación entre grados y grado medio de los vecinos
Mezclado selectivo (assortive mixing)
Indice de coincidencia
i,j: nodos
n(i), n(j): vecinos de los nodos i,j
A: matriz de adyacencia
M ij=∑ vecinos comunes
∑ total de vecinos=
∑k ,l
N
Aik . A jl
ni+ n j−∑k ,l
N
Aik . A jl
Coeficiente de clustering
Coeficiente de clustering
Estima la cohesividad local, midiendo la probabilidad de que
dos nodos que tienen un vecino común, también estén
conectados entre ellos.
Se calcula como el cociente entre el número de aristas
observadas para i y el máximo número posible de aristas:
C = 0.0 C = 0.7
Ci= E
i /E
max
Emax
= ki(k
i-1)/2
Ci = 2E
i / k
i(k
i - 1)
Coeficiente de clustering
Coeficiente de clustering medio o global
C = <Ci>
Muchas redes muestras un coeficiente de clustering
alto, indicando cohesividad local y una tendencia de los
nodos a formar grupos
Mundos pequeños
En muchas redes reales a pesar del gran número
de nodos, las distancias medias son cortas:
d ~ logNv para N
v → ∞
La mayoría de los nodos tienen pocas aristas y un
número pequeño de ellos está altamente
conectado.
También se las conoce como redes libres de escala
Mundos pequeños
Características:
1. La distribución de grados p(k) sigue la ley de
potencia:
p(k) ~ k-γ γ: exponente del grado
2. Los coeficientes de clustering son mayores que los
de grafos al azar con el mismo número de nodos y
vértices (y no debería haber grandes diferencias en el
promedio de las caminos más cortos).
Mezclado selectivo (assortive mixing)
Clustering en triadas
Una triada es un triplete de nodos
Ctriadas
= 3 x nro. triadas / nro. tripletes conectados
3 A, B, C
12 A->B, C
102 A<->B, C
021D A<-B->C
021U A->B<-C
021C A->B->C
111D A<->B<-C
111U A<->B->C
030T A->B<-C, A->C
030C A<-B<-C, A->C
201 A<->B<->C
120D A<-B->C, A<->C
120U A->B<-C, A<->C
120C A->B->C, A<->C
210 A->B<->C, A<->C
300 A<->B<->C, A<->C
Triadas
Prototipos de modelos de redes
Son modelos nulos de redes. Sirven para testear hipótesis.
Ejemplos:
Erdös-Rényi
Es el modelo básico de redes aleatorias, Son Nv nodos
conectados por Ne aristas elegidas aleatoriamente del conjunto
de Nv x (N
v-1) / 2 posibles aristas.
Reproduce propiedades de mundo pequeño, pero no clustering
local.
Prototipos de modelos de redes
Watts-Strogatz
Es una red que comienza como un “lattice” en el que se
intercambian nodos al azar.
Se obtienen redes con elevado clustering local y caminos cortos
en promedio, pero no reproduce otras características de redes
reales.
Ninguno de los modelos anteriores reproduce la inhomogeneidad en la distribución del grado
Prototipos de modelos de redes
Barabási-Albert
Este modelo genera redes con distribuciones de grados que se
corresponden con los de grafos libres de escala.
Se construye agregando aristas de a pasos, y los nodos con
mayor grado tienen mayor probabilidad de recibir una nueva
arista
Testeo estadístico de redes
Comparación contra modelos nulos
Un índice de interés Q de una red se compara contra un conjunto
de redes sustitutas, que son redes generadas aleatoriamente a
partir del modelo nulo, y se evalua de acuerdo a un score:
S=Qred−⟨Qsustitutas⟩
sustitutas
Propiedades adicionales de redes complejas
Robustez: persistencia de propiedades topológicas, como la
distancia media, ante la remoción de nodos o aristas.
Las redes libres de escala son robustas frente a ataques
aleatorios y sensibles a ataques selectivos.
Modularidad: Los módulos son subconjuntos de nodos
conectados densamente entre sí, pero de manera rala con
otros subconjuntos.
A partir de estructuras más simples es posible construir una
red más compleja.
La detección se estas sub-estructuras puede realizarse con
métodos de clustering apropiados
Propiedades adicionales de redes complejas
Modularidad:
m: número de vérticesAij: matriz de adyacenciak: gradosδ(c
i,c
j) =1 si los nodos i,j pertenecen a la misma comunidad,
si no, es cero
Propiedades adicionales de redes complejas
Subgrafos y motivos en redes:
Propiedades locales asociadas a nodos
motivos redes