Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2...

Introducción al análisis de redesparte 2

Propiedades globales de redes

Modelos de redes

Clustering en redes

Características topológicas de redes

Diámetro

El diámetro dm de un grafo es la máxima distancia entre

cualquier par de nodos:

dm = max(d

Distancia media

La distancia media o longitud característica de un grafo es la

distancia promedio entre todos los pares de nodos:

d = <duv

Cuando hay distancias infinitas, se calcula la eficiencia,

utilizando las inversas de las distancias:

→ 0 para duv

→ ∞ y, deff

= <1/duv

Distribución del grado

Los gráficos y análisis de las curvas de distribución de

grado son una herramienta habitual para analizar la

topología de redes.

Se puede graficar el histograma de la frecuencia, o

probabilidad, de que un nodo tenga grado k:

p(k) : probabilidad de que el grado de un nodo sea k

Distribución del grado

Por cuestiones computacionales un gráfico usual que reemplaza al anterior es el de grados de los nodos vs. los nodos ordenados (rankeados) por rango:

En redes muy inhomogéneas* el calculo de la

distribución de p(k) via histogramas es

imprecisa y se dificulta la interpretación

En estos casos funciona mejor la distribución

acumulada del grado, es decir, la probabilidad

de que un nodo tenga un grado mayor que k.

*: una red es inhomogenea cuando los nodos tienden a agruparse de acuerdo a su grado.

Mezclado selectivo (assortive mixing)

red no selectiva (disassortive)

Los vértices con alto grado se conectan

preferencialmente con nodos de bajo grado.

red selectiva (assortative)

Los nodos de alto grado se asocian con otros

nodos de alto grado, y los de bajo grado se asocian

entre si.

Las redes sociales tienden a ser selectivas; y las redes biológicas y físicas no selectivas

Correlación de grados

La correlación de grados se puede obtener a partir de la

distribución conjunta p(ki, k

j) de que los nodos i,j tengan

grados ki y k

Para grados no correlacionados la probabilidad conjunta

está dada por el producto de las distribuciones

marginales p(ki, k

j) = p(k

i).p(k

La estimación directa de p(ki, k

j) es computacionalmente

demandante. Es más directo usar el coeficiente de

correlación de Pearson entre el grado de nodos

adyacentes.

El coeficiente de correlación o “selectividad” varía entre

-1 y +1:

r < 0 → red no selectiva

r > 0 → red selectiva

Este coeficiente falla para redes muy inhomogéneas,

por ejemplo, redes selectivas para nodos de grado bajo

y no selectivas para nodos de grado alto.

R= - 0.137

Asociación entre grados de vecinos en una red no selectiva

Otra medida para evaluar la correlación de grados es el

grado medio de los vecinos (gmv). Para cada nodo i:

Después se puede graficar, por ejemplo, gmv vs. k, o

<gmv> vs. k

Para grafos dirigidos se calcula también la correlación

entre ki

in y los kj

out de los vecinos; o la correlación ki

con los kj

in de los vecinos.

∣N i∣ ∑j∈N i

k jN(i): vecinos de I

kj: grado de j

Asociación entre grados y grado medio de los vecinos

Indice de coincidencia

i,j: nodos

n(i), n(j): vecinos de los nodos i,j

A: matriz de adyacencia

M ij=∑ vecinos comunes

∑ total de vecinos=

∑k ,l

Aik . A jl

ni+ n j−∑k ,l

Aik . A jl

Coeficiente de clustering

Estima la cohesividad local, midiendo la probabilidad de que

dos nodos que tienen un vecino común, también estén

conectados entre ellos.

Se calcula como el cociente entre el número de aristas

observadas para i y el máximo número posible de aristas:

C = 0.0 C = 0.7

= ki(k

i-1)/2

Ci = 2E

i - 1)

Coeficiente de clustering

Coeficiente de clustering medio o global

C = <Ci>

Muchas redes muestras un coeficiente de clustering

alto, indicando cohesividad local y una tendencia de los

nodos a formar grupos

Mundos pequeños

En muchas redes reales a pesar del gran número

de nodos, las distancias medias son cortas:

d ~ logNv para N

v → ∞

La mayoría de los nodos tienen pocas aristas y un

número pequeño de ellos está altamente

conectado.

También se las conoce como redes libres de escala

Mundos pequeños

Características:

1. La distribución de grados p(k) sigue la ley de

potencia:

p(k) ~ k-γ γ: exponente del grado

2. Los coeficientes de clustering son mayores que los

de grafos al azar con el mismo número de nodos y

vértices (y no debería haber grandes diferencias en el

promedio de las caminos más cortos).

Clustering en triadas

Una triada es un triplete de nodos

Ctriadas

= 3 x nro. triadas / nro. tripletes conectados

3 A, B, C

12 A->B, C

102 A<->B, C

021D A<-B->C

021U A->B<-C

021C A->B->C

111D A<->B<-C

111U A<->B->C

030T A->B<-C, A->C

030C A<-B<-C, A->C

201 A<->B<->C

120D A<-B->C, A<->C

120U A->B<-C, A<->C

120C A->B->C, A<->C

210 A->B<->C, A<->C

300 A<->B<->C, A<->C

Triadas

Prototipos de modelos de redes

Son modelos nulos de redes. Sirven para testear hipótesis.

Ejemplos:

Erdös-Rényi

Es el modelo básico de redes aleatorias, Son Nv nodos

conectados por Ne aristas elegidas aleatoriamente del conjunto

de Nv x (N

v-1) / 2 posibles aristas.

Reproduce propiedades de mundo pequeño, pero no clustering

local.

Watts-Strogatz

Es una red que comienza como un “lattice” en el que se

intercambian nodos al azar.

Se obtienen redes con elevado clustering local y caminos cortos

en promedio, pero no reproduce otras características de redes

reales.

Ninguno de los modelos anteriores reproduce la inhomogeneidad en la distribución del grado

Barabási-Albert

Este modelo genera redes con distribuciones de grados que se

corresponden con los de grafos libres de escala.

Se construye agregando aristas de a pasos, y los nodos con

mayor grado tienen mayor probabilidad de recibir una nueva

arista

Testeo estadístico de redes

Comparación contra modelos nulos

Un índice de interés Q de una red se compara contra un conjunto

de redes sustitutas, que son redes generadas aleatoriamente a

partir del modelo nulo, y se evalua de acuerdo a un score:

S=Qred−⟨Qsustitutas⟩

sustitutas

Propiedades adicionales de redes complejas

Robustez: persistencia de propiedades topológicas, como la

distancia media, ante la remoción de nodos o aristas.

Las redes libres de escala son robustas frente a ataques

aleatorios y sensibles a ataques selectivos.

Modularidad: Los módulos son subconjuntos de nodos

conectados densamente entre sí, pero de manera rala con

otros subconjuntos.

A partir de estructuras más simples es posible construir una

red más compleja.

La detección se estas sub-estructuras puede realizarse con

métodos de clustering apropiados

Modularidad:

m: número de vérticesAij: matriz de adyacenciak: gradosδ(c

j) =1 si los nodos i,j pertenecen a la misma comunidad,

si no, es cero

Subgrafos y motivos en redes:

Propiedades locales asociadas a nodos

motivos redes

Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2...

Documents

Transcript of Introducción al análisis de redes parte 2inba.agro.uba.ar/dm/files/grafos_2.pdf · parte 2...

Estudio de transiciones de fase topológicas en materiales ...

Evaluación de análisis de clustering jerárquico en datos ...

Estudio de las dimensiones topológicas de Poincaré-Brouwer ...inmabb.conicet.gob.ar/static/publicaciones/iti/ITI-33.pdf · i.t.i. no 33 estudio de las dimensiones topolÓgicas de

Técnicas de clustering para detectar patrones espaciales ...

Propiedades topológicas relativasAndrea Donaji Ruiz Jiménez DIRECTORDETESIS: Alejandro Ramírez Páramo Iván Martínez Ruíz Puebla Noviembre, 2018 Propiedades topológicas relativas

Clustering j boss7

Artículo Cientifico "Clustering of vety low energy particles"

NOCIONES TOPOLÓGICAS

U2. continuidad y equivalencias topológicas

Clustering Dia 5

Clustering Using REpresentatives: An E cient Clustering …wiki.icmc.usp.br/images/1/1b/CURE_BilzaAraujo.pdf · 2018-09-25 · Clustering Using REpresentatives: An E cient Clustering

Análisis De Clustering FIFA Worldcup 2010

Computacion inteligente Clustering Fuzzy. 2 Contenido Conceptos basicos Tipos de clustering Tipos de Clusters La tarea del clustering Nociones.

Clustering Jerarquico

Hier a Chica l Clustering

Computacion inteligente Fuzzy Clustering. Contenido Clustering Fuzzy de las c-medias El algoritmo Parametros del algoritmo Ejemplos de aplicación.

Clustering en redes bayesianas. Implementación en R

Clase 6 Clustering K-Means

GIS-CLUSTERING: Identificación de Clusters

Arquitectura lambda aplicada a clustering de documentos en ...