La red compleja de la F’sica Estad’stica

 

Albert D’az-Guilera

Departament de F’sica Fonamental

Universitat de Barcelona

 

 

 

Historia

 

En el a–o 1987 tuvo lugar en Barcelona la primera reuni—n a nivel nacional del colectivo de investigadores relacionados con la f’sica estad’stica en Espa–a, lo que hemos llamado FisEs. A partir de entonces, cada a–o y medio han ido teniendo lugar las diferentes ediciones a lo largo de toda la geograf’a nacional. En la p‡gina web de la œltima edici—n del congreso, celebrada en el oto–o del 2003 en Pamplona, se puede obtener una relaci—n, con sus respectivos hiperenlaces (donde los haya), de las ediciones anteriores (http://fises03.fisica.unav.es/historia.html).

 

Durante todos estos a–os, dichas reuniones han dado lugar a multitud de colaboraciones cient’ficas que se han puesto de manifiesto en publicaciones en revistas de prestigio, y tambiŽn en contribuciones a las propias reuniones de la comunidad. Tampoco hay que olvidar, que las reuniones de FisEs se han convertido en un lugar de encuentro donde las relaciones personales juegan un papel tambiŽn muy importante.

 

Desde sus inicios hay un grupo de personas que por su trayectoria han jugado un papel importante en el estado final de la comunidad. Entre estas personas est‡n las que han ido formando parte de los comitŽs cient’ficos, cuyos cargos han tenido siempre una duraci—n de tres congresos. Teniendo en cuenta el nœcleo que forman estas personas, tambiŽn como l’deres mayoritariamente de grupos consolidados, a su alrededor se va gestando la comunidad que conocemos actualmente.

 

Est‡ claro que cada uno de los miembros de la comunidad podr’a aportar su visi—n personalizada de la historia de este colectivo; y es por ello, que desde aqu’ me gustar’a llamar a la participaci—n de todos y que pudierais contribuir con cualquier detalle, anŽcdota, o lo que sea con tal de enriquecer estos contenidos. Pero en este documento, de momento, nos limitaremos a realizar un an‡lisis sistem‡tico de la historia del FisEs a travŽs de la red que las colaboraciones a lo largo de las distintas ediciones han dado lugar.

 

Construcci—n de la red de FisEs

 

En general, una red social es un conjunto de nodos que representan a las personas, y los enlaces corresponden a los tipos de v’nculos que se pueden establecer; estos v’nculos pueden ser relaciones de parentesco, amistad, profesionales, etc.

 

 

 

 

 

Para construir dichos enlaces  se ha recurrido principalmente, a la elaboraci—n de cuestionarios; pero Žste es un mŽtodo que es caro de realizar, dif’cil de evitar sesgos, y, en grandes colectivos, impracticable. Sin embargo, en nuestra Žpoca actual de almacenamiento digital, es mucho m‡s f‡cil acceder a grandes bases de datos de cualquier tipo y construir los enlaces entre los agentes de un determinado colectivo y construir as’ la red social.

 

Para construir la red de FisEs, hemos utilizado las listas de colaboraciones en los p—sters de las diferentes ediciones; habiendo elegido solamente las colaboraciones en los p—sters porque en las contribuciones orales aparece normalmente s—lo el nombre del conferenciante y no todos aquellos que han participado en la investigaci—n presentada.

 

En principio pensamos en utilizar las relaciones de nombres de FisEs y establecer los enlaces a travŽs de la publicaci—n en revistas cient’ficas internacionales. Esta relaci—n ser’a quiz‡s m‡s fiable, sin embargo, el hecho de utilizar bases de datos que contienen nombres y apellidos y cruzarlas con bases de origen anglo-saj—n siempre es problem‡tico, por la cuesti—n del nœmero de apellidos.  

 

Las redes de FisEs

 

A continuaci—n tenemos las redes que se construyen en cada una de las ediciones. En este primer conjunto de gr‡ficos, aparecen los grupos formados por las colaboraciones en cada edici—n. Los c’rculos verdes corresponden a los miembros de los ComitŽs Cient’ficos (el hecho de que aparezcan algunos de Žstos de forma aislada en alguno de los gr‡ficos es debido a que no participaron en ninguna colaboraci—n durante esa edici—n, pero al estar definidos en todo el conjunto de gr‡ficos, el programa de visualizaci—n los tiene en cuenta igualmente).

 

 

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

PalmaÕ88

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

BadajozÕ90

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

GijonÕ91

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

El EscorialÕ93

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SevillaÕ94

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

ZaragozaÕ96

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

GetafeÕ97

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SantanderÕ99

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SantiagoÕ00

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

TarragonaÕ02

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

PamplonaÕ03

 

 

 

 

En el segundo conjunto de redes, mostramos las redes acumuladas, es decir considerando como consolidados aquellos enlaces que se van produciendo con el tiempo. Estas redes nos permitir‡n entonces tener una idea bastante fidedigna de la evoluci—n del colectivo de FisEs.

 

 

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

PalmaÕ88

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

BadajozÕ90

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

GijonÕ91

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

El EscorialÕ93

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SevillaÕ94

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

ZaragozaÕ96

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

GetafeÕ97

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SantanderÕ99

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

SantiagoÕ00

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

TarragonaÕ02

CREATOR: gd-jpeg v1.0 (using IJG JPEG v62), default quality

PamplonaÕ03

 

 

 

 

La red de FisEs

 

En los gr‡ficos anteriores podemos ver el crecimiento de la conectividad en la red de FisEs y como a partir de los nœcleos iniciales, van apareciendo enlaces que hacen que se forme una gran red de colaboraciones, esta ser’a lo que llamamos la ÒComponente principal conexaÓ que esta formada por 841, que representa el 89% de los participantes en todas las ediciones, y que se puede observar en detalle en la siguiente gr‡fica:

AppleMark

 

De entrada, el hecho de que haya un nœmero de nodos tan elevado es sorprendente, pero muchos de estros nodos corresponden a contribuciones puntuales de investigadores que no forman parte realmente de esta comunidad, o bien por razones geogr‡ficas o tem‡ticas. Una idea aproximada del tama–o de la comunidad la dar’a el nœmero de participantes inscritos entre todas las ediciones que puede estar entre 400 y 500.

 

Si echamos un vistazo detallado a esta componente principal conexa podemos ver que el nœcleo de la red est‡ formado por aquellas personas que han ido participando desde las primeras ediciones, que han sido miembros de los comitŽs cient’ficos y que tambiŽn han ido haciendo un mayor esfuerzo de colaboraci—n tanto con grupos de diversa procedencia geogr‡fica como con grupos de diferentes tem‡ticas cient’ficas. Quiz‡s porque han sido los grupos m‡s numerosos, y por extensi—n aquellos que han producido m‡s contribuciones y m‡s colaboraciones tanto internas al grupo como externas, podemos destacar las contribuciones de los grupos en las universidades de Barcelona, de las Illes Balears i de Santander.

 

 

Caracterizaci—n de la red de FisEs

 

La caracterizaci—n de la red se puede hacer desde una perspectiva local, estudiando caracter’sticas individuales de los nodos, como, por ejemplo, las conectividades, las distancias medias o el grado de cohesi—n, o desde una perspectiva global, analizando despuŽs las distribuciones de las diferentes magnitudes o las correlaciones.

 

Lo primero a lo que acostumbramos a mirar en cualquier tipo de red compleja es en la conectividad. En este caso la conectividad de un nodo corresponde al nœmero de coautores a lo largo de todas las ediciones. Aunque el nœmero de colaboradores y el de contribuciones no tienen porque coincidir est‡ claro que entre los dos hay una fuerte correlaci—n. Por lo tanto, aquellos investigadores que tengan un mayor nœmero de colaboradores o contribuciones podemos esperar que hayan jugado un papel importante en el desarrollo de la comunidad, tal y como coment‡bamos en el apartado anterior. Si queremos hacer una descripci—n estad’stica de estas caracter’sticas estudiamos las distribuciones, que representamos en la siguiente gr‡fica:

AppleMark

En esta gr‡fica est‡n representados, en escala log-log, los histogramas de los nœmeros de colaboraciones y contribuciones; podemos ver aqu’ que son distribuciones potenciales, con un decaimiento exponencial en el caso de las contribuciones.

 

El nœmero de conexiones de un nodo nos da una idea de lo importante que es el papel de ese nodo, pero en un entorno muy localizado, ya que tenemos en cuenta el nœmero de conexiones a sus vecinos. Si queremos tener una idea del papel que juega cada nodo dentro de la red global, habremos de mirar otras medidas como pueden ser la distancia media al resto de los nodos.  La distancia media entre nodos dentro de la componente principal conexa es de 5.37, lo que significa que a pesar de la dimensi—n que ha ido tomando la red acumulada en las œltimas ediciones, la red de Fises presenta la caracter’stica "mundo peque–o" en el que las distancias entre nodos escalan logar’tmicamente con el tama–o de la red mientras que se preserva una especie de transitividad (relaciones a tres) entre los nodos de la misma. En este punto es interesante destacar que son precisamente las mismas personas (aunque el orden pueda variar algo), y por extensi—n, los mismos grupos, que forman el nœcleo de la red los que est‡n a distancias medias m‡s peque–as del resto de la poblaci—n (del orden de 3.4), lo cual obedece a ese papel amalgamador que han ido jugando ciertas personas en la historia de la comunidad. En la siguiente gr‡fica se puede ver la distribuci—n de distancias medias en la red:

AppleMark

 

Otra caracter’stica que, al igual que la distancia media al resto de los nodos, nos da una idea de la centralidad de la red es lo que se conoce con el nombre de "betweenness", concepto muy utilizado en el contexto de las redes sociales, cuyo valor numŽrico corresponde al nœmero de caminos m’nimos entre cualquier par de nodos de la red que pasan por un nodo dado. Hemos calculado tambiŽn los valores de la "betweenness" de todos los nodos de la red; aunque la interpretaci—n de esta caracter’stica es diferente a la de la distancia media, significando en este caso quiz‡s cual es el papel que juegan los nodos en lo que hace referencia al flujo de informaci—n en la red, cabe decir que, de nuevo, los nodos de menor distancia media son tambiŽn aquellos de mayor betweenness.

 

Otra de las caracter’sticas de las redes complejas es el grado de correlaci—n entre la conectividad de dos nodos vecinos. Mientras que en las redes tecnol—gicas y biol—gicas encontramos que los nodos con mayor conectividad est‡n principalmente conectados a nodos de menor conectividad y viceversa, en las redes sociales se produce el efecto contrario, es decir que los nodos con mayor conectividad tienden a estar conectados entre ellos. Sin embargo, en el caso de la red de FisEs, nos encontramos con el sorprendente efecto de que esto no se cumple, como podemos ver en la siguiente gr‡fica:

AppleMark

La explicaci—n podr’a estar en el hecho de que los investigadores senior de los grupos aparecen en muchas colaboraciones con los miembros junior, pero que las colaboraciones se establecen entre grupos no a travŽs de los investigadores senior, si no a travŽs de los nodos de menor conectividad, que pueden corresponder tanto a investigadores noveles como a investigadores reconocidos pero fuera de la comunidad en estudio, casos que se pueden identificar muy f‡cilmente en la base de datos, por su aparici—n en diferentes grupos y contextos.

 

Finalmente, y tal y como coment‡bamos al principio, una de las caracter’sticas m‡s relevantes de las redes sociales es la formaci—n de comunidades, que en el caso que nos ocupa tiene una clara interpretaci—n. Para la identificaci—n de estas comunidades uno de los algoritmos m‡s eficientes es el propuesto por Girvan y Newman (GN)[1] que se basa en el concepto de "betweenness" de enlaces. Se define la "betweenness" de un enlace, por analog’a a la de los nodos, como el nœmero de caminos m’nimos entre pares de nodos que pasan por el enlace considerado. As’, el algoritmo tiene en cuenta que aquellos enlaces que tienen una mayor betweenness enlazan comunidades con una fuerte conectividad interna (para m‡s detalles haced clic aqu’). Cortar entonces estos enlaces hace que se separen la comunidades. Mediante el proceso de ir cortando recursivamente los enlaces con mayor "betweenness" se llega a separar la red en dos subredes y as’ se va procediendo generando un ‡rbol binario de escisiones entre comunidades anidadas. Toda la informaci—n sobre la estructura de comunidades de la red original queda reproducida as’ en el ‡rbol binario, donde los nodos negros corresponden a nodos reales de la red y los blancos corresponden a las comunidades. Cuando no hay estructura de comunidades subyacente los nodos van apareciendo a lo largo de las ramas, de tal manera, adem‡s, que los nodos m‡s centrales aparecen en los extremos de las ramas.

 

En el trabajo publicado en European Journal of Physics B[2] hemos analizado mediante este algoritmo varias redes: la red del correo electr—nico en la Universidad Rovira i Virgili, la red de mœsicos de jazz entre los a–os 1912 y 1940, la propia red de colaboraciones en las reuniones nacionales de F’sica Estad’stica y la red de colaboraciones en el repositorio de preprints http://xxx.arxiv.org. No s—lo hemos estudiado la visualizaci—n de las comunidades en el ‡rbol binario, sino que tambiŽn hemos investigado las distribuciones de tama–os de comunidades en las diferentes redes; observando que estas distribuciones tienen un marcado car‡cter potencial, aunque con diferentes exponentes.

 

A continuaci—n presentamos la aplicaci—n del algoritmo anterior a la red acumulada del FisEs

 

AppleMark

 

Lo que podemos ver en esta red es c—mo a lo largo del tiempo, a pesar de las colaboraciones mantenidas, se mantiene una clara estructura de comunidades. En este caso, es f‡cil identificar en las comunidades a los grupos de los diferentes departamentos y universidades, y las colaboraciones m‡s o menos intensas que se han ido estableciendo entre Žstos. Hemos distinguido con color verde a los miembros que han ido perteneciendo a los diferentes comitŽs cient’ficos. En esta figura podemos ver c—mo el criterio que se ha tomado siempre en la elecci—n de los miembros de que fueran apareciendo los diferentes grupos representativos de tem‡ticas y de localizaciones geogr‡ficas es verdaderamente representativo de la comunidad; estos nodos est‡n repartidos de manera bastante uniforme por todo el ‡rbol de comunidades y adem‡s estos nodos se hallan muy cerca de las puntas de las ramas, indicando su importancia relativa en cada una de las comunidades. Pero no s—lo observamos la importancia de ciertos nodos dentro de los grupos, sino que adem‡s podemos visualizar la importancia relativa de ciertos grupos dentro de las comunidades tem‡ticas o geogr‡ficas y finalmente la importancia de determinados sectores dentro de la comunidad global.

 

En cambio si utilizamos un c—digo de colores segœn su afiliaci—n obtenemos la siguiente imagen:

AppleMark

donde podemos observar que hay una gran correlaci—n entre la afiliaci—n y las comunidades de trabajo. Sin embargo, hay que decir que a lo largo de la historia ha ido habiendo cambios de afiliaci—n, y en la gr‡fica se han considerado los œltimos, siempre segœn las inscripciones en las propias ediciones de FisEs. Los colores corresponden a las universidades con mayor representaci—n, mientras que los nodos de color gris corresponden a universidades con menor representaci—n y aquellas ramas sin nodo corresponde a afiliaciones desconocidas o fuera de la comunidad. Por supuesto que una imagen m‡s realista de la comunidad se podr’a obtener considerando solamente aquellos investigadores que se hubieran inscrito en las diferentes ediciones, pero este trabajo lo dejamos como opci—n de futuro.



[1] M. Girvan, M.E.J. Newman, Community structure in social and biological  networks, Proc. Nat. Acad. Sci. USA 99 (2002) 7821.

[2] A. Arenas, L. Danon, A. D’az-Guilera, P.M. Gleiser, R. Guimerˆ, Community analysis in social networks, Europ. J. Phys. B  (en prensa)