17 de abril de 2012

Redes

Fagamos nesta ocasión unha pequena incursión na realidade, ou mellor nalgunhas ideas –que aínda non son definitivas– sobre a realidade biolóxica e física. O estudo actual dos sistemas biolóxicos caracterízase pola análise das relacións entre diferentes compoñentes biolóxicas en lugar de cada compoñente en si mesma. Inténtase comprender as funcións biolóxicas a partir dunha rede de interaccións entre moléculas, que adoita estar modelada por un grafo, orientado ou non [1], cunha combinatoria e unha topoloxía complexas. Os biólogos interésanse daquela por redes complexas como a rede de regulación xénica, que describe as relacións entre os xenes e as proteínas, a rede de interaccións proteína-proteína, que contempla as relacións entre proteínas, ou a rede metabólica, que intenta modelizar as reaccións metabólicas dun organismo [2].

Figura 1
A figura mostra a rede de interaccións do lévedo Saccharamoyces cerevisiae onde os 1870 nós representan proteínas e os 2240 arcos interaccións físicas entre estas proteínas [3].

As redes neuronais e as redes alimentarias son outros exemplos coa mesma orixe, pero hai redes sociais de actores ou de matemáticos, redes de información como as redes de citas, Internet ou a World Wide Web e redes tecnolóxicas como as redes das centrais eléctricas dun país ou Internet2 que non teñen unha raíz biolóxica. Todas estas redes posúen algunhas propiedades comúns como a existencia de «camiños curtos» en promedio [4] –o efecto «small world» ou «do mundo pequeno» [5]–, unha elevada taxa de agregación ou «clustering» [6] –de maneira que os veciños dun nó sempre teñen outros veciños– ou a distribución do grao dos nós segundo unha lei de potencia [7] –con moitos nós feblemente conectados e poucos fortemente conectados–.

En 2002, o equipo do profesor Uri Alon do Weizmann Institut of Science observou que estas redes conteñen pequenos subgrafos sobrerrepresentados, aos que chamaron motivos [8]. As súas frecuencias de aparición son máis altas que as correspondentes en grafos aleatorios coa mesma distribución de nós. Presentan tamén altas taxas de conservación entre os diferentes organismos. Velaquí os motivos sobrerrepresentados na rede neuronal do nematodo Caenorhabditis elegans (252 neuronas e 509 conexións):

Figura 2
A idea dunha función biolóxica asociada aos motivos da rede neuronal deste pequeno verme, que se converten daquela en módulos funcionais, é moi suxestiva. Pero como foi sinalado por outros autores, hai que ter coidado cos falsos positivos derivados do algoritmo de reconexión usado para xerar redes aleatorias e coa agregación local de neuronas favorecida pola estrutura espacial da rede –como acontece coa rede neuronal do verme Caenorhabditis elegans[9]. Non obstante, a proposta dunha modularidade propia de certas redes biolóxicas (onde a agregación de módulos funcionais simples –presentes en moi diferentes especies– conduce a amplas e complexas estruturas, superpostas e fortemente vencelladas, características de cada especie) segue a ser moi atraente, cando menos para un matemático [10].

Hai diferentes modelos que se propoñen aprehender as propiedades esenciais das redes do mundo real. O modelo aleatorio de Erdös-Rényi, que se obtén conectando cada par de nós con probabilidade 0 ≤ p ≤ 1, posúe a propiedade de «camiños curtos» propia dos «mundos pequenos», pero non as outras propiedades. O modelo de Watts-Strogatz permite aumentar a taxa de agregación, pero a distribución do grao dos nós segue sendo poisoniana. Para construír un modelo cunha distribución do grao que siga unha lei de potencia, pódese usar un algoritmo, chamado modelo de Barabási-Albert, consistente en engadir un novo nó e conectalo cos existentes (enumerados i=1,...n) cunha probabilidade
que se di de conexión preferente, proporcional ao grao ki de cada nó i. Trátase de modelos, chamados  sen escala, moi robustos ou insensibles aos erros aleatorios, pero vulnerables aos ataques dirixidos contra os nós de grao alto ou  «hubs». Pero neste modelo a taxa de agregación tende a 0 cando o tamaño da rede aumenta, un feito que non se corresponde coa observación. A noción de rede xerárquica, introducida por E. Ravasz do equipo de A. L. Barabási, pretende eliminar este problema [11]. Trátase de combinar de maneira recorrente pequenos conglomerados de motivos. Velaquí un exemplo de rede xerárquica, descrita no artigo de Ravasz, onde o centro dun «módulo central» conéctase cos «nós periféricos» (pertencentes aos submódulos periféricos) de tres «módulos  periféricos» e os centros destes módulos están interconectados.

Figura3
Sinalemos que calquera subgrafo finito pode atoparse nunha veciñanza de  calquera nó de radio limitado. Non obstante, o carácter repetitivo de esta rede é menos ríxido que no caso do mosaico de Kepler-Penrose ou da árbore de Kenyon onde calquera motivo atópase de maneira fiel, é dicir tendo en conta as arestas presentes e ausentes. Nas redes xerárquicas, a taxa de agregación aproxímase a unha constante –que vale 0,606 no exemplo anterior– independente do número de nós, pero a función c(k), que mide a tasa de agregación dos nós de grao k, segue unha lei de potencia
neste caso. Ravasz e os seus coautores usan este tipo de rede para modelizar a rede metabólica do bacilo Escherichia Coli. O proceso ilustrado na seguinte figura permítelles reducila a unha rede modular e servirse da lei de escala para concluír que se trata dunha rede xerárquica [12].

Figura 4
Como dixen nun principio, trátase de ideas que non son definitivas. Pero, discutidas ou non, debuxan na miña opinión un interesante bosquexo do papel da bioloxía nas matemáticas do futuro [13]. Unha ollada ás matemáticas dos inicios do século XX, agora que se conmemora o centenario da morte de Henri Poincaré, pode darnos unha idea do alcance do desafío e dos seus perigos. 

Tradución do billete «Réseaux»

Traducido ao italiano por Elena Toscano no sitio
Società Italiana di Matematica Applicata e Industriale


[1] Un grafo dise orientado se cada aresta pode identificarse cun par ordenado, dotado polo tanto dunha orientación natural. Si se esquece a orientación definida pola orde dos extremos de cada aresta, o grafo trócase en non orientado.

[2] Os lectores francófonos atoparán información neste sitio web que contén as notas de diferentes cursos de Alessandra Carbone.

[3] Os termos vértice e aresta usuais na teoría de grafos son substituídos frecuentemente por e arco cando se fala de redes. Chámase  grao ou valencia dun nó ao número de nós veciños ou conectados mediante arcos (que coincide co número de arcos que parten dun nó se non hai arcos múltiples).

[4] A distancia media entre dous nós vén dada por 
 
onde n é o número de nós e dij é a distancia mínima entre dous nós. Nunha rede de tipo «mundo pequeno», esta distancia é pequena.

[5] Pensemos en Hollywood onde «case todo o mundo» traballou con Kevin Bacon.

[6] A taxa de agregación ou «clustering» dunha rede é o promedio das cantidades 

asociados aos nós v onde ev representa o número de arestas entre veciños de v e kv o grao de v. Cando se di que unha rede real ten unha alta taxa de agregación, estase a comparar a súa taxa coa taxa correspondente dunha rede aleatoria.

[7] Desde un punto de vista determinista, dise que o grao dos nós dunha rede segue unha lei de potencia se o número de nós de grao k 

onde factor e expoñente son constantes. Se se pensa no número de nós como unha variable aleatoria, falarase dunha lei de potencia se a fracción do número de nós de grao k tende á cantidade
cando k se fai cada vez máis grande. Escríbese daquela
Os grafos aleatorios seguen unha distribución de Poisson 

[8] R. Milo, S. Shen-Orr, S. Itzkovitz, N. Kashtan, D. Chklovskii, U. Alon, Motifs: Simple Building Blocks of Complex Networks. Science, 298 (2002), 824-827.

[9] Y. Artzy-Randrup, S. J. Fleishman, N Ben-Tal, L. Stone, Comment on "Network Motifs: Simple Building Blocks of Complex Networks" and "Superfamilies of Evolved and Designed Networks". Science, 305 (2004), 1107. Neste traballo, os autores constrúen unha «rede de xoguete» a partir dos nós dun retículo de 30 ¥ 30 cadrados de maneira que a probabilidade de conectar dous nós cun arco decrece coa distancia seguindo unha distribución gaussiana. Os motivos presentes na rede neuronal do verme C. elegans están tamén sobrerrepresentados nesta rede aleatoria.

[10] Da mesma maneira que a árbore de Kenyon me evoca a prosa de Kafka e a música de Bach, a lectura de epílogo do libro An introduction to systems biology de Uri Alon (publicado por  Chapman & Hall en Boca Raton no ano 2007) sobre o papel da modularidade e da probabilidade nos sistemas biolóxicos faíme pensar inevitablemente nos seus compañeiros –as árbores indistinguibles da árbore de Kenyon – e nos mosaicos de Penrose.

[11] E. Ravasz, A. L. Somera, D. A. Mongru, Z. N. Oltvai, A. L. Barabási, Hierarchical organization of modularity in Metabolic networks. Science, 297 (2002), 1551-1555.

[12] Hai autores como John Doyle que critican esta aproximación e propoñen outros modelos para explicar a arquitectura de certas redes –relacionadas adoito coa enxeñería informática e industrial– que non teñen as propiedades das redes xerárquicas. A lei de escala da taxa de agregación é daquela unha condición necesaria, pero non suficiente para a existencia dunha estrutura xerárquica. O modelo HOT («Highly Optimized Tolerance» ou «Heuristic Optimized Tradeoff») proposto por  Doyle –que intenta atopar unha maneira de optimizar a capacidade dunha rede baixo limitacións tecnolóxicas ou económicas– preténdese oposto ao de Ravasz, é dicir, «disimilar» e con «escala rica». Pero a existencia dun núcleo neste modelo é parecida á do núcleo no mosaico de Durero: aínda que a estrutura non sexa repetitiva ou autosimilar (nun sentido a precisar), iso non significa que a rede non conserve algún tipo de repetitividade ou autosimilaridade consubstancial á noción de modularidade.


Figura 5 : (a) Modelo de Barabási-Albert (b) Modelo sen escala (c) Rede ineficiente (d) Rede HOT
[13] Non estou a pensar só nas «mathematical sciences», senón tamén nas «core mathematics» repetindo as fórmulas empregadas recentemente por F. Quinn na revista Notices of the American Mathematical Society.


Créditos de figuras


Figura 1: Imaxe do artigo de H. Jeong, S. P. Mason, A.-L. Barabási et Z. N. Oltvai, Lethality and centrality in protein networks. Nature, 411, 41-42 (3 May 2001) doi:10.1038/35075138

Figura 4: Imaxe do artigo de E. Ravasz, A. L. Somera, D. A. Mongru, Z. N. Oltvai, A. L. Barabási, Hierarchical organization of modularity in Metabolic networks. Science, 297 (2002), 1551-1555.

Figura 5: Imaxe do artigo de John C. Doyle, David L. Alderson, Lun Li, Steven Low, Matthew Roughan, Stanislav Shalunov, Reiko Tanaka, Walter Willinger, The ‘‘robust yet fragile’’ nature of the Internet. Proc. Natl. Acad. Sci. USA, 102 (41) (2005), 14497-14502.