Ésta no es una historia típica. Y quizás la forma en que la comenzamos va a dejarlo patente. Nuestro relato terminará con un descubrimiento que puede revolucionar el mundo de la medicina y la biología, pero empieza con un chico cuya máxima aspiración era seguir jugando toda la vida, lo cual incluía el plan perfecto de un adolescente: encerrarse en un sótano y no parar de darle a los videojuegos. Todo ello, pasando por el momento en que el ingenio humano tuvo que hincar la rodilla frente a la tecnología y reconocer que ya no era el más listo de la ̶h̶a̶b̶i̶t̶a̶c̶i̶ó̶n̶ creación.
Vamos a iniciar nuestra narración con este buen señor: Demis Hassabis, un londinense de ascendencia singapurense y grecochipriota (preparaos: la gente del futuro será así). De joven quería ser jugador de ajedrez -llegó a ser considerado un niño prodigio en el campo-, pero lo descartó porque fue testigo de cómo el ordenador Deep Blue derrotaba al campeón mundial Gary Kasparov, y dedujo que las computadoras habían superado en ese aspecto a los humanos. Por cierto, que aquella batalla trajo cola. Durante las partidas en las que el ordenador derrotó al ajedrecista humano, Kasparov le "tendió una trampa" al programa informático, el cual no "picó" en su estrategia. Kasparov sospechó que una mano humana estaba detrás de su derrota, y exigió a los programadores que publicaran los registros de los procesos internos de Deep Blue, para saber si alguien había "ayudado" al ordenador. Los programadores no quisieron responder a sus acusaciones, pero más tarde publicaron dichos registros, y hasta ahora nadie ha sido capaz de confirmar las acusaciones del ajedrecista. Desde entonces, la informática ha progresado mucho, y no sólo en el ajedrez: otro programa fue capaz de derrotar a los dos máximos ganadores del programa televisivo estadounidense Jeopardy. Pero todavía quedaba un reto mayor. Aunque para eso debemos seguir con la historia de Hassabis.
Hassabis era y es una persona interesada en los juegos, y de hecho acabó trabajando como creador de éstos. Por supuesto, se metió en el campo que más le permitía desarrollar su creatividad, que es el del entretenimiento a través del ordenador. No sólo fue muy reconocido a nivel de premios, sino que algunos de los videojuegos que creó fueron tremendamente populares. Pero Hassabis es una persona ecléctica, y mientras desarrollaba un cierto nivel como jugador de póker online, hacía también incursiones en el campo académico, en concreto de la neurociencia (tiene un estudio muy interesante que habla sobre la relación estrecha entre memoria y desarrollo de la imaginación).
De todos modos, tiene pinta de que ya entonces Hassabis miraba más allá, y la experiencia que tenía en la industria tecnológica le sirvió para rodearse de un equipo que le ayudó en su siguiente aventura: Deepmind, una compañía británica de inteligencia artificial especializada en el aprendizaje automático y deep learning. No voy a explicar la diferencia entre estos dos conceptos porque seguro que hay lectores que entienden de este tema mucho más que yo. Sin embargo, voy a exponer lo que creo que es el concepto esencial para los no-iniciados: estos programas de inteligencia artificial son capaces de aprender a partir de sus propios errores y procesos internos, de tal manera que mejoran de modo cada vez más rápido, en un progreso exponencial. Deepmind (adquirido en 2014 por Google) se especializa en muchos asuntos distintos, pero lógicamente se encaminó a un tema que a Hassabis le entusiasmaba: los juegos. Pero no creamos que detrás sólo estaban los intereses de un individuo aislado: hay un motivo importante por el que este tipo de entretenimiento es tan esencial para el desarrollo de la inteligencia artificial, y es porque sus resultados son fáciles de interpretar. Por ejemplo, si (como se propone siempre entre risas) una inteligencia artificial tratara de ser un buen político, sería muy difícil evaluar si lo está haciendo bien o mal -pensad que ni siquiera los votantes nos ponemos de acuerdo en ello-. Pero, en cambio, en los juegos es muy fácil analizar el nivel de éxito: ganas o pierdes. Así que resultan un modelo de estudio ideal.
¿Y con qué juego intentaron testar sus programas? Pues con uno mucho más complejo que el ajedrez: el go. En Occidente no lo conocemos demasiado, pero en Asia causa auténtico furor. ¿Y por qué decimos más complicado? Porque en el ajedrez, el número medio de movimientos que puedes hacer por jugada es de 37, mientras que en el go son aproximadamente de 200. Por tanto, una partida de go tiene tantas posibles variantes que no puedes "explorar" todas las opciones disponibles mediante un ordenador, por muy potente que sea, sino que te ves obligado estimar. Ése es el caldo de cultivo ideal para poner a prueba a una inteligencia artificial, y por eso Deepmind se metió a fondo, creando un programa que fuera capaz de competir en dicho juego. El resultado se narra en un documental,
AlphaGo (el nombre del programa desarrollado por la compañía), el cual os recomiendo vivamente, con la suerte de que puede
visualizarse en Youtube.
Para empezar, los de Deepmind probaron con el campeón de go europeo (el cual, por cierto, es de origen asiático). Jugaron con él unas cuantas partidas -no os describiré cómo es el juego porque su mecanismo profundo es algo que tampoco entiendo; desde lejos, parecen dos personas colocando piedrecitas en posiciones predeterminadas en un tablero; por lo visto, la base es tratar de cercar áreas con las piedrecitas con el fin de englobar la mayor proporción de la superficie de juego-. El programa informático las ganó todas. Cuando este hecho se hizo público, el mundo del go profesional despreció aquella evidencia: decían que el competidor humano no tenía el nivel suficiente, e inmediatamente se sugirió que el programa debía enfrentarse al jugador más destacado del planeta, el coreano Lee Se-Dol, el cual llevaba 20 años dominando la disciplina: el Federer del go, o asi lo definieron. Es interesante comprobar la evolución del enfrentamiento a partir de la actitud de ese campeón mundial respecto al reto. Al principo, nuestro hombre se halla confiado (un poco "sobrado", como suele decirse popularmente) en que derrotará con solvencia al programa. Entonces pierde la primera partida, y lo achaca a que no ha jugado bien. En la segunda contienda, actúa de manera conservadora, y cae de manera más incontestable que la anterior; aun así, sigue argumentando que el problema son los errores propios, no que el ordenador suponga un salto cualitativo. Los que han jugado contra AlphaGo describen una experiencia "arrolladora", en el sentido de que el ordenador te aplasta por todos lados, de una manera agresiva que ni siquiera eres capaz de entender. Además, se observa que el programa desarrolla "movimientos anómalos": realiza jugadas que, desde el punto de vista clásico del juego, aparentan ser un suicidio; pero que, a posteriori, con el desarrollo global de la partida, demuestran ser fundamentales para modificar el curso de los acontecimientos. Hay un momento determinado en que Se-Dol mueve las piezas, entre desnortado y carente de esperanza, mientras transmite la sensación de que ha perdido el control. Sin embargo, inesperadamente, a partir de un movimiento clave, consigue ganar una de las partidas. Tras su victoria, Se-Dol se muestra tan agotado como sonriente, declarando que todavía existe un resquicio en el que los humanos tienen una opción para ganar (y suena tan derrotista, o tan falsamente optimista, como el último humano a punto de ser esclavizado por las máquinas). Los creadores de Deepmind analizan a fondo su derrota, y entienden que Se-Dol tomó una decisión con la cual sólo tenía un mínimo porcentaje de posibilidades de éxito, pero explotó ese resquicio, y fue capaz de derrotar al cálculo de probabilidades de la máquina. Se-Dol pierde finalmente el resto de las partidas, en lo que supone un baño de humildad para el género humano. Tres años después, Se-Dol se retiraría, arguyendo que es imposible derrotar a la computadora, y que su victoria sobre AlphaGo fue debida a un error del programa. Según el coreano, la inteligencia artificial pierde en ocasiones de una modo que le resulta tan poco comprensible a los humanos como cuando gana, pero eso no cambia la tendencia general. Hasta hoy, Se-Dol es la única persona que ha conseguido derrotar a un programa de ordenador de este tipo en el go. Por otra parte, muchos jugadores han adoptado algunos de los comportamientos "anómalos" desarrollados por los programas, demostrando que la inteligencia artifical ha llegado no sólo para cambiar nuestra modo de jugar, sino también para revolucionar nuestros esquemas de pensamiento.
Pero Deepmind quería llegar a un rincón más profundo, y se ha embarcado en el objetivo último de la inteligencia artificial: ayudar a los seres humanos no sólo a hacer los cálculos más accesibles, sino a resolver problemas que él no es capaz de solventar por sí mismo. El área en el que ha aterrizado con más ímpetu ha sido el de la medicina y la biología molecular. Los planes de Deepmind a largo plazo incluyen diagnosticar enfermedades a partir de imágenes de nuestra retina, así como ser determinar el pronóstico de la salud de un individuo mediante el análisis de sus constantes vitales. Pero, por el momento, el mayor logro que se le conoce no es ni mucho menos baladí. Ha quizás resuelto el denominado "problema de más de 50 años", y que probablemente sea objeto de un premio Nobel: el misterio del plegamiento de las proteínas. Pero esto requiere una explicación.
Las proteínas son las moléculas responsables de buena parte del funcionamiento del organismo de los seres vivos. Si las grasas y los azúcares se dedican en mayor medida a funciones estructurales y de alimento, las proteínas, aparte de estas actividades, son en una alta proporción enzimas (es decir, aceleran las reacciones bioquímicas del organismo), y también poseen funciones reguladoras, de transporte, de movimiento, defensivas, constituyen receptores de distintos tipos... Para que nos hagamos una idea, la principal función del famoso ADN -nuestra herencia genética- es decidir qué proteínas va a expresar la célula en cada momento concreto, y en qué cantidad. De hecho, cuando la biología molecular estaba en pañales, se pensaba que el responsable de la herencia genética tenía que ser una proteína (tan importantes son en nuestro organismo), y fue una sorpresa cuando descubrieron que era el ADN. Pero para saber cómo funcionan las proteínas tenemos que irnos a su estructura, donde se centra el fondo del problema que hoy nos ocupa.
La mioglobina, una de las primeras proteínas cuya estructura se describió.
Las proteínas (cuyo nombre, muy apropiadamente, viene de la divinidad griega Proteo, la cual tenía la capacidad de cambiar de forma a voluntad) tienen varios niveles de estructura. Lo primero es su estructura primaria, es decir, su secuencia. Una proteína en el fondo es una larga cadena de unas moléculas más pequeñas que se llaman aminoácidos, de los cuales (nos referiremos en este caso a los seres humanos) hay veinte tipos distintos. Una proteína puede tener desde unos pocos cientos a varias decenas de miles de aminoácidos, uno detrás de otro, en un número casi infinito de combinaciones. Luego, tienen una estructura secundaria -es decir, pequeños grupos de aminoácidos que se agrupan en una conformación particular, como una hélice o un bucle-. Finalmente, está la estructura terciaria, es decir, cómo se organiza la proteína en su conjunto (por ejemplo, la imagen que véis arriba es la estructura terciaria de la mioglobina). Esto se complica porque las proteínas pueden tener estructura cuaternaria (es decir, proteínas que se unen entre sí), pero de momento vamos a dejarlo ahí.
La cuestión es que, hasta ahora, no había manera de saber, a partir de la secuencia de aminoácidos de una proteína, cuál sería la estructura global de la misma (o, dicho de otra manera, de qué forma se pliega esa cadena de aminoácidos, como si fuera un gusano de múltiples segmentos enroscándose sobre sí mismo). Hay que tener en cuenta que, según la estructura que tenga, la proteína será capaz de unirse a otras moléculas o cumplir algunas de sus funciones: de hecho, proteínas de actividad similar suelen tener una forma similar también. La manera de descubrir el plegamiento final de una proteína, clásicamente, ha sido a partir de estudios bioquímicos muy complejos (la cristalografía de rayos X y la resonancia magnética nuclear, entre los más destacados) que requieren de meses o años. No es raro que la tesis doctoral de un científico especializado en estas técnicas sea descubrir la estructura de una proteína. La informática, a este respecto, había podido hasta ahora hacer poco. Determinados programas podían dilucidar estructuras secundarias (o sea, secciones parciales de la proteína), y se podía deducir mucho de la estructura de una proteína a partir de otras cuya secuencia fuera similar -digamos que pertenecerían a la misma familia-. El problema del plegamiento de las proteínas es una especie de Santo Grial de la biología que lleva más de 50 años planteándose: un profesor mío afirmaba, sin ningún género de duda, que, el día que se resolviera, el descubrimiento sería acreedor de varios premios Nóbel. Quizás por eso, desde 1994 hay un concurso denominado CASP que se celebra cada dos años y que otorga un premio a la compañía informática que sea capaz de mostrar un desarrollo más avanzado en la predicción de proteínas. Pero lo realmente esencial de este asunto no es la dificultad del reto: el día que conozcamos cómo puede plegarse una proteína a partir de su secuencia, no sólo conoceremos la función y los detalles del mecanismo de miles de proteínas nuevas, sino que, en teoría, podremos diseñar proteínas a voluntad, generando no sólo una descomunal cantidad de conocimiento teórico, sino abriendo múltiples posibilidades para la ciencia médica, farmacéutica o los procesos industriales, con aplicaciones de las que ahora mismo no somos ni siquiera conscientes. El desafío, por tanto, era lo suficiente atractivo para que Hassabis y su equipo -sin duda lleno de mentes brillantes- se pusieran a trabajar en ello.
Así que Deepmind se puso a diseñar un programa que pudiera absorber todo el conocimiento que poseemos de estructura de proteínas, realizara sus propias predicciones, y aprendiera a partir de ellas para así mejorar día a día. Idealmente, el programa debería ser capaz de replicar (desde la secuencia) las estructuras de proteínas que ya conocemos y, a partir de ahí, generar nuevas predicciones con las proteínas cuya estructura ignoramos. El resultado: el programa, AlphaFold, no sólo fue capaz de ganar las dos últimas ediciones del concurso CASP (tanto que han pensado seriamente en cancelarlo) sino que, sobre todo, cristalizó en dos artículos que salieron en 2021 en la revista
Nature -una de las dos mayores publicaciones científicas del mundo- con la diferencia de una semana. Para que os hagáis una idea, el último alarde similar de éxito a nivel de publicaciones
resultó ser un fraude, así que os podéis imaginar que no es un fenómeno ni mucho menos frecuente.
En el
primer artículo, Hassabis y su amplio equipo describen cómo desarrollaron el programa, y los resultados que éste obtuvo, comparándolo con los obtenidos con las técnicas bioquímicas.
En el segundo, amplían todavía más el reto: consiguen determinar la estructura de casi todas las proteínas humanas -casi; luego diremos el "pero"- y de un cierto número de especies importantes en investigación, hasta un número de 150.000 (hasta ahora, se habían un descrito un total de 100.000 estructuras de proteínas, de las potencialmente miles de millones que existen). Tengamos en cuenta un par de números: sólo se han publicado hasta ahora la posición de un 17% de los aminoácidos de todas las proteínas registradas en las bases de datos científicas de todo el mundo. AlphaFold, por otra parte, es capaz de determinar la posición de un 94% de los aminoácidos de las proteínas estudiadas con un alto nivel de seguridad. De repente, los científicos tienen toneladas de conocimiento que ahora habrán de certificar mediante los métodos clásicos para determinar si, en efecto, AlphaFold es tan fiable como afirma ser. Los siguientes años van a ser muy interesantes para constatar si Deepmind ha dado en la diana y resuelto "el problema de más de 50 años".
Nada más ser publicados estos artículos, empezaron las críticas. Algunas tienen sentido, y pasamos a enumerarlas a continuación:
-Una de ellas radica en que la capacidad de Deepmind para predecir la estructura de las proteínas se basa en la certeza de <<hipótesis de Anfinsen>>. Esta es una asunción realizada por un bioquímico estadounidense por la cual, en teoría, todos los detalles necesarios para conocer la estructura de una proteína están contenidos en su secuencia primaria. Hasta ahora, y por lo que conocemos de la forma en que se generan las proteínas, esto parece ser así, pero no se descarta que haya excepciones. Hay que tener en cuenta que las proteínas no se crean de golpe, sino por un proceso secuencial: primero se unen dos aminoácidos, luego se añade otro... Aunque parece que las células tienen sistemas para evitar que, durante el proceso, las proteínas se plieguen de manera anormal, ocurre que mientras las proteínas se van creando van adquiriendo lo que se denomina "modificaciones post-traduccionales": es decir, otras proteínas les añaden azúcares, grupos cargados eléctricamente, etc... Estas modificaciones "sobre la marcha" podrían afectar la estructura final de las proteínas (respecto a si dichos cambios se produjeran sobre una proteína ya completa), aunque, como digo, todavía no se ha demostrado. Por otra parte, sea cual sea el momento en el que se añaden, esas modificaciones post-traduccionales pueden alterar la estructura de la proteína sobre la que se encuentran, y habría que ver si AlphaFold es capaz de integrar todos estos parámetros.
-Otro de los problemas para AlphaFold es la capacidad que tienen las proteínas para interaccionar entre sí (la estructura cuaternaria que hemos mencionado antes), asunto en el que el programa todavía no se ha metido a fondo. En realidad, muchas funciones de las proteínas se basan precisamenten en cambios de conformación motivados por esas interacciones.
-Por otra parte, con el objetivo de simplificar, el equipo de Deepmind limitó el tamaño máximo de las proteínas que incluyó en su análisis: es posible que proteínas de mayor tamaño no sólo sean más difíciles de analizar, sino que causen problemas complejos en cuanto a la fiabilidad de su estructura. Aun así, hay que romper una lanza en favor de AlphaFold, en el sentido de que el tiempo que invierte en determinar la estructura de una proteína de miles de aminoácidos es de unas seis horas, en contraste con los meses o años que se tarda mediante el sistema tradicional.
-Por último, hay que decir que un porcentaje de los aminoácidos analizados por Deepmind no estaban contenidos en ninguna estructura clara. Pero también es verdad que se cree que existe una cierta proporción de las secuencias de las proteínas -o incluso proteínas casi completas- que no tienen una estructura clara (son proteínas "intrínsecamente desordenadas"), y de hecho se cree que este fenómeno puede ser esencial para su función. Una cuestión curiosa es que estos dos porcentajes (el estimado de proteínas "intrínsecamente desordenadas", y el de aminoácidos para los que AlphaFold no encuentra una estructura estable) coinciden sospechosamente, lo cual apunta a que el programa de nacionalidad británica, quizás, ha dado en el clavo.
Otras críticas, en cambio, se parecen más a las que sufrió AlphaGo por parte de los jugadores profesionales de este deporte: las del humano que no se cree que las máquinas le dominarán, justo antes de que le subyugue
Skynet. Entre otras, que el auténtico problema del plegamiento de las proteínas no es cuál es el resultado final, sino describir el proceso detallado mediante el cual se produce (un enigma desde luego apasionante, aunque en mi modesta opinión no le resta méritos a lo conseguido, si se confirma, por parte de AlphaFold). Pero en el fondo lo que subyace es la sensación de que muchos biólogos están dolidos porque de repente han llegado un grupo de
frikis amantes de los videojuegos y han enviado de una patada al rincón de la historia no sólo metodologías, sino también carreras y áreas científicas completas. Y, lo que es peor, les pueden robar uno de los más relevantes premios Nobel de Medicina o Química sin tener ni idea de estas especialidades, en un acto de intrusismo sin precedentes. Son las consecuencias colaterales del progreso, que dirían algunos. Siempre hay ganadores y perdedores, aunque uno querría pensar que la gandora, en global, con esta clase de cosas, es la especie humana y el planeta en su conjunto.
Como he dicho antes, los hallazgos de Deepmind aún deben confirmarse, pero abren la puerta a un mundo de medicamentos a la carta y de una mayor comprensión del funcionamiento del organismo, con todo lo que ello conlleva. Y, como hemos mencionado también, la inteligencia artificial puede tener otras múltiples aplicaciones en el campo de la medicina, las cuales aún se están desarrollando. El futuro llega y, junto a los coches autónomos y el procesamiento masivo de datos, llegan utilidades de la inteligencia artificial que modificarán nuestro mundo y que no podemos todavía atisbar. Lo que hagamos con ellas, como siempre, es cosa nuestra. Hay algunos que ya se están comprando la edición de lujo de las películas de Terminator, para ver si así les caen bien, en el futuro, a los robots. Aunque bien puede ocurrir que las inteligencias artificiales del mañana nos consideren seres inofensivos, e incluso a los que hay que estar agradecidos, por eso de que inventamos la escritura y los libros. Espero que por esa parte nos salvemos. Pasadlo bien y, mientras tanto, pensad en qué mundo les estamos dejando a las máquinas. Un saludo.
Post-scriptum: este tema, junto con otros apasionantes, relacionados con el futuro de la inteligencia artificial, los intentamos desarrollar los amigos del
podcast del Gato de Hubble con la presencia estelar de un experto en el campo (hay que decir que el equipo del podcast ya desarrolló un estupendo
programa sobre inteligencia artificial que os recomiendo, tanto por la información como por las risas. Sólo tres palabras: drones, cecina, León). Sin embargo, problemas técnicos nos han impedido hasta ahora publicarlo -quizás una inteligencia artificial se apiade de nosotros y nos ayude-, así que de momento tendréis que conformaros con esta humilde crónica. Nos vemos, nos leemos. Otro saludo, y disfrutad con las lecturas, al menos antes de que llegue la
singularidad. Hasta muy pronto.