AlphaFold

De Wikipedia, la enciclopedia libre
Ir a la navegación Ir a la búsqueda

AlphaFold es un programa de inteligencia artificial (IA) desarrollado por DeepMind de Alphabets/Google que realiza predicciones de la estructura de las proteínas[1]​ mediante el sistema de aprendizaje profundo.[2]​ La primera versión de AlphaFold, conocida como AlphaFold 1, obtuvo el primer lugar en la clasificación general de la 13.ª edición de la competición CASP (Critical Assessment of Techniques for Protein Structure Prediction, 'evaluación crítica de técnicas para la predicción de la estructura de proteínas') en diciembre de 2018. El programa se destacó particularmente en las predicciones de estructuras para las que no existían modelos previos;[n. 1]​ los organizadores de la competición consideran estos casos como los más difíciles.

AlphaFold 2, versión desarrollada en 2020, volvió a ganar la competición CASP en noviembre de 2020,[3]​ con predicciones mucho más exactas que las de cualquier otro programa.[2]​ En alrededor de dos tercios de las proteínas, AlphaFold 2 obtuvo una puntuación superior a 90 en la prueba de distancia global (GDT), que compara las predicciones de los programas con las estructuras determinadas experimentalmente; una puntuación de 100 denota una coincidencia completa.[2][4]

Los resultados de AlphaFold 2 en CASP han sido calificados como «asombrosos»[5]​ y «transformadores».[6]​ Aunque la exactitud de las predicciones no es lo suficientemente alta en un tercio de los casos y el programa no revela ninguna información sobre el mecanismo del plegamiento de las proteínas,[7][8]​ el logro técnico ha recibido un reconocimiento generalizado.

El 15 de julio de 2021, Nature publicó un artículo sobre AlphaFold2 junto con software de código abierto y una base de datos de búsqueda de proteomas de varias especies.[9][10][11]

El problema del plegamiento de las proteínas[editar]

tres cadenas de polipéptidos en diferentes etapas de plegamiento y un agrupamiento de cadenas
Las cadenas de aminoácidos, conocidas como polipéptidos, se pliegan para formar una proteína.

Las proteínas están formadas por cadenas de aminoácidos que se doblan y acoplan entre sí espontáneamente, en un proceso llamado plegamiento de proteínas, para formar las estructuras tridimensionales (3-D) de las proteínas. La estructura tridimensional es crucial para la función biológica de la proteína. Uno de los desafíos de la biología molecular, conocido como el «problema del plegamiento de las proteínas» consiste en entender cómo la secuencia de aminoácidos determina la estructura tridimensional.[12]​ Para solucionar este problema, es necesario comprender la termodinámica de las fuerzas interatómicas que resultan en una estructura estable y el mecanismo por el que las proteínas alcanzan su confuguración final con extrema rapidez.[13]

Las estructuras de las proteínas se determinan habitualmente de forma experimental mediante técnicas como la cristalografía de rayos X, la microscopía crioelectrónica y la resonancia magnética nuclear, técnicas que son costosas y pueden requerir mucho tiempo.[12]​Durante los últimos sesenta años se han identificado las estructuras de unas 170 000 proteínas, mientras que las proteínas existentes en todas las formas de vida son más de doscientos millones.[4]​ El poder predecir la estructura de las proteínas solo a partir de la secuencia de aminoácidos sería de gran ayuda para avanzar en la investigación científica. Sin embargo, la paradoja de Levinthal muestra que, si bien una proteína se puede plegar en milisegundos, el tiempo que lleva calcular todas las estructuras posibles al azar para determinar la estructura es más largo que la edad del universo conocido.[12]

A lo largo de los años, los investigadores han aplicado numerosos métodos computacionales para resolver el problema de la predicción de la estructura de las proteínas, pero la precisión de los modelos generados jamás había estado cerca de las estructuras determinadas por técnicas experimentales, excepto para proteínas pequeñas y simples. Hasta la entrada en escena de AlphaFold con su técnica de inteligencia artificial (IA) basada en el aprendizaje profundo,[12]​ los mejores algoritmos usados en CASP, solo producían estructuras comparables a las determinadas experimentalmente en un 40 % de los casos más difíciles.[4]

Algoritmo[editar]

DeepMind ha entrenado el programa AlphaFold con más de 170 000 proteínas de los depósitos públicos de secuencias y estructuras de proteínas. El programa utiliza una forma de red de atención, una técnica de aprendizaje profundo que identifica partes de un problema mayor y luego las junta para obtener la solución general.[2]​ Entre cien y doscientas unidades de procesamiento gráfico (GPU) se usaron para el entrenamiento del algoritmo,[2]​ que tomó «algunas semanas». Tras el entrenamiento, el programa tardaba días en predecir una estructura.[14]

AlphaFold 1 (2018)[editar]

AlphaFold 1 se basó en el trabajo de varios equipos en la década de 2010, que buscaron secuencias de ADN relacionadas de organismos diferentes —la mayoría sin una estructura tridimensional conocida— en los bancos de bases de datos de secuencias para tratar de encontrar cambios correlacionados en la lista de aminoácidos. Estas correlaciones implican que los aminoácidos mutados pueden estar cerca unos de otros físicamente, aunque no ocupen lugares contiguos en la secuencia de ADN, lo que permite elaborar un mapa de posibles contactos. Sobre la base de un trabajo reciente anterior a 2018, AlphaFold 1 extendió esta idea para calcular una distribución de probabilidad de las distancias entre los aminoácidos y convertir el mapa de contactos en un mapa de distancias probables. También utilizó métodos de aprendizaje avanzados para desarrollar la inferencia. Combinando un potencial estadístico basado en esta distribución de probabilidad con la energía libre local calculada de la configuración, el equipo pudo utilizar el descenso de gradiente para encontrar una solución ajustada óptimamente a ambos criterios.[15]

En lenguaje técnico, Torrisi et al resumieron en 2019 la versión 1 de AlphaFold de la siguiente manera:[16]

El elemento central de AlphaFold es un predictor de mapas de distancia implementado como redes neuronales residuales muy profundas con 220 bloques residuales que procesan una representación de dimensionalidad 64 × 64 × 128, que corresponde a las características de entrada calculadas a partir de dos fragmentos de 64 aminoácidos. Cada bloque residual tiene tres capas, entre ellas una capa convolucional dilatada de 3 × 3; los bloques pasan por la dilatación de los valores 1, 2, 4 y 8. En total, el modelo tiene 21 millones de parámetros. La red utiliza una combinación de entradas 1D y 2D, incluidos perfiles evolutivos de diferentes fuentes y características de coevolución. Junto con un mapa de distancias en forma de histograma de distancias de grano muy fino, AlphaFold predice ángulos Φ y Ψ para cada residuo que se utilizan para crear la predicción inicial de la estructura 3D. Los autores de AlphaFold concluyeron que la profundidad del modelo, su gran tamaño, el conjunto de entrenamiento de aproximadamente 29 000 proteínas, las técnicas modernas de Deep Learning y la riqueza de información del histograma de distancias predichas ayudaron a AlphaFold a lograr una alta precisión de predicción de mapas de contacto.

AlphaFold 2 (2020)[editar]

El equipo de DeepMind descubrió que su método anterior tenía la tendencia de sobrevalorar las interacciones entre los aminoácidos cercanos en la secuencia en comparación con los más alejados. Como resultado, AlphaFold 1 predecía modelos en los que la estructura secundaria (hélices alfa y hojas beta) predominaba excesivamente.[17]​ AlphaFold 1 constaba de varios módulos, cada uno entrenado por separado, utilizados para producir un potencial guía que luego se combinaba con el potencial energético basado en cálculos de física. AlphaFold 2 reemplazó esto con un sistema de subredes acopladas en un único modelo basado completamente en el reconocimiento de patrones, entrenado como una única estructura integrada.[18][19]​ El refinamiento de la energía se aplica solo como un paso del refinamiento final una vez que la predicción de la red neuronal ha convergido, y solo ajusta ligeramente la estructura predicha.[17]

Una parte clave del sistema de 2020 consiste en dos módulos, probablemente basados en un modelo de transformador, que se utilizan para refinar progresivamente un vector de información para cada relación —o «borde» en la terminología de la teoría de grafos— entre dos residuos de aminoácido de la proteína y entre cada posición de aminoácido y cada secuencia diferente en el alineamiento de secuencias.[19]​ Internamente, estas transformaciones de refinamiento contienen capas que tienen el efecto de reunir datos relevantes y filtrar datos irrelevantes (el «mecanismo de atención») para estas relaciones, de una manera dependiente del contexto, aprendidas de los datos de entrenamiento. Estas transformaciones se repiten de manera que la salida de información actualizada en un paso se convierte en la entrada del siguiente; en cada iteración, la información de la relación residuo-residuo mejorada sirve para actualizar la información de la relación residuo-secuencia, y luego la información mejorada de la relación residuo-secuencia se usa para la actualización de la relación residuo-residuo.[19]​ A medida que avanza la iteración, según un informe, el «algoritmo de atención ... imita la forma en que una persona podría armar un rompecabezas: primero conectando piezas en pequeños grupos, en este caso grupos de aminoácidos, y luego buscando formas de unir los grupos en un todo más grande».[4]

El resultado de estas iteraciones provee la información para la predicción final del módulo de predicción de la estructura,[19]​ que también usa transformadores.[n. 2]​ En un ejemplo presentado por DeepMind, el módulo de predicción de la estructura logró una topología correcta para la proteína en su primera iteración, que recibió una puntuación de 78 en la prueba de distancia global (GDT), pero con un 90 % de violaciones estereoquímicas, es decir, ángulos o longitudes de enlace no permitidos. En las iteraciones posteriores, el número de violaciones estereoquímicas disminuyó. En la tercera iteración, el GDT de la predicción era casi 90, y en la octava iteración el número de violaciones estereoquímicas se acercaba a cero.[19]

El equipo de AlphaFold declaró en noviembre de 2020 que sería posible introducir cambios para mejorar la precisión.[20]

Competiciones[editar]

CASP13[editar]

En diciembre de 2018, AlphaFold 1 ocupó el primer lugar en la clasificación general de la 13.ª Evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP).[21][22]

El programa era capaz de predecir más correctamente las estructuras condideradas más difíciles por los organizadores, para las que no había estructuras de proteínas con una secuencia parcialmente similar. AlphaFold generó la mejor predicción para 25 de 43 proteínas en esta clase,[22][23][24]​ logrando una puntuación media de 58,9 en la prueba de distancia global por delante de los 52,5 y 52,4 obtenidos por los siguientes mejores equipos,[25]​ que también utilizaban el aprendizaje profundo para estimar las distancias de contacto.[26][27]​ La puntuación general de AlphaFold en todos los objetivos fue de 68,5.[28]

En enero de 2020, se publicó código de demostración de AlphaFold 1 como código abierto en GitHub,[29][12]​ pero, como se indica en el archivo de instrucciones adjunto, solo se puede utilizar para los datos de CASP13, y no para predecir la estructura de cualquier proteína.

CASP14[editar]

En noviembre de 2020, la nueva versión de DeepMind, AlphaFold 2, ganó CASP14,[14][30]​ con los mejores resultados en 88 de las 97 predicciones. En la medida de distancia global (GDT), el programa logró una puntuación media de 92,4 sobre 100,[n. 3]​ un nivel de precisión comparable al obtenido experimentalmente con la cristalografía de rayos X.[20][6][28]​ Dos años antes, en CASP13, AlphaFold 1 solo había alcanzado este nivel de en dos de todas sus predicciones; en 2020, 88 % de las predicciones obtuvieron una puntuación media de más de 80, que ascendió a 87 en los casos clasificados como difíciles.

En lo que concierne a la raíz del error cuadrático medio (RMSD) de la posición de los átomos de carbono alfa de la cadena principal de la proteína, cantidad muy sensible a las desviaciones atípicas muy amplias, el 88 % de las predicciones de AlphaFold 2 tenían un valor de 4 Å. Un 76 % y 46 % de las predicciones lograron RMSD menores de 3 y 2 Å respectivemente. La RMSD media de las predicciones fue de 2,1 Å.[5]​ AlphaFold 2 también logró predicciones correctas para las cadenas laterales de los aminoácidos

Los modelos generados por AlphaFold 2 sirvieron además para determinar cuatro estructuras que hasta entonces no se habían podido elucidar de novo con métodos experimentales.[31]​ Una de ellas era la de la Af1503, una proteína de membrana estudiada durante diez años.[4]​ En estos cuatro casos, los modelos de AlphaFold se usaron como punto de partida para el método de reemplazo molecular, que requiere una similitud estructural entre el modelo y la estructura real.[31]

De las tres peores predicciones de AlphaFold, dos de las estructuras pudieron obtenerse por espectroscopia mediante resonancia magnética nuclear de proteínas (RMN), a partir de una solución acuosa, mientras que AlphaFold se entrenó principalmente en estructuras cristalinas. La tercera proteína existe como un complejo multidominio de 52 copias idénticas del mismo dominio, un caso que para el que AlphaFold no estaba programado. En todos los casos con un solo dominio, excluyendo solo una proteína muy grande y las dos estructuras determinadas por RMN, AlphaFold 2 logró una puntuación GDT de más de 80.[32]

Reacciones[editar]

AlphaFold 2 se considera un logro significativo en biología computacional y un gran progreso en el campo de la predicción de estructuras a partir de la secuencia de aminoácidos.[4][6]​ El Premio Nobel de Química y biólogo estructural Venki Ramakrishnan ha descrito los resultados como «un avance asombroso en el problema del plegamiento de proteínas», y predijo que «cambiará(n) fundamentalmente la investigación biológica».[14]

A raíz de los comunicados de prensa de CASP y DeepMind,[33][14]​ AlphaFold 2 recibió una amplia atención en los medios. Además de las noticias en la prensa científica especializada, como Nature,[6]Science,[4]MIT Technology Review,[2]​ y New Scientist,[34][35]​ la historia apareció en la prensa generalista,[36][37][38][39]​ así como servicios de noticias y publicaciones semanales, como Fortune,[40][18]The Economist,[20]Bloomberg,[28]Der Spiegel,[41]​ y The Spectator .[42]​ En Londres, The Times publicó la historia en la portada, con dos páginas adicionales de cobertura interna y un editorial.[43]​ Un comentario frecuente en todas las publicaciones es que la capacidad de predecir las estructuras de proteínas con exactitud, beneficiará a la investigación en el área de las ciencias de la vida, facilitará el proceso de descubrimiento de nuevos fármacos y ayudará a entender la causa de las enfermedades.[6]

Transparancia y accesibilidad[editar]

Una de las principales críticas a AlphaFold es la falta de transparencia. El líder del proyecto, John Jumper, hizo una presentación de 30 minutos sobre AlphaFold 2 durante la conferencia CASP14, descrita como «llena de ideas e insinuaciones, pero casi completamente desprovista de detalles».[44]​ A diferencia de las presentaciones de otros grupos de investigación que tomaron parte en CASP14, la de DeepMind no fue grabada y no está disponible públicamente. En declaraciones a El País, el investigador Alfonso Valencia dijo: «Lo más importante que nos deja este avance es saber que este problema [el plagamiento de las proteínas] tiene solución, que es posible resolverlo [...] Google no proporciona el software y esta es la parte frustrante del logro porque no beneficiará directamente a la ciencia».[39]​ Sin embargo, simplemente saber lo que DeepMind ha logrado puede incentivar a otros equipos a desarrollar sistemas de IA similares.[39]​ A fines de 2019, DeepMind publicó una gran parte de la primera versión de AlphaFold como código abierto; pero solo cuando AlphaFold 2, mucho más potente, se encontraba en una fase avanzada de desarrollo. La preocupación por una posible falta de transparencia por parte de DeepMind se ha puesto en contraste con la labor de cinco décadas para elucidar las estructuras de miles de proteínas y almacenarlas en el Banco de Datos de Proteínas financiado principalmente con recursos públicos, al igual que otros repositorios abiertos de secuencias de ADN. Sin los resultados de este trabajo, públicamente accesibles, el éxito de AlphaFold 2 no hubiera sido posible.[45][46][47]

Un investigador del grupo de Informática de Proteínas de Oxford ha resaltado que el éxito de AlphaFold se debe en parte a una ingente infraestructura computacional, a la que pocos grupos científicos pueden optar, y apunta a un futuro en el que los investigadores académicos no podrían llevar a cabo investigación en campos competitivos más que formando consorcios «de la misma meneral que los físicos de partículas tuvieron que unirse para construir proyectos enormes como CERN».[48]

Con tan poco conocimiento sobre el funcionamiento interno de AlphaFold 2 se ha cuestionado su capacidad para identificar pliegues poco representados en las estructuras existentes en las bases de datos.[7][49]​ También se desconoce hasta qué punto las estructuras de proteínas en tales bases de datos, en su mayoría de proteínas en estado cristalino, son representativas de proteínas no cristalizables o de las estructuras adoptadas por las mismas proteínas en condiciones fisiológicas en las células vivas. Las discrepancias entre las predicciones de AlphaFold 2 y las estructuras obtenidas mediante RMN pueden ser una señal de dificultades es esta área.

Predicciones de complejos moleculares[editar]

No está claro hasta qué punto las predicciones de AlphaFold 2 serán válidas para proteínas en complejos con otras proteínas y moléculas,[49]​ puesto que AlphaFold no estaba diseñada para este caso. Precisamente fue en las predicciones de estructuras de proteínas con interacciones fuertes con otras copias de sí mismas o con otras estructuras donde AlphaFold 2 tuvo peores resultados. Dado que la maquinaria biológica de la célula se basa en gran parte en tales complejos, o en modificaciones de las proteínas al entrar en contacto con otras moléculas, esta es un área que todavía es un desafío para los programas de predicción de estructuras.[49]

Notas[editar]

  1. Estos modelos se basan en las estructuras de terminadas experimentalmente de proteínas con una secuencia parcialmente similar.
  2. El módulo de predicción de la estructura usa una arquitectura de «transformador 3D equivariante».[19]
  3. Para conseguir una puntuación de 92,5, al menos 70 % de la estructura debe ser correcta dentro de una precisión de 1 Å y, al menos 85 %, a una precisión de 2 Å.

Referencias[editar]

  1. «AlphaFold». Deepmind (en inglés). Consultado el 30 de noviembre de 2020. 
  2. a b c d e f «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 de noviembre de 2020. 
  3. Shead, Sam (30 de noviembre de 2020). «DeepMind solves 50-year-old 'grand challenge' with protein folding A.I.» (en inglés). p. CNBC. Consultado el 30 de noviembre de 2020. 
  4. a b c d e f g Service, Robert F. (2020-11-30 30). «‘The game has changed.’ AI triumphs at solving protein structures». Science (en inglés). 
  5. a b AlQuraishi, Mohammed (30 de noviembre de 2020). «CASP14 scores just came out and they’re astounding». twitter (en inglés). 
  6. a b c d e Callaway, Ewen (30 de noviembre de 2020). «'It will change everything': DeepMind's AI makes gigantic leap in solving protein structures». Nature (en inglés) 588 (7837): 203-204. Bibcode:2020Natur.588..203C. PMID 33257889. doi:10.1038/d41586-020-03348-4. 
  7. a b Stephen Curry, No, DeepMind has not solved protein folding, Reciprocal Space (blog), 2 de diciembre de 2020
  8. Balls, Phillip (9 de diciembre de 2020). «Behind the screens of AlphaFold». Chemistry World (en inglés). 
  9. Jumper, John; Evans, Richard; Pritzel, Alexander; Green, Tim; Figurnov, Michael; Ronneberger, Olaf; Tunyasuvunakool, Kathryn; Bates, Russ et al. (15 de julio de 2021). «Highly accurate protein structure prediction with AlphaFold». Nature (en inglés) 596 (7873): 583-589. PMC 8371605. PMID 34265844. doi:10.1038/s41586-021-03819-2. 
  10. «GitHub - deepmind/alphafold: Open source code for AlphaFold.». GitHub (en inglés). Consultado el 24 de julio de 2021. 
  11. «AlphaFold Protein Structure Database». alphafold.ebi.ac.uk. Consultado el 24 de julio de 2021. 
  12. a b c d e «AlphaFold: Using AI for scientific discovery». Deepmind (en inglés). Consultado el 30 de noviembre de 2020. 
  13. Ken A. Dill, S. Banu Ozkan, M. Scott Shell, and Thomas R. Weikl (2008). «The Protein Folding Problem». Annual Review of Biophysics (en inglés) 37: 289-316. PMC 2443096. PMID 18573083. doi:10.1146/annurev.biophys.37.092707.153558. 
  14. a b c d «AlphaFold: a solution to a 50-year-old grand challenge in biology». Deepmind (en inglés). Consultado el 30 November 2020. 
  15. «AlphaFold: Machine learning for protein structure prediction». Foldit (en inglés). 31 de enero de 2020. 
  16. Torrisi, Mirko et al. (22 de enero de 2020). «Deep learning methods in protein structure prediction». Computational and Structural Biotechnology Journal (en inglés) 18: 1301-1310. doi:10.1016/j.csbj.2019.12.011. 
  17. a b John Jumper et al., conference abstract (December 2020)
  18. a b Kahn, Jeremy (1 de diciembre de 2020). «Lessons from DeepMind's breakthrough in protein-folding A.I.». Fortune. 
  19. a b c d e f Jumper, John et al. (1 d diciembre de 2020). AlphaFold2 (en inglés). 
  20. a b c «DeepMind is answering one of biology's biggest challenges». The Economist (en inglés). 30 de noviembre de 2020. ISSN 0013-0613. Consultado el 30 de noviembre de 2020. 
  21. «Group performance based on combined z-scores» (en inglés). CASP 13. diciembre de 2018. 
  22. a b Sample, Ian (2 de diciembre de 2018). «Google's DeepMind predicts 3D shapes of proteins». The Guardian (en inglés). 
  23. «AlphaFold: Using AI for scientific discovery». Deepmind. Consultado el 30 de noviembre de 2020. 
  24. Singh, Arunima (2020). «Deep learning 3D structures». Nature Methods (en inglés) 17 (3): 249. ISSN 1548-7105. PMID 32132733. doi:10.1038/s41592-020-0779-y. 
  25. «CASP 13 data tables» (en inglés). CASP. 
  26. Wei Zheng et al,Deep-learning contact-map guided protein structure prediction in CASP13, Proteins: Structure, Function, and Bioinformatics, 87(12) 1149–1164 doi 10.1002/prot.25792; and slides
  27. Hou, Jie; Wu, Tianqi; Cao, Renzhi; Cheng, Jianlin (25 de abril de 2019). «Protein tertiary structure modeling driven by deep learning and contact distance prediction in CASP13». Proteins: Structure, Function, and Bioinformatics (Wiley) 87 (12): 1165-1178. ISSN 0887-3585. doi:10.1002/prot.25697. 
  28. a b c «DeepMind Breakthrough Helps to Solve How Diseases Invade Cells» (en inglés). 30 de noviembre de 2020. Consultado el 30 de noviembre de 2020. 
  29. «deepmind/deepmind-research». GitHub (en inglés). Consultado el 30 de noviembre de 2020. 
  30. «DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology». MIT Technology Review (en inglés). Consultado el 30 November 2020. 
  31. a b Andriy Kryshtafovych (30 November 2020), Experimentalists: Are models useful?
  32. Lisa Kinch et al, CASP14 Tertiary Structure Prediction Assessment:Topology (FM) Category (CASP 14 presentation)
  33. Artificial intelligence solution to a 50-year-old science challenge could ‘revolutionise’ medical research (press release), CASP organising committee, 30 November 2020
  34. Le Page, Michael (30 de noviembre de 2020). «DeepMind's AI biologist can decipher secrets of the machinery of life». New Scientist (en inglés). 
  35. «The predictions of DeepMind’s latest AI could revolutionise medicine». New Scientist (en inglés). 2 de diciembre de 2020. 
  36. Metz, Cade (30 de noviembre de 2020). «London A.I. Lab Claims Breakthrough That Could Accelerate Drug Discovery». New York Times (en inglés). 
  37. Sample, Ian (30 de noviembre de 2020). «DeepMind AI cracks 50-year-old problem of protein folding». The Guardian (en inglés). 
  38. Roberts, Lizzie (30 de noviembre de 2020). «"Once in a generation advance" as Google AI researchers crack 50-year-old biological challenge». Daily Telegraph (en inglés). 
  39. a b c Domínguez, Nuño (2 de diciembre de 2020). «La inteligencia artificial arrasa en uno de los problemas más importantes de la biología». El País. 
  40. Kahn, Jeremy (30 de noviembre de 2020). «In a major scientific breakthrough, A.I. predicts the exact shape of proteins». Fortune (en inglés). 
  41. Merlot, Julia (2 de diciembre de 2020). «Forscher hoffen auf Durchbruch für die Medikamentenforschung». Der Spiegel (en alemán). 
  42. Al-Lazikani, Bissan (1 de diciembre de 2020). «The solving of a biological mystery]». The Spectator (en inglés). 
  43. Whipple, Tom (30 de noviembre de 2020). «Deepmind finds biology’s ‘holy grail’ with answer to protein problem». The Times (en inglés). 
  44. AlQuraishi, Mohammed (8 de diciembre de 2020). «AlphaFold2 @ CASP14: "It feels like one's child has left home." The Method». Some Thoughts on a Mysterious Universe (en inglés). Consultado el 15 de diciembre de 2020. 
  45. Edwards, Aled (5 de diciembre de 2020). «The AlphaFold2 success: It took a village» (en inglés). Structural Genomics Consortium. 
  46. Briggs, David (4 de diciembre de 2020). «If Google’s Alphafold2 really has solved the protein folding problem, they need to show their working». The Skeptic (UK) (en inglés). 
  47. «The Guardian view on DeepMind’s brain: the shape of things to come». The Guardian (en inglés). 6 de diciembre de 2020. 
  48. Outeiral, Carlos (3 de diciembre de 2020). «CASP14: what Google DeepMind’s AlphaFold 2 really achieved, and what it means for protein folding, biology and bioinformatics» (en inglés). Oxford Protein Informatics Group. 
  49. a b c Ireland, Tom (4 de diciembre de 2020). «How will AlphaFold change bioscience research?». The Biologist (en inglés). Royal Society of Biology.