Protein Data Bank

De Wikipedia, la enciclopedia libre
(Redirigido desde «Protein data bank»)
Ejemplos de estructuras de proteínas de la PDB

Protein Data Bank (PDB) (Banco de Datos de Proteínas)[1]​ es una base de datos de la estructura tridimensional de las proteínas y ácidos nucleicos. Estos datos, generalmente obtenidos mediante cristalografía de rayos X o resonancia magnética nuclear, son enviados por biólogos y bioquímicos de todo el mundo. Están bajo el dominio público y pueden ser usados libremente.[2]​ El PDB está supervisado por una organización llamada Worldwide Protein Data Bank (wwPDB).

Historia[editar]

Dos hechos convergieron para iniciar la PBD: una colección pequeña pero creciente de conjuntos de datos de estructura de proteínas determinados por difracción de rayos X; y la pantalla de gráficos moleculares recientemente disponible (1968), Brookhaven RAster Display (BRAD), para visualizar estas estructuras de proteínas en 3-D. En 1969, con el patrocinio de Walter Hamilton en el Laboratorio Nacional de Brookhaven , Edgar Meyer ( Texas A&M University ) comenzó a escribir software para almacenar archivos de coordenadas atómicas en un formato común para que estén disponibles para la evaluación geométrica y gráfica. En 1971, uno de los programas de Meyer, SEARCH, permitió a los investigadores acceder de forma remota a la información de la base de datos para estudiar las estructuras de proteínas sin conexión.[3]​ SEARCH fue fundamental para permitir la creación de redes, lo que marcó el comienzo funcional del PBD.

El Protein Data Bank se anunció en octubre de 1971 en Nature New Biology [4]​ como una empresa conjunta entre el Cambridge CrystallogrPBDhic Data Center , Reino Unido y el Laboratorio Nacional Brookhaven, EE. UU.

Tras la muerte de Hamilton en 1973, Tom Koeztle asumió la dirección del PBD durante los siguientes 20 años. En enero de 1994, Joel Sussman, del Instituto de Ciencias Weizmann de Israel, fue nombrado director del PBD. En octubre de 1998,[5]​ el PBD se transfirió al Laboratorio de Investigación en Bioinformática Estructural (RCSB);[6]​ la transferencia se completó en junio de 1999. La nueva directora fue Helen M. Berman de la Universidad de Rutgers (una de las instituciones administradoras de la RCSB, la otra es el San Diego Supercomputer Center en UC San Diego ).[7]​ En 2003, con la formación de la wwPDB, el PBD se convirtió en una organización internacional. Los miembros fundadores son PDBe (Europa),[8]Research Collaboratory for Structural Bioinformatics (RCSB PBD) (Estados Unidos) y PDBj (Japón). El Biological Magnetic Resonance Bank (BMRB) se incorporó en 2006.[9]​ Cada uno de los cuatro miembros de wwPDB puede actuar como centro de depósito, procesamiento de datos y distribución de datos PDB. El procesamiento de datos se refiere al hecho de que el personal de wwPDB revisa y anota cada entrada enviada. A continuación, se comprueba automáticamente la plausibilidad de los datos (el código fuente de este software de validación se ha puesto a disposición del público de forma gratuita).

Crecimiento[editar]

Tasa de determinación de la estructura proteica por método y año.MX=cristalografía, 3DEM = 3D Microscopía electrónica.[10]

Cuando se fundó, el PDB contenía tan solo 7 estructuras de proteínas. Desde entonces ha experimentado un crecimiento aproximadamente exponencial en el número de estructuras y nada parece indicar que el ritmo vaya a decaer. La base de datos de la AP se actualiza semanalmente ( UTC +0 miércoles), junto con su lista de existencias. A 1 de abril de 2020 , la PBD estaba compuesto por:

Método
experimental
Proteínas Ácidos nucléicos Proteína/Ácidos nucleicos
complejos
Otros Total
Cristalografía de rayos X 135170 2097 6945 4 144216
Espectroscopia de resonancia magnética nuclear 11337 1325 264 8 12934
Microscopía electrónica 3475 35 1136 0 4646
Híbridos 155 5 3 1 164
Otros 286 4 6 13 309
Total: 150423 3466 8354 26 162269

El ritmo de crecimiento del PDB ha sido analizado en profundidad en diversos estudios.[11]

Véase también[editar]

Referencias[editar]

  1. «Protein Data Bank: the single global archive for 3D macromolecular structure data». Nucleic Acids Research 47 (Database issue): D520-D528. 8 de enero de 2019. ISSN 0305-1048. PMC 6324056. PMID 30357364. doi:10.1093/nar/gky949. Consultado el 27 de abril de 2021. 
  2. «wwPDB: Worldwide Protein Data Bank». www.wwpdb.org. Consultado el 26 de abril de 2021. 
  3. Meyer, Edgar E. (1997). «The first years of the Protein Data Bank» [Primeros años del Protein Data Namk]. Protein Science (en inglés) 6 (7): 1591-1597. ISSN 1469-896X. PMC 2143743. PMID 9232661. doi:10.1002/pro.5560060724. Consultado el 24 de junio de 2021. 
  4. «Crystallography: Protein Data Bank». Nature New Biology (en inglés) 233 (42): 223-223. 1 de octubre de 1971. ISSN 2058-1092. doi:10.1038/newbio233223b0. Consultado el 24 de junio de 2021. 
  5. Acid Nucleic Research (ed.). «The Protein Data Bank». 
  6. «RCSB | Research Collaboratory for Structural Bioinformatics». web.archive.org. 5 de febrero de 2007. Archivado desde el original el 5 de febrero de 2007. Consultado el 24 de junio de 2021. 
  7. Bank, RCSB Protein Data. «RCSB PDB: RCSB PDB Newsletter Archive». www.rcsb.org (en inglés estadounidense). Consultado el 24 de junio de 2021. 
  8. «PDBe home < Node < EMBL-EBI». www.ebi.ac.uk. Consultado el 24 de junio de 2021. 
  9. «BMRB - Biological Magnetic Resonance Bank». bmrb.io. Consultado el 24 de junio de 2021. 
  10. Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD, et al (enero 2019). «Protein Data Bank: the single global archive for 3D macromolecular structure data». Nucleic Acids Research 47 (D1): D520-D528. PMC 6324056. PMID 30357364. doi:10.1093/nar/gky949. 
  11. «Protein Data Bank». www.ehu.eus. Consultado el 26 de abril de 2021. 

Enlaces externos[editar]