Preservación digital

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La preservación digital es el conjunto de métodos y técnicas destinadas a garantizar que la información digital almacenada, sea cual sea el formato, programa, máquina o sistema que se utilizó para su creación, pueda permanecer y seguir usándose en el futuro pese a los rápidos cambios tecnológicos u otras causas que puedan alterar la información que contienen. Con la explosión de las tecnologías de la información cada vez existen más documentos nacidos digitales y digitalizaciones de documentos que han de ser preservados manteniendo su integridad, autenticidad, fiabilidad, legibilidad y funcionalidades. [1]

Introducción[editar]

La primera evidencia conocida es de escritura –signos pictóricos sobre tablillas de arcilla secadas al sol– data de aproximadamente seis mil años atrás. Desde la antigüedad hasta el presente, la escritura ha experimentado una evolución sostenida, dando origen a una de las paradojas más grandes de la historia: nuestra capacidad de registrar información ha aumentado exponencialmente con el tiempo, mientras que la longevidad de los medios utilizados para almacenarla ha disminuido de manera equivalente. Así, aún son legibles los fragmentos de papiro de escritura egipcia de hace 4.500 años o manuscritos y otros documentos de la época medieval, pero la durabilidad del moderno papel es bastante menor. El primer desafío mundial en tema de preservación documental surge por la extraordinaria fragilidad de los libros impresos a partir de la segunda mitad del siglo XIX, a causa del elevado grado de degradación del papel fabricado con madera, llamado también papel friable. Este problema se dio a conocer a mediados del siglo XX y recibió el nombre de "fuego lento" -slow fire-, porque era tan letal para los libros como los incendios, pero a un ritmo más lento. La lección no fue aprendida, y durante el siglo XX continuan decayendo la permanencia, durabilidad y resistencia de los nuevos medios de registro, como por ejemplo el de una cinta magnética, que puede quedar ilegle sólo treinta años después de su fabricación. El medio de registro más reciente – el disco óptico– puede alcanzar una vida más prolongada, sin embargo, ésto tampoco garantiza su perdurabilidad, y es que es probable que los actuales medios ópticos de almacenamiento superen ampliamente la vida útil del sistema informático que lo creó.

De lo anterior podemos concluir que nos encontramos ante un nuevo paradigma en preservación: tradicionalmente, la conservación del documento físico equivalía a la conservación de la información que contenía, y por tanto, garantizaba su usabilidad, sin embargo en los documentos digitales preservar el soporte es condición necesaria, pero no suficiente: hay que considerar otras cuestiones, tanto de conservación como de usabilidad: La fiabilidad e integridad de la información, ya que la grabación de datos digitales no se hace en un soporte fijo y los datos se pueden reproducir, alterar o borrar con gran facilidad; la obsolescencia de los soportes digitales, que han de ser renovados con cierta frecuencia; la necesidad del entorno informático original u otro que pueda interpretar la cadena de bits que contiene la información; y la necesidad de que los usuarios sepan utilizarlo.

Esto ocurre con gran parte de los contenidos que se producen en el mundo, y que pueden ser desde composiciones artísticas hasta datos personales, pasando por los resultados de la actividad de organismos públicos y privados o pensamientos y sentimientos de seres humanos. Muchos de ellos tienen un interés histórico, científico o cultural y conviene conservarlos para que sean conocidos y utilizados por nosotros y por las generaciones que nos sucedan, ahora bien, la extensa variedad de formatos - texto, bases de datos, grabaciones sonoras, películas, imágenes,... - la volatilidad, la obsolescencia técnica, el deterioro físico y la inestabilidad de Internet, entre otras muchas causas, constituyen un gran riesgo para este conocimiento acumulado, poniendo de manifiesto la necesidad de llevar a cabo una actividad de preservación responsable por parte las instituciones. Para los organismos que tienen a su cargo el acopio y la preservación del patrimonio cultural, “se ha convertido en un problema apremiante definir qué elementos deben conservarse para las generaciones futuras y cómo proceder en su selección y conservación”.[2] La necesidad de salvaguardar esta forma relativamente nueva de patrimonio documental requiere un consenso internacional sobre su acopio, preservación y difusión, y así algunas instituciones inician proyectos, elaboran normativas o crean directrices que sientan las bases para que esta nueva forma de patrimonio no desaparezca en silencio. Algunos ejemplos de ello son los proyectos NEDLIB,[3] DigiCult,[4] PADI,[5] Kulturarw3,[6] o Patrimonio.es;[7] la resolución 2002/C 162/02 del Consejo de Europa: Conservar la memoria del mañana;[8] o la Carta sobre la preservación del patrimonio digital de la UNESCO[9]

Propiedades de la preservación digital[editar]

Para conservar los objetos digitales es necesario que su comprensión y gestión se realice desde su singularidad, que combina el fenómeno físico con las codificaciones lógicas. Por ello, a la hora de la preservación digital vamos a encontrar puntos comunes con su hermana la preservación analógica, pero también características propias derivadas de su naturaleza:

  • Se trata de una serie de actividades encaminadas a un mismo fin, y no sólo de técnicas aisladas,es decir, no vale de nada conservar un fichero si no se garantiza que luego se pueda acceder a él para utilizarlo. Por ello, hay que llevar a cabo tareas que comprenden –además de los procedimientoss técnicos– la planificación y la gestión de los recursos
  • Su finalidad es la futura utilización de los documentos. La garantía del futuro uso del recurso digital representa un reto mayor que solamente mantener la cadena de bits.
  • Se pretende preservar la información en vez del documento físico: “La preservación a largo plazo implica la provisión de acceso indefinido a los documentos o, como mínimo, al contenido de éstos",[10] aunque numerosos expertos recomiendan que se mantenga también la cadena de bits original.
  • Voluntad de mantenimiento a largo plazo, mediante nuevas operaciones de tratamiento si éstas fueran necesarias en el futuro. Un informe sobre las necesidades de preservación digital en el Reino Unido define "largo plazo" aplicado a documentos digitales como un periodo de más de veinte años.[11]

Amenazas a la integridad de los documentos digitales[editar]

Los valores esenciales a preservar en un documento electrónico son la fiabilidad, la autenticidad, la integridad, la identidad de las personas que han creado o trabajado en el mismo y la capacidad de uso y acceso para los humanos.[12] La volatilidad y virtualidad de la información digital y su dependencia de programas y máquinas informáticas para el acceso y la decodificación hacen que estos valores puedan alterarse por una serie de problemas reales o potenciales:

  • La obsolescencia tecnológica: Debido a la rápida evolución tecnológica los recursos digitales pueden quedar "huérfanos", es decir, inutilizables por falta de todos o alguno de los elementos informáticos – hardware, software o soportes físicos - de su entorno original. Este concepto no significa que dichos elementos hayan dejado de funcionar, sino que ya no se puede acceder a ellos e interpretarlos o hacerlos funcionar. Un claro ejemplo lo constituye la desaparición de los disquetes de tres pulgadas y media. En la actualidad ningún fabricante de ordenadores proporciona de serie un dispositivo capaz de leer y de escribir en dichos discos; y aunque aún es posible solicitar una disquetera externa a algunos fabricantes, es un artículo difícil de encontrar, y cada vez lo será más. Por ello, se hace necesario la migración de los datos a otros soportes tecnológicos actuales.
  • La degradación de los soportes. La "fragilidad" o inestabilidad del soporte, debida tanto a factores internos como a factores externos, pueden conducir, tarde o temprano, a la pérdida de la información grabada en él. Los factores internos se asocian a la propia composición de los materiales de los soportes ópticos o magnéticos. Estos soportes envejecen y se deterioran, perdiéndose información o produciéndose errores de lectura. Entre los factores externos que pueden afectar a la degradación de los soportes, destacar las fluctuaciones elevadas de temperatura y de humedad. Para ayudar a comprender como puede llegar a perjudicar a la esperanza de vida de los soportes ópticos y magnéticos, se adjunta la siguiente tabla que refleja la degradación del soporte como consecuencia del incremento de temperatura y de humedad relativa (Jones y Beagrie, 2001, pág.130):[13]
Soporte / Hum. rel. 25 h. r. 30 h. r. 40 h. r. 50 h. r. 50 h. r.
Soporte / Temp. 10º C 15º C 20º C 25º C 28º C
DLT cinta magnética 75 años 40 años 15 años 3 años 1 año
CD / DVD 75 años 40 años 20 años 10 años 2 años
CD-ROM 30 años 15 años 3 años 9 meses 3 meses

Además la IFLA proporciona unas recomendaciones generales y particulares para facilitar la conservación y el manejo de los diferentes soportes para su conservación, que se muestran en la siguiente tabla simplificada:

- Generales - Evitar tocar la superficie, y emplear guantes sin pelusa si fuera necesario

- Almacenar en áreas limpias sin polvo, humo ni elementos magnéticos

- Guardar el soporte en posición vertical, empleando cajas especiales para ello

- Discos ópticos - Limpiar suavemente desde el centro hacia los bordes del disco

- Limpiar con pistola de aire o en su defecto, con un papel de tisú no abrasivo

- Siempre emplear marcadores suaves de punta de fieltro sin disolventes

- Cintas magnéticas - Rebobinar las cintas siempre después de cada uso

- Avanzar y rebobinar las cintas periódicamente

- Girar las cintas anualmente

  • Datos fácilmente alterados o destruidos. Debido a errores humanos, al mal funcionamiento de los sistemas o a acciones mal intencionadas, los datos pueden ser eliminados o falseados. Además, también existe el riesgo de que la información se pierda debido a la falta de control de las versiones de un recurso.[14]

Políticas de preservación digital[editar]

Aún existiendo capacidad técnica y voluntad, no es realista preservar absolutamente todo. Los recursos son limitados y obligan a las instituciones a establecer políticas de preservación bien definidas económicamente y que determinen una colección formada por los datos cuyo interés social e intelectual sea mayor, en función de las necesidades y recursos de la institución, de los intereses de sus usuarios y de aspectos físicos e intelectuales.[15] Para ello nos podríamos plantear las siguientes preguntas:

¿Cómo debemos preservar el documento? Debemos decidir entre preservar esencialmente el contenido, incluso mejorar la legibilidad o utilidad mediante las tecnologías disponibles en el momento de su recuperación o mantener el aspecto y comportamiento original, con las limitaciones que ésto pueda representar.[16]

¿Qué recursos debemos preservar? En primer lugar deberemos tener en cuenta la obligación legal, y después consideraciones como el valor intrínseco del material, si el material se ajusta a la política de selección, si otra institución ha asumido ya la responsabilidad, su estado físico, el uso actual y potencial, la relación coste-efectidad del tratamiento, etc. En general se prioriza en este orden: 1. Documentos nacidos digitales. 2. Documentos digitalizados sin versión analógica. 3. Documentos digitalizados con versión analógica.

¿Cuándo hay que iniciar el tratamiento? Cuanto antes mejor. El abandono benigno en los documentos analógicos podía no ser excesivamente dañino, pero en los digitales es letal. Son necesarias soluciones preventivas que detecten la amenaza antes de que el daño se haya producido y vigilancia continuada tanto en el documento como en los metadatos. Se recomienda tener en cuenta la preservación desde el mismo momento de la creación del documento, mediante una adecuada selección de los formatos, soportes y metadatos.

¿Quién se implicará en el proceso de preservación? Ante la dificultad de la labor, es muy importante seleccionar a profesionales con los conocimientos y aptitudes adecuados, que asuman claramente su responsabilidad y que puedan responder de forma ágil y eficiente a los nuevos retos que indudablemente surgirán.[17]

Para garantizar el éxito de los esfuerzos de la preservación digital se requerirá un nivel más elevado de implicación institucional que suele matizarse en los dos conceptos siguientes:

  • La viabilidad institucional (institutional viability): la transición requerirá la capacidad técnica, económica y material para asumir las nuevas competencias.
  • La sostenibilidad económica (economic sustainability): La capacidad de sostener el nivel de apoyo necesario-sobre todo el económico-en el futuro.

Cabe recordar que actualmente los factores institucionales, no los tecnológicos, se consideran el principal obstáculo para el avance de la preservación digital.

Estrategias de preservación digital[editar]

La preservación de un fondo tradicional se diseñaba en base a conservar el material lo más inalterado posible. Por el contrario los documentos digitales deben ser modificados y transformados continuamente para que continúen siendo accesibles e inteligibles: Se trata de preservación por alteración, a través de métodos como los que se detallan a continuación:

Refresco[editar]

Es la transferencia de los datos de un soporte a otro nuevo para reducir el riesgo de la pérdida de datos debida a la degradación lógica por el uso y el paso del tiempo. Se efectúa sin producir cambio alguno en el software o el formato, es decir, no es una solución contra la obsolescencia tecnológica, ya que el continente se renueva sin alterar el contenido, aunque en ocasiones el refresco coincide con un cambio generacional del soporte, como cuando se pasa información de cintas o discos originales a modelos actuales. La frecuencia con la que se realiza el refresco varía según la política institucional y el tipo de soporte, pero siempre debería realizarse dentro del plazo recomendado por el fabricante.

Metadatos[editar]

Se pueden crear los metadatos durante la producción de los documentos o simplemente crear unos básicos con la posibilidad de ampliarlos. Existen dos tipos de metadatos:

Descriptores de objetos (permiten su recuperación)

De conservación (describen como acceder a los datos) con dos tipos de información necesaria:

• De contenido: detalles sobre como representar el formato del documento (estos metadatos de representación cambian y se actualizan).

• Descriptiva: incluye identificadores y detalles bibliográficos, propietarios, historia, validación de formatos y nexo con demás formatos.

Preservación de la tecnología[editar]

Consiste en el mantenimiento de la máquina con la que fueron creados los documentos, incluyendo software, hardware, etc. No es una solución válida ya que con el paso del tiempo este mantenimiento se verá dificultado por la falta de recambios y avances tecnológicos que harán que dicho ordenador quede obsoleto.

Migración[editar]

Es la estrategia más utilizada hoy en día. Este método consiste en convertir los documentos almacenados a nuevos formatos con el fin de no perder la información que contienen. Mediante este proceso se mantienen las características esenciales de los datos, aunque se pueden producir pequeños cambios que con el paso del tiempo y la acumulación de migraciones pueden verse amplificados. Por éso, se convierte en un proceso poco fiable si se utilizaron componentes muy específicos de software, lo que conlleva una incompatibilidad entre sistemas. La migración también puede utilizarse en la extensión o formato de los documentos, por ejemplo, trasladar un documento en formato Microsoft Word 95 a uno Microsoft Word 97/2000/XP, para aumentar su funcionalidad.

Existen diferentes variedades de migración:[18]

Migración sobre la demanda: se trata de separar el código binario de su entorno y soporte original en el momento en el que se deposite el recurso. Junto con esta cadena de bits, se guardan los metadatos técnicos que especifican cómo debe migrarse a otros entornos. De ese modo el centro evita tener que realizar migraciones periódicas de toda la colección para poder concentrar los esfuerzos y recursos en los documentos con una demanda constatada. Aunque mediante este método se ahorran los esfuerzos de las migraciones periódicas, al mismo tiempo se requiere mayor dedicación en la presentación y la actualización de los metadatos técnicos que han de ser modificados paralelamente a la evolución de la tecnología (Cedars guide to digital preservation..., 2002).[1]

Migración a un formato estándar: se refiere a la migración del documento original a un formato neutral o estandarizado, con una mayor duración prevista. Por ejemplo, muchos centros pasan los documentos textuales de diferentes formatos a XML, PDF u otros formatos abiertos. Por esta razón y por contar, como consecuencia, con un mayor número de usuarios, se prevé que estos formatos tendrán una vida más larga que un formato propietario.

En una medida parecida, algunos depósitos sólo admiten determinados formatos. De esta manera, los depósitos pueden centrar sus esfuerzos y recursos en la gestión del fondo digital en vez de desperdigarlos en procesar unos formatos minoritarios. Algunas instituciones incentivan o incluso obligan a los autores a utilizar formatos estándares para la creación de documentos. En cambio, otras asumen la responsabilidad de convertir el fichero a un formato estandarizado en el momento de ingresar el documento.

Migración sucesiva o conversión en serie: mediante esta técnica (conocida en inglés como serial conversion y también Backward compatibility) se actualizan los documentos con cada cambio incremental del software, sea necesario o no la operación interna. Es obvio que cuando se introducen nuevas versiones de software es justamente cuando existe mayor motivo por parte de los fabricantes para facilitar la conversión. De esta manera, se corre el riesgo de perder la oportunidad cuando el formato esté a punto de desaparecer y existan menos facilidades para realizar la migración.

La migración tiene varios inconvenientes, entre los más importantes destacan los siguientes:

  • No se puede evitar la alteración del documento original. Esta alteración puede afectar a la estructura, al contenido, a la apariencia y a la funcionalidad en mayor o menor grado. Por la inevitabilidad de algunas alteraciones, los procesos seguidos durante la migración han de ser documentados mediante los metadatos técnicos, igual que cualquier efecto que hayan producido en el documento. De este modo los futuros usuarios sabrán qué diferencias existen entre el documento original y la versión recuperada.
  • No es muy adecuado para los objetos digitales que contienen una variedad de formatos, ya que cada uno de éstos necesitará recibir un tratamiento diferente, lo que hace muy difícil la automatización del proceso. Actualmente la catalogación tradicional no capta con exactitud la presencia de los diferentes elementos incorporados en el documento, lo que dificulta aún más la migración de cada formato en el momento oportuno.

Se enumeran a continuación las principales ventajas de la migración:

  • Es una operación muy experimentada.
  • No se requieren conocimientos técnicos muy especializados.
  • Se puede automatizar una parte de los procesos.
  • La tendencia hacia la estandarización de software y formatos facilitará la migración.
  • Convierte el documento a un formato compatible con sistemas actuales.

Entre sus inconvenientes se destacan los siguientes:

  • Es difícil programar la migración para objetos digitales complejos.
  • Altera el documento con el riesgo de la pérdida de elementos importantes.
  • Debe repetirse periódicamente a lo largo de la vida del recurso.

Emulación[editar]

La emulación permite simular el comportamiento del software original con el que se crearon los documentos digitales, de forma que puedan ejecutarse y utilizarse pudiendo prescindir del programa de origen. Los partidarios de la emulación creen que esta estrategia ofrece la mejor solución para preservar recursos digitales más complejos, ya que es la única que garantiza la recuperación del documento original sin las inevitables alteraciones que ocurren en la migración. Jeff Rothenberg, el principal defensor de esta estrategia, argumentaba que la emulación era la única manera capaz –al menos en teoría– de garantizar la conservación de los datos junto con sus elementos esenciales, en lo que se refiere tanto a su apariencia como a su funcionalidad "de manera coherente, automática y homologable para diferentes tipos de documentos"[19] El problema es que este proceso requiere el mantenimiento de una cantidad de información considerable - emulador, SO, aplicación y datos - y por otro lado conservar los emuladores de cada software no tiene sentido, ya que también se quedarían obsoletos. Además, diferencia de la migración, la emulación no está tan experimentada y requiere unos conocimientos informáticos muy avanzados.

Replicado (copia de seguridad)[editar]

Basado en la realización de duplicados de los datos almacenados. Esta técnica no puede trasladarse a un largo periodo de tiempo, ya que, suele utilizarse en pérdidas de datos debidas a fallos en la computadora, ya sea por causas técnicas o ajenas (como virus), o fallos en el hardware. Suele utilizarse en centros de procesamiento de datos o en situaciones domésticas para evitar la pérdida de estos datos importantes. Lo que se olvida es que los métodos de almacenamiento también quedan obsoletos, por lo que debe realizarse un rejuvenecimiento y una transferencia a nuevos medios.

Arqueología digital[editar]

La arqueología digital es una técnica que recupera informaciones dañadas, con pérdidas o demasiado antiguas, a causa de un mal trato de los datos (refiriéndose a conservación, etc).

Preservación en línea[editar]

Algunos expertos proponen esta opción frente al almacenamiento de la información en soportes físicos por el coste de los dispositivos de almacenamiento en línea, bastante menor, y por la utilización de formatos como el HTML y el XML, que se prevén más duraderos que los formatos de programas de propiedad, y además se actualizan sobre la marcha de manera natural. Sus inconvenientes serían que no se elimina la necesidad de realizar migraciones, sólo se aplaza, y tampoco se evita el riesgo de destrucción física de un archivo almacenado en un único servidor.

Combinación de estrategias[editar]

Comunmente, pueden ser necesarias varias estrategias para abarcar toda la variedad de objetos y características que se deben preservar. Además, los programas de preservación deben considerar asimismo las posibles ventajas de la redundancia y aplicar más de un tipo de actuación, ya que una sola estrategia, aunque esté bien planificada, puede fallar y dejar el documento inservible. Así, por ejemplo, es conveniente considerar que un documento puede contener tanto texto como imágenes, objetos multimedia, etc. y ocuparse de los problemas de obsolescencia de cada elemento por separado, sin olvidarse, por otro lado, del deterioro de los soportes.[20]

Implementación[editar]

Los documentos o imágenes digitales están formados por un conjunto de píxeles distribuidos en un número predefinido de filas y de columnas. Los archivos se transforman en mapas de bits mediante dispositivos electrónicos como escáneres o cámaras. En la transformación se adquiere una cierta resolución y posteriormente los datos se encapsulan en un formato de almacenamiento. Todo esto hace que haya ciertos aspectos a tener en cuenta cuando ejecutamos un sistema de preservación digital.

Conversión[editar]

Los programas de digitalización capturan y presentan el formato digitalizado de todo el contenido del archivo transformado, de forma que quede concatenado en un solo documento o en una pequeña colección. Para determinar cuales son las partes importantes del documento se suele comparar la imagen o imágenes digitales con la original teniendo en cuenta la calidad, resolución con la que se transformó el documento, etc. Todo esto para determinar cual será la mejor forma de realizar la conversión, de la información que tenemos en soporte papel a digital, para su almacenamiento

Calidad[editar]

Para garantizar que los datos digitales tienen la máxima similitud, sobre todo en rasgos importantes, con el documento original es imprescindible llevar un buen control de la calidad, para minimizar los errores (que podrían acumularse por diversas transformaciones sucesivas). No existe ninguna norma que estandarice este control de la calidad, ya que cada documento, requiere un trato distinto fundamentado en sus características más básicas.

Tramitación de la colección[editar]

La permanencia a lo largo del tiempo de una colección digital no solo depende de factores de calidad o de conversión, sino también de una buena gestión, por lo que se refiere, al almacenamiento acorado de los documentos o datos escaneados, mediante organización (ya sea por tamaño, nombre, etc.), nominación adecuada y una buena descripción de los datos. Para hacer una buena tramitación es preciso identificar cada uno de los archivos como único dentro del conjunto, acompañándolo de una buena descripción y si es preciso, por el uso de metadatos.

Organización[editar]

Previamente a la nominación y descripción de los documentos es necesario definir como van a ser almacenados. El método más habitual es organizar los datos tal y como lo haría la misma computadora, por lo que se tiene que tener en cuenta el avance tecnológico para evitar incompatibilidades entre máquinas, asegurando que la colección pueda preservarse y asimismo, crecer.

Caracterización[editar]

Los ordenadores no son capaces de relacionar documentos por su contenido, es decir, no son capaces de identificar que rasgos son comunes entre dos o más archivos. Hay dos modos de caracterizar o identificar las imágenes:

• Utilizando una numeración predeterminada que quede en memoria.

• Utilizando los nombres completos de los documentos.

Para establecer la identificación de los documentos se adopta uno de los criterios, teniendo en cuenta que el elegido deberá utilizarse a lo largo de toda la colección sin posibilidad de cambio.

Detalle[editar]

Para llevar a cabo la descripción de cada documento es necesario el uso de los metadatos para facilitar la tramitación de la colección y el uso de los datos que esta contiene. Hay proyectos actuales que distinguen hasta tres categorías o tipos de metadatos:

Descriptivos para descripción e identificación de las fuentes de información.

Estructurados para la navegación y presentación.

Administrativos para la tramitación y el proceso.

Según el proyecto o colección que llevemos a cabo utilizaremos un tipo de metadatos u otro.

Modelo de referencia Open Archival Information System (OAIS)[editar]

OAIS nació de la preocupación de la National Aeronautics and Space Administration (NASA), por la conservación y custodia de sus datos, al ser consciente de que errores en la custodia habían ocasionado la pérdida de datos originales.[21]

Fue desarrollado originalmente por la NASA con la ayuda de otras agencias aeroespaciales ante la preocupación por la conservación de sus archivos digitales.[22] En enero de 2002 se publica como estándar del Consultative Committee for Space Data Systems CCSDS 650.0-B-1 y, finalmente, al año siguiente el modelo terminó convirtiéndose en la norma internacional ISO 14721:2003 Open Archival Information System (OAIS), actualmente existe una norma revisada y actualizada, la ISO 14721:2012

El modelo de referencia OAIS persigue una doble finalidad, conservar la información y facilitar a la comunidad el acceso futuro a la misma. Esta doble finalidad responde al hecho de que los soportes en los que se almacena la información digital tienen una vida muy corta y la información debe sobrevivir migrando a otros soportes o a otros entornos de software para que el acceso a la misma sea posible[23]

Agencias aeroespaciales y preservación digital[editar]

La preocupación por la preservación digital mostrada por las agencias aeroespaciales nacionales -ajenas al mundo de las bibliotecas- nace de las cantidades ingentes de imágenes y otra información digital generadas por los satélites y gestionadas por ellas para asegurar su recuperación y usabilidad en el futuro. Según la página web de la NASA, el telescopio espacial Hubble diariamente archiva entre 3 y 5 GB de datos y difunde entre 10 y 15 GB a astrónomos de todo el mundo. Esta web ofrece acceso libre a algunas de las imágenes más espectaculares captadas y que aportan vistas de la Tierra y de otros rincones del universo.[24]

Definición[editar]

OAIS no muestra el diseño concreto de un programa, más bien ofrece una serie de pistas que sirven para estandarizar la forma en que los materiales a preservar deben ser gestionados, desde su ingreso hasta el acceso público. Estas pistas deben ser adaptadas por cada institución a sus propias necesidades.[25]

Es un modelo de referencia que pretende reducir los malentendidos, y según la propia definición del protocolo OAIS, un modelo de referencia es:[26] “Un marco para la comprensión de las relaciones importantes entre las entidades de un mismo entorno y para el desarrollo de los estándares o especificaciones básicas que apoyan ese entorno. Un modelo de referencia se basa en un pequeño número de conceptos unificadores y puede ser utilizado como base para la educación y para explicar los estándares a alguien no especialista”[27]

OAIS identifica las responsabilidades y componentes de un sistema centrado en archivar documentos digitales:[28]

  • Los actores: Productores, administradores y consumidores
  • Los objetos o documentos procesados: El objeto que se pretende preservar se denomina “Paquete de información” (Information package) IP y en él se incluyen el objeto y sus metadatos. Las clases de paquetes de información según el área funcional en que se encuentran son:[29]

- SIP (Submission information package): Es el paquete tal como llega al depósito procedente de los productores, junto con sus metadatos, para ser incorporado al OAIS.
- AIP (Archival information package): Al SIP se le añade, como mínimo, la información necesaria para su gestión y preservación a largo plazo.
- DIP (Disemination information package): El paquete de información tal como se entrega al consumidor y contiene la información necesaria para que el consumidor pueda utilizarlo

  • Los procesos implicados:

Procesos[editar]

Según el modelo OAIS, un archivo digital debe componerse de seis procesos básicos,[30] que podemos ver reflejados en el siguiente gráfico:

Esquema funcional del modelo OAIS

Cuatro de ellos son actividades a las que se somete el material almacenado:

  • Incorporación/ingesta (ingest): Los paquetes de información llegan desde los productores y, tras someterlos a diversos controles, se procede a su ingreso en el sistema de preservación.
  • Almacenamiento/Almacén del archivo (archival storage): En este proceso, los ficheros de datos son almacenados en un soporte físico y se proporcionan los servicios necesarios para el almacenamiento, mantenimiento y recuperación.
  • Gestión/Administración de datos (data Management): Se gestionan los metadatos de los ficheros: los originales, que formaban parte del IP, los que fueron creados en el proceso de ingesta y todos aquellos que se generen a lo largo de la vida de los ficheros.
  • Acceso/difusión (access/disemination): Se da soporte a los consumidores para posibilitar la recuperación y acceso a la información preservada

Y dos hablan del funcionamiento del depósito:

  • Planificación para la preservación (preservation planning):En este proceso se deciden las políticas que se van a aplicar, se monitorea el entorno y se sigue una vigilancia tecnológica para detectar cuando un formato se vuelve obsoleto y proceder a la migración a un nuevo formato. La finalidad es asegurar que la información permanezca disponible en el futuro.
  • Administración/Gestión del depósito (archive administration): Desde aquí se proporciona el soporte técnico a toda la operación global de preservación.

Metadatos[editar]

Para poder realizar la preservación de forma efectiva, OAIS reconoce dos tipos de metadatos:

  • RI (Representation information): es la información necesaria para interpretar los datos técnicos del paquete de información y es lo que permitirá convertirlo a otros formatos y hacerlo recuperable[31]
  • PDI(Preservation description information): Esta información será la que posibilite la interpretación descriptiva que permita identificar y recuperar el contenido de la información durante un largo periodo de tiempo. Incluye datos referentes a los derechos de autor, restricciones de uso etc.[32]

Metadatos de representación y metadatos de preservación[editar]

Siguiendo las recomendaciones del modelo de referencia OAIS los sistemas de metadatos de representación (RI) más populares son:

  • Dublin Core: es un sistema de descripción de recursos de información. Este estándar (ISO 15836:2003) se caracteriza por ser un sistema general, independiente, extensible y económico. Está formado por 15 elementos que se clasifican en tres grupos: Descripción del recurso: datos sobre las características bibliográficas del recurso, Propiedad intelectual: autor, editor de la obra e Instancia: fecha de creación, formato, tipo e idientificador (URL, DOI, ISBN). Todos los elementos son repetibles y opcionales y van precedidos de los caracteres DC. Existe un Dublin Core Simple y Dublin Core Calificado. Este segundo esquema es una ampliación del DC Simple y determina el significado de cada uno de los 15 elementos iniciales añadiéndole calificadores. Se pretende mitigar la generalidad de las propiedades principales del sistema para describir cualquier tipo de recurso electrónico.
  • Marcxml:[33] es la codificación de los registros MARC en XML para facilitar la captura e integración de estos registros en los procesos de recopilación propios de desarrollos OAI e incluir metadatos MARC en el texto completo de documentos codificados en XML.
  • MODS:[34] sistema XML para codificar metadatos e información bibliográfica. Basado en el MARC21 consta de 20 elementos principales que se subdividen en elementos más específicos para una estructuración del contenido más precisa. Son etiquetas alfanuméricas que posibilitan una descripción más detallada que el sistema Dublin Core pero menos compleja que el MARC.
  • METS:[35] sistema que codifica en formato electrónico el propio objeto digital. Además de contener los metadatos descriptivos añade metadatos administrativos y de gestión. Los mets son documentos XML que recogen la estructura de un objeto digital formado por varios archivos en distinto formato y la forma en la que se organizan estos archivos en el documento digital.

El sistema de metadatos de preservación de objetos digitales (PDI) que destaca en el panorama bibliotecario es:

  • PREMIS:[36] Es el fruto de un grupo de trabajo miembros de la OCLC y RLG (Research Libraries Group) creado en 2003. Entre sus objetivos estaba crear un conjunto de metadatos para la preservación de objetos digitales que pudiera aplicarse a un sistema real y analizar otras soluciones para la codificación, almacenamiento e intercambio de registros. Los resultados más importantes de este equipo de profesionales fueron, por un lado el informe Implementing Preservation Repositories for Digital Materials: Current Practice and Emerging Trends in the Cultural Heritage Community (2004) y el Data Dictionary for Preservation Metadata[37] (2005, última versión PREMIS 2.2 de julio de 2012). Este diccionario describe los metadatos esenciales para la preservación digital de cualquier formato de archivos y el esquema XML para su codificación.

Este sistema divide los metadatos en cinco categorías: Entidad intelectual: detalla la tipología documental del objeto digital. Objeto: formato electrónico de la entidad intelectual. Se clasifican en cuatro tipos: bitstream, secuencia de bites; file, archivos; filestream, tipo de archivo (comprimidos, encriptados); representation, conjunto de archivos que representan al documento. Eventos: los distintos procesos que se llevan a cabo en un documento digital para su preservación (registro, almacenamiento, migración, etc.). Agentes: personas, instituciones o aplicaciones informáticas relacionadas con un evento. Derechos: permiso del autor de la obra para ejecutar las tareas que conlleva la preservación digital.

Objetivos[editar]

La implantación del modelo de referencia OAIS persigue los siguientes fines:

  • Recibir información proveniente de organismos productores y que cumpla las condiciones establecidas para su incorporación al archivo.
  • Fijar los criterios de selección de los contenidos que van a ser preservados, respetando los derechos de autor y favoreciendo el depósito de los materiales por parte de los productores.
  • Permitir el acceso público a la información que se preserva.
  • Asegurar la comprensión de la información almacenada y preservada, por parte de los potenciales destinatarios de la misma, sin que éstos necesiten de ningún soporte para ello.
  • Establecer procesos y políticas concretas que garanticen la preservación de los documentos frente a riesgos eventuales y la difusión de copias legales y auténticas de los mismos.

Aspectos legales de la preservación[editar]

Derechos de propiedad intelectual afectados[editar]

Derechos morales. Corresponden al autor de una obra y se concretan en decidir su divulgación, de qué forma y si se hace bajo su nombre, seudónimo, o de manera anónima; reconocimiento de su autoría; respeto a la integridad de la obra, frente a deformación o alteración que pueda perjudicarle; modificarla, respetando derechos de terceros y lo establecido para bienes de interés cultural; retirada del comercio, previa indemnización a los titulares de derechos de explotación; acceso al ejemplar único o raro de la obra, si está en manos de otro, garantizando así su divulgación.

Derechos de explotación. Corresponden también al autor, requieren su autorización y son la reproducción (fijación de la obra o de una parte, sobre cualquier soporte que sirva para comunicar y obtener copias), distribución (puesta a disposición del público de los ejemplares de una obra mediante venta, alquiler, préstamo o cualquier otra forma), comunicación pública (se produce cuando un conjunto de personas accede a la obra a través de una representación escénica, proyección, emisión radiofónica o vía satélite) y transformación (traducción, adaptación o modificación, de la que resulte una obra diferente). La duración de estos derechos es de 70 años después de la muerte del autor, transcurridos los cuales la obra pasa a dominio público, pudiendo ser utilizada por cualquiera, con finalidades comerciales o no, siempre que se respeten los derechos morales de reconocimiento de autoría y de integridad de la obra.

Los derechos de explotación o derechos económicos pueden ser cedidos, pagando o de manera gratuita, y habitualmente lo son, a través de los contratos de edición. Equivalen al copyright, derecho característico de la tradición anglosajona.

Derechos afines. Se reconocen a intérpretes, ejecutantes, productores audiovisuales y de fonogramas, entes radiofónicos y autores de fotos, sin valor artístico, sobre la reproducción y comunicación de sus obras. Derecho sui géneris, se reconoce al fabricante de una base de datos no original, sobre la prestación (inversión, esfuerzo, etc.) que ha realizado y por el que puede impedir: la extracción y/o reutilización de todo o de parte importante del contenido; la extracción y/o reutilización continuada de una parte no fundamental, cuando cause perjuicio a los intereses legítimos del fabricante y sea contraria a una explotación normal.

Actividades de preservación vs. derechos[editar]

Copias/reproducción. La obtención de copias es una actividad frecuente relacionada con la preservación y que se opone al derecho de explotación, que exige el consentimiento del autor para reproducir el original.

Migración/modificación e integridad. La migración de sistemas y programas trae consigo la transformación del documento a un nuevo formato. Se produce una modificación del original que entra en conflicto con el derecho moral reconocido al autor y que le confiere en exclusiva la modificación de la obra. También puede afectar a la integridad de la misma, por la pérdida de determinados datos.

Accesibilidad remota/Distribución y comunicación pública. La puesta a disposición del público de determinados contenidos, por ejemplo, a través de una web, se contrapone al derecho reconocido al autor sobre la distribución y comunicación pública de su obra. Si además el acceso se ve limitado por contraseñas o cifrados, se interfiere también en el control que sobre su propia obra se garantiza al autor de la misma.

Límites a los derechos[editar]

La Ley de Propiedad Intelectual (España) permite: la reproducción sin necesidad de autorización de una obra publicada, para uso temporal, sin compensación económica y dentro de una actividad tecnológica y para uso privado, sin ánimo lucrativo, a cambio de compensación económica a la entidad de gestión de derechos de autor que corresponda. La reproducción, distribución y comunicación pública para uso de personas con discapacidad y sin fin lucrativo y en procedimientos judiciales, administrativos o parlamentarios por motivos de seguridad pública; de pequeños fragmentos de una obra, salvo libros de texto o manuales universitarios, en tareas de enseñanza; de trabajos sobre temas de actualidad, en medios de comunicación social, indicando fuente y autor y respetando sus derechos; de las situadas en espacios públicos. También permite las recopilaciones periódicas, cuando el autor no se haya opuesto expresamente y sin fines lucrativos; la utilización de fragmentos, a modo de cita o reseña, en actividades docentes o de investigación, señalando el autor y la fuente; el uso de bases de datos, a las que se acceda de forma legal; la ejecución de obras en actos oficiales y ceremonias religiosas, sin autorización del autor, cuando tengan carácter gratuito y el artista no perciba remuneración a cambio; la parodia.

Por lo que respecta concretamente a la preservación, la ley dice en su artículo 37, que se permite la reproducción de obras, sin ánimo lucrativo y con fines exclusivos de investigación o conservación, por parte de bibliotecas, museos, fonotecas, filmotecas o archivos públicos o que pertenezcan a entidades culturales o científicas. Al mismo tiempo se permite, sin necesidad de consentimiento del autor, la comunicación y puesta a disposición pública de obras, con fines de investigación, por parte de los establecimientos citados antes, además de por centros integrantes del sistema educativo español, mediante red interna y a través de terminales localizados en dichos establecimientos.

Iniciativas favorables a la preservación[editar]

Acceso Abierto (Open Access). Iniciativa que persigue el acceso libre y sin obstáculos a la información científica, a través de internet y que apuesta por el archivo de los contenidos en depósitos o repositorios digitales, a cargo de instituciones (universidades u otros organismos productores), dónde además del acceso se asegura su conservación y preservación.

Creative Commons. Son licencias que permiten el uso legal de una obra, garantizando la autoría. Se clasifican en cuatro tipos, combinables entre sí: Reconocimiento (By) del autor; No Comercial (NC), se permite cualquier uso, salvo la explotación comercial; Sin obra derivada (ND, Non derivative), prohíbe la modificación o reutilización de parte de la obra, para la creación de otra; Compartir igual (SA, Same as), obliga a publicar bajo la misma licencia, cualquier obra derivada.

Copyleft. Licencias que en contraposición al copyright, permiten la modificación y distribución de una obra, pero siempre respetando aquellos derechos que el autor no quiera ceder. Favorece el trabajo en colaboración.

Protección de las medidas tecnológicas[editar]

La adaptación de las legislaciones de los derechos de autor al contexto digital ha venido acompañada de la inclusión de la protección de las medidas tecnológicas, incorporadas en una obra, para proteger estos derechos, y también de la información referente a la gestión de los derechos de autor.[38]

Este punto puede llegar a representar un grave riesgo de cara a la preservación, ya que si no se pueden utilizar legalmente mecanismos para suprimir las medidas tecnológicas de protección, será imposible, a largo plazo, acceder a muchas obras porque habrán desaparecido los códigos de paso de la protección o del organismo o el mecanismo de autorización, o simplemente por la imposibilidad de hacer una copia de refresco debido a que ésta saldrá con una degradación sustancial respecto al original a causa de las medidas de protección integradas.

El otro punto que se debe considerar es que los derechos de explotación son temporales y cuando la obra pase a dominio público debe poder ser utilizada sin obstáculos. Si las medidas de protección no se pueden suprimir en el momento en el que obra pasa a dominio público, se puede decir que este artículo de la legislación referente al dominio público ha quedado, en buena parte, liquidado en lo que respecta a la producción digital.

De igual modo, quedan seriamente reducidos los límites y las excepciones permitidas en el contexto impreso, tales como las reproducciones para uso privado, para uso de discapacitados, y para investigación o conservación en determinadas instituciones; con la ironía de estar pagando cánones sobre soportes que después las medidas tecnológicas de protección de los derechos no dejan utilizar para las actividades en concepto de las cuales se aplican estos cánones.

Iniciativas y proyectos[editar]

PREMIS working group (OCLC): [2]

PADI Preserving Access to Digital Information: [3]

ERPANET: [4]

The Library of Congress. Digital Preservation: [5]

Digital Preservation Coalition: [6]

La preservación digital y las universidades: [7]

UK national preservation initiatives: [8]

Digital library federation: [9]

National Digital Preservation Initiatives: [10]

CEDARS Curl exemplars in Digital Archives: [11]

DELOS Network of Excellence on Digital Libraries: [12]

Fundación Copyleft: [13]

Referencias[editar]

  1. Biblioteca de Cataluña: http://www.bnc.cat/esl/Profesionales/Preservacion-digital2 (Fecha de consulta: l9/03/14)
  2. http://www.unesco.org/new/es/communication-and-information/access-to-knowledge/preservation-of-documentary-heritage/digital-heritage/
  3. http://www.nedlib.org
  4. http://www.digicult.info
  5. http://www.nla.gov.au/padi/index.html
  6. http://openlinkprofiler.org/r/kulturaw3.kb.se
  7. http://www.patrimonio.es
  8. http://www.bne.es/es/Colecciones/Adquisiciones/DepositoLegal/.../unesco.pdf
  9. http://www.unesco.org/webworld/mdm
  10. Soler, Joan(2009). La preservación de documentos electrónicos.Barcelona:UOC. ISBN 978-84-9788-728-1
  11. Digital Preservation Coalition(2006). Informe Mind the gap: assesing digital preservation needs in the UK. http://www.dpconline.org/docs/reports/uknamindthegap.pdf
  12. Soler, Joan(2009). La preservación de documentos electrónicos.Barcelona:UOC. ISBN 978-84-9788-728-1
  13. Jones, Maggie; Beagrie, Neil (2001). Preservation management of digital materiales: a handbook. Londres: British Library. p. 130. 
  14. Keefer, Alicia; Gallart, Nuria (2007). La preservación de recursos digitales: el reto para las bibliotecas del siglo XXI. Barcelona: UOC. ISBN 978-84-9788-567-6.
  15. Llueca Fonollosa, Ciro (2012). Preservación Digital UNMSM. http://www.slideshare.net/cirollueca/preservacin-digital-cirollueca-unmsm-2012. Consultado el 19 de marzo de 2014
  16. Keefer, Alicia; Gallart, Nuria(2007). La preservación de recursos digitales: el reto para las bibliotecas del siglo XXI. Barcelona: UOC
  17. Keefer, Alicia; Gallart, Nuria (2012). Preservación de recursos de información digital. [material docente] Barcelona: UOC
  18. Keefer & Gallart (2012). Preservación de los recursos de la información digital. Barcelona: UOC. 
  19. Rothenberg, Jeff (1999). Ensuring the Longevity of Digital Information
  20. Rivera Donoso, Miguel Angel (2009). Directrices para la creación de un programa de preservación digital. Serie Bibliotecología y Gestión de Información Nº 43, Marzo 2009. ISSN: 0718 – 1701
  21. Termens, Mikel (2013). Preservación digital. Barcelona: UOC. ISBN 978-84-9029-819-0. 
  22. Keefer & Gallart (2007). La preservación de recursos digitales. El reto para las bibliotecas del siglo XXI. Barcelona: UOC. ISBN 978-84-9788-567-6. 
  23. SILIó, Teresa (2005). «Fundamentos tecnológicos del acceso abierto: Open Archives Initiative y Open Archival Information System». El Profesional de la Información. Consultado el 18 de marzo de 2014.
  24. Keefer, Alicia; Gallart, Nuria(2007). La preservación de recursos digitales: el reto para las bibliotecas del siglo XXI. Barcelona: UOC
  25. RIVERA DONOSO, Miguel Ángel (2009). «Directrices para la creación de un programa de preservación». Serie Bibliotecología y Gestión de Información Nº 43. Consultado el 19 de marzo de 2014.
  26. CCSDS (junio de 2012). «Recommendation for space sata system practices - Reference model for an open archival information system (OAIS) - Recommended practice CCSDS 650.0-M-2» (en inglés). Consultado el 20 de marzo de 2014.
  27. "A framework for understanding significant relationships among the entities of some environment, and for the development of consistent standards or specifications supporting that environment. A reference model is based on a small number of unifying concepts and may be used as a basis for education and explaining standards to a non-specialist"
  28. http://www.digitalizacion.unam.mx/
  29. SEDICI. «Bibliotecas y Repositorios Digitales Tecnología y Aplicaciones : la preservación en el RI». Consultado el 21 de marzo de 2014.
  30. RIVERA DONOSO, Miguel Ángel (2009). «Directrices para la creación de un programa de preservación». Serie Bibliotecología y Gestión de Información Nº 43. Consultado el 19 de marzo de 2014.
  31. Jordi Serra Serra (diciembre de 2003). «L'administració electrònica i la gestió de documents» (en catalán). BID Biblioteconomía y documentación. Consultado el 22 de marzo de 2014.
  32. Keefer & Gallart (2007)
  33. Library of Congress. «MARC21 xml Schema» (en inglés). Consultado el 31 de marzo de 2014.
  34. Library of Congress. «Metadata Object Description Schema: MODS». Consultado el 31 de marzo de 2014.
  35. Library of Congress. «Metadata Encoding and Transmission Standar: METS» (en inglés). Consultado el 31 de marzo de 2014.
  36. Library of Congress. «Preservation Metadata Maintenance Activity (PREMIS)» (en inglés). Consultado el 31 de marzo de 2014.
  37. «PREMIS Data Dictionary for Preservation Metadata» (en inglés). Consultado el 31 de marzo de 2014.
  38. Keefer, Alicia; Gallart, Nuria (2012). Preservación de recursos de información digital. [material docente] Barcelona: UOC

Bibliografía[editar]

Véase También[editar]