Tomado de los apuntes de cátedras de la maestra Izaskun Herrojo Salas
Dentro de los procesos de conservación y preservación de documentos, existen varios, como son: Respaldo (Respaldo análogo), renovación de soportes, replicación, mantenimiento, arqueología digital y la migración de datos. De esto último se trata el post de hoy.
Otros elementos a tener en cuenta también son:
- Estándares
- Normalización
- Emulación
- Encapsulación
- Canonicalización
- Autenticidad
- Estabilidad e integridad
- Metadatos
Para entender mejor el proceso de migración de datos, acudamos a la definición que nos ofrece la Wikipedia:
“La migración de datos consiste en la transferencia de materiales digitales de un origen de datos a otro, transformando la forma lógica del ente digital de modo que el objeto conceptual pueda ser restituido o presentado por un nuevo equipo o programa informático. Se trata de una consideración clave para cualquier implementación, actualización o consolidación de un sistema informático.”
En las bibliotecas este fenómeno se da con mucha frecuencia, especialmente en lo concerniente a los registros bibliográficos. En este caso es frecuente que al cambiar de una plataforma informática a otra, se hace necesario la migración de los registros al nuevo formato. Existen diversos motivos para realizar la migración y algunos de ellos son:
- Preservación
- Mejoras en el Funcionamiento
- Nuevos requerimientos (usuario o software)
- Interoperabilidad
- Actualización de versiones
- Estandarización de la tecnología
- Reducción de costos (software libre)
- Aumento manejo volumen datos
- Mejoras en la seguridad y control de datos
- Etc.
Ejemplos de migraciones son:
- De un formato a otro (Word a PDF).
- De un sistema operativo a otro (Windows a Linux)
- De lenguajes básicos a otros avanzados (Basic a Java).
Pero estos procesos no se realiza al azar, sino que se deben tener en cuenta algunos elementos y criterios, a saber:
La fase de planificación conlleva:
•Inventario de los activos actuales (documentación, máquinas, software, instancias, bases de datos y código personalizado).
•Documentar los requisitos de la Institución.
•Documentar los requisitos de hardware.
•Conocer las capacidades que serán necesarias en cada fase de la migración (gestor de proyectos, arquitecto de soluciones que comprenda la topología del sitio, los puntos de integración y todas las tecnologías utilizadas, administradores de bases de datos, Desarrolladores experimentados en los lenguajes utilizados para las personalizaciones que se lleven a cabo).
•Asegurarse de que los entornos de desarrollo y de pruebas estén sincronizados con la versión del código que se encuentra en producción.
•Desarrollar una planificación detallada incluyendo usuarios, contraseñas, tareas, propietarios, temporización, puntos de comprobación, pasos de validación y planes de retrotracción (determinar además la formación del personal).
Analítica de datos.
Según Leguizamon Tarazona (2017) es "aquellas en que las variables de integridad, de exactitud o de consistencia de los datos a tener en cuenta de cara a migrar los datos, teniendo en cuenta las características de las bases de datos de origen y destino. Esta analítica se hará como un enfoque para la recopilación y análisis de datos.
Validación de datos.
Para este concepto, González Lau y Aristizábal Moreno,(2007) hace referencia a verificar, controlar o filtrar cada una de las entradas de datos que provienen desde el exterior del sistema. proceso que asegura que un programa opere sobre datos limpios, correctos y útiles. Emplea rutinas, frecuentemente conocidas como reglas de validación, que verifican la exactitud y la significancia del dato en el sistema. Una validación incorrecta de datos puede llevar a la corrupción de datos o a vulnerabilidades de seguridad.
Tipos de validación de datos.
Los autores antes citados, explican los siguientes:
•Verificaciones de formato o imagen: Verifica que el dato esté en un formato específico.
•Verificaciones del tipo de dato: Verifica el tipo de dato ingresado con respecto al esperado y presenta mensajes de error cuando no se cumple.
•Verificaciones de rango: Verifica que el dato se encuentre entre un rango especificado de datos.
•Verificaciones de límites: A diferencia de la verificación de rango, este solo compara con respecto a un límite, superior o inferior.
•Verificaciones de presencia (o de datos nulos): Verifica que datos de importancia no tengan valores en blanco (o nulos).
•Verificaciones de consistencia: Verifica los campos dentro de la base de datos para asegurar que los datos estén en sus campos correspondientes.
Pruebas para la migración.
- Partir de un estado conocido.
- Problema: puede ser modificado desde infinidad de puntos de la aplicación, por lo que hay que generar un sistema cómodo y rápido para generar información antes de ejecutar cada test (esto lo suelen hacer los expertos en el área e incluso los proveedores del software en caso de contratar un servicio externo).
- Preparar la base de datos para cada test que apliquemos e informaciones que necesitemos (utilizar la misma API del sistema - ORM).
- Mapeo objeto-relacional (Object-Relational mapping) es una técnica de programación para convertir datos entre el sistema de tipos utilizado en un lenguaje de programación orientado a objetos y la utilización de una base de datos relacional como motor de persistencia. Wikipedia.
Problemas para la migración.
No siempre se cuentan con los datos de las codificaciones anteriores, sobre todo en los formatos cerrados o de propietario; este problema se agranda con la necesidad de sucesivas migraciones. Como no siempre es posible hacer copias exactas, sobre todo cuando se transfiere desde una tecnología anterior a una subsecuente, se trata de interferir lo menos posible, pero tras la acumulación de varias migraciones estos cambios pueden acrecentar demasiado las diferencias con el material original. Los nuevos formatos pueden ser incapaces de interpretar toda la funcionalidad del formato original.
Normalmente las empresas proporcionan compatibilidad con sus productos de software anteriores, pero esto rara vez sobrepasa tres generaciones, por lo que las versiones anteriores a estas pierden la compatibilidad o bien la conservan con pérdidas. No es un plan de preservación por sí mismo, puesto que está aún lejos de resolver los problemas de la mantención de la integridad, apariencia y autenticidad de los contenidos digitales. Los costos para migrar todo un archivo pueden llegar a ser muy altos, por lo que muchas instituciones han tenido que privilegiar unos contenidos por sobre otros, lo que genera un grave riesgo de pérdida irreparable para mucha información.
Rivera Donoso, 2009.
En conclusión, podemos confirmar lo anterior basamentado en las experiencias que hemos tenidos en la migración de registros bibliográficos. No siempre resulta 100 por ciento completo el proceso. Es complejo, muy técnico y se requieren de habilidades y competencias informáticas, para ser capaz de manejar más de una aplicación a al vez, para mapear las bases de datos, realizar comparaciones entre un sistema y otro, y finalmente migrar los registros, etc.
La migración es un proceso que nos ayuda a ir actualizando la información a medida que los cambios tecnológicos nos impactan, pues de lo contrario, se cae en la obsolescencia.




