miércoles, 20 de febrero de 2019

Hablemos del proceso de digitalización I


La Digitalización: apuntes de cátedra


Imagen tomada de: https://www.muycomputerpro.com/2017/05/11/digitalizacion-empresas-espanolas

Nota: los apuntes aquí expuestos corresponden a los contenidos de las cátedras en la materia  de Documentos digitales y su conservación, de la maestra Izaskum Herrojo Salas. Otros contenidos fueron tomados de la web y algunos diseños propios.

Para comenzar busquemos una definición del término "digitalización". Veamos:

La Digitalización es el proceso mediante el cual un mensaje se convierte en una sucesión de impulsos eléctricos, equivalente a dígitos combinados (código binario), el 0 ó el 1 (en realidad es una serie de apagado y prendido de impulso combinados). Estos dígitos son los llamados bits. De esta forma, todo mensaje que es susceptible de transformarse en señal eléctrica y ser codificado digitalmente puede almacenarse en soporte informático o transmitirse como tren de impulsos por una red adecuada (hilo telefónico, microondas, fibra óptica, cable coaxial, etc.) El código digital o binario es la base del tratamiento informático y de la tecnología de la información en su estado actual.


Sí, pero esa definición está muy informatizada. Acerquémonos a una más cerca del ámbito de la Bibliotecología. Veamos:

La digitalización de documentos implica pasar documentación física a formato digital. Son muchas las empresas que almacenan gran cantidad de documentación que ocupa demasiado espacio y es difícil de consultar. Aunque este proceso pueda resultar tedioso, una vez realizado puede suponer una ventaja competitiva al hacer que la información sea accesible. 


Sí, en Bibliotecología nos referimos a ese proceso técnico de volver un contenido lógico (que se encuentra en estado físico, como en el caso de los documentos de tipo bibliográfico) en uno digital, mediante un proceso de escaneo de dichos documentos, para que estos puedan ser leídos, visto u oído a través de un medio electrónico, como un computador, tableta, móvil, etc. Pero para adentrarnos al tema de manera más detallada, haremos una pregunta de reflexión:


No esperen respuesta, es para usted, yo ya respondí a la misma durante mis clases. De acuerdo a los mencionados apuntes de cátedras del sub título de ese artículo, hay que tomar en cuenta algunos elementos, a saber:

  • Marco normativo
  • Conceptos básicos
  • Plan de digitalización
  • Aspectos técnicos
  • Marco legal (Derechos de autor).
Dentro de las normativas, disponemos de :

Documento publicado en el año 2002 por la IFLA/UNESCO para los programas de digitalización de colecciones y fondos públicos, especialmente aplicables a países en vías de desarrollo.

Recogen las cuestiones clave en cuanto a: conceptualización, planificación, implementación y “buenas prácticas” que deben seguirse en cada una de las etapas del proceso de digitalización.

También disponemos de una serie de normas establecidas por la ISO.

Algunas de esas normas, las nombramos a continuación:

ISO 3664 – Sobre Calidad Visual de las Imágenes (en dos dimensiones).

ISO 12646 – Sobre Tecnología Gráfica. Monitores para la realización de pruebas a color. Características.

ISO 13028 – Información y Documentación. Directrices para la implementación de la digitalización en documentos.

ISO 30300 – Sobre Sistemas de Gestión Documental. (Complementa a la Norma ISO 15489) .

ISO 3664 – Sobre Calidad Visual de las Imágenes (en dos dimensiones): Fotografías en papel, diapositivas, pruebas impresas, documentos impresos…

•Esta norma proporciona las reglas básicas que deben cumplir las cabinas de pruebas, mesas de luz y puntos de trabajo utilizados para juzgar el color, luminosidad y la calidad general de imágenes en artes gráficas.

•Especial hincapié en que las condiciones especificadas permitan comparar y juzgar de modo fiable documentos impresos, pruebas de color y materiales fotográficos originales. 

•Los parámetros que tiene en cuenta son:

•Calidad del color
•Intensidad de la iluminación
•Uniformidad de la iluminación
•Entorno de trabajo y observación
•Colocación del observador, los elementos de iluminación y los materiales los unos con respecto de los otros.

•La norma ISO 3664 tiene en cuenta además la presencia de blanqueadores ópticos en el papel y el efecto de la luz ultravioleta en combinación con éstos.

•El iluminante especificado para la iluminación empleada es D50 cuyo Índice de Reproducción Cromática (CRI) deberá ser de 90 o superior.

En nuestro país, República Dominicana, existen las siguientes dos normas:



Como se puede ver en la imagen superior, estamos en eso.


Imagen Digital

Diferenciamos entre una reproducción fotográfica ordinaria (analógica) y una reproducción fotográfica digital. La primera obtiene la imagen sobre una emulsión química fotosensible (película fotográfica), mientras que la reproducción digital captura una imagen de formato electrónico por medio de un sensor y construye su representación mediante una cadena de bits. Esta cadena de bits, interpretada por un ordenador, presenta una reproducción de la imagen en pantalla.  (Archivo General de Castilla y León, 2011).


Dicha imagen, obtenida por escaneo, es dividida en una matriz de puntos a modo de cuadrícula, tantos como fotodiodos (dispositivo electrónico que al recibir luz genera una corriente eléctrica acorde a la cantidad de luz recibida) tenga el sensor. Cada uno de estos puntos recibe el nombre de píxel (elemento más pequeño que compone la imagen), que toma el valor binario 1 ó 0 dependiendo de la luminosidad y el tono lumínico leído por el escáner. (Archivo General de Castilla y León, 2011).

A cada píxel se le asigna un valor tonal (negro, blanco, gris, color) que está representado por un código binario (ceros y unos). Estos dígitos binarios (bits) para cada píxel son almacenados en una secuencia y con frecuencia reducidos a una representación matemática (compresión). (Archivo General de Castilla y León, 2011).

Resolución Digital.

Viene dada por el número de pixeles (nº de filas x nº de columnas) que tiene la imagen. Cuanto mayor sea este número mayor será la resolución. (Archivo General de Castilla y León, 2011).



Profundidad de bits o resolución cromática.

La profundidad de bits especifica la cantidad de información de color que está disponible para cada píxel de una imagen. Cuantos más bits de información por píxel haya, más colores disponibles existirán y se podrá apreciar una mayor precisión en la representación del color. (Archivo General de Castilla y León, 2011).

Tamaño del fichero .

Se calcula multiplicando el área de superficie (ancho x alto) del documento a digitalizar (en pulgadas), por la profundidad en bits (en bits/píxel) y por el cuadrado de la resolución (ppi2). Dado que el tamaño del archivo se representa en Bytes (8 bits), dividiremos el resultado entre 8.

Compresión de archivos.

La compresión se utiliza para reducir el tamaño del fichero de imagen para su almacenamiento, su procesamiento y transmisión. A mayor tamaño del archivo mayores recursos informáticos serán necesarios consumir.


Formatos de Archivos (Archivo General de Castilla y León, 2011) .

(Windows Bitmap): Formato propio del programa Microsoft Paint, perteneciente al Sistema operativo Windows. Puede guardar imágenes de 24 bits (16,7 millones de colores), 8 bits (256 colores) y menos. Proporciona gran calidad para imágenes en color. Es un formato estándar y ampliamente soportado. Es de fácil integración en aplicaciones y entornos Windows. En contrapartida, este formato no permite apenas la compresión de los ficheros, lo que genera archivos demasiado grandes. Además, carece de metadatos.

(Graphic Interchange Format): Formato estándar que utiliza compresión sin pérdida de calidad para imágenes de hasta 256 colores, limitados por una paleta restringida a este número de colores. Las imágenes con más de 256 colores ( y profundidad de color superior a 8), deben adaptarse reduciendo sus colores, con la consiguiente pérdida de calidad. Admite un alto grado de compresión. Tiene capacidad para soportar la animación y no necesita de una aplicación externa para su visualización en web.

(Tagged Image File Format): Formato de fichero digital que acepta la compresión sin pérdidas, por lo que se conserva la información original completa. Se trata de un formato estándar y de uso libre, y es el más utilizado con fines de conservación. Proporciona gran calidad para imágenes en color (32 bits), escala de grises y blanco y negro. Su principal inconveniente es el alto volumen de almacenamiento requerido motivado por el tamaño del archivo que genera.

(Joint Photographic Experts Group): Formato de gran calidad para imágenes en color (24 bits) que ofrece un alto grado de compresión (con pérdidas). No es una “pérdida visual”, sin embargo cada vez que se edita y se guarda una imagen jpg se producen pérdidas de calidad, por lo que no es recomendable para ficheros maestros. Es un formato estándar muy usado.

(Portable Document Format): Formato de almacenamiento de documentos compuesto (imagen vectorial, mapa de bits y texto), desarrollado por la empresa Adobe Systems. Este formato permite distintos grados de compresión (con pérdidas). Estándar muy extendido que mantiene una calidad muy buena. Idóneo para imprimir y crear documentos secuenciales con páginas múltiples. Puede generarse desde cualquier aplicación mediante la instalación de una impresora virtual en el sistema operativo, en caso de usar aplicaciones sin esa funcionalidad embebida. El PDF/A, basado en un subconjunto del formato PDF, es el estándar ISO (ISO 19005-1:2005) para la preservación de los documentos electrónicos a largo plazo.

(Portable Network Graphics):  Formato gráfico basado en un algoritmo de compresión sin pérdida para bitmaps no sujeto a patentes. Este formato fue desarrollado en buena parte para solventar las deficiencias del formato GIF y permite almacenar imágenes con una mayor profundidad de contraste y otros datos importantes.

(Scalable Vector Graphics): Formato para describir gráficos vectoriales bidimensionales, tanto estáticos como animados. La imagen vectorial, a diferencia de un mapa de bits, puede ser escalada, tanto como se requiera, sin pérdida de calidad de imagen. Las imágenes SVG pueden salvarse comprimidas. Tiende a comprimirse muy bien, llegando a ser ficheros mucho más pequeños. Aun así, a menudo el fichero vectorizado original (SVG) o gráfico vectorial es más pequeño que la versión de mapa de bits.

El formato RAW, cuya traducción literal del inglés al castellano significa “crudo”, es un formato de archivo digital de imágenes que contiene la totalidad de los datos de la imagen tal y como ha sido captada por el sensor digital de la cámara fotográfica. Sería, por así decirlo, el “negativo de una cámara digital”. El formato RAW generalmente lleva aplicado compresión de datos sin pérdida de información. Debido a que contiene la totalidad de los datos de la imagen captada por la cámara y una mayor profundidad de color, sus ficheros tienen un tamaño de archivo muy grande, a pesar de que, generalmente, usan compresión.


Finalidad (Crespo, 1986).

•El servicio inmediato y directo de consulta.

•Completar fondos documentales, originaria o temáticamente afines, repartidos entre varias instituciones archivísticas, facilitando con ello su conocimiento y uso.

•Potenciar la accesibilidad y difusión de series documentales.

•Preservar de su deterioro las piezas más frágiles y/o valiosas, al evitar de esta forma su consulta directa.

•Asegurar la pervivencia del contenido de un fondo frente a posibles destrucciones o perdidas materiales.

•Sustituir legal y definitivamente al original (en papel) en el supuesto de eliminación autorizada.



Finalidad a tener en cuenta:

1.Objetivos y justificación del Plan en cada centro.

2.Establecimiento de prioridades.

3.Criterios de selección del material objeto de la digitalización.

4.Proceso de digitalización .

Objetivos y justificación.

1.El volumen de documentos que alberga susceptibles de ser digitalizados.

2.Costes de la digitalización (adquisición y mantenimiento de recursos informáticos):

1.Máquinas (escáneres, almacenamiento masivo, servidores, PCs, monitores, impresoras, comunicaciones, etc.)

2. Programas de ordenador (funcionalidades adicionales de escáner, incorporación de metadatos, gestión y recuperación de documentos, visualización y tratamiento de las imágenes, OCR, etc.)

3.servicios necesarios (programas a medida, puesta en marcha y mantenimiento de sistemas para tratamiento de la información, etc.)

Documentos de valor excepcional, sometidos a un volumen de consultas elevado, que pueda provocar riesgos en su conservación o bien peligro de deterioro. Por ejemplo, los pergaminos medievales, cartularios, cartas reales, privilegios rodados, etc.

Documentos con gran valor histórico o probatorio, que contengan información relevante, como son los libros de actas, libros de acuerdos, documentación del catastro, etc. 

Criterios de selección (Filmoteca Nacional, 2006).

A tener en cuenta los siguientes aspectos para la evaluación del material a digitalizar :


Configuración del hardware.  

Deberá responder a las siguientes preguntas:

¿Qué clase de imágenes u objetos digitales se están creando? ¿Textuales, fotográficos, otros?

¿Qué cantidad?
¿Con qué fines? ¿Servicio al usuario, difusión, conservación?




InfanView.


Herramienta de fácil manejo, potente y con un escaso consumo de recursos. Permite visualizar imágenes de archivos corruptos. Para imágenes RAW es necesaria la descarga de un plug-in adicional.

WildBitViewer.

Software que permite la visualización de imágenes de forma rápida y completa. Posee un editor de fotos con bastantes herramientas, incluye la posibilidad de introducir metadatos a un grupo entero de fotos. Permite la comparación de fotos y la consulta remota a través del Wi-Fi.

XnView.

Es uno de los visores de imágenes que más archivos puede abrir. Mediante plug-ins, puede ser compatible con más de 500 tipos de archivos, e incluso convertirlos a 70 formatos distintos. Permite algunos retoques básicos como el brillo, rotar, recortar, redimensionar, o aplicar efectos, incluso a varias fotos a la vez.


Herramienta que cuenta con un modo pantalla completa.  Se muestran los metadatos de la foto. Permite realizar retoques de fotografía como brillo, color, e incluso mejora de detalle y función de clonar como en Photoshop. Compatible con visualización de fotos en RAW y permite enviar fotos a otros programas que elijamos.










La preservación a largo plazo de los documentos digitales debe garantizar sus valores informativos y testimoniales. No se trata solo de poder consultar una información, sino que ésta sea íntegra, fiable y auténtica.  Por tanto se recomienda:

Aspectos técnicos.

Condiciones de visualización y calibración monitor.
La calibración es el proceso de ajustar la configuración del color, brillo y contraste del monitor a un nivel estándar, de manera que la imagen se presente de la misma forma en diferentes monitores. Se recomienda que el control de calidad de visionado de imágenes lo realice una sola persona con la misma máquina.

Obtención de imágenes
Seleccionar el dispositivo de captura más adecuado para cada tipo de objeto (selección de la mejor opción de escáner). Comprobar que el número de páginas digitalizadas sea igual al número de imágenes digitales resultantes del proceso de digitalización. 


Requisitos técnicos para garantizar la calidad y preservación digital de documentos textuales, gráficos y sonoros del Principado de Asturias (Normas Nortic A1).


Requisitos técnicos para garantizar la calidad y preservación digital de documentos textuales y gráficos Archivo General Castilla y León.


Tratamiento de imágenes
Obtenidas las imágenes deberá verificarse lo siguiente:

1.Que las imágenes estén correctamente alineadas
2.Que las imágenes no tengan márgenes añadidos
3.Sean una representación fiel e íntegra del original
4.Sean legibles

Tratamiento de imágenes

Nombramiento de objetos digitales (dilema y dificultad, deberá establecerse desde el inicio para poder recuperar la información de forma rápida, evitando así la pérdida de información y duplicidad de la misma). 
Ejemplo – Principado de Asturias

Creación de ficheros de consulta para evitar tener que abrir de manera constante el fichero maestro (preservación de la calidad de la imagen con el tiempo).

                                                                         Ejemplo – Principado de Asturias


                                       En conclusión.

Como pudo observarse en toda la teoría de estos procesos de digitalización, se requiere de muchos procedimientos, normativas, tecnologías, capacitación, destrezas y habilidades, lo cual no se logra de la mañana a la noche. Además de tener conciencia de lo que se hace, se requiere profesionalidad, dedicación y conocimientos. El bibliotecario no es informático, ni programador, ni editor de imágenes y mucho menos un técnico de  en el arte de escanear documentos, pero debido a que al día de la biblioteca decidió incursionar en el mundo de las tecnologías para no quedarse en la historia, entonces los bibliotecarios de hoy, son todas esas cosas y más. Queda pues, capacitarse y estudiar más e ir logrando metas cada día, para poder llamarse un bibliotecario del Siglo XXI. ¿Y el Siglo XXII que nos traerá?










Conservación y preservación digital: la migración

Tomado de los apuntes de cátedras de la maestra Izaskun Herrojo Salas Dentro de los procesos de conservación y preservación de docume...