La Digitalización: apuntes de cátedra
Imagen tomada de: https://www.muycomputerpro.com/2017/05/11/digitalizacion-empresas-espanolas
Nota: los apuntes aquí expuestos corresponden a los contenidos de las cátedras en la materia de Documentos digitales y su conservación, de la maestra Izaskum Herrojo Salas. Otros contenidos fueron tomados de la web y algunos diseños propios.
Para comenzar busquemos una definición del término "digitalización". Veamos:
La Digitalización es el proceso mediante el cual un mensaje se convierte en una sucesión de impulsos eléctricos, equivalente a dígitos combinados (código binario), el 0 ó el 1 (en realidad es una serie de apagado y prendido de impulso combinados). Estos dígitos son los llamados bits. De esta forma, todo mensaje que es susceptible de transformarse en señal eléctrica y ser codificado digitalmente puede almacenarse en soporte informático o transmitirse como tren de impulsos por una red adecuada (hilo telefónico, microondas, fibra óptica, cable coaxial, etc.) El código digital o binario es la base del tratamiento informático y de la tecnología de la información en su estado actual.
Texto extraído de: http://www2.udec.cl/~lsalazarv/digitalizacion.html
Sí, pero esa definición está muy informatizada. Acerquémonos a una más cerca del ámbito de la Bibliotecología. Veamos:
La digitalización de documentos implica pasar documentación física a formato digital. Son muchas las empresas que almacenan gran cantidad de documentación que ocupa demasiado espacio y es difícil de consultar. Aunque este proceso pueda resultar tedioso, una vez realizado puede suponer una ventaja competitiva al hacer que la información sea accesible.
Sí, en Bibliotecología nos referimos a ese proceso técnico de volver un contenido lógico (que se encuentra en estado físico, como en el caso de los documentos de tipo bibliográfico) en uno digital, mediante un proceso de escaneo de dichos documentos, para que estos puedan ser leídos, visto u oído a través de un medio electrónico, como un computador, tableta, móvil, etc. Pero para adentrarnos al tema de manera más detallada, haremos una pregunta de reflexión:
No esperen respuesta, es para usted, yo ya respondí a la misma durante mis clases. De acuerdo a los mencionados apuntes de cátedras del sub título de ese artículo, hay que tomar en cuenta algunos elementos, a saber:
- Marco normativo
- Conceptos básicos
- Plan de digitalización
- Aspectos técnicos
- Marco legal (Derechos de autor).
Dentro de las normativas, disponemos de :
Documento publicado en el año 2002 por la
IFLA/UNESCO
para los programas de digitalización de colecciones y fondos públicos,
especialmente aplicables a países en vías de desarrollo.
Recogen las cuestiones clave en cuanto a:
conceptualización, planificación, implementación y “buenas prácticas” que deben
seguirse en cada una de las etapas del proceso de digitalización.
También disponemos de una serie de normas establecidas por la ISO.
Algunas de esas normas, las nombramos a continuación:
•ISO
3664 – Sobre Calidad Visual
de las Imágenes (en dos dimensiones).
•ISO
12646 – Sobre Tecnología
Gráfica. Monitores para la realización de pruebas a color. Características.
•ISO
13028 – Información y
Documentación. Directrices para la implementación de la digitalización en
documentos.
•ISO
30300 – Sobre Sistemas de
Gestión Documental. (Complementa a la Norma ISO 15489)
.
•ISO
3664 – Sobre Calidad Visual
de las Imágenes (en dos dimensiones): Fotografías en papel, diapositivas,
pruebas impresas, documentos impresos…
•Esta norma proporciona
las reglas básicas que deben cumplir las cabinas de pruebas, mesas de luz y
puntos de trabajo utilizados para juzgar el color, luminosidad y la calidad
general de imágenes en artes gráficas.
•Especial hincapié en que
las condiciones especificadas permitan comparar y juzgar de modo fiable
documentos impresos, pruebas de color y materiales fotográficos originales.
•Los parámetros que tiene
en cuenta son:
•Calidad
del color
•Intensidad
de la iluminación
•Uniformidad
de la iluminación
•Entorno
de trabajo y observación
•Colocación
del observador, los elementos de iluminación y los materiales los unos con respecto de los otros.
•La norma ISO 3664 tiene
en cuenta además la presencia de blanqueadores ópticos en el papel y el efecto
de la luz ultravioleta en combinación con éstos.
•El iluminante
especificado para la iluminación empleada es D50 cuyo Índice de Reproducción
Cromática (CRI) deberá ser de 90 o superior.
En nuestro país, República Dominicana, existen las siguientes dos normas:
Como se puede ver en la imagen superior, estamos en eso.
Imagen Digital
Diferenciamos entre una reproducción fotográfica ordinaria
(analógica) y una reproducción fotográfica digital. La primera obtiene la
imagen sobre una emulsión química fotosensible (película fotográfica), mientras
que la reproducción digital captura una imagen de formato electrónico por medio
de un sensor y construye su representación mediante una cadena de bits. Esta
cadena de bits, interpretada por un ordenador, presenta una reproducción de la
imagen en pantalla. (Archivo General de
Castilla y León, 2011).
Dicha imagen, obtenida
por escaneo, es dividida en una matriz de puntos a modo de cuadrícula, tantos
como fotodiodos (dispositivo
electrónico que al recibir luz genera una corriente eléctrica acorde a la
cantidad de luz recibida)
tenga el sensor. Cada uno de estos puntos recibe el nombre de píxel (elemento
más pequeño que compone la imagen), que toma el valor binario 1 ó 0 dependiendo de la
luminosidad y el tono lumínico leído por el escáner. (Archivo General de
Castilla y León, 2011).
A cada píxel se le
asigna un valor tonal (negro, blanco, gris, color) que está representado por un
código binario (ceros y unos). Estos dígitos binarios (bits) para cada píxel
son almacenados en una secuencia y con frecuencia reducidos a una representación
matemática (compresión). (Archivo General de Castilla y León, 2011).
Resolución Digital.
Viene dada por el número
de pixeles (nº de filas x nº de columnas) que tiene la imagen. Cuanto mayor sea
este número mayor será la resolución. (Archivo General de Castilla y León,
2011).
Profundidad de bits o resolución cromática.
La profundidad de bits
especifica la cantidad de información de color que está disponible para cada
píxel de una imagen. Cuantos más bits de información por píxel haya, más
colores disponibles existirán y se podrá apreciar una mayor precisión en la
representación del color. (Archivo General de Castilla y León, 2011).
Tamaño del fichero
.
Se calcula multiplicando
el área de superficie (ancho x alto) del documento a digitalizar (en pulgadas),
por la profundidad en bits (en bits/píxel) y por el cuadrado de la resolución
(ppi2). Dado que el tamaño del archivo se representa en Bytes (8 bits),
dividiremos el resultado entre 8.
Compresión de archivos.
La compresión se utiliza para reducir el tamaño del fichero
de imagen para su almacenamiento, su procesamiento y transmisión. A mayor
tamaño del archivo mayores recursos informáticos serán necesarios consumir.
Formatos de Archivos (Archivo
General de Castilla y León, 2011)
.
(Windows
Bitmap): Formato propio del
programa Microsoft Paint, perteneciente al
Sistema operativo Windows. Puede guardar imágenes de 24 bits (16,7 millones de
colores), 8 bits (256 colores) y menos. Proporciona gran calidad para imágenes
en color. Es un formato estándar y ampliamente soportado. Es de fácil integración
en aplicaciones y entornos Windows. En contrapartida, este formato no permite
apenas la compresión de los ficheros, lo que genera archivos demasiado grandes.
Además, carece de metadatos.
(Graphic Interchange Format): Formato estándar que
utiliza compresión sin pérdida de calidad para imágenes de hasta 256 colores,
limitados por una paleta restringida a este número de colores. Las imágenes con
más de 256 colores ( y profundidad de color superior a 8), deben adaptarse reduciendo
sus colores, con la consiguiente pérdida de calidad. Admite un alto grado de
compresión. Tiene capacidad para soportar la animación y no necesita de una
aplicación externa para su visualización en web.
(Tagged Image File Format): Formato de fichero
digital que acepta la compresión sin pérdidas, por lo que se conserva la
información original completa. Se trata de un formato estándar y de uso libre,
y es el más utilizado con fines de conservación. Proporciona gran calidad para
imágenes en color (32 bits), escala de grises y blanco y negro. Su principal
inconveniente es el alto volumen de almacenamiento requerido motivado por el
tamaño del archivo que genera.
(Joint Photographic Experts Group): Formato de gran calidad
para imágenes en color (24 bits) que ofrece un alto grado de compresión (con
pérdidas). No es una “pérdida visual”, sin embargo cada vez que se edita y se
guarda una imagen jpg se
producen pérdidas de calidad, por lo que no es recomendable para ficheros
maestros. Es un formato estándar muy usado.
(Portable
Document Format): Formato de
almacenamiento de documentos compuesto (imagen vectorial, mapa de bits y
texto), desarrollado por la empresa Adobe Systems. Este formato permite distintos grados de compresión (con
pérdidas). Estándar muy extendido que mantiene una calidad muy buena. Idóneo
para imprimir y crear documentos secuenciales con páginas múltiples. Puede
generarse desde cualquier aplicación mediante la instalación de una impresora
virtual en el sistema operativo, en caso de usar aplicaciones sin esa
funcionalidad embebida. El PDF/A, basado en un subconjunto del formato PDF, es
el estándar ISO (ISO 19005-1:2005) para la preservación de los documentos
electrónicos a largo plazo.
(Portable
Network Graphics): Formato gráfico basado en un algoritmo de
compresión sin pérdida para bitmaps no sujeto a patentes. Este formato fue desarrollado en
buena parte para solventar las deficiencias del formato GIF y permite almacenar
imágenes con una mayor profundidad de contraste y otros datos importantes.
(Scalable
Vector Graphics): Formato para describir
gráficos vectoriales bidimensionales, tanto estáticos como animados. La imagen
vectorial, a diferencia de un mapa de bits, puede ser escalada, tanto como se
requiera, sin pérdida de calidad de imagen. Las imágenes SVG pueden salvarse
comprimidas. Tiende a comprimirse muy bien, llegando a ser ficheros mucho más
pequeños. Aun así, a menudo el fichero vectorizado original (SVG) o gráfico vectorial es más pequeño que la
versión de mapa de bits.
El formato RAW, cuya
traducción literal del inglés al castellano significa “crudo”, es un formato de
archivo digital de imágenes que contiene la totalidad de los datos de la imagen
tal y como ha sido captada por el sensor digital de la cámara fotográfica.
Sería, por así decirlo, el “negativo de una cámara digital”. El formato RAW
generalmente lleva aplicado compresión de datos sin pérdida de información.
Debido a que contiene la totalidad de los datos de la imagen captada por la
cámara y una mayor profundidad de color, sus ficheros tienen un tamaño de
archivo muy grande, a pesar de que, generalmente, usan compresión.
Finalidad (Crespo, 1986).
•El
servicio inmediato y directo de consulta.
•Completar
fondos documentales, originaria o temáticamente afines, repartidos entre varias
instituciones archivísticas, facilitando con ello su conocimiento y uso.
•Potenciar
la accesibilidad y difusión de series documentales.
•Preservar
de su deterioro las piezas más frágiles y/o valiosas, al evitar de esta forma
su consulta directa.
•Asegurar
la pervivencia del contenido de un fondo frente a posibles destrucciones o
perdidas materiales.
•Sustituir
legal y definitivamente al original (en papel) en el supuesto de eliminación
autorizada.
Finalidad a tener en cuenta:
1.Objetivos y
justificación del Plan en cada centro.
2.Establecimiento de
prioridades.
3.Criterios de selección
del material objeto de la digitalización.
4.Proceso de
digitalización
.
Objetivos y justificación.
1.El volumen de documentos
que alberga susceptibles de ser digitalizados.
2.Costes de la
digitalización (adquisición y mantenimiento de recursos informáticos):
1.Máquinas (escáneres,
almacenamiento masivo, servidores, PCs, monitores, impresoras, comunicaciones,
etc.)
2. Programas de ordenador
(funcionalidades adicionales de escáner, incorporación de metadatos, gestión y
recuperación de documentos, visualización y tratamiento de las imágenes, OCR,
etc.)
3.servicios necesarios
(programas a medida, puesta en marcha y mantenimiento de sistemas para
tratamiento de la información, etc.)
Documentos
de valor excepcional,
sometidos a un volumen de consultas elevado, que pueda provocar riesgos en su
conservación o bien peligro de deterioro. Por ejemplo, los pergaminos
medievales, cartularios, cartas reales, privilegios rodados, etc.
Documentos
con gran valor histórico o probatorio, que contengan información relevante, como son los libros
de actas, libros de acuerdos, documentación del catastro, etc.
Criterios de selección (Filmoteca
Nacional, 2006).
A
tener en cuenta los siguientes aspectos para la evaluación del material a
digitalizar
:
Configuración
del hardware.
Deberá responder a las siguientes preguntas:
¿Qué
clase de imágenes u objetos digitales se están creando? ¿Textuales,
fotográficos, otros?
¿Qué
cantidad?
¿Con
qué fines? ¿Servicio al usuario, difusión, conservación?
InfanView.
Herramienta
de fácil manejo, potente y con un escaso consumo de recursos. Permite
visualizar imágenes de archivos corruptos. Para imágenes RAW es necesaria la
descarga de un plug-in adicional.
WildBitViewer.
Software que permite la
visualización de imágenes de forma rápida y completa. Posee un editor de fotos
con bastantes herramientas, incluye la posibilidad de introducir metadatos a un
grupo entero de fotos. Permite la comparación de fotos y la consulta remota a
través del Wi-Fi.
XnView.
Es uno de los visores de imágenes
que más archivos puede abrir. Mediante plug-ins, puede ser compatible con más de
500 tipos de archivos, e incluso convertirlos a 70 formatos distintos. Permite
algunos retoques básicos como el brillo, rotar, recortar, redimensionar, o
aplicar efectos, incluso a varias fotos a la vez.
Herramienta
que cuenta con un modo pantalla completa. Se muestran los metadatos de la foto. Permite
realizar retoques de fotografía como brillo, color, e incluso mejora de detalle
y función de clonar como en Photoshop. Compatible con visualización de
fotos en RAW y permite enviar fotos a otros programas que elijamos.
La preservación a largo plazo de
los documentos digitales debe garantizar sus valores informativos y
testimoniales. No se trata solo de poder consultar una información, sino que
ésta sea íntegra, fiable y auténtica.
Por tanto se recomienda:
Aspectos técnicos.
Condiciones
de visualización y calibración monitor.
La calibración es el proceso de
ajustar la configuración del color, brillo y contraste del monitor a un nivel
estándar, de manera que la imagen se presente de la misma forma en diferentes
monitores. Se recomienda que el control de calidad de visionado de imágenes lo
realice una sola persona con la misma máquina.
Obtención
de imágenes
Seleccionar el dispositivo de
captura más adecuado para cada tipo de objeto (selección de la mejor opción de
escáner). Comprobar que el número de páginas digitalizadas sea igual al número
de imágenes digitales resultantes del proceso de digitalización.
Requisitos técnicos para garantizar
la calidad y preservación digital de documentos textuales, gráficos y sonoros
del Principado de Asturias (Normas Nortic A1).
Requisitos
técnicos para garantizar la calidad y preservación digital de documentos
textuales y gráficos Archivo General Castilla y León.
Tratamiento
de imágenes
Obtenidas
las imágenes deberá verificarse lo siguiente:
1.Que las imágenes estén
correctamente alineadas
2.Que las imágenes no tengan márgenes
añadidos
3.Sean una representación fiel e
íntegra del original
4.Sean legibles
Tratamiento
de imágenes
Nombramiento de objetos digitales
(dilema y dificultad, deberá establecerse desde el inicio para poder recuperar
la información de forma rápida, evitando así la pérdida de información y
duplicidad de la misma).
Ejemplo – Principado de Asturias
Creación de ficheros de consulta
para evitar tener que abrir de manera constante el fichero maestro
(preservación de la calidad de la imagen con el tiempo).
Ejemplo – Principado de Asturias
En conclusión.
Como pudo observarse en toda la teoría de estos procesos de digitalización, se requiere de muchos procedimientos, normativas, tecnologías, capacitación, destrezas y habilidades, lo cual no se logra de la mañana a la noche. Además de tener conciencia de lo que se hace, se requiere profesionalidad, dedicación y conocimientos. El bibliotecario no es informático, ni programador, ni editor de imágenes y mucho menos un técnico de en el arte de escanear documentos, pero debido a que al día de la biblioteca decidió incursionar en el mundo de las tecnologías para no quedarse en la historia, entonces los bibliotecarios de hoy, son todas esas cosas y más. Queda pues, capacitarse y estudiar más e ir logrando metas cada día, para poder llamarse un bibliotecario del Siglo XXI. ¿Y el Siglo XXII que nos traerá?
























