Protocolo de parámetros técnicos para la digitalización de documentos del acervo del Archivo Municipal de La Plata

Versión julio 2024

Prefacio

Es importante destacar que el presente protocolo constituye un documento de trabajo auto-explicativo y pretende asistir el proceso de digitalización de documentos de archivo; no obstante, la producción de este documento se enmarca en un plan de más amplio alcance el cual prescinde de capacitación al personal.

Introducción

La digitalización de documentos es un proceso comprendido dentro de la normalización archivística, que incluye la identificación, clasificación y descripción, la conservación (informe de estado y modo de manipulación de los documentos), la ingesta y el acceso.

Toda la documentación que se proponga digitalizar debe estar al menos identificada, clasificada y acorde a un estado de conservación que permita su manipulación segura y libre de daño a la misma. De esta manera, se brinda el contexto necesario a los documentos, se facilita su correcto control y se proporcionan las referencias necesarias para su usabilidad.

Todos los potenciales objetos digitales deberán tener un código de identificación indicado por el archivista o el responsable de la trazabilidad del proyecto.

Alcance y contenido

El objetivo del presente documento es definir los parámetros técnicos para la producción de objetos digitales a partir del proceso de digitalización de los documentos físicos que resguarda el Municipio de La plata.

En todo proceso de digitalización y según lo demande cada proyecto, es preciso establecer el tipo y la dimensión de los lotes de trabajo y prever la ejecución de una prueba piloto que verifique la satisfacción de los requerimientos específicos que se indican en el diagnóstico del proyecto.

En este último caso, este Protocolo permite determinar los parámetros técnicos exigibles, así como el Control de Calidad que se debe hacer sobre los objetos digitales producidos.

Los criterios técnicos de captura y codificación que se mencionan en este documento son adecuados para garantizar la preservación digital de los documentos que resguarda el municipio, aspirando a lograr un estándar de calidad elevado y un peso de objeto digital optimizado.

Capacidades técnicas de captura y reproducción

Los tipos de dispositivos recomendados para el municipio orientados a procesos de captura y reproducción de documentos se listan a continuación.

  • Captura por tecnología de rodillos (rotativo) con accesorio cama plana: utilizado para documentación en muy buen estado de conservación, hasta A3.
  • Captura de tipo barrido (cama plana): orientado a documentación de soporte opaco, hasta A3.
  • Captura de tipo plano cenital: utilizado para documentación frágil, formato A2.

Captura de imágenes

La siguiente tabla justifica la extensión requerida para la producción de los archivos digitales:

Tipos de archivo de imagen TIFF JPG PNG GIF
Uso Archivos para imprimir / Fotografía Web Web; imágenes con transparencias y muchos tonos de color Animaciones
Posibilidad de compresión sin pérdidas Sí (LZW) No
Tamaño de archivo 4 GB máximo Pequeño Pequeño Muy pequeño
Espectro de color CMYK, RGB y LAB; espectro de color completo CMYK y RGB; espectro de color completo Solo RGB; espectro de color completo Solo RGB; limitado a 256 colores
Calidad para imprimir No No

Se ha identificado al formato de archivo TIFF (Tagged Image File Format) como el más adecuado para las necesidades de copias digitales con calidad máster.

Imágenes con lenguaje textual

Características
materiales de originales
Resolución de captura/tipos de archivo a obtener (*) Modos de Color (Escala de grises/color RGB) Tipo de escáner compatible al formato y/o soporte (**)
PUBLICACIONES PERIODICAS
(formato hasta A4)
300 DPI / TIFF Escala de grises @ 8 bits - Cenital
- Barrido (A3)
- Rotativo
PUBLICACIONES PERIODICAS
(formatos A3 o superior)
200 DPI / TIFF Escala de grises @ 8 bits - Cenital
TEXTO IMPRESO
(formato hasta A4)
300 DPI / TIFF Escala de grises @ 8 bits - Cenital
- Barrido (A3)
- Rotativo
TEXTO IMPRESO
(formatos A3 o superior)
200 DPI / TIFF Escala de grises @ 8 bits - Cenital
MANUSCRITO
(diferentes formatos)
300 DPI / TIFF Escala de grises @ 8 bits ó Color @ 24 bits - Cenital
- Barrido (A3)
- Rotativo
MAPAS, PLANOS Y PERGAMINOS
(formatos hasta A4)
600 DPI / TIFF Color @ 24 bits - Cenital
- Barrido (A3)
- Rotativo
MAPAS, PLANOS Y PERGAMINOS
(formatos A3 ó superior)
300 DPI / TIFF Color @ 24 bits - Cenital

* La resolución (DPI) de captura posee parámetros para generar objetos digitales master, por lo que nunca debe ser inferior a estos parámetros, a su vez, en casos excepcionales puede ser superior donde la definición sea insuficiente y se precise un resultado más legible.

** Si bien el escáner y el formato y/o soporte pueden ser compatibles, las áreas intervinientes deberán evaluar el equipo aconsejable según estado de la documentación y nivel de productividad deseable.

Imágenes con lenguaje visual

Para este tipo de documentación se debe mantener una colorimetría que refleje de manera fidedigna su composición original. Por profesionalidad y prestaciones superiores se recomienda utilizar el software SilverFast, configurado con las siguientes disposiciones:

  • Espacio de color Adobe RGB.
  • Escáneres pre-configurados con targets (IT8) para mejor rango dinámico.
  • Captura a color con 48 bits de profundidad y salida a 24 bits.
Tamaño DPI Mega pixels aprox. Peso de objeto digital (Mega bytes)
35 mm(*) 2400 14 MP 43,2 MB
6 x 6 cm 2400 33 MP 97,4 MB
17 x 12 cm 1200 47 MP 137 MB
24 x 30 cm (o superior) 600 39 MP 115 MB

*Un incremento superior en la cantidad de DPI establecida no discriminara mejoría alguna, esto es debido a la limitación en el soporte de origen.

Es importante observar que, salvo en 35 mm, el número de DPI decrece a la vez que aumenta la superficie del documento, si bien la relación del cuadro no es lineal, se puede apreciar que siguiendo esta lógica el peso del objeto digital rondará entre 100 y 150 MB.

Control de calidad del proceso

La siguiente definición contemplara la etapa productiva del proyecto, en etapas de prueba e inicial los controles se harán sobre la totalidad de la muestra.

El Control de Calidad abarca:

  • Verificar la fidelidad, incluyendo integridad del documento, bordes con márgenes límites (0,4 ± 0,1mm) y contenido de anverso y reverso contrastado al original.
  • Evaluar los parámetros técnicos acorde al tipo de documento digitalizado y los posibles defectos de captura. Espacio de color, foco y definición congruente al tipo de captura.
  • Comprobar que el código de identificación de los distintos niveles de descripción coincida con la denominación de las carpetas, la estructura del árbol de carpetas pertinente al proyecto y (si lo hubiese) al inventario analítico del mismo.

El Control de Calidad debe realizarse:

  • Semanalmente.
  • De acuerdo al tipo de escáner o medio de captura.
  • Sobre la totalidad de los objetos digitales extremos: comienzo y final del lote analizado.
  • Sobre un muestreo de los restantes objetos digitales, conforme se indica a continuación.

Muestra y control variable por tipo de digitalización

De acuerdo al tipo de escáner puede variar significativamente la velocidad de digitalización, como así también la cantidad de errores probables.

Ejemplo de ello es que mientras una captura por medio rotativo (solo para documentación en excelente estado de conservación) posee una producción más “automatizable”, de promedio en 6.000 objetos digitales semanales y suele tener una baja tasa de errores, en cambio una captura de tipo cenital, ronda una producción promedio a 500 objetos digitales semanales y la tasa de errores puede ser alta; ya que discrimina recurrentes fallas técnicas de pérdida de foco e iluminación dispar, lo cual plantea un desafío extra por sobre la prolijidad del digitalizador.

El tipo de escáner utilizado determinará tanto la cantidad de objetos digitales a seleccionar de manera aleatoria como muestra (aplicando el porcentual correspondiente), como así el control de calidad adicional que deberá realizarse de la siguiente manera:

  • Escáner cenital A2: 30% con especial énfasis en foco y colorimetría.
  • Escáner rotativo: 5% con énfasis en posibles rayas de guías.
  • Escáner cama plana: 50% verificar ausencia de líneas por dispersión de luz.

Metadados técnicos

Son datos que tienen la particularidad de ser metadatos incrustados dentro de cada objeto digital, los mismos pueden variar de acuerdo al tipo de captura realizada y deben ser:

  • Responsable de la digitalización/conversión del formato: identifica operador de la digitalización o de la conversión de formato.
  • Fecha de la digitalización/conversión del formato: consigna la fecha en la que se ha realizado la digitalización.
  • Formato/contenedor: extensión del archivo obtenido.
  • Resolución: forma en la que la información es encapsulada para generar el objeto digital (alto, ancho de pixeles y DPI)
  • Tamaño: tamaño del objeto digital obtenido. Indica peso digital del objeto.
  • Tipo de copia: identifica si es máster o derivada. (TIFF ó JPG/PDF)
  • Profundidad de bits de imagen: cantidad de información expresada en bits que se usa para generar cada pixel.
  • Compresión: indica si la información en el objeto digital se encuentra codificada con algún mecanismo de compresión de datos.
  • Software utilizado para la captura y/o proceso: software utilizado para la captura y/o proceso de digitalización del documento.
  • Dispositivo o equipo: equipamiento utilizado para la captura digital del documento.
  • Observaciones: campo para comentarios generales que no debe utilizarse para otros metadatos específicos.

Archivos de salida y almacenamiento

Del proceso de digitalización se obtendrán solamente los objetos digitales Máster (TIFF), los cuales luego de la etapa de control serán almacenados en la carpeta Máster correspondiente al fondo/colección dentro del servidor. Una vez generado el objeto digital Máster el mismo estará disponible para el proceso de ingesta.

Las derivadas para consulta serán generadas en el propio proceso de ingesta y su formato será JPG y/o PDF. Lo define ingesta según la necesidad para su difusión.

Para dar estructura a la totalidad de los objetos digitales producidos, los mismos deberán ser guardados en el servidor y en carpetas ordenadas de forma tal, que se refleje en su estructura el cuadro de clasificación del material original.

Para los Fondos y Colecciones documentales

MASTER

Código del fondo/Colección
Código del subfondo (si corresponde)
Código de la sección (si corresponde)
Código de la serie
Código de la unidad documental (UD) compuesta o simple
Código de identificación de la UD. Extensión

DERIVADA

Código del fondo/Colección
Código del subfondo (si corresponde)
Código de la sección (si corresponde)
Código de la serie
Código de la unidad documental (UD) compuesta o simple
Código de identificación de la UD. Extensión

Ejemplo:

Código de fondo/Colección: WIT01
Código subfonfo (si corresponde): CJ
Código de la sección (si corresponde): Eff
Código de la serie: nre
Código de la UD compuesta o simple: 0080
Código de identificación de la UD. Extensión:
AR-AGN-WIT01-CJ-Eff-nre-0080.tiff


volver
100 Bomberos
103 Defensa Civil
106 Prefectura
107 Ambulancia
147 Atención al Vecino
911 Seguridad