El proceso se está realizando con un equipo creado por dos argentinos; el aparato es cinco veces más barato que los convencionales y está realizado con software abierto.
El proyecto de digitalización de documentos de la Biblioteca del Colegio Nacional de Buenos Aires comenzó a gestarse en 2013. «Este proyecto fue posible gracias al apoyo de la Asociación Cooperadora Amadeo Jacques y se enfocó en la digitalización de colecciones especiales que incluyen publicaciones periódicas del siglo XIX, fotografías antiguas, documentación variada sobre la historia del colegio y revistas estudiantiles. El objetivo fue visibilizar las colecciones y ponerlas a disposición del público en una biblioteca digital que pronto estará en línea«, cuenta Matías Butelman, encargado de preservación digital en la Biblioteca del Colegio Nacional de Buenos Aires (BCNBA) y uno de los dos creadores del equipo que se está utilizando para la digitalización, que también se implementó en el Centro de Estudios Históricos de la Fuerza Aérea Argentina.
Pero la novedad de esta digitalización es que el equipo, que fue creado por Butelman y por el diseñador Juan Pablo Suárez: es mucho más económico que un equipo convencional. El nuevo aparato cuesta aproximadamente 600 dólares, mientas que el precio de los escáneres comerciales más económicos supera los 5000 dólares. «Además, si se lo compara con los escáneres planos, con este escáner ‘en V’ los libros reciben menos presión al ser manipulados. Mientras que si se lo compara con los escáneres ‘en V’ comerciales, el costo es hasta diez veces menor«, resalta Butelman al hablar de las ventajas de su equipo.
Otro de los beneficios de esta creación nacional es que con él las instituciones pueden acceder a los recursos técnicos y al software, porque ambos son libres y no dependen de un fabricante. «Al mismo tiempo, el diseño no está orientado hacia la obsolescencia programada y los repuestos, al igual que el equipo, pueden ser fabricados fácilmente; sus partes pueden ser modificadas para mejorar las capacidades y funciones del aparato«, señala el encargado de preservación digital de la biblioteca.
El escáner digitaliza aproximadamente 700 páginas por hora si se lo opera continuamente, mientras que el «postprocesado» demora en promedio 20 segundos por página.
Sobre el equipo y el proceso
El escáner consiste en dos cámaras digitales de gama media y un estativo compuesto por cuatro partes: una cama de madera con forma de ‘v’ ajustable, donde se apoya el documento; un prisma o platina móvil, que presiona las páginas del libro contra una placa transparente de vidrio o acrílico; dos soportes ajustables para posicionar las cámaras; y un sistema de iluminación, también ajustable.
«Para digitalizar un documento se levanta la platina, se coloca el documento en la cama, se baja la platina y se realiza la adquisición de las imágenes presionando una tecla. Por otro lado, las cámaras se controlan remotamente desde una PC. Luego se levanta la platina, se da vuelta la hoja y el proceso se repite. Esto permite digitalizar alrededor de 700 páginas por hora«, detalla Butelman.
Esta etapa inicial del proceso de digitalización se denomina captura. Una vez capturadas, las imágenes deben descargarse a una computadora para ser procesadas. Los pasos del procesamiento son ordenar, nombrar, rotar, recortar, ajustar el contraste y realizar el reconocimiento óptico de caracteres (OCR) hasta conseguir un documento final apto para publicarse en Internet.
Sobre sus principales proyectos a futuro, Butelman cuenta esta solución se encuentra en desarrollo constante y cada nueva organización que decide emplearlo está colaborando y aportando para lograr mayor perfeccionamiento del equipo y de los programas. «Actualmente estamos corrigiendo errores y disminuyendo la dificultad para configurar y operar el aparato. También consideramos la posibilidad de construir equipos para digitalizar documentación en otros formatos, siguiendo los mismos principios de desarrollo abierto y colaborativo», adelanta.
Tanto el equipo como el software son fruto de un desarrollo de producción colaborativo, basado en software y hardware libres. «Adaptamos recursos técnicos existentes que fueron liberados al público por una comunidad global de programadores, bibliotecarios y técnicos, principalmente en diybookscanner.org, chdk.wikia.com y drupal.org, a las necesidades de las bibliotecas, archivos y museos locales Con el apoyo de diversas instituciones pudimos avanzar en el desarrollo de una solución integral y de bajo costo para todo el proceso de digitalización«, revela el encargado de preservación digital de la BCNBA.
Según aclara Butelman, este equipo no está aún listo para salir al mercado, sino que se encuentra en un proceso experimental. «Actualmente estamos buscando la posibilidad de incubar el proyecto«, concluye.