Monday, September 24, 2007

¿cómo funciona un escaner?

Así funciona un escáner
1. El escáner es una de las herramientas fundamentales para introducir en internet imágenes realmente sorprendentes. Esta herramienta junto con un programa de retoque fotográfico son muy importantes para conseguir un sitio web moderno y estéticamente atrayente. Una definición simple de escáner podría ser la siguiente: dispositivo que permite pasar la información que contiene un documento en papel a un ordenador, para de esta manera poder modificarlo.
2. Este proceso transforma las imágenes a formato digital, es decir en series de 0 y de 1, pudiendo entonces ser almacenadas, retocadas o impresas o ser utilizadas para ilustrar un texto. Si el documento que se desea escanear es un texto, por medio de programas de reconocimiento de caracteres, también llamados por las siglas inglesas OCR (Optical Character Recognition), es posible reconstituirlo y convertirlo en texto reconocible por el ordenador, pudiendo ser corregido o añadir texto nuevo, es decir, nos evita tener que teclearlo.
3. El escaneado de una imagen se realiza con el barrido del documento por una fuente luminosa. Las zonas claras reflejan más luz que las partes oscuras. La luz reflejada se envía por un juego de espejos y a través de un objetivo hasta un sensor CCD el cual la convierte en señal eléctrica. En color, el mismo procedimiento es repetido tres veces, o bien son los tres chips o captores CCD los que analizan los tres haces luminosos separados previamente por un prisma y filtros rojos, verdes y azules. Los elementos CCD están colocados en una sola fila de forma que a cada elemento le corresponde un pixel de cada una de las filas de puntos que forman la imagen.
Un escáner de sobremesa incluye una fuente de alimentación, una lente, un dispositivo denominado CCD y uno o varios ADCs (convertidor analógico digital).
1. Parámetros para una elección correcta
o Definición Es la cualidad más importante de un escáner, es el grado de finura con el que se puede realizar el análisis de la imagen. Los fabricantes indican dos tipos de definición:
a. Óptica, que es la realmente importante, está determinada por el número de elementos CCD y la resolución de la lente. Se mide en puntos por pulgada.
b. Interpolada, que es el resultado de una serie de cálculos de difícil verificación.
o Profundidad de análisis de color Que se expresa en número de bits:
§ De 2 bits, resultaría una imagen en blanco y negro.
§ De 8 bits, se obtendría una imagen de 256 tonos de grises.
§ De 24 bits u 8 bits por componente de color (verde, rojo, azul), la imagen puede llegar a ser de 16,7 millones de colores.
§ De 30 bits, permite sobrepasar los mil millones de tintas.
Software Otro elemento a tener en cuenta es el software que acompaña al escáner. Muchos de ellos incorporan programas de gestión de textos y fotos, programas de reconocimiento de caracteres o programas de retoque fotográfico.
 Adaptación Es importante mirar la manera en que la cubierta del escáner se adapta al espesor de los distintos documentos que se vayan a escanear, como un libro grueso por ejemplo.Cómo funciona
El proceso de captación de una imagen resulta casi idéntico para cualquier escáner: se ilumina la imagen con un foco de luz, se conduce mediante espejos la luz reflejada hacia un dispositivo denominado CCD que transforma la luz en señales eléctricas, se transforma dichas señales eléctricas a formato digital en un DAC (conversor analógico-digital) y se transmite el caudal de bits resultante al ordenador.
El CCD (Charge Coupled Device, dispositivo acoplado por carga -eléctrica-) es el elemento fundamental de todo escáner, independientemente de su forma, tamaño o mecánica. Consiste en un elemento electrónico que reacciona ante la luz, transmitiendo más o menos electricidad según sea la intensidad y el color de la luz que recibe; es un auténtico ojo electrónico. Hoy en día es bastante común, puede que usted posea uno sin saberlo: en su cámara de vídeo, en su fax, en su cámara de fotos digital...
La calidad final del escaneado dependerá fundamentalmente de la calidad del CCD; los demás elementos podrán hacer un trabajo mejor o peor, pero si la imagen no es captada con fidelidad cualquier operación posterior no podrá arreglar el problema. Teniendo en cuenta lo anterior, también debemos tener en cuenta la calidad del DAC, puesto que de nada sirve captar la luz con enorme precisión si perdemos mucha de esa información al transformar el caudal eléctrico a bits.
Por este motivo se suele decir que son preferibles los escáners de marcas de prestigio como Nikon o Kodak a otros con una mayor resolución teórica, pero con CCDs que no captan con fidelidad los colores o DACs que no aprovechan bien la señal eléctrica, dando resultados más pobres, más planos.

La resolución
No podemos continuar la explicación sin definir este término, uno de los parámetros más utilizados (a veces incluso demasiado) a la hora de determinar la calidad de un escáner. La resolución (medida en ppp, puntos por pulgada) puede definirse como el número de puntos individuales de una imagen que es capaz de captar un escáner... aunque en realidad no es algo tan sencillo.
La resolución así definida sería la resolución óptica o real del escáner. Así, cuando hablamos de un escáner con resolución de "300x600 ppp" nos estamos refiriendo a que en cada línea horizontal de una pulgada de largo (2,54 cm) puede captar 300 puntos individuales, mientras que en vertical llega hasta los 600 puntos; como en este caso, generalmente la resolución horizontal y la vertical no coinciden, siendo mayor (típicamente el doble) la vertical.
Esta resolución óptica viene dada por el CCD y es la más importante, ya que implica los límites físicos de calidad que podemos conseguir con el escáner. Por ello, es un método comercial muy típico comentar sólo el mayor de los dos valores, describiendo como "un escáner de 600 ppp" a un aparato de 300x600 ppp o "un escáner de 1.200 ppp" a un aparato de 600x1.200 ppp; téngalo en cuenta, la diferencia es obtener o no el cuádruple de puntos.
Tenemos también la resolución interpolada; consiste en superar los límites que impone la resolución óptica (300x600 ppp, por ejemplo) mediante la estimación matemática de cuáles podrían ser los valores de los puntos que añadimos por software a la imagen. Por ejemplo, si el escáner capta físicamente dos puntos contiguos, uno blanco y otro negro, supondrá que de haber podido captar un punto extra entre ambos sería de algún tono de gris. De esta forma podemos llegar a resoluciones absurdamente altas, de hasta 9.600x9.600 ppp, aunque en realidad no obtenemos más información real que la que proporciona la resolución óptica máxima del aparato. Evidentemente este valor es el que más gusta a los anunciantes de escáners...
Por último está la propia resolución de escaneado, aquella que seleccionamos para captar una imagen concreta. Su valor irá desde un cierto mínimo (típicamente unos 75 ppp) hasta el máximo de la resolución interpolada. En este caso el valor es siempre idéntico para la resolución horizontal y la vertical, ya que si no la imagen tendría las dimensiones deformadas.

Los colores y los bits
Al hablar de imágenes, digitales o no, a nadie se le escapa la importancia que tiene el color. Una fotografía en color resulta mucho más agradable de ver que otra en tonos grises; un gráfico acertadamente coloreado resulta mucho más interesante que otro en blanco y negro; incluso un texto en el que los epígrafes o las conclusiones tengan un color destacado resulta menos monótono e invita a su lectura.
Sin embargo, digitalizar los infinitos matices que puede haber en una foto cualquiera no es un proceso sencillo. Hasta no hace mucho, los escáners captaban las imágenes únicamente en blanco y negro o, como mucho, con un número muy limitado de matices de gris, entre 16 y 256. Posteriormente aparecieron escáners que podían captar color, aunque el proceso requería tres pasadas por encima de la imagen, una para cada color primario (rojo, azul y verde). Hoy en día la práctica totalidad de los escáners captan hasta 16,7 millones de colores distintos en una única pasada, e incluso algunos llegan hasta los 68.719 millones de colores.
Para entender cómo se llega a estas apabullantes cifras debemos explicar cómo asignan los ordenadores los colores a las imágenes. En todos los ordenadores se utiliza lo que se denomina sistema binario, que es un sistema matemático en el cual la unidad superior no es el 10 como en el sistema decimal al que estamos acostumbrados, sino el 2. Un bit cualquiera puede por tanto tomar 2 valores, que pueden representar colores (blanco y negro, por ejemplo); si en vez de un bit tenemos 8, los posibles valores son 2 elevado a 8 = 256 colores; si son 16 bits, 2 elevado a 16 = 65.536 colores; si son 24 bits, 2 elevado a 24 = 16.777216 colores; etc, etc.
Por tanto, "una imagen a 24 bits de color" es una imagen en la cual cada punto puede tener hasta 16,7 millones de colores distintos; esta cantidad de colores se considera suficiente para casi todos los usos normales de una imagen, por lo que se le suele denominar color real. La casi totalidad de los escáners actuales capturan las imágenes con 24 bits, pero la tendencia actual consiste en escanear incluso con más bits, 30 ó incluso 36, de tal forma que se capte un espectro de colores absolutamente fiel al real; sin embargo, casi siempre se reduce posteriormente esta profundidad de color a 24 bits para mantener un tamaño de memoria razonable, pero la calidad final sigue siendo muy alta ya que sólo se eliminan los datos de color más redundantes.

¿Cuánto ocupa una imagen?
Depende de la imagen (genial respuesta, ¿verdad?). Para saber exactamente cuál va a ser el tamaño de una imagen, deberemos usar la siguiente fórmula:
Tamaño imagen (KB) = L x A x RH x RV x bits / 8.192
Donde L y A son las dimensiones de la imagen en pulgadas (una pulgada = 2,54 cm) y RH y RV las resoluciones horizontal y vertical respectivamente. Hagamos un ejemplo rápido: una imagen DIN-A4 (aproximadamente 11,7x8,3 pulgadas) escaneada a 300 ppp (300x300) con 24 bits de color (color real) ocupa ¡25.490 KB!! (unos 25 MB, 25 megas!!). La cifra resulta impactante, pero no se preocupe; existen muchos métodos para reducir el tamaño de las imágenes, tanto a la hora de manejarlas en memoria como a la de almacenarlas en el disco duro.
El primer método consiste en escanear a menor resolución; la calidad es menor, pero el tamaño del fichero resultante también. Si la imagen va a tener como destino la pantalla de un ordenador, 75 ppp serán casi siempre suficientes, lo que reduciría el tamaño de la imagen anterior a apenas 1.593 KB, poco más de 1,5 MB.
Como segundo método tenemos reducir la profundidad de color. Si la imagen anterior es un dibujo a tinta china, con escanear a 1 bit (en blanco y negro) puede que tengamos suficiente. Esto reduciría el tamaño a tan sólo 1.062 KB, casi exactamente 1 MB.
Por último podemos archivar la imagen en formato comprimido. En este caso el tamaño de la imagen en memoria permanece invariable (25 MB), pero el tamaño en disco puede quedar en menos de una quinta parte sin pérdida de calidad, o incluso menos si la compresión se realiza eliminando información redundante. Como ejemplo de formatos de archivo de imagen con compresión tenemos los JPEG (o JPG), GIF o TIFF, frente al clásico BMP que carece de compresión alguna.
Lo más importante es que podemos combinar los factores anteriores para conseguir resultados realmente optimizados; así, escaneando la imagen del ejemplo a 75 ppp, con 1 bit de color y guardándola en formato GIF, el resultado puede ocupar tan sólo 66 KB en memoria y menos de 15 KB en disco.Formatos de escáner
Físicamente existen varios tipos de escáner, cada uno con sus ventajas y sus inconvenientes:
· De sobremesa o planos: son los modelos más apreciados por su buena relación precio/prestaciones, aunque también son de los periféricos más incómodos de ubicar debido a su gran tamaño; un escáner para DIN-A4 plano puede ocupar casi 50x35 cm, más que muchas impresoras, con el añadido de que casi todo el espacio por encima del mismo debe mantenerse vacío para poder abrir la tapa. Sin embargo, son los modelos más versátiles, permitiendo escanear fotografías, hojas sueltas, periódicos, libros encuadernados e incluso transparencias, diapositivas o negativos con los adaptadores adecuados. Las resoluciones suelen ser elevadas, 300x600 ppp o más, y el precio bastante ajustado. El tamaño de escaneado máximo más común es el DIN-A4, aunque existen modelos para A3 o incluso mayores (aunque ya con precios prohibitivos).
· De mano: son los escáners "portátiles", con todo lo bueno y lo malo que implica esto. Hasta hace unos pocos años eran los únicos modelos con precios asequibles para el usuario medio, ya que los de sobremesa eran extremadamente caros; esta situación a cambiado tanto que en la actualidad los escáners de mano están casi en vías de extinción. Descansen en paz. Su extinción se debe a las limitaciones que presentan en cuanto a tamaño del original a escanear (generalmente puede ser tan largo como se quiera, pero de poco más de 10 cm de ancho máximo) y a su baja velocidad, así como a la carencia de color en los modelos más económicos. Lo que es más, casi todos ellos carecen de motor para arrastrar la hoja, sino que es el usuario el que debe pasar el escáner sobre la superficie a escanear (abstenerse aquellos con mal pulso). Todo esto es muy engorroso, pero resulta eficaz para escanear rápidamente fotos de libros encuadernados, artículos periodísticos, facturas y toda clase de pequeñas imágenes sin el estorbo que supone un escáner plano.
· De rodillo: unos modelos de aparición relativamente moderna, se basan en un sistema muy similar al de los aparatos de fax: un rodillo de goma motorizado arrastra a la hoja, haciéndola pasar por una rendija donde está situado el elemento capturador de imagen. Este sistema implica que los originales sean hojas sueltas, lo que limita mucho su uso al no poder escanear libros encuadernados sin realizar antes una fotocopia (o arrancar las páginas, si se es muy bestia), salvo en modelos peculiares como el Logitech FreeScan que permite separar el cabezal de lectura y usarlo como si fuera un escáner de mano. A favor tienen el hecho de ocupar muy poco espacio, incluso existen modelos que se integran en la parte superior del teclado; en contra tenemos que su resolución rara vez supera los 400x800 puntos, aunque esto es más que suficiente para el tipo de trabajo con hojas sueltas al que van dirigidos.
· Modelos especiales: aparte de los híbridos de rodillo y de mano, existen otros escáners destinados a aplicaciones concretas; por ejemplo, los destinados a escanear exclusivamente fotos, negativos o diapositivas, aparatos con resoluciones reales del orden de 3.000x3.000 ppp que muchas veces se asemejan más a un CD-ROM (con bandeja y todo) que a un escáner clásico; o bien los bolígrafos-escáner, utensilios con forma y tamaño de lápiz o marcador fluorescente que escanean el texto por encima del cual los pasamos y a veces hasta lo traducen a otro idioma al instante; o impresoras-escáner, similares a fotocopiadoras o más particulares como las Canon, donde el lector del escáner se instala como un cartucho de tinta.

Conectores: ¿paralelo, SCSI o USB?
Esta es una de las grandes preguntas que debe hacerse todo futuro comprador de un escáner. La forma de conectar un periférico al ordenador es siempre importante, pues puede afectar al rendimiento del dispositivo, a su facilidad de uso o instalación... y fundamentalmente a su precio, claro.
Puerto paralelo
Es el método más común de conexión para escáners domésticos, entendiendo como tales aquellos de resolución intermedia-alta (hasta 600x1.200 ppp, pero más comúnmente de 300x600 ó 400x800 ppp) en los que la velocidad no tiene necesidad de ser muy elevada mientras que el precio es un factor muy importante.
El puerto paralelo, a veces denominado LPT1, es el que utilizan la mayor parte de las impresoras; como generalmente el usuario tiene ya una conectada a su ordenador, el escáner tendrá dos conectores, uno de entrada y otro de salida, de forma que quede conectado en medio del ordenador y la impresora. Como primer problema de este tipo de conexión tenemos el hecho de que arbitrar el uso del puerto paralelo es algo casi imposible, por lo que en general no podremos imprimir y escanear a la vez (aunque para un usuario doméstico esto no debería ser excesivo problema).
De cualquier modo, debemos tener presente el hecho de que para obtener una velocidad razonable, el puerto debe estar configurado en los modos ECP o EPP (dependiendo del escáner en concreto), lo cual se selecciona generalmente en la BIOS. El problema aparece cuando el ordenador que queremos conectar es algo antiguo y no puede configurar el puerto más que en el antiguo estándar, 10 veces más lento (como ocurre con los primeros 486 e inferiores), o cuando surgen conflictos con otros dispositivos que tengamos conectados al puerto paralelo, como unidades Zip o algunas impresoras modernas.
En estos casos puede merecer la pena comprar una tarjeta controladora nueva que sustituya al puerto actual o bien que añada un segundo puerto (que será LPT2); estas tarjetas controladoras de dispositivos, llamadas también de I/O, son baratas pero en ocasiones difíciles de encontrar por estar en la actualidad integradas en la placa base.
Conector SCSI
Sin lugar a dudas, es la opción profesional. Un escáner SCSI (leído "escasi") es siempre más caro que su equivalente con conector paralelo, e incluso muchos resultan más caros que modelos de mayor resolución pero que utilizan otro conector. Debido a este sobreprecio no se fabrican en la actualidad escáners SCSI de resolución menor de 300x600 ppp, siendo lo más común que las cifras ronden los 600x1.200 ppp o más.
La utilidad de la conexión SCSI radica en dos apartados: velocidad y pocos requisitos de microprocesador. Lo primero es fácil de entender: la interfaz SCSI puede transmitir de 5 a 80 MB/s, dependiendo del estándar SCSI en concreto, mientras que el puerto paralelo a duras penas supera 1 MB/s (y eso en los modos "avanzados" ECP o EPP). Si como vimos antes una imagen A4 puede ocupar 25 MB o más, resulta evidente que un escáner SCSI es la opción a utilizar para escanear imágenes grandes con una cierta resolución y calidad de color.
La otra cualidad de SCSI incide también en la velocidad, aunque de otra forma. No se trata sólo de que se puedan transmitir 10 ó 20 MB/s, sino que además dicha transferencia se realiza sin que el microprocesador realice apenas trabajo; esto permite ir escaneando imágenes mientras realizamos otras tareas, agilizando mucho el trabajo. En un escáner paralelo resulta muy normal que mientras se realiza el escaneado el rendimiento del ordenador baje tanto que no merezca la pena intentar hacer nada hasta que haya finalizado el proceso.
Pero como no todo van a ser ventajas en esta vida, los escáners SCSI (y en general todos los dispositivos SCSI) tienen una carga: su precio elevado, justificable por el aumento de prestaciones que suponen y por la necesidad de incluir una tarjeta controladora SCSI, ya que muy pocos ordenadores traen una incorporada (mientras que todos tienen puerto paralelo). Para economizar un poco, en muchas ocasiones dicha tarjeta es un modelo de prestaciones reducidas, capaz de controlar únicamente el escáner y no los 7 ó 15 dispositivos que pueden manejar las tarjetas normales.
Puerto USB
Esto es lo último en escáners; tanto, que hace poco más de un año sencillamente no existía ningún escáner en el mercado con este tipo de conexión. Los puertos USB están presentes en la mayoría de ordenadores Pentium II, AMD K6-2 o más modernos, así como en algunos Pentium MMX.
En general podríamos decir que los escáners USB se sitúan en un punto intermedio de calidad/precio. La velocidad de transmisión ronda los 1,5 MB/s, algo más que el puerto paralelo pero bastante menos que el SCSI; la facilidad de instalación es casi insuperable, ya que se basa en el famoso Plug and Play (enchufar y listo) que casi siempre funciona; todos los ordenadores modernos tienen el USB incorporado (los Pentium normales ya son antiguos... ¡qué se le va a hacer!!); y además dejan el puerto paralelo libre para imprimir o conectar otros dispositivos.
Se trata, en fin, de una solución claramente enfocada al usuario doméstico u oficinista, lo que se nota en su precio, sólo algo por encima del de los escáners de puerto paralelo. En realidad dicha diferencia de precio no debería existir, ya que fabricar un escáner de uno u otro tipo cuesta prácticamente lo mismo, pero al ser una tecnología reciente nos cobran la novedad; es de suponer que dentro de unos meses cuesten lo mismo que los de puerto paralelo, que probablemente acaben por desaparecer en unos años
La interfaz TWAIN
Aunque se trata de un tema que compete estrictamente al software (los programas), no viene mal comentar brevemente en qué consiste este elemento. Se trata de una norma que se definió para que cualquier escáner pudiera ser usado por cualquier programa de una forma estandarizada e incluso con la misma interfaz para la adquisición de la imagen.
Si bien hace unos años aún existía un número relativamente alto de aparatos que usaban otros métodos propios, hoy en día se puede decir que todos los escáners normales utilizan este protocolo, con lo que los fabricantes sólo deben preocuparse de proporcionar el controlador TWAIN apropiado, generalmente en versiones para Windows 9x, NT y a veces 3.x. Desgraciadamente, sólo los escáners de marca relativamente caros traen controladores para otros sistemas operativos como OS/2 o Linux, e incluso en ocasiones ni siquiera para Windows 3.x o NT; la buena noticia es que la estandarización de TWAIN hace que a veces podamos usar el controlador de otro escáner de similares características, aunque evidentemente no es un método deseable...
Dejando aparte las librerías DLL y otros temas técnicos, la parte que el usuario ve del estándar TWAIN es la interfaz de adquisición de imágenes. Se trata de un programa en el que de una forma visual podemos controlar todos los parámetros del escaneado (resolución, número de colores, brillo...), además de poder definir el tamaño de la zona que queremos procesar.
Si la fidelidad del color es un factor de importancia, uno de los parámetros que probablemente deberemos modificar en esta interfaz es el control de gamma, para ajustar la gama de colores que capta el escáner con la que presenta nuestro monitor o imprime la impresora. Le recomiendo que busque en la documentación del escáner para más información.

El OCR
Se trata de una de las aplicaciones más comunes de los escáners. OCR son las siglas de Optical Character Recognition, reconocimiento óptico de caracteres, o con una descripción más sencilla: cómo hacer para enseñar a leer al ordenador.
Si pensamos un poco en el proceso de escaneado que hemos descrito anteriormente, nos daremos cuenta de que al escanear un texto no se escanean letras, palabras y frases, sino sencillamente los puntos que las forman, una especie de fotografía del texto. Evidentemente, esto puede ser útil para archivar textos, pero sería deseable que pudiéramos coger todas esas referencias tan interesantes pero tan pesadas e incorporarlas a nuestro procesador de texto no como una imagen, sino como texto editable.
Lo que desearíamos en definitiva sería que el ordenador supiera leer como nosotros. Bueno, pues eso hace el OCR: es un programa que lee esas imágenes digitales y busca conjuntos de puntos que se asemejen a letras, a caracteres. Dependiendo de la complejidad de dicho programa entenderá más o menos tipos de letra, llegando en algunos casos a interpretar la escritura manual, mantener el formato original (columnas, fotos entre el texto...) o a aplicar reglas gramaticales para aumentar la exactitud del proceso de reconocimiento.
Para que el programa pueda realizar estas tareas con una cierta fiabilidad, sin confundir "t" con "1", por ejemplo, la imagen que le proporcionamos debe cumplir unas ciertas características. Fundamentalmente debe tener una gran resolución, unos 300 ppp para textos con tipos de letra claros o 600 ppp si se trata de tipos de letra pequeños u originales de poca calidad como periódicos. Por contra, podemos ahorrar en el aspecto del color: casi siempre bastará con blanco y negro (1 bit de color), o a lo sumo una escala de 256 grises (8 bits). Por este motivo algunos escáners de rodillo (muy apropiados para este tipo de tareas) carecen de soporte para color

No comments: