Universidad Nacional Autónoma de México
Dirección General de Servicios de Cómputo Académico
Año 7 Núm. 74, Publicación Mensual, 27 de Noviembre de 2008

ARTÍCULOS

 

Año 7, Número 73, Octubre de 2008

La computadora humana

Carlos Suárez Gutiérrez

 

 

Las computadoras son insuperables en el manejo de grandes cantidades de información y para la realización de cálculos a velocidades asombrosas, sin embargo, cuando se quieren usar para evaluar la belleza de una fotografía o la calidad musical de una interpretación orquestal, simplemente no pueden, las sacamos de su elemento natural y las enfrentamos a situaciones manejadas muy bien por las personas, pero que los equipos no saben procesar; ¿pueden las computadoras actuales aprender a clasificar y a evaluar como lo hacen las personas?

Voy a conectar tu cerebro a la red

Dos personas entran al sitio www.gwap.com donde, entre varios juegos disponibles, eligen uno llamado Matchin, con el objetivo de escoger entre dos imágenes cuál es la más bella.

Cuando los participantes seleccionan la misma fotografía suman puntos, además de que tienen un minuto para evaluar el mayor número de imágenes posibles; al finalizar el tiempo, les dicen el porcentaje de aciertos y los puntos acumulados. Como podrán imaginar, este juego es un experimento encubierto de inteligencia artificial.

Cada vez que alguien juega Matchin está entrenando a un sistema informático en una de las habilidades humanas básicas que no han podido ser imitadas por las computadoras: la capacidad de seleccionar imágenes bellas entre cientos que no lo son; eventualmente, este “aprendizaje” informático podría ser incorporado a maquinarias de búsquedas, como Google, para que nos regrese mejores resultados al buscar “casas hermosas” o “caballos bonitos”. La idea es usar enormes redes de personas para auxiliar en la realización de tareas que las computadoras no pueden procesar, y lograrlo mediante juegos en línea en los que todos ganan; de esta forma, las personas obtienen entretenimiento, y los sistemas informáticos reciben entrenamiento e información computable.

Mediante sistemas como éstos, las personas ayudan a las computadoras a ser más inteligentes, rompiendo con el viejo mito de que de un momento a otro las máquinas nos van a rebasar en inteligencia y capacidad de raciocinio.

El CAPTCHA y tú

En 1997, Yahoo! veía con desesperación cómo su sistema de correo electrónico gratuito se llenaba de cuentas generadas por robots, muchas de las cuales se usaban para enviar spam, a la vez que cargaban a los servidores con usuarios que no eran reales. Buscaron varias soluciones hasta que le plantearon el problema a un grupo académico de la Universidad Carnegie Mellon, al poco tiempo, presentaron una solución sencilla y elegante, a la que llamaron CAPTCHA.

CAPTCHA es el acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart (Prueba de Turing pública y automática para diferenciar a máquinas y humanos), la cual se usa en computación para determinar cuándo un usuario es humano o no. En ésta, el usuario introduce un conjunto de caracteres mostrados en una imagen distorsionada que aparece en pantalla, se supone que una máquina no es capaz de comprender e introducir la secuencia de forma correcta, por esta razón solamente el humano podría hacerlo.

El sistema resultó tan bueno que después fue adoptado, entre otras compañías, por Ticketmaster con la finalidad de restringir el acceso a los servicios de ventas de boletos; por AOL para verificar que fueran personas quienes contestaban sus encuestas en línea; y por Microsoft para proteger a Hotmail.

El uso de los CAPTCHAS llevó de manera natural al siguiente reto: invitar a las personas a utilizar su capacidad para distinguir entre imágenes y letras, con la intención de colaborar en la etiquetación de miles de imágenes que circulan por la red y que las computadoras no pueden reconocer por su contenido; después de varios intentos, llegaron a la conclusión de que la manera más sencilla de involucrar a las personas era mediante el juego y por eso desarrollaron Matchin.

A pesar de los avances informáticos, todavía los sistemas de búsqueda dependen de las palabras escritas por los usuarios alrededor de sus imágenes, de las etiquetas colocadas, o del nombre dado a los archivos con objeto de identificar el contenido de sus figuras; como es fácil imaginar, hay cientos de fotos que no corresponden a sus etiquetas y si buscamos “manzana” en Google, veremos que más de un tercio de los resultados no corresponden a la fruta, aunque desde 2006 Google utiliza la base de datos generada por miles de usuarios, quienes han jugado Matchin para mejorar su sistema de búsqueda de imágenes.

Detrás de todas estas iniciativas, se esconde la idea de diseñar una manera de utilizar todo el potencial humano que pasa horas en Internet, y quien constituye el más grande poder de cómputo conocido hasta la fecha.

Por amor o por dinero

El equipo que diseñó los CAPTCHAS ofrece juegos a cambio de ayuda informática, pero hay otros, como Amazon, que brinda dinero a los usuarios a cambio de realizar las tareas no efectuadas por las computadoras, como elegir la mejor fotografía para ilustrar un producto, escribir la descripción de un artículo a la venta, seleccionar el género al que pertenece un disco, entre otras cosas. El servicio se llama Amazon Mechanical Turk.

PriceGrabber usa a cientos de usuarios para completar sus catálogos en línea y actualizar la descripción de sus productos. Otras compañías han desarrollado sus propias herramientas de colaboración, por ejemplo Threadless vende camisetas diseñadas y votadas por sus usuarios.

Sin ir muy lejos, en 2006 se acuñó el concepto de crowdsourcing, una forma de involucrar al mayor número de personas en la solución de problemas y recompensar a quien o quienes solucionaran el enigma propuesto.

La idea es ofrecer dinero, entretenimiento o algún tipo de recompensa a aquellas personas interesadas en colaborar en la resolución de problemas visuales desde sus computadoras; algunos han propuesto mostrarles a los usuarios imágenes de rayos X de las terminales aéreas, con la finalidad de detectar elementos peligrosos en las maletas de los viajeros.

Recordemos que los inspectores de seguridad tienen solo unos segundos para evaluar el contenido del equipaje de mano, y entre más ojos vean las imágenes mayor probabilidad habrá de detectar algún elemento sospechoso.

Otra aplicación interesante es la digitalización de libros y textos, en el sentido de la existencia de algunas palabras que los programas de reconocimiento óptico de caracteres no logran descifrar o las reconocen con errores, se pueden mostrar dichas palabras dudosas a los usuarios para que las escriban de forma correcta a cambio del acceso a ciertos servicios como cuentas de correo gratuitas, encuestas en línea y programas para descargar; esta última aplicación ya se implementa en varias partes bajo el nombre de ReCaptcha.

Con la masificación del Internet y el aumento exponencial en el número de usuarios, varias empresas y grupos académicos han descubierto la posibilidad de emplear a todas las personas para la resolución de problemas que, simplemente, las computadoras no pueden manejar, de forma muy especial sobresalen las cuestiones de reconocimiento visual que tantas dificultades presentan a la hora de computarse. Pronto veremos soluciones nuevas e ingeniosas para atacar ésta y otras muchas incógnitas, con el apoyo de la más compleja unidad de procesamiento conocida: la mente humana.

Para mayor información:
http://www.captcha.net
http://www.gwap.com
http://caca.zoy.org/wiki/PWNtcha

 

Inicio | Contacto |