Universidad Nacional Autónoma de México
Dirección General de Servicios de Cómputo Académico
Año 7 Núm. 74, Publicación Mensual, 27 de Noviembre de 2008

ARTÍCULOS

 

Año 4, Número 40, Junio de 2005

Post edición digital, la visión oculta de la publicación en red

Laura M. Hernández Alvarado
Gustavo Alberto Gutiérrez Ramírez

 

El desarrollo de Internet durante los últimos cinco años ha sido interesante. Cerca de ocho mil millones de páginas coexisten en la web, un poco más que el número de habitantes en el mundo, y se estima que en los próximos años esta cifra se duplicará casi al ritmo de la vida diaria. En este universo de información, ¿cómo es posible encontrar con precisión los datos que buscamos?

Existen en la red herramientas específicas que permiten a los usuarios encontrar datos, documentos, imágenes o textos que contengan una determinada frase o palabra. Estos “buscadores”, como se les conoce, son sistemas que ubican en Internet la información sobre algún tema que se haya solicitado.

Sin embargo, para que estos buscadores puedan localizar los datos requeridos, es necesario que los administradores de contenidos web realicen ciertos procedimientos en el proceso de post-producción, algunos de los cuales son ignorados por los usuarios.

Los motores de búsqueda

El proceso de producción de las publicaciones digitales, para nuestro caso específico, comprende la planeación de una lógica interna en la publicación y permite un acceso organizado, sencillo y viable a los lectores, para su difusión en el sitio web que alberga a la revista electrónica.

Esta línea secuencial de la edición digital se encuentra ligada a la creación del hipertexto, que incorpora la arquitectura de información, la construcción de índices y motores de búsqueda internos, la selección del programa o tecnología que se utilizará para configurar la página, además del diseño de las pantallas y la forma en que el usuario podrá recorrer el sitio, y por último, lograr su publicación en Internet.

Los motores de búsqueda en Internet son automatizados y utilizan, en la gran mayoría de los casos, un sistema mediante programas arañas (spiders), que tiene como finalidad realizar operaciones basadas en algoritmos donde se asignan valores de relevancia en sus búsquedas, como la frecuencia de aparición de una palabra o bien, su ubicación. Algunos ejemplos son Google, Altavista, Hotbot y Lycos.

El proceso que se sigue se podría ejemplificar de la siguiente forma: las arañas buscan en la red los términos consignados a la búsqueda, entran a una página y siguen las ligas que encuentran, elaboran un índice de estas ligas y las copian para finalmente, realizar otra búsqueda en las páginas de dicho índice. No todas las arañas indexan las mismas páginas, porque no siguen los mismos esquemas de frecuencia y ubicación, por ello, son diferentes los resultados.

Un criterio que solían aplicar las arañas eran las etiquetas del código HTML (Lenguaje de Marcación de Hipertexto, por sus siglas en inglés) que hacen referencia al formato para la construcción y la estructura interna de las páginas web, el cual no es visible para el usuario, pero que ofrece datos respecto al tema y descripción de la página. Sin embargo, fueron
desechados ante el spamming, es decir, el mal uso de algunos sitios que mentían en su descripción con el fin de conseguir un ranking más alto en las búsquedas.

En la actualidad, los criterios ponen mayor atención en el cuerpo de la página, donde las arañas localizan la frecuencia de las palabras y su ubicación dentro del texto y los vínculos.

A la par de las arañas, existen otros buscadores que trabajan con base en directorios. Tal es el caso de Yahoo, donde se ejecutan las búsquedas a partir de la información registrada respecto a la página y no sobre la página en sí. Tienen como inconveniente la necesidad de una permanente actualización de las bases de datos, es decir, su proceso de trabajo es manual, aunque sus resultados son más exactos.

La mayoría de los buscadores comerciales son híbridos. Toman en cuenta algunos elementos de los metadatos (información contenida en la estructura de la página) como el título y la descripción de la página, aunque ponen mayor énfasis en la ubicación y la frecuencia del término buscado en el cuerpo del sitio. No obstante, los buscadores mantienen velada la información respecto del proceso y la metodología, de acuerdo con el secreto comercial.

Encontrarte en la web

Considerar los criterios y mecanismos de los buscadores comerciales, puede ayudar a las revistas y publicaciones electrónicas a difundir su material. Sin embargo, existen criterios mercantiles para lograr aparecer en las búsquedas de algunos portales, como son pagar por indexar, incrementar el ranking o, bien, pagar por insertar ligas en la página de resultados.

Pero éstas no son las únicas formas de dar a conocer una publicación electrónica debido a que existen sistemas de información, bases de datos, índices y bibliotecas digitales que, en su mayoría, pertenecen a organismos académicos, gubernamentales o no gubernamentales.

Estos sistemas son ventajosos en cuanto a la precisión de su información, aunque dispersos y limitados, por el hecho de que no utilizan una interfaz de búsqueda común y no existe la actualización automática de sus registros.

Publicar en Internet no es tarea sencilla pues se requiere asignar el tiempo y los recursos para lograr resultados efectivos. Algunas sugerencias para lograrlo son:

  • Asignar metadatos relacionados con el tema de la publicación.
  • Trabajar con las palabras en el
    cuerpo (body) de los sitios web.
  • Buscar que la publicación sea suscrita en bibliotecas digitales.
  • Observar estadísticas.
  • Buscar la publicación por temas y/o título en diversos buscadores.
  • Ingresar ligas.

Para mayor información:

Galina, Isabel. Ponencia “Las conexiones entre las publicaciones digitales”, dentro del ciclo de conferencias del Primer Foro de Edición Digital, marzo 2005, México, DF.

http://dublincore.org/

http://www.openarchives.org/

http://es.wikipedia.org/wiki/Buscador

Inicio | Contacto |