domingo, 17 de junio de 2012

CONSTRUCCIÓN DE TESAUROS

"El trabajo quedará completado con un post individual, en el que se debe evaluar el papel y las posibilidades de los tesauros en el escenario actual, sobre la base de la experiencia del trabajo en red."



Como estamos observando a lo largo de este curso y de toda la carrera de Documentación, la ‘World Wide Web’ de Internet se ha convertido en uno de los principales vehículos de información de todo tipo. En los sitios Web que circulan por la Red es posible encontrar información sobre prácticamente cualquier tema que se pueda imaginar en un formato electrónico que permite transmitir no sólo textos escritos sino también documentos gráficos y audiovisuales. Internet es una fuente de información que ya está demostrando un enorme potencial de desarrollo y que ocupa todas las etapas de la vida: familiar, empresarial, social, económca, política, científica, etc...


La cantidad de usuarios que utilizan Internet de manera habitual sigue creciendo día a día en todos los países. Los usuarios privados o las organizaciones utilizan la Web con propósitos muy diversos: comunicación de mensajes, intercambio de información y conocimientos, realización de transacciones comerciales, publicidad de productos y servicios, difusión de iniciativas, ideas y opiniones, etc. Esta expansión de Internet ha propiciado la transmisión universal de documentos de manera instantánea y virtual. 

Para las comunidades científica, académica e incluso empresarial, uno de los aspectos más interesantes de la Web es la capacidad de difundir y obtener conocimientos a través de servicios electrónicos de información bibliográfica y repositorios de documentos electrónicos. Para poder acceder a su contenido y saber de qué manera se estructuran dentro de cada uno de ellos, tanto los documentos que los integran como sus referencias bibliográficas, siguen utilizándose las clasificaciones y lenguajes documentales, herramientas que facilitan la organización de los recursos documentales por temas y materias. Con la edición electrónica es posible elaborar lenguajes documentales en formato digital y aprovechar las ventajas que permite este soporte:

- La facilidad con la que pueden editarse, publicarse y actualizarse.
- Su gran accesibilidad y capacidad de difusión.
- La posibilidad para el usuario final de imprimir o almacenar su contenido.
- La inclusión de enlaces (‘links’) que remiten a otros documentos, sitios o páginas Web sobre temas afines o de especial relevancia.
- Suelen contener también las direcciones de correo electrónico de sus autores, de ma-nera que los usuarios pueden contactar e intercambiar sugerencias y opiniones con ellos.


Como hemos comprobado los lenguajes documentales son instrumentos ideados para ayudar a la sistematización de colecciones de documentos con el objeto de facilitar su identificación y posterior recuperación, y su uso está muy extendido en centros de documentación, bibliotecas y archivos.

Un lenguaje documental electrónico elimina estos inconvenientes: se puede manejar desde el propio ordenador al mismo tiempo que los documentalistas o los usuarios utilizan otros recursos electrónicos, admite actualizaciones constantes y al instante sin necesidad de imprimir el documento, con el consiguiente ahorro de papel, y hace más cómodas y rápidas las tareas de indizar o consultar, pudiendo tener abierto el archivo que lo contiene mientras trabajamos. Asimismo, al tratarse de un documento electrónico, un mismo tesauro puede ser utilizado en red por varios usuarios a la vez y puede almacenarse en tantas copias de seguridad como se desee.

En Internet circulan  numerosos tesauros en formato electrónico de libre acceso. Muchos de ellos permiten ser descargados por el propio usuario para utilizarlos en su ordenador fuera de línea. Otros, sin embargo, son tan extensos que hacen poco práctica su descarga o bien están protegidos de algún modo para evitarla. Unos son sencillos en su estructura y contenido, mientras otros son más complicados y requieren un cierto aprendizaje previo para su comprensión y manejo. Las áreas temáticas que cubren son también muy dispares, desde los aspectos más triviales hasta disciplinas científicas como la astronomía, la física, la informática o la medicina; además de ciencias sociales como la economía, la historia o el derecho. También pueden encontrarse clasificaciones y tesauros relacionados con la actividad de organizaciones e instituciones públicas o privadas y con la gestión de las Administraciones públicas. Algunos de estos tesauros permiten al usuario acceder a bases de datos a las que están asociados y en las que se referencian documentos sobre los temas de los que tratan los descriptores seleccionados, e incluso permiten recuperar los documentos en formato electrónico. Respecto a su autoría, gran parte de los tesauros de Internet corresponden a entidades públicas o privadas cuya actividad se relaciona con el tema del lenguaje documental que han desarrollado. 

Destacan las universida-des y centros de investigación (CINDOC, NASA), así como las organizaciones interna-cionales (OCDE, OIT, UNESCO, Unión Europea).

Se ha visto también como algunos tesauros pueden ser utilizados indistintamente como clasificaciones o como tesauros propiamente dichos, según se usen sus términos en la forma codificada o literal.

La aparición de los primeros tesauros aplicados a la recuperación de información a principios de los años sesenta desplazó, en gran medida, la utilización de los sistemas de clasificación tradicionales para la indización y la recuperación, que se mostraron poco adecuados para su aplicación en sistemas automatizados y para el análisis de literatura especializada. Sin embargo, la creciente disponibilidad en los años setenta de bases de datos online con resúmenes o texto completo puso el énfasis en los sistemas basados en el lenguaje natural, como alternativa a los lenguajes controlados. Desde entonces, ha aparecido una abundante literatura exponiendo resultados de experimentos que proporcionaban argumentos a favor y en contra de dichos sistemas y del rendimiento obtenido en la recuperación con ambos. Sin embargo, como han demostrado los estudios de Katzer , entre muchos otros, cada procedimiento puede recuperar documentos relevantes allí donde no se encontraron por el otro.  En la actualidad, parece claro que la naturaleza complementaria del lenguaje natural y del controlado, especialmente los tesauros, justificaría la necesidad de disponer de ambos procedimientos para recuperar información. Como señala Lancaster , el modo normal de funcionamiento de un sistema de recuperación de información debe ser el de la «búsqueda en dos niveles», utilizando conjuntamente el lenguaje natural y términos controlados. La posibilidad de almacenar grandes cantidades de texto en el ordenador, el desarrollo de procedimientos de indización automática y la aplicación de mejores interfaces con ayudas de búsqueda, hace que muchos sistemas online utilicen el tesauro más como un instrumento de recuperación que de indización, quedando incluso muchas de sus características de control invisibles para el usuario. Así, el tesauro pasaría a convertirse de un recurso fundamentalmente de exhaustividad en un potente recurso de precisión, sobre todo en los sistemas que lo utilizan conjuntamente con el lenguaje natural en la búsqueda. En general, en el futuro, las bases de datos pequeñas probablemente aún confiarán en la indización humana, pero las bases de datos amplias y con texto completo, utilizaran diccionarios de traducción de equivalencias y un tesauro, o algo parecido a él, con ayudas online al usuario que hagan más fácil determinar si un documento recuperado es útil para una determinada necesidad de información . Internet y sobre todo el World Wide Web, ofrece ventajas y nuevas posibilidades de desarrollo y acceso a tesauros online, entre las que podemos destacar:
a) Es un medio idóneo para desarrollar la estructura hipertextual de la red semántica de un tesauro, con enlaces entre los términos que mantienen una relación de equivalencia, jerárquica o asociativa y entre las diferentes partes del tesauro (alfabética, jerárquica y permutada) y la posibilidad de «navegar» entre ellas. También pueden establecerse enlaces con imágenes o sonidos.
b) En este medio, puede simplificarse mucho la estructura de los tesauros y facilitar su manejo con interfaces adecuadas, respecto a las versiones impresas.
c ) Reducción significativa de costes de actualización. Puede ser una alternativa a las ediciones impresas, habitualmente caras.
d) Puede contribuir al desarrollo de tesauros multilingües y multidisciplinares con equipos de trabajo de organizaciones de distintos países.
e ) Permite disponer de herramientas terminológicas, de acceso universal, de ayuda a la recuperación en distintas bases de datos y como fuente para establecer bases del conocimiento.




De todo lo expuesto podemos concluir y de lo observado puntualizar que el papel de los tesauros en el escenario actual es fundamental y altamente necesario para organizar toda la información que hay en la red. Información que no solamente está constituida por la aportada por instituciones y organismos productores y gestores de la información, sino donde el usuario, el particular también aporta información y que también puede ser útil a los demás en función de las necesidades de conocimiento de la sociedad. Todos pueden ser productores y consumidores de información, y el papel de los gestores de la información es clave para organizarla y favorecer el mejor uso de la misma y permitir el acceso universal a ella, y ahí reside la importancia de los tesauros como organizadores de esa información.

No hay comentarios:

Publicar un comentario