jueves, 17 de abril de 2008

Construcción Tesauro

PRIMERAS IDEAS DEL TESAURO

1) Debemos pensar en:

· Qué queremos conseguir con el tesauro. Para el trabajo encomendado por nuestro cliente actual (Ministerio de Sanidad y Consumo, dentro de su Plan Nacional sobre Drogas), queremos conseguir que nuestro tesauro cumpla los siguientes objetivos:

o Servir como instrumento de indización de los documentos (born-digital) de los que hemos hablado anteriormente.

o Servir como instrumento de navegación para la recuperación de estos documentos publicados en la Web, por el usuario final.

Nuestro tesauro:

· No ha de esta integrado en el sistema de información del cliente, ya que se trata de un evento puntual y específico del momento. Pero si se puede integrar, obviamente se considera positivo.

· Queremos utilizar el tesauro como herramienta de recuperación de información (incluso de navegación)

· Es necesario visualizar todas las relaciones semánticas en los resultados de recuperación, para que tanto el analista que indice los documentos, como el usuario final sea consciente de los descriptores (aceptados y no aceptados) con los que cuenta el tesauro.

· El nivel de control de vocabulario queremos establecer en nuestro tesauro / sistema de recuperación de información:

o Funcional: Instrumento para el control terminológico y la Recuperación de información.

o Estructural: Vocabulario controlado y dinámico de términos (relaciones semánticas).

· ¿Merece la pena que cumpla la ISO 2788 totalmente? De momento, creemos que no, cumpliendo la mayor parte de sus indicaciones, pero sin “radicalismos”.

2) Contenido

· Especificidad: el contenido de nuestro tesauro será ampliamente específico, ya que dentro del sector sanitario/farmacológico de las drogas, se ha acotado a las “drogas de club”

· Estabilidad: Al estar acotada la temática de la campaña del cliente a los últimos diez años (1998-2008) puede que lleguemos a conseguir un vocabulario bastante estable.

3) Tecnología

· Herramientas: aún las tenemos evaluadas…

· Integración

4) Usuarios

a) Los analistas / catalogadores que tengan que indizar los documentos que procedan de la campaña

b) Los usuarios finales que consulten los documentos por la Web

5) Mantenimiento

a) No será necesario un mantenimiento, por lo menos, por la parte de nuestro departamento, pues en junio de 2008 cerramos el contrato con el cliente.

6) Construcción :

a) Por comité (expertos):

o Top-Down (de arriba a abajo)

(1) CDSED decide el alcance y las categorías básicas (macrodescriptores).

(2) Seleccionamos los términos genéricos inicialmente y los específicos se irán añadiendo para alcanzar el nivel de especificidad deseado.

(3) Se van a utilizar diccionarios (glosarios) y tesauros para decidir qué términos utilizar y sus relaciones. à ver las herramientas de trabajo de CDSED.

b) Construcción empírica:

o Método deductivo (términos extraídos de objetos de contenido) Los términos (pre-descriptores) se extraen de un conjunto de objetos de contenido, que hemos seleccionado tanto de fuentes formales como informales, para dar más cobertura al tesauro (no olvidar que hay que ser “generosos” con los términos no aceptados, y el sector de las drogas posee un rico argot. Para ello nos valemos de herramientas SEO, y otras que analizamos de la web 2.0, folksonomías, etc.

o Se identifican primero las clases más genéricas.

FACETAS ESTABLECIDAS:

1. TIPOLOGÍA DROGAS DE CLUB

2. EFECTOS SECUNDARIOS

3. ABUSO DE DROGAS DE CLUB -> ENFERMEDADES DEGENERATIVAS

4. CONTEXTO DEL CONSUMO DE DROGAS DE CLUB