Desarrollo de una herramienta para la anotación semántica automática de documentos pdf basado en ontologías
Acceso a Texto completo
Abstract
Actualmente, Internet es una de las fuentes más accesibles y utilizadas para buscar información
sobre determinado tema, a través de la cual las personas pueden conectarse a una gran colección
de recursos, servicios y contenidos. En ese sentido, el uso de motores de búsqueda es
indispensable para poder encontrar contenido específico y relevante para el usuario, es decir,
información precisa y alineada con el tema de su interés.
Sin embargo, los buscadores pueden presentar dificultades para brindar al usuario la información
deseada. Estas dificultades se presentan por motivos tales como las características propias del
lenguaje natural como la polisemia, sinonimia y ambigüedad; así, también, por el
desconocimiento de los temas que son de interés para el usuario. Otra de las causas que
dificultan la recuperación de información relevante es que la búsqueda de resultados se realiza
de manera sintáctica, esto es, buscando en los documentos la coincidencia exacta de los términos
ingresados en la cadena de búsqueda. Del mismo modo, otra razón importante es que los
formatos e interfaces de contenido se presentan en formatos comprensibles solo por las personas
y no por un computador.
Ante esto, el presente proyecto propone una alternativa de solución de forma tal que los
documentos contengan información adicional que describa los conceptos y entidades principales
del contenido. Esta información adicional se añadirá de manera automática a los documentos
mediante anotaciones semánticas en base a un dominio de conocimiento que sea de interés para
el usuario. De esta manera, se pretende apoyar el concepto de Web semántica cuya propuesta es
clasificar, estructurar y anotar los recursos con semántica explícita para que puedan ser
procesados por sistemas inteligentes.