<ENV 118> PROYECTO DE ANALISIS LEXICO Y SINTACTICO AUTOMATICOS DE LA LENGUA ESPAÑOLA //
PROJET D'ANALYSE LEXICALE ET SYNTAXIQUE AUTOMATIQUES DE LA LANGUE ESPAGNOLE


14/07/98

1. Título del proyecto:
Análisis léxico y sintáctico automáticos de la lengua española

2. Período de duración: 1996/99

3. Investigador principal:
Carlos Subirats Rüggeberg <
[email protected]>

4. Entidad que financia el proyecto:
Ministerio de Educación y Ciencia, España
(Proyecto del Plan Nacional de Tecnología de la Información y de las Comunicaciones, TIC96-804)

5. Miembros del equipo de investigación:
Eulalia de Bobes, Becaria FPI <
[email protected]>
Sebastián Galera, Servicios Informáticos, UAB <
[email protected]>
Marc Ortega, Ingeniero en Informática <
[email protected]>
Antonio Ríos, Facultad de Traducción e Interpretación <
[email protected]>
Jordi Valls, Facultad de Ingeniería Informática, UAB <
[email protected]>

6. Laboratorio en el que se está desarrollando:
Laboratorio de Lingüística Informática (LaLI)
Universidad Autónoma de Barcelona

7. Resumen:
Este proyecto de investigación está centrado en el desarrollo de aplicaciones destinadas al tratamiento automático de la información textual y a la extracción automática de información de grandes corpus en lengua española, partiendo de la utilización de bases de conocimiento léxico y sintáctico.

La base de conocimiento léxico (BCL) está integrada por un diccionario electrónico de 600.000 formas, que integra todas las formas posibles pertenecientes al léxico general de la lengua española. La BCL se expande automáticamente a partir de un diccionario de formas canónicas, que está integrado por 92.000 entradas:

66.000 formas simples, es decir, cadenas de caracteres entre dos espacios en blanco;
26.000 formas compuestas o locuciones, es decir, los elementos léxicos formados por más de una forma simple.

[...]

En el marco de este proyecto se está desarrollando una Base de Conocimiento Sintáctico (BCS), que consiste en una representación en forma de transductores de las propiedades de dependencia y de las propiedades transformacionales de los predicados del léxico del español. El objetivo de la BCS es formalizar las características sintácticas de las construcciones que permiten vehicular la información en español y, a su vez, desarrollar una base de conocimiento que permita mejorar el proceso de extracción automático de la información textual.

Más información en la última publicación sobre el proyecto:
http://cc.uab.es/~ilfe1/estado_actual.zip

8. Dirección postal y teléfono:
Laboratorio de Lingüística Informática
Universidad Autónoma de Barcelona
Facultad de Letras, Edificio B
08193 Bellaterra, ESPAÑA
Fax: + 34-93-581-16-86
Tel: + 34-93-581-22-29

Fuente: INFOLING

{liste de messagesliste de messages-lista de mensajeslista de mensajes}


--->[Fr-Es-It-Pt-Ro]<---
volver a la página principal