Definición de la lingüística computacional:
Es un campo interdisciplinario que se ocupa del desarrollo de formalismos del funcionamiento del lenguaje natural, tales que puedan ser transformados en programas ejecutables para un ordenador.
Dicho desarrollo se sitúa entre el modelado basado en reglas y el modelado estadístico del lenguaje natural desde una perspectiva computacional.
En él participan, entre otros, lingüistas e informáticos especializados en inteligencia artificial, psicólogos cognoscitivos y expertos en lógica.
Algunas de las áreas de estudio de la lingüística computacional son:
- Corpus lingüístico asistido por ordenador.
- Diseño de analizadores sintácticos (en inglés: parser), para lenguajes naturales.
- Diseño de etiquetadores o lematizadores, tales como el POS-tagger.
- Definición de lógicas especializadas que sirvan como fuente para el Procesamiento de Lenguajes Naturales.
- Estudio de la posible relación entre lenguajes formales y naturales.
- Traducción automática.
Ramas de estudio de la lingüística computacional
1. Lingüística computacional teórica
Basa sus temas de trabajo en la lingüística teórica y en la ciencia cognitiva.
Su objetivo es desarrollar teorías lingüísticas computables, es decir, que puedan ser aplicadas sutilmente a los ordenadores.
Sin embargo, no todas las teorías lingüísticas tienen la pretensión de ser aplicadas al dominio informático.
La lingüística cognitiva estudia las motivaciones de un hablante determinado para expresarse, lo que naturalmente está lejos de poder ser modelado con un ordenador.
2. Lingüística computacional aplicada
Es una vertiente de la lingüística computacional con una evidente orientación tecnológica.
Esto provoca, que con frecuencia, es referida con nombres como ingeniería lingüística o tecnología del lenguaje humano.
Su objetivo es crear productos informáticos que incorporen algún componente en el que intervenga el lenguaje, oral o escrito.
Entre ellos figuran las siguientes:
- El apoyo a los usuarios de computadores con el procesamiento de texto, por ejemplo, corrección de errores de digitación y ortográficos, prueba de la corrección gramatical, cambio en ideogramas en japonés o chino.
- La búsqueda automática en pasajes de texto (búsqueda inteligente de información) y, no solo su forma, sino también su significado (recuperación de información y motores de búsqueda).
- El apoyo al traducir textos en otra lengua (traducción asistida por ordenador) o también la traducción automática.
- El procesamiento del lenguaje hablado (reconocimiento del habla y síntesis de habla), por ejemplo, en el servicio de información telefónico o en aparatos de lectura para ciegos.
- De la búsqueda de información en grande de bibliografías a la contestación directa de preguntas sobre la base de grandes bancos de datos (recuperación de información, minería de datos, extracción de la información).
- El tratamiento de datos presentes lingüísticamente, por ejemplo, la indexación de literatura, la creación de índices y listas de materias, la producción de resúmenes y abstracts.
- El apoyo a los autores en la redacción de textos, por ejemplo, en la búsqueda de la palabra precisa o la terminología correcta.
- La interacción de los usuarios con el computador en lenguaje natural, tal que los computadores sean accesibles también a las personas que no tienen suficiente conocimiento de las órdenes específicas (interfaces hombre-máquina).
Aplicaciones
- Analizador sintáctico
- Desambiguador funcional
- Analizador morfológico
- Corpus lingüístico
- Analizador semántico
- Alineador
- Conjugador
- Conversor de lenguajes
- Corrector ortográfico
- Flexionador
- Lematizador
- Motor de indexación = Motor de indización
- Ontologías