Show Less
Restricted access

Lingüística de corpus: génesis y bases metodológicas de los corpus (históricos) para la investigación en lingüística

Series:

Joan Torruella

La finalidad de este libro es mostrar las posibilidades que ofrece la «lingüística de corpus» para el estudio de la lengua en general y de la lengua antigua en particular, alertando de los peligros que su aplicación irreflexiva e indiscriminada puede acarrear. La obra trata principalmente de cómo diseñar y recopilar corpus para que estos sean representativos del universo lingüístico que quieren describir, y de los postulados que se deben tener presentes en el momento de su explotación (análisis de los datos). Se trata de mostrar métodos científicos, sustentados en análisis cuantitativos y estadísticos, que posibiliten un mayor avance en las investigaciones del que se ha podido conseguir con otras metodologías, para poder ofrecer perspectivas diferentes que permitan aportar nuevas interpretaciones.

Show Summary Details
Restricted access

8. Preparación de los textos

Extract

← 164 | 165 →

8.   Preparación de los textos

La preparación de los textos que deben formar parte de un corpus requiere una serie de trabajos que tienen como finalidad, por una parte, que desde el punto de vista filológico los textos sean unitarios (edición textual) y, por otra, que desde el punto de vista informático sean aptos para ser interpretados por los programas y por las plataformas informáticas (edición digital). La primera finalidad requiere la definición del tipo o tipos de edición que se desarrollará y la aplicación de unas normas de edición; la segunda finalidad implica la selección de unas normas para marcar los textos y el establecimiento de los casos en que estas se deberán aplicar. En consecuencia, todos los textos que deben formar parte de un corpus han de pasar por un proceso de edición que cuide sus aspectos internos o lingüísticos y otro de post-edición, o de edición digital, que tenga en cuenta sus aspectos externos o formales y los adapte al medio informático. Existe un nivel superior de edición, opcional dependiendo de la finalidad del corpus, que hace referencia a la atribución automática de categorías lingüísticas a las unidades del texto, es decir, a su lematización, a su categorización, etc.

NIVELES EN LA EDICIÓN FILOLÓGICA DIGITAL

Edición textual (edición)...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.