Loading...

Corpus y estudio diacrónico del discurso especializado en español

by Matteo De Beni (Volume editor) Dunia Hourani Martín (Volume editor)
Edited Collection 352 Pages

Summary

El volumen está dedicado al empleo de corpus como herramientas para el análisis del léxico especializado en español con una perspectiva diacrónica. Recoge contribuciones de autores invitados que abarcan distintos lenguajes de especialidad, en textos provenientes de los dos lados del océano y desde diferentes aproximaciones, como la terminología, la fraseología y la variación diatópica.
Nuestra intención ha sido dar voz tanto a jóvenes estudiosos como a especialistas consolidados y, al mismo tiempo, dar cabida a investigadores de distinta procedencia, tanto geográfica como disciplinaria. Consideramos que la polifonía del volumen que proponemos enriquecerá un campo que aún no se ha agotado ni temática ni metodológicamente.

Table Of Contents

  • Cover
  • Title
  • Copyright
  • Sobre el autor
  • Sobre el libro
  • Esta edición en formato eBook puede ser citada
  • Tabla de contenidos
  • Lista de autores
  • Léxico de especialidad, diacronía y corpus: introducción
  • Atlas, diccionarios y corpus: tres recursos lingüísticos en contraste
  • Locuciones adverbiales latinas (P+X) de ámbito jurídico en los corpus diacrónicos del español medieval y clásico
  • Terminología jurídica en un corpus diacrónico de textos literarios
  • La terminología poblacional en la Hispanoamérica colonial. Aproximación metodológica para la conformación de un corpus histórico
  • Hacia un tesoro de voces indígenas recogidas en las expediciones científicas de los siglos xviii-xix
  • Textos comerciales de Cuba y Colombia del siglo xix en el corpus DIACOM: estudio de casos de variación terminológica
  • Del aceite de comer al aceite de oliva virgen extra. Terminología fraseológica histórica asociada a la calidad del aceite de oliva
  • La difusión de tecnicismos en judeoespañol vista a través de las glosas en periódicos sefardíes (1880–1930)
  • Estudio diacrónico de terminología técnica de manuales de usuario de automoción a través de recursos de la Real Academia Española: CORDE, CREA, CORPES XXI, NTTLE y MDA
  • Aproximación metodológica para el análisis diacrónico de la banalización terminológica en medios de divulgación escritos mediante la consulta de corpus contemporáneos del español
  • Análisis diacrónico de la desterminologización del término tumor a partir de corpus

←6 | 7→

Lista de autores

Dunia Hourani-Martín/Matteo De Beni

Universität Leipzig-Università degli Studi di Verona

Joan Torruella

Institució Catalana de Recerca i Estudis Avançats-Universitat Autònoma de Barcelona

David Porcel Bueno

Karl-Franzens-Universität Graz

Encarnación Tabares Plasencia

Universidad de La Laguna-Instituto de Lingüística “Andrés Bello”

Piero Renato Costa León

Università degli Studi di Verona-Universitat Autònoma de Barcelona

Luis Pablo Núñez

Universidad de Granada

Dunia Hourani-Martín/Elisa Sartor

Universität Leipzig-Università degli Studi di Verona

Esteban T. Montoro del Arco

Universidad de Granada

Sandra Schlumpf/Beatrice Schmid

Universität Basel

Míriam Pérez-Carrasco/Miriam Seghiri

Universidad de Málaga

Sergio Rodríguez-Tapia

Universidad de Córdoba

Adela González Fernández

Universidad de Córdoba

Dunia Hourani-Martín/Matteo De Beni

1 Léxico de especialidad, diacronía y corpus: introducción

Léxico de especialidad, diacronía y corpus son las tres coordenadas del libro que se presenta a continuación. El objetivo confeso ha sido, pues, reunir trabajos dedicados al empleo de corpus como base empírica para el análisis del léxico especializado en español con una perspectiva diacrónica. El interés por los corpus de corte diacrónico se ha asentado en estos últimos años en el ámbito iberorrománico, como demuestran, por ejemplo, encuentros científicos (entre otros, los Congresos Internacionales de Corpus Diacrónicos en Lenguas Iberorrománicas, que en 2019 celebraron su quinta edición en Bruselas) e iniciativas editoriales, como la revista Scriptum Digital.1 Al mismo tiempo, encuentros de larga trayectoria como las reuniones internacionales de la Red Temática “Lengua y Ciencia”2 y los Coloquios sobre la historia de los lenguajes iberrománicos de especialidad, que también en 2019 celebraron su octava edición, así como diversos grupos de investigación3 siguen poniendo de relieve el atractivo de los vocabularios especializados para el estudio de la historia del español.

←9 | 10→

El presente volumen se propone aunar estas dos corrientes: por un lado, el análisis del español desde una perspectiva histórica a partir de corpus —o lingüística con corpus (Kabatek 2016, 3)— y, por otro, la investigación de los lenguajes de especialidad con un enfoque diacrónico. De ahí que los tres ejes rectores que guían las contribuciones sean el léxico de especialidad, la diacronía y los corpus. No hemos querido determinar un periodo histórico concreto ni delimitar un marco temático particular dado que nuestra voluntad ha sido dar voz a estudiosos que, desde diferentes aproximaciones, aborden cuestiones terminológicas y fraseológicas, teóricas y aplicadas, en distintos ámbitos de especialidad y en vivo, a saber, en el contexto comunicativo real que ofrecen los corpus.4

La distribución de los once trabajos aquí propuesta empieza con una contribución de orden general en la que se introducen y ponen en contraste tres recursos para estudiar el léxico iberorrománico especializado y se guía, en lo sucesivo, por el criterio cronológico comenzando en los siglos xvi-xvii hasta llegar al siglo xxi. Si bien los capítulos podrían haber sido agrupados según se hayan utilizado, de un parte, corpus propios elaborados por particulares o en el seno de grupos o proyectos de investigación y, de otra, corpus y herramientas de referencia para la filología española ya disponibles, hemos optado por la conveniencia de vertebrar la obra siguiendo el criterio de los periodos de la lengua estudiados —de los más antiguos a los más recientes—, lo cual, a su vez, nos ha permitido agrupar los trabajos en bloques temáticos: la fraseología y terminología jurídica, la terminología colonial y expedicionaria, los fenómenos de la variación en toda su amplitud y en diferentes combinaciones espaciales y temporales, y las cuestiones de la banalización y desterminologización de las unidades léxicas especializadas en la lengua general. A pesar de la temática variada de las contribuciones, son posibles otras formas de acercamiento a la obra en función de los intereses del lector, pues los trabajos individuales comparten enfoques teóricos y metodológicos independientemente del fenómeno estudiado y del periodo en el que se ubique la investigación.

←10 | 11→

Asimismo, en el compendio de propuestas aquí recogidas, se vuelven a observar dos cuestiones fundamentales en el estudio de la terminología diacrónica basada en corpus: por un lado, que la investigación de la historia de la lengua no puede dejar de lado, en ocasiones, a la sincronía. Así, como se observa en algunas de las contribuciones del volumen, el estudio diacrónico se complementa con el análisis de cortes sincrónicos que permiten observar la evolución lingüística y establecer tendencias. Por otro lado, se vuelve a constatar la trascendencia que siguen teniendo los recursos de la Real Academia Española, pues, a pesar de que muchos de los trabajos presentados hagan uso de corpus propios o presenten proyectos de corpus, también acuden a otros recursos como material de referencia para paliar posibles carencias, obtener datos de diferente índole o aportar al análisis de los datos reales extraídos de corpus un enfoque lexicográfico.5

Abre el volumen el trabajo titulado Atlas, diccionarios y corpus: tres recursos lingüísticos en contraste firmado por Joan Torruella. Como indica el título, el objetivo consiste en comparar los datos que se obtienen de atlas lingüísticos, diccionarios y corpus para dar cuenta de las potencialidades y debilidades de cada uno de estos recursos a la hora de realizar estudios lingüísticos, así como para evaluar la representatividad y la fiabilidad de los resultados obtenidos. El estudio se ilustra a través de las variantes designativas para el concepto ‘crepúsculo’ en cuatro lenguas iberorrománicas: español, catalán, gallego y portugués, y se ubica en la mitad norte de la península ibérica y en el siglo xx.

←11 | 12→

El capítulo parte de la distinción entre término y palabra, pues tanto el concepto seleccionado para el análisis, ‘crepúsculo’, como las temáticas de uno de los recursos estudiados, el atlas lingüístico, podrían considerarse pertenecientes de igual modo a la lengua general y a la especializada. No obstante, si se tiene en cuenta que el carácter terminológico de las unidades léxicas no existe per se, sino que el valor especializado se activa «por condiciones pragmáticas (temática y situación)» (Cabré 2009, 14), muchas de las palabras recopiladas en los atlas, en general, y el término estudiado, en particular, se enmarcarían en el campo de la terminología considerando el perfil del emisor, su experiencia profesional como trabajador en el campo o en el mar y el ámbito de uso rural, como justifica el autor. Seguidamente, presenta las fuentes consultadas para el trabajo: 6 atlas referentes al arco septentrional de las diferentes lenguas iberorrománicas estudiadas, 10 diccionarios y 4 corpus, estos últimos seleccionados a partir del Portal CORHIBER (Corpus Históricos Iberorrománicos).6 El apartado 4 ofrece los resultados de la consulta de dichas fuentes que van a ser la base sobre la que se efectúe la comparación de los tres recursos. Ante la amplitud de términos para expresar el «tiempo que dura el crepúsculo», Joan Torruella acota su estudio a las denominaciones referentes a un momento determinado del día: la tarde (atardecer, tardecer, tardada y tardecica). Como señala el autor y se pone de manifiesto en el análisis, los atlas, los diccionarios y los corpus tienen unas características propias y proporcionan informaciones concretas que pueden coincidir, discrepar o, mayoritariamente, ser complementarias (por ejemplo, precisando las dimensiones geográfica, temporal o conceptual de las unidades léxicas). Al mismo tiempo, la metodología de estudio combinada que presenta el autor constituye, de igual modo, un modelo reproducible en futuras investigaciones en lengua especializada —también en lengua general—tanto de corte intralingüístico como interlingüístico. Los resultados obtenidos sirven como base para el subsiguiente contraste entre atlas, diccionarios y corpus en el apartado 5. El autor identifica 12 características principales que permiten valorar, en líneas generales, la representatividad y el alcance de los tres recursos: lengua viva, realidad hablada/escrita, significado/significante, objetividad, temática, fonética, variedades diastrática, tipológica, geográfica y cronológica y contexto. A pesar de las singularidades y distintas finalidades de las tres herramientas contrastadas, el artículo concluye resaltando su complementariedad a la hora de estudiar palabras y términos de especialidad, siempre teniendo presente que estas solo pueden dar cuenta de lo que existe, que nunca llega a ser todo lo que existe y mucho menos será lo que no existe.

El segundo capítulo, titulado Locuciones adverbiales latinas (P+X) de ámbito jurídico en los corpus diacrónicos del español medieval y clásico, lo firma David Porcel Bueno (Karl-Franzens-Universität Graz). Los esquemas adverbiales latinos formados por una preposición más un elemento nominal (P+X) constituyen uno de los aspectos más destacados del español jurídico actual. Gracias a la documentación textual reunida en los corpus diacrónicos ha sido posible demostrar que muchos de estos latinismos fraseológicos se incorporaron al castellano durante la época medieval, pero no se afianzaron en los registros más cultos de la lengua hasta los siglos XVI y XVII, en una época, así pues, sucesiva al conocido momento de relatinización que supuso el cuatrocientos. Los textos jurídicos y administrativos revisten una importancia capital para las locuciones adverbiales latinas (P+X), puesto que documentan los primeros usos como unidades fraseológicas especializadas de dichos esquemas.

←12 | 13→

Dentro del marco aludido, Porcel Bueno aborda la caracterización de las locuciones adverbiales latinas (P+X) en el castellano de la Edad Media y del Siglo de Oro gracias a muestras textuales seleccionadas del Corpus diacrónico del español (CORDE), el Corpus Hispánico y Americano en la Red: Textos Antiguos (CHARTA) y el Diccionario del Castellano del Siglo XV en la Corona de Aragón (DiCCA-XV), con la atención puesta en las fuentes jurídicas. De ahí que el investigador haya desechado, además de los esquemas adverbiales cuyo uso se documenta solo a partir del siglo XVIII, también los esquemas adverbiales que, ya desde las atestiguaciones más antiguas, presentan un empleo general «como es el caso de in extenso, in extremis, in extremo, a posteriori, a priori, per accidens, etc.»

Asimismo, en el trabajo de Porcel Bueno la búsqueda y selección de ejemplos de uso de las locuciones estudiadas están supeditadas a la desigual calidad de los propios textos recogidos en los corpus, ya que ella depende en buena medida de los ejemplares escogidos como representativos (cf. Rodríguez/Octavio 2017); por ello, el autor ha descartado «la datación más antigua de algunos latinismos fraseológicos, una vez constatado que estos se trasmitían en documentos poco fiables en términos lingüísticos o en testimonios que presentaban una cronología equivocada».

Encarnación Tabares Plasencia suscribe el siguiente capítulo dedicado a la terminología jurídica en los textos literarios españoles. Su análisis se basa en un corpus de literatura española (CORLITES) que recopila obras desde el siglo xii hasta principios del siglo xx y que la autora ha diseñado y compilado con la finalidad de estudiar el desarrollo histórico tanto de los términos como de las unidades fraseológicas especializadas del derecho (véase Tabares Plasencia 2020). Como muestra la profesora de la Universidad de La Laguna, la metodología para la extracción de unidades terminológicas no siempre se puede apoyar, o por lo menos no exclusivamente, en las herramientas de análisis de corpus, sino que también es necesario complementar el proceso con otros medios para la identificación de las unidades y su posterior adscripción a un subdominio concreto, como pueden ser la consulta de obras lexicográficas generales y especializadas.7 El proceso de extracción da como resultado un total de aproximadamente 1 700 unidades terminológicas, entre ellas destacan las unidades nominales como categoría formal más numerosa (75 %), motivo por el cual la autora dirige su atención a este grupo.

←13 | 14→

Su análisis presenta una doble vertiente conceptual y formal. Por un lado, la distribución en campos nocionales de las unidades pone de relieve que el subámbito jurídico más representado es el derecho procesal penal seguido de cerca por el derecho civil, hecho que no es de extrañar, pues, como afirma la autora, en la literatura son constantes, respectivamente, tanto «los aspectos más oscuros de la naturaleza humana, las conductas antisociales y criminales, así como su punición; la autodefensa o la heterocomposición; la justicia humana o divina» como «los motivos clásicos de la familia (filiación, parentesco, instituciones tutelares, matrimonio) y de su trascendencia tras la muerte (sucesiones y sus conflictos)». Por otro lado, en lo que se refiere al análisis formal, Tabares Plasencia da cuenta de diferentes aspectos. Así, su estudio muestra que las unidades monoverbales son más frecuentes que las pluriverbales, lo que implica una mayor estabilidad semántica general por cuanto los términos pluriverbales se crean para denominar nuevos conceptos en los que el conocimiento especializado se reparte entre sus diferentes elementos. Asimismo, los esquemas sintácticos más habituales en las formas pluriverbales son [sustantivo + de + sustantivo] y [sustantivo + adjetivo]. Además, los resultados demuestran la trascendencia de la derivación como procedimiento de formación de términos. La última cuestión de la que se ocupa es la variación terminológica, exponiendo qué tipo de variantes se han encontrado en CORLITES.

En definitiva, este completo análisis de las unidades terminológicas nominales constituye un aporte tanto al campo de la terminología como al movimiento de los Law and Literature Studies (véase Tabares Plasencia 2018, 60–61) desde una perspectiva diacrónica; estamos seguros de que las vías de investigación basadas en CORLITES seguirán dando frutos a la lingüística histórica.

Piero Renato Costa León (Università degli Studi di Verona/Universitat Autònoma de Barcelona) dedica sus páginas al estudio de la terminología demográfica en Hispanoamérica durante la etapa colonial; considera, así pues, un amplio corte cronológico que abarca desde el siglo xvi hasta mediados del xix y que queda repartido en cinco cortes temporales de media centuria cada uno con el fin de contrastar desde el punto de vista histórico los datos recogidos y de evaluar su evolución. Más en concreto, en su trabajo, Costa León expone los objetivos y los criterios para la conformación de un corpus que permita analizar y clasificar, a través de textos de orientación etnográfica, el surgimiento, la variación y la (eventual) desaparición de denominaciones poblacionales en las colonias americanas, contemplando tanto los gentilicios como los etnónimos, dos categorías cuyas fronteras resultan en ocasiones difuminadas.

←14 | 15→

El corpus de Costa León se encuentra actualmente en fase de desarrollo y por ello es susceptible de ampliaciones en cuanto a las muestras textuales recogidas. Para su diseño, que se fundamenta en particular en las aportaciones de Torruella Casañas (2017), el investigador compagina parámetros distintos y de diversa índole. De hecho, al interés por la terminología demográfica colonoamericana y la estructuración cronológica —criterios ya aludidos—se suman el tipo textual —Costa León distingue entre crónica y relación geográfica o de viajes—y la región de producción textual, en la que contempla el Virreinato de Nueva España, el Virreinato del Perú y también la España peninsular, dado que muchas obras relevantes para la investigación en cuestión se imprimieron en la metrópoli.

La investigación de Costa León destaca por su naturaleza interdisciplinaria: de hecho, una parcela de la historia de la lengua se aborda de la mano de la lingüística de corpus y los planteamientos del estudioso compaginan la diacronía lingüística con elementos propios de la historiografía y de los estudios sociales. Además, la realización del proyecto del autor supone el examen, desde un punto de vista lingüístico, de fuentes que, en las épocas consideradas, son el testimonio textual de disciplinas aún en ciernes: en concreto, la etnografía y, de cierto modo, la antropología.

El capítulo siguiente, Hacia un tesoro de voces indígenas recogidas en las expediciones científicas de los siglos XVIII-XIX, amplía aún más los lindes geográficos del presente volumen. De hecho, como aclara su autor, Luis Pablo Núñez (Universidad de Granada), los vocabularios estudiados en su proyecto y reunidos en su corpus «se corresponden con lenguas de varias regiones geográficas: por un lado, la región del noroeste de América (el actual estado de Washington de Estados Unidos, la actual Columbia Británica de Canadá y Alaska); de diversas regiones de la América del Sur (Venezuela, Chile y Patagonia) y, finalmente, de áreas del Pacífico (costa este de Australia, islas del Pacífico —Hawái, Tahití, isla de Pascua, Micronesia—) y sudeste asiático (Malasia y China). En otro ámbito, pueden sumarse los vocabularios de las misiones de la Alta California».

Las expediciones oceánicas de finales del siglo xviii y principios del xix, de carácter científico y militar, permitieron a los países europeos con proyección marinera intercontinental (España, Francia, Reino Unido y Rusia, fundamentalmente) entablar contactos con poblaciones de regiones poco conocidas o incluso inexploradas de América y del Pacífico. La documentación relacionada con dichas exploraciones, estudiada desde distintas disciplinas, resulta aún poco aprovechada por parte de la filología. De ahí la relevancia del corpus que Pablo Núñez está conformando: el investigador está reuniendo vocabularios bilingües y plurilingües de los siglos xviii-xix realizados en el seno de las exploraciones aludidas con el propósito de realizar un tesoro léxico de voces indígenas. Los glosarios que conforman el corpus se suelen encontrar dentro de escritos más amplios, sobre todo los diarios de navegación, y son materiales de archivo, en gran medida aún manuscritos e inéditos. Aunque el interés principal es la documentación de las exploraciones españolas, el corpus considerará no solo vocabularios de idiomas indígenas en los que la metalengua es el castellano, sino también el francés o el inglés, siempre que los glosarios sean de la misma época y se hayan producido en circunstancias análogas.

←15 |
 16→

Pablo Núñez describe el contexto y el planteamiento de su proyecto, las fases de este y sus propósitos. Para ejemplificar el trabajo que ha puesto en marcha, el autor ofrece además una muestra de voces a partir de uno de los vocabularios considerados, introducidas por pertinentes consideraciones lingüísticas: se trata de un glosario de voces del idioma rapanui procedentes del diario de uno de los oficiales de la expedición de Felipe González de Haedo a la Isla de Pascua (1770). La presentación de dicha muestra permite entender el alcance y la complejidad de la investigación presentada y el tratamiento lexicográfico al que el autor someterá las voces reunidas en su tesoro.

Biographical notes

Matteo De Beni (Volume editor) Dunia Hourani Martín (Volume editor)

Matteo De Beni es profesor titular de Lengua Española desde 2014 en la Universidad de Verona (Italia). Sus principales intereses científicos son la lexicografía y la lexicología del español, la historia de la traducción en el mundo hispánico y el estudio diacrónico del léxico técnico y científico del español, sobre todo de los siglos XVIII y XIX. Dunia Hourani-Martín es licenciada en Traducción e Interpretación y doctora por la Universidad de Granada (España). Sus principales líneas de investigación son la terminología y la fraseología especializada (español-alemán) y la lingüística de corpus.

Previous

Title: Corpus y estudio diacrónico del discurso especializado en español