Loading...

Los términos compuestos desde la Terminología y la Traducción

by Melania Cabezas-García (Author)
Thesis 278 Pages

Table Of Content

  • Cubierta
  • Título
  • Copyright
  • Sobre el autor
  • Sobre el libro
  • Esta edición en formato eBook puede ser citada
  • Tabla de contenido
  • Resumen
  • 1. Introducción
  • 2. La Terminología Basada en Marcos
  • 2.1 Fundamentos teóricos
  • 2.2 Aplicación práctica: EcoLexicon
  • 3. Una mirada a los términos compuestos
  • 3.1 Los términos compuestos en la fraseología
  • 3.2 Noción de término compuesto y estudios principales
  • 3.3 Tipología y formación de términos compuestos
  • 3.4 Análisis de los términos compuestos
  • 3.4.1 Desambiguación estructural: bracketing
  • 3.4.2 La semántica de los formantes
  • 3.4.3 Análisis de las relaciones semánticas internas
  • 3.4.3.1 Los inventarios de relaciones semánticas
  • 3.4.3.2 Las paráfrasis
  • 3.4.4 Variación en los términos compuestos
  • 3.4.4.1 Variación denominativa formal
  • 3.4.4.2 Variación denominativa cognitiva
  • 3.4.5 Neología en los términos compuestos
  • 3.5 Traducción de términos compuestos
  • 3.6 Representación de términos compuestos
  • 4. Profundizando en los términos compuestos
  • 4.1 La formación de términos compuestos
  • 4.1.1 Análisis semántico de la formación de términos compuestos
  • 4.1.1.1 Bracketing
  • 4.1.1.2 Categorías semánticas
  • 4.1.1.3 Relación semántica interna
  • 4.1.1.4 Roles semánticos
  • 4.1.2 Los microcontextos en los términos compuestos
  • 4.2 La traducción de términos compuestos
  • 4.2.1 Técnicas de búsqueda de equivalentes
  • 4.2.2 Composición en inglés y equivalencias en español
  • 4.3 El módulo de términos compuestos de EcoLexicon
  • 4.3.1 Desde el interior: plantilla de introducción de datos
  • 4.3.2 Desde el exterior: interfaz de usuario
  • 4.3.2.1 Vista MWT formation/Formación de términos compuestos
  • 4.3.2.2 Vista Equivalents/Equivalentes
  • 4.3.2.3 Vista Morphosyntactic combinations/Combinaciones morfosintácticas
  • 4.3.2.4 Vista Semantic combinations/Combinaciones semánticas
  • 4.3.2.5 Vista Summary/Resumen
  • 4.3.3 Conclusiones del módulo de términos compuestos de EcoLexicon
  • 5. Conclusiones
  • Bibliografía
  • Anexo 1: Extracción inicial de términos compuestos en inglés
  • Index for the book
  • Obras publicadas en la colección

Resumen

El tratamiento de los términos compuestos en un ámbito especializado y con una orientación bilingüe precisa de un estudio previo sobre sus características estructurales y semánticas. Este estudio revela que la formación de los términos compuestos puede estudiarse mediante un mecanismo de ocupación de slots activado por el núcleo, que denominamos microcontexto. En este sentido, los diferentes patrones de formación de términos y la falta de sistematicidad en su descripción complican la traducción de los términos compuestos. Su representación, por otro lado, debe abarcar las distintas características de estas unidades (p. ej. formación semántica y morfosintáctica, estructura, variantes y equivalentes, posición en el sistema conceptual). Una muestra de ello es la sección dedicada a los términos compuestos que hemos diseñado en EcoLexicon, una base de conocimiento terminológica sobre el medio ambiente.

Palabras clave: término compuesto, terminología, traducción, semántica, corpus, EcoLexicon.

1. Introducción

Los términos compuestos están formados por varias unidades que, en su conjunto, aluden a un concepto. En su forma más frecuente, cuentan con un núcleo nominal y uno o varios modificadores, p. ej. floating offshore wind turbine. Estos a menudo se denominan compuestos nominales, si bien se suele emplear la denominación genérica término compuesto para aludir a este tipo de combinaciones, como asumimos en esta monografía. Los términos compuestos son muy frecuentes en diferentes lenguas, tanto en el discurso general como en el especializado, en el que constituyen uno de los mecanismos más frecuentes de formación de términos, si no el principal, gracias a sus múltiples posibilidades de combinación conceptual.

Así, en el discurso científico-técnico no resulta extraño encontrar secuencias como el siguiente título, formado prácticamente por términos compuestos: Inertia-Free Stand-Alone Microgrid—Part II: Inertia Control for Stabilizing DC-Link Capacitor Voltage of PMSG Wind Turbine System. Este ejemplo señala la complejidad de los términos compuestos, que presentan diferentes aspectos problemáticos, como su identificación y desambiguación estructural, el análisis semántico de sus formantes y la relación que los vincula, así como su traducción o su descripción en recursos terminográficos.

Por una parte, reconocerlos en los textos puede resultar complicado, ya que a menudo están formados por tres o más elementos o incluso por palabras de la lengua general, que pueden complicar la identificación de la secuencia completa. Además, discernir las dependencias estructurales en los términos formados por tres o más elementos puede plantear dificultades (en wound rotor induction generator > [wound rotor] [induction generator]). Su análisis semántico no es menos complicado, dada la omisión de la relación semántica entre los formantes (en steam generator > generator uses_resource steam) y la elevada especialización que a menudo presentan, además de los frecuentes casos en los que se eliden formantes (en renewable power, el adjetivo renewable alude a un elemento omitido, de forma que la proposición subyacente sería power effected_by renewable source). Su transferencia a otras lenguas tampoco es tarea sencilla debido a los diferentes patrones de formación de términos y al tratamiento desigual que reciben en los recursos terminográficos, que también es un reflejo de la dificultad de su representación.

Algunas de estas cuestiones, como las relaciones internas o la desambiguación estructural, han sido objeto de estudio en diferentes trabajos. Sin embargo, ←11 | 12→quedan muchos aspectos en los que indagar, como el análisis de los términos compuestos que presentan un alto grado de especialización, su formación en inglés y otras lenguas, su traducción o su descripción en recursos terminográficos de cara a fomentar la adquisición de conocimiento.

Así pues, este libro profundiza en los términos compuestos, ilustrados a través de la terminología de la energía eólica. Esta es un área relativamente reciente que aún no se ha explorado en detalle, especialmente en español, a pesar de la importancia que está cobrando. Se caracteriza, entre otros aspectos, por el empleo de palabras de la lengua general, así como por la integración de diferentes disciplinas, como la Ingeniería o las Matemáticas, como se desprende de la gran cantidad de fórmulas y términos técnicos pertenecientes a estos campos.

De este modo, el libro ahonda en las siguientes cuestiones:

Estado de la cuestión y características de los términos compuestos.

Análisis semántico de los términos compuestos, como punto de partida para tareas posteriores. Este análisis se centra en los siguientes aspectos: (i) el bracketing o análisis de las dependencias estructurales ([wound rotor] [induction generator]); (ii) las categorías semánticas (power station> power[energy movement] station[structure]); (iii) la relación semántica interna (descodificada por medio de paráfrasis, p. ej. a power curve is a curve that represents or plots power); y (iv) los roles semánticos (wave power > wave[agent] power[patient]), ya que estas combinaciones cuentan con proposiciones conceptuales subyacentes.

Formación de los términos compuestos desde una perspectiva semántica, mediante un mecanismo de slots activado por el núcleo, que permite estudiar las regularidades y la productividad en el desarrollo de estos términos.

Traducción de los términos compuestos en inglés y español, con especial atención a la identificación de equivalentes en corpus, y al análisis y la propuesta de correspondencias. Para ello, asumimos que la estructura formal y semántica de los términos compuestos no siempre se reproduce en la lengua meta.

Representación de los términos compuestos en la base de conocimiento terminológica EcoLexicon, en la que se comprende tanto el modo de introducción de datos por los terminólogos como su visualización por los usuarios mediante diferentes rutas de acceso.

Estas cuestiones se presentarán en el contexto de la Terminología Basada en Marcos (Faber et al. 2005, 2006; Faber 2012), una teoría cognitiva de la terminología que contextualiza los conceptos en marcos o estructuras de conocimiento y se basa en el análisis de corpus. Así, en los siguientes capítulos se parte de un corpus ←12 | 13→comparable, en inglés y español, formado por textos especializados relativos a la energía eólica, para ilustrar el comportamiento de los términos compuestos.

Por tanto, se plantea una propuesta terminológica detallada que abarca diferentes aspectos de estos términos, entre los que figuran los más problemáticos, que hasta ahora se habían eludido o no se habían explorado en detalle. Algunos de estos aspectos son la formación de los compuestos por cualquier número y tipo de elementos (p. ej. participios, que revelan las proposiciones subyacentes), su desambiguación estructural, su traducción como parte de la labor diaria de los traductores y terminólogos, o su representación sistemática encaminada a favorecer la organización y adquisición del conocimiento. Asimismo, el libro no se limita a los términos compuestos en inglés, sino que incorpora también sus correspondencias en español, que habían recibido bastante menos atención hasta el momento. Se trata, por tanto, de un planteamiento innovador que aúna las aportaciones realizadas desde la Lingüística General, la Terminología, la Lexicografía, la Lingüística Computacional o la Psicolingüística. Tras identificar puntos débiles, se proponen nuevos enfoques, con el fin de trazar el comportamiento de los términos compuestos.

Así, tras presentar el libro en la Sección 1, se detallan sus fundamentos terminológicos en la Sección 2. En concreto, nos centramos en la Terminología Basada en Marcos, cuyas bases teóricas se comentan en la Sección 2.1. A continuación se describe EcoLexicon, la base de conocimiento terminológica que resulta de su aplicación (Sección 2.2).

La Sección 3 explora los aspectos teóricos de los términos compuestos. Después de abordar su papel como unidades fraseológicas (Sección 3.1), se comenta la noción de término compuesto y los principales estudios centrados en estas combinaciones (Sección 3.2). A continuación, se presentan los distintos tipos de términos compuestos y las aportaciones que se han realizado sobre su formación (Sección 3.3). En la Sección 3.4 se desglosan los diferentes aspectos que resultan de su análisis: el bracketing (Sección 3.4.1), la semántica de los formantes (Sección 3.4.2), el análisis de las relaciones semánticas internas (Sección 3.4.3), su variación (Sección 3.4.4) y su naturaleza neológica (Sección 3.4.5). Por último, la Sección 3.5 se centra en la traducción de los términos compuestos y la Sección 3.6 explora su representación en los recursos lingüísticos.

En la Sección 4 profundizamos en la investigación llevada a cabo con los términos compuestos. En concreto, en la Sección 4.1 se examina cómo se desarrollan estas combinaciones y, gracias a un profundo análisis semántico (Sección 4.1.1), se propone la noción de microcontextos para dar cuenta de su formación (Sección 4.1.2). A continuación, en la Sección 4.2 se ahonda en la traducción de estos términos. En concreto, se plantean técnicas para identificar equivalentes en ←13 | 14→corpus (Sección 4.2.1) y se contrastan las correspondencias en inglés y español (Sección 4.2.2). La Sección 4.3 está dedicada a la representación de los compuestos en recursos terminográficos. Así, en la Sección 4.3.1 se desglosa la plantilla para introducir la información en el módulo fraseológico de EcoLexicon, mientras que en la Sección 4.3.2 se describe la interfaz de usuario y en la Sección 4.3.3 se sintetizan las conclusiones derivadas del diseño de este módulo. Por último, la Sección 5 culmina este libro y apunta nuevas vías de interés.

2. La Terminología Basada en Marcos

2.1 Fundamentos teóricos

La Terminología Basada en Marcos es una teoría terminológica que toma algunas premisas del trabajo previo, a partir del cual propone nuevos enfoques. Así, La Teoría General de la Terminología (Wüster 1968, 1979) fue la primera propuesta teórica en estudiar el área de la Terminología. Su iniciador fue Eugen Wüster, un ingeniero austriaco que entendía que la función de la terminología era la de crear y estandarizar denominaciones para los conceptos. Por ello su enfoque es eminentemente prescriptivo, además de onomasiológico, ya que parte del concepto, mientras que los términos se conciben como meras etiquetas.

La visión de Wüster (1968, 1979) de la realidad terminológica es bastante idealizada, ya que simplificaba o eludía aspectos problemáticos como el contexto, la variación, la fraseología o la diacronía. Esto se produce con el ánimo de conceder a la Terminología un estatus de disciplina independiente. Es por ello también que se incide en la diferencia entre la lengua general y la lengua especializada y, con ello, en la distinción entre palabra (lengua general) y término (lengua especializada).

Así, desde la Teoría General de la Terminología (Wüster 1968, 1979; Felber 1984) se afirma la inexistencia de variación en la lengua especializada, sea del tipo que fuere. Esto es, se defiende la referencia unívoca y estable entre término y concepto: un concepto se denomina con un único término (se niega la variación denominativa) y un término no puede aludir a más de un concepto (se rechaza la variación conceptual). Se elimina de este modo la ambigüedad y se consigue una comunicación efectiva. Además, los aspectos gramaticales y discursivos se consideran irrelevantes, careciendo así de interés cuestiones como el contexto, la sintaxis, el lenguaje figurado o la fraseología.

Aunque los principios y la metodología de la Teoría General de la Terminología siguen vigentes en algunos ámbitos, como en el trabajo estandarizador de la Organización Internacional de Normalización (ISO), en la década de los 90 surgieron nuevos enfoques que ofrecían una visión más realista y descriptiva de la terminología, al analizar los términos en contextos reales de uso. Estos nuevos enfoques ponen el foco en cuestiones sociales, lingüísticas, comunicativas y cognitivas de la terminología, y adoptan un enfoque semasiológico, al partir del término para después analizar el concepto.

Uno de ellos fue la Socioterminología (Gaudin 1993, 2003, 2005), que surge al aplicar a la Terminología los principios de la Sociolingüística. Se reconoce la existencia de variación denominativa y conceptual en el lenguaje especializado, ←15 | 16→fenómenos que se estudian en sus contextos de uso. Así, el uso y los usuarios, especialmente los aspectos sociales y étnicos, son factores determinantes en la variación. Se estudia, por tanto, la diacronía y, con ella, la neología adquiere también un papel relevante (Gaudin 1993, 2003, 2005).

Desde la Socioterminología se defiende que no existen límites exactos entre los dominios especializados. Asimismo, se considera que la estandarización no es más que ficción, ya que la lengua y los sistemas conceptuales no dejan de evolucionar (Gaudin 1993, 2003, 2005). Se trata, por tanto, de un enfoque descriptivo y semasiológico, en el que se recoge el uso de los términos y se parte de estos para llegar a los conceptos. Constituye un avance importante, pues inició las nuevas teorías descriptivas de la Terminología que intentaron presentar una realidad más precisa de esta disciplina.

Otra de estas nuevas teorías es la Teoría Comunicativa de la Terminología (Cabré 1993, 1999), desde la que se señala el carácter de la Terminología como disciplina transdisciplinar, ya que todas las materias especializadas hacen uso de ella, e interdisciplinar, pues se sirve de diversas materias para describir su objeto de estudio. En concreto, se entiende que la Terminología integra teorías del conocimiento, de la comunicación y del lenguaje (Cabré 1993, 1999).

Así, mediante su teoría de las puertas, Cabré (2003) propugna que las unidades terminológicas se asemejan a un poliedro, una figura tridimensional con varias caras. De este modo, se puede acceder a ellas mediante tres puertas o dimensiones: la cognitiva, la comunicativa o la lingüística, sin que ninguna de ellas deje de estar presente en la unidad terminológica (aunque la puerta lingüística es la más habitual en el contexto de la comunicación especializada).

En su faceta cognitiva, se pretende dar cuenta del modo en que se conceptualiza la realidad. Para ello, los dominios conceptuales se entienden como conjuntos de unidades terminológicas vinculadas por relaciones de distinto tipo, en las que las unidades terminológicas constituyen nodos. En esta línea, desde la Teoría Comunicativa de la Terminología, se incide en que los conceptos pueden pertenecer a distintas disciplinas, en las que pueden conservar o modificar sus características (Cabré 1993, 1999, 2003). Se destaca, por tanto, la importancia de la multidimensionalidad, que como veremos, consiste en particularizar un mismo concepto mediante distintas perspectivas o características.

Por otra parte, en su faceta comunicativa, se atiende a los distintos tipos de situaciones que pueden darse y su influencia en la comunicación. Ello deriva en un papel central de la variación como ámbito de estudio, a diferencia de la perspectiva inicial adoptada por Wüster y sus seguidores. Por último, en cuanto a la faceta lingüística, se defiende que los términos se comportan como palabras y adquieren su especificidad al emplearse en contextos y situaciones determinados. ←16 | 17→Así, al contrario que la Teoría General de la Terminología, se entiende que la frontera entre la lengua general y la especializada no es clara.

Por tanto, son diversas las ventajas de esta teoría: ha contribuido a asentar la Terminología como disciplina; reconoce la importancia de la cognición, la comunicación y la lingüística en la Terminología; y contempla diferentes contextos de uso, además de fenómenos importantes como la variación o la multidimensionalidad. No obstante, presenta algunas desventajas. En concreto, no se basa en ningún modelo lingüístico; no clarifica cómo se crean las representaciones conceptuales que utilizan ni cuáles son sus características (más allá de decir que se trata de mapas conceptuales formados por nodos y relaciones); además de no especificar cómo se realiza el análisis semántico (Faber y López Rodríguez 2012).

La Terminología Sociocognitiva (Temmerman 2000, 2007), por su parte, surge con el giro cognitivo de la Terminología, a partir del cual se otorga una mayor importancia a las estructuras conceptuales que subyacen en el lenguaje especializado. Así, esta teoría, junto a la Terminología Basada en Marcos que explicaremos a continuación, presenta un enfoque más cognitivo que la Teoría Comunicativa de la Terminología, al integrar premisas de la Lingüística Cognitiva y la Psicología.

En la Terminología Sociocognitiva (Temmerman 2000), los conceptos se denominan unidades de comprensión y, de este modo, su comprensión implica la organización en categorías. Estas se encuadran en modelos cognitivos idealizados (Lakoff 1987) (representaciones que se utilizan para estructurar los espacios mentales) y suelen presentar una estructura prototípica (Rosch 1978), es decir, se entiende que un miembro es el más representativo de la clase. Por tanto, se pone un énfasis especial en nociones cognitivas como la categorización y los prototipos.

Se critican distintos aspectos de la Teoría General de la Terminología, en concreto el enfoque onomasiológico y prescriptivo, la existencia de fronteras bien delimitadas en los conceptos y categorías, las descripciones basadas en la intensión, la univocidad de los términos y los estudios sincrónicos (Temmerman 2000, 2007). Al contrario, desde la Terminología Sociocognitiva se adopta un enfoque semasiológico y descriptivo, y se defiende que las fronteras entre conceptos y categorías no están bien delimitadas, pues suelen presentar una estructura prototípica. Así, la definición no debe basarse únicamente en la intensión, sino que dependerá del tipo de unidad de comprensión, el dominio especializado en el que esta se dé (se hace alusión a la multidimensionalidad) y el perfil de los usuarios. Por otra parte, se destaca la importancia de la variación y se llevan a cabo estudios diacrónicos de los términos y los conceptos.

←17 |
 18→

Desde la Terminología Sociocognitiva se ha propuesto la denominada Termontografía (Termontography, en Temmerman y Kerremans 2003). Se trata de un término híbrido que resulta al unir terminología (el estudio del lenguaje especializado), ontología (representación en la que se explicita una conceptualización) y terminografía (la compilación de recursos lingüísticos que recogen el léxico especializado). Constituye un enfoque multidisciplinar para la gestión y representación del conocimiento en el que se aúnan el análisis terminológico multilingüe de la Terminología Sociocognitiva y la ingeniería del conocimiento, pues se conciben las ontologías como una forma más práctica de realizar representaciones conceptuales.

Sin embargo, aunque se indica que la estructura prototípica de las unidades de comprensión se tiene en cuenta (Temmerman 2007), probablemente la dificultad de integrar este tipo de representaciones cognitivas en sistemas informáticos ha derivado en un uso principal de las ontologías en detrimento de las estructuras prototípicas y los modelos cognitivos idealizados, como señalan Faber y López Rodríguez (2012). No obstante, ello no nos parece un inconveniente, al contrario, destacamos la importancia de este enfoque por su énfasis en la representación conceptual y las perspectivas interesantes que presenta de cara a la gestión y representación del conocimiento en diferentes lenguas.

Entre estos nuevos enfoques terminológicos también se encuentra la Terminología Basada en Marcos (Faber et al. 2005, 2006; Faber 2012), cuya metodología seguimos en este libro. Se trata de un enfoque terminológico de corte cognitivo que se centra en la representación del conocimiento especializado, prestando especial atención a sus aspectos semánticos y cognitivos. Así, los ejes principales de esta teoría son la organización conceptual, la naturaleza multidimensional de las unidades terminológicas, y la extracción de información semántica y sintáctica a partir de corpus multilingües (Faber 2009: 123).

De este modo, se sigue una doble metodología para acceder al sistema conceptual subyacente. Por una parte, se extrae información de corpus en varias lenguas que aborden el dominio en cuestión. Por otra, se obtiene información de recursos terminográficos y otro material de referencia, que se complementa con la ayuda de expertos del área (Faber 2009: 124).

La Terminología Basada en Marcos comparte algunas de las ideas de la Teoría Comunicativa de la Terminología (Cabré 1993, 1999) y la Terminología Sociocognitiva (Temmerman 2000, 2007), como su carácter descriptivo, al analizar los términos en los textos en los que se utilizan. Igual que estas teorías, defiende que la distinción estricta entre palabras y términos carece de sentido, ya que las fronteras entre la lengua general y la especializada no son claras y estas unidades presentan el mismo comportamiento, aunque se den en contextos diferentes. En concreto, se asumen las diferentes puertas de acceso a las unidades ←18 | 19→terminológicas, como se plantea en la Teoría Comunicativa de la Terminología, y la existencia de variación en el lenguaje especializado. También coincide con la Terminología Sociocognitiva (y con la Lingüística Cognitiva) en la existencia de prototipos en las categorías, la evolución diacrónica de los términos y los conceptos, y la utilidad de las ontologías en la representación del conocimiento especializado (López Rodríguez et al. 2010).

Sin embargo, la Terminología Basada en Marcos se diferencia de estas teorías al integrar premisas de otras corrientes de estudio, en concreto, el Modelo de la Gramática Léxica (Martín Mingorance 1989; Faber y Mairal 1999), el Lexicón Generativo (Pustejovsky 1991, 1995), la Cognición Situada (Barsalou 2003) y, principalmente, la Semántica de Marcos (Fillmore 1977, 1982, 1985), a partir de la cual se adopta la denominación de Terminología Basada en Marcos (Faber 2012).

Por un lado, el Modelo de la Gramática Léxica (Martín Mingorance 1989; Faber y Mairal 1999) se utiliza para la extracción y representación de relaciones semánticas y colocacionales presentes en el discurso especializado. Según este modelo, en el lexicón se distingue entre un eje paradigmático y otro sintagmático. El eje paradigmático organiza el lexicón en una jerarquía de dominios y subdominios, e influye en el eje sintagmático, que da cuenta del potencial combinatorio de los términos. La convergencia de los dos ejes es la base de la estructura conceptual tanto en la lengua general como en la especializada (Faber 2012).

El Lexicón Generativo (Pustejovsky 1991, 1995) permite la organización y la restricción de las dimensiones conceptuales según la semántica de los conceptos (León Araúz 2009). Por su parte, la Cognición Situada (Barsalou 2003), una de las ideas claves de la Lingüística Cognitiva, subyace en la importancia que adquieren para la representación del conocimiento elementos como el contexto y las relaciones semánticas no jerárquicas (aquellas que no pertenecen a una jerarquía hiponímica o partitiva, p. ej. las que aluden al objetivo, el uso o el resultado de un concepto). Además, como demostraron Faber et al. (2014), el cerebro representa y procesa los conceptos especializados mediante simulaciones. En general, la Terminología Basada en Marcos propugna que los conceptos deben entenderse y analizarse en contexto y este contexto adquiere la forma de un marco.

Así, los marcos son el principio estructurador del conocimiento especializado, cuya noción se toma de la Semántica de Marcos (Fillmore 1977, 1982, 1985), que a su vez parte de la idea inicial de Minsky (1975) en la Inteligencia Artifical, en la que estos se conciben como estructuras de datos que representan situaciones estereotipadas, como una fiesta de cumpleaños (Minsky 1975: 212). En esta línea, la Semántica de Marcos (Fillmore 1977, 1982, 1985) concibe los marcos como estructuras de conocimiento que permiten la contextualización ←19 | 20→de los conceptos. De este modo, se entiende que el significado depende del contexto –una idea que también se defiende desde el enfoque enciclopédico de la Semántica Cognitiva (Allwood 2003; Croft y Cruse 2004)– y que los términos son la puerta de acceso a los conceptos. Sin embargo, a diferencia del enfoque de Fillmore (1977, 1982, 1985), las representaciones en la Terminología Basada en Marcos no son específicas de una lengua, sino conceptuales, de modo que se asemejan en este sentido a la propuesta de Minsky (1975).

Según Fillmore (1982: 116–117), para conocer el significado de elementos como buy o sell, es necesario acceder al evento comercial (commercial event), en el que se incluyen también participantes como buyer, seller, goods y money. En la Terminología Basada en Marcos, esta representación en forma de marcos da lugar a lo que se denomina evento medioambiental (Figura 1) (Faber et al. 2005), que subyace en los textos relacionados con el medio ambiente y donde el análisis de los conceptos y sus relaciones permite adquirir el conocimiento (Faber 2012; León Araúz et al. 2012). Así, este evento, que puede particularizarse (p. ej. el evento de la energía eólica), se compone de las acciones y procesos que tienen lugar en el medio ambiente, así como las entidades que participan en ellos (Faber 2009).

Figura 1: El evento medioambiental

←20 |
 21→

Como puede observarse en la Figura 1, un agente (natural o humano) se encuentra en el origen de los procesos. Estos pueden ser procesos naturales, cuando los causa un agente natural, y pueden afectar a un paciente y tener resultados. En cambio, cuando es un agente antrópico el que lleva a cabo los procesos, estos se consideran procesos artificiales y pueden realizarse utilizando algún instrumento, además de derivar en resultados. Asimismo, en el evento medioambiental participan los atributos o propiedades de los conceptos (p. ej. speed, height). Los roles semánticos empleados (agente, paciente, resultado, etc.) se especifican con las categorías semánticas que pueden desempeñar dichos roles en el medio ambiente (p. ej. water, atmospheric, geological).

Además, las relaciones conceptuales desempeñan un papel fundamental para delimitar los conceptos según las diferentes proposiciones conceptuales de las que pueden participar y, con ellas, los diferentes contextos. Así sucede en los eventos o marcos, en los que se recogen las relaciones entre conceptos y, en esta línea, su potencial combinatorio (Faber 2009).

De este modo, en el evento medioambiental intervienen relaciones jerárquicas y no jerárquicas (Faber 2015). Las relaciones jerárquicas son las más estudiadas en la Terminología y en las otras áreas que hacen uso de las relaciones semánticas, como la Inteligencia Artificial. Estas se basan en la subordinación o superordinación de los conceptos, y pueden ser genérico-específicas o hiponímicas (type_of, o lo que es lo mismo is_a, y su relación inversa, has_type) o bien partitivas o meronímicas (part_of y su inversa has_part). Por ejemplo, una de las relaciones jerárquicas que se aprecia en la Figura 1 es la genérico-específica: human agent type_of agent. Esta relación ha sido probablemente la más estudiada, debido a su importancia para la categorización y la herencia de propiedades.

Por su parte, las relaciones no jerárquicas (p. ej. natural agent causes natural process) se han estudiado menos, lo que, unido a la diferente granularidad de los distintos enfoques, ha desembocado en una falta de inventarios más o menos consensuados. Sin embargo, uno de los puntos fuertes de la Terminología Basada en Marcos radica en su amplia concepción y uso de las relaciones no jerárquicas (p. ej. causes, affects, represents, has_function, etc.), que favorecen la adquisición situada del conocimiento al reproducir los diferentes vínculos que pueden mantener los conceptos. De hecho, las relaciones no jerárquicas son fundamentales en terminología, ya que la complejidad de muchos dominios no permite su representación basada únicamente en relaciones hiponímicas y partitivas (León Araúz 2009).

←21 |
 22→

En la Terminología Basada en Marcos, las relaciones, cuya capacidad para vincular dos conceptos depende de la naturaleza de los mismos (León Araúz y Faber 2012), se detectan mediante patrones de conocimiento (Hearst 1992; Meyer 2001; Bowker 2003; León Araúz et al. 2016; inter alia), que son marcadores léxico-sintácticos que se encuentran en textos reales y expresan una determinada relación entre conceptos (Meyer 2001).

Así pues, la utilidad de las relaciones en diferentes tareas resulta innegable, pues permiten la estructuración conceptual (por ejemplo, las representaciones terminológicas o la elaboración de definiciones), además de la comprensión de los textos (Bowker 2003). Sin embargo, no han gozado de la misma atención que otros entes conceptuales como las categorías (León Araúz 2009; León Araúz et al. 2016). En cuanto a la elaboración de definiciones, en la Terminología Basada en Marcos cada categoría semántica tiene una plantilla definicional compuesta por las relaciones semánticas que activa dicha categoría (Faber et al. 2001). Estas plantillas permiten la redacción de definiciones homogéneas (basadas en la estructura clásica de genus y differentiae) y la organización conceptual de los términos. Mediante su uso, los hipónimos heredan las propiedades del concepto superordinado, a las que añaden nuevas características.

En la Terminología Basada en Marcos también se comprende el contenido visual como método para favorecer la adquisición de conocimiento, ya que la representación de los conceptos se acompaña a menudo de imágenes específicamente seleccionadas para tal fin (Reimerink et al. 2016). Como veremos a continuación, los diferentes aspectos comentados se plasman en EcoLexicon, una base de conocimiento terminológica sobre el medio ambiente.

2.2 Aplicación práctica: EcoLexicon

El trabajo terminográfico llevado a cabo en la Terminología Basada en Marcos se aplica a la base de conocimiento terminológica EcoLexicon (http://ecolexicon.ugr.es) (Faber et al. 2011; Faber et al. 2016; San Martín et al. 2017). Se trata de un recurso desarrollado por el grupo de investigación LexiCon de la Universidad de Granada que se diseñó e implementó en 2003, y recoge la terminología del medio ambiente en español, inglés, alemán, árabe, francés, griego moderno y ruso, siendo el inglés y el español las lenguas más presentes. Actualmente contiene 4471 conceptos y 23 783 términos.

Entre los usuarios de EcoLexicon se cuentan especialistas de la lengua (p. ej. terminólogos, traductores), expertos del medio ambiente y el público en general. Se trata, en definitiva, de usuarios que necesiten acceder a los conceptos del ←22 | 23→medio ambiente, por ejemplo, para comprender, escribir o traducir textos especializados o semiespecializados (San Martín et al. 2017).

EcoLexicon presenta una interfaz con varios módulos que ofrecen información conceptual, lingüística y gráfica, entre los que se puede elegir para obtener los datos que resulten de mayor interés. En la Figura 2 se muestra la entrada de anthropic erosion.

Figura 2: Entrada de anthropic erosion en EcoLexicon

En la parte superior de la interfaz se puede acceder a la búsqueda por término o concepto. Bajo esta barra se muestran pestañas que despliegan el historial de navegación, los resultados de las consultas, una lista alfabética de los términos, el recorrido conceptual más corto entre dos conceptos y ejemplos de concordancias del término buscado. Por otro lado, a la izquierda se muestra la información del concepto, en concreto, su definición, los términos que lo designan (al hacer clic se indica la lengua, el tipo de término, ejemplos de uso, la categoría gramatical y el género), los recursos asociados (imágenes, documentos, etc.), las categorías conceptuales1 y su fraseología2.

←23 | 24→

En el centro de la pantalla se muestra la red semántica en la que interviene el concepto consultado, que constituye la característica más distintiva de EcoLexicon. El concepto consultado se muestra en el centro, vinculado a otros conceptos mediante flechas que indican relaciones jerárquicas y no jerárquicas, así como atributos.

Dado que la amplitud y la multidimensionalidad del dominio medioambiental dieron lugar a una sobrecarga de información en la interfaz de EcoLexicon, se tomaron diferentes medidas para paliar el exceso de información. En concreto, se permitió elegir las relaciones que querían visualizarse en la red, además de ofrecer una vista recontextualizada según restricciones contextuales al elegir un dominio determinado y mostrar diferentes puertas de acceso al sistema conceptual (a modo de red, árbol o camino).

Además, se han creado productos derivados de esta base de conocimiento. En concreto, hemos señalado que EcoLexicon cuenta con un módulo fraseológico, ya que se reconoce la importancia de la fraseología en el lenguaje especializado. Este incluye actualmente colocaciones verbales, en las que se presentan los verbos que suelen coocurrir con un determinado concepto, ordenados en dominios léxicos (Faber y Mairal 1999) según su significado. En esta monografía presentamos la ampliación de este módulo fraseológico para representar también términos compuestos, como detallaremos en la Sección 4.3.

Otro de los productos derivados de EcoLexicon es el EcoLexicon English Corpus, un corpus de 23,1 millones de palabras compuesto por textos actuales del medio ambiente en inglés. Puede accederse a él en la opción Search concordances de EcoLexicon, además de estar disponible en acceso abierto en los Open Corpora de Sketch Engine. Sus metadatos permiten realizar búsquedas basadas en factores pragmáticos, como los dominios contextuales, o el tipo de usuario o de texto. Cabe destacar que está anotado con las gramáticas de sketches desarrolladas por León Araúz et al. (2016), que están basadas en patrones de conocimiento y permiten extraer las principales relaciones semánticas del dominio medioambiental (genérico-específicas, parte-todo, ubicación, causa y función) (San Martín et al. 2017).

Asimismo, se ha desarrollado una herramienta web de traducción asistida destinada a facilitar la traducción de textos medioambientales en inglés y español. Se trata de EcoLexiCAT (León Araúz y Reimerink 2018), que parte del software libre de traducción asistida MateCat para enriquecer el texto origen con información de EcoLexicon, BabelNet (un diccionario enciclopédico y red semántica multilingüe que se construye de forma automática) (Navigli y Ponzetto 2012) y la herramienta de análisis de corpus Sketch Engine (Kilgarriff et al. 2004, 2014).

←24 | 25→

En definitiva, como se desprende de sus diferentes funciones y los distintos productos a los que ha dado lugar, EcoLexicon constituye una herramienta terminográfica muy rica que cuenta con una base teórica bien asentada. Así, da cuenta de fenómenos relevantes en el lenguaje especializado, como son la variación, la multidimensionalidad o la fraseología. Además, sigue alimentándose con dominios adicionales del medio ambiente, así como con nuevos conceptos y términos, y funcionalidades novedosas, por lo que se trata de un recurso que, sin duda, seguirá creciendo.

←25 |
 26→←26 | 27→

1 Este apartado está en proceso de modificación para representar de forma precisa la categoría o categorías conceptuales a las que pertenezca el concepto, ya que por el momento se presenta una mezcla de categorías y roles.
2 El apartado de fraseología también se encuentra en construcción. Actualmente despliega los verbos que suelen coocurrir con el concepto, si bien se enriquecerá esta información y se aportará, además, un apartado de términos compuestos (Sección 4.3).

3. Una mirada a los términos compuestos

Los términos compuestos, p. ej. hydroelectric power station, destacan por su elevada presencia en diferentes lenguas, como el inglés y el español (Nakov 2013; Hendrickx et al. 2013; Fernández Domínguez 2016). Este protagonismo del que hace gala la composición se debe a las infinitas posibilidades de combinación que ofrece la lengua para facilitar la expansión léxica y terminológica (Baldwin y Kim 2010). Así, los términos compuestos suelen consistir en la especificación de un núcleo nominal con modificadores nominales, adjetivales o preposicionales, que varían según los patrones de formación de términos de cada lengua. Estos términos compuestos se denominan compuestos nominales y constituyen el tipo de término compuesto por antonomasia. Por ello, es frecuente el empleo de la denominación genérica término compuesto que adoptamos en esta monografía para aludir a los compuestos nominales. No obstante, no podemos olvidar que existen otros términos compuestos, como los adjetivos compuestos (decay-corrected) o los verbos compuestos (precast) (Sager et al. 1980), aunque su presencia es mucho menor.

Además de ser frecuentes en la lengua general, los términos compuestos destacan por su omnipresencia en el discurso especializado (Sager et al. 1980; Cabré 1993; Kageura 2002; Daille et al. 2004; Faber et al. 2012; Nakov y Hearst 2013; inter alia), como etiquetas de los conceptos, que contribuyen a la transmisión del conocimiento científico-técnico. Entendemos los términos compuestos como unidades fraseológicas especializadas, a pesar de la diversidad de opiniones al respecto, como comentaremos en este capítulo.

Los términos compuestos plantean problemas a diferentes niveles, como su identificación, su desambiguación estructural, el análisis semántico de sus formantes y la relación implícita que los vincula, su traducción o su representación en recursos terminográficos. Por ello, no resulta extraña la atención que han recibido desde distintas áreas, entre las que destacan: (i) la Lingüística General, que los ha estudiado como mecanismo habitual de formación léxica; (ii) la Terminología, que parte de su relevancia en los sistemas conceptuales; (iii) la Lexicografía, que ha investigado los desafíos de su representación; (iv) la Lingüística Computacional, cuyo tratamiento concibe como indispensable para el buen funcionamiento de los sistemas de procesamiento del lenguaje natural; y (v) la Psicolingüística, que ha analizado la combinación conceptual que subyace en estas unidades.

←27 | 28→

Además, la investigación en términos compuestos sigue siendo un tema de actualidad, como lo demuestran los numerosos congresos y publicaciones que intentan aclarar las diferentes particularidades de este fenómeno. No obstante, aún quedan aspectos en los que profundizar, como los términos compuestos que presentan un alto grado de especialización, su formación por cualquier número y tipo de elementos, su traducción o formación en lenguas diferentes del inglés, así como su representación en recursos terminográficos de forma que se facilite la transmisión de conocimiento, además de otras vías que sin duda seguirán surgiendo.

Este capítulo recoge los diferentes aspectos de interés en relación con los términos compuestos. En la Sección 3.1 comentamos los principales rasgos de la fraseología general y la fraseología especializada, a la que pertenecen los términos compuestos. En la Sección 3.2 desarrollamos la noción de términos compuestos que se asume en este libro y presentamos la literatura principal que ha estudiado estas unidades. A continuación, en la Sección 3.3 describimos los tipos de términos compuestos y su formación. Seguidamente, en la Sección 3.4 profundizamos en el análisis de los términos compuestos, deteniéndonos en la desambiguación estructural, la semántica de los formantes, las relaciones semánticas internas, y su frecuente variación y neología. En la Sección 3.5 abordamos la traducción de los términos compuestos, en la que pasamos revista a los problemas que plantea su transferencia y los estudios que se han realizado al respecto. Por último, en la Sección 3.6 nos detenemos en la representación de los compuestos en los recursos lingüísticos en general y los de carácter especializado en particular.

3.1 Los términos compuestos en la fraseología

La fraseología constituye un área de estudio que ha recibido un gran interés. Desde la Lingüística Teórica (Bally 1951[1909]; Vinogradov 1947) hasta la Psicología (Rapp 2008), pasando por la Lingüística Computacional (Smadja 1993; Sag et al. 2002) y la Lingüística de Corpus (Firth 1957; Halliday 1966; Sinclair 1991; Stubbs 2001), entre otras disciplinas, se han interesado por estas combinaciones de palabras, principalmente en la lengua general, pero también en el discurso especializado (Picht 1991; Martin 1992; Tercedor Sánchez 1999; Montero Martínez 2002; Buendía Castro 2013; inter alia). No resulta sorprendente si consideramos que estas unidades son una parte fundamental de nuestro lenguaje, que podrían representar la mitad de nuestro vocabulario (Jackendoff 1997).

La fraseología se asienta sobre la idea de que el lenguaje no se compone únicamente de palabras individuales, sino también de estructuras superiores que funcionan como un todo (Sinclair 1991). En este sentido, la Lingüística de Corpus ←28 | 29→ha desempeñado un papel fundamental, pues, por una parte, ha demostrado la relevancia de la fraseología en el lenguaje y, por otra, ha proporcionado las herramientas necesarias para extraer y analizar estas unidades (Granger y Meunier 2008: xix).

Existen diferentes tipos de combinaciones de palabras, que han recibido distintos nombres y cuya consideración como unidad fraseológica depende de la restricción del enfoque adoptado. Según la teoría de centro-periferia de la Escuela de Praga, las corrientes más estrictas que solo consideran unidades fraseológicas las expresiones fijas, como las locuciones (Zuluaga 1975; Rossenbeck 1989; García-Page 2001), estarían en el centro. A medida que se va ampliando el círculo, se incluyen elementos periféricos en la lista de unidades fraseológicas. Así, existen otros muchos estudios que también consideran las colocaciones como unidades fraseológicas (Bally 1951[1909]; Gläser 1988; Hausmann 1989; inter alia). Finalmente, la concepción más amplia sostiene que todas las combinaciones frecuentes de palabras, incluidos los compuestos, son unidades fraseológicas (Benson et al. 1986; Pawley 2001; Ramisch 2015; Parra Escartín et al. 2018).

Este libro se adscribe a esa concepción amplia, considerando unidades fraseológicas las locuciones, las colocaciones y los compuestos. Excluimos, pues, las combinaciones libres, ya que nos parece necesaria la existencia de un cierto grado de fijación para considerarse unidades fraseológicas. No obstante, como veremos a continuación, la frontera entre unos tipos y otros dista de ser clara. Más bien cabría hablar de un continuo fraseológico (Fontenelle 1998) que, de mayor a menor fijación, comenzaría en un extremo por las locuciones, pasaría por las colocaciones y los compuestos en el centro y terminaría por las combinaciones libres (Ruiz Yepes 2017). Esta idea ya la proponía Bally (1951[1909]: 68), quien sostenía que existen extremos de máxima y mínima fijación, entre los cuales se encuentran las series fraseológicas o grupos usuales, que se corresponderían con las colocaciones.

Por lo tanto, en uno de los extremos se encuentran las locuciones o idioms, que son combinaciones cuyo significado no se puede deducir del significado de sus partes (p. ej. mosquita muerta). Se trata de estructuras rígidas que presentan fijación semántica y sintáctica, es decir, no admiten sustitución de sus elementos ni variación sintáctica (p. ej. uso de pasiva o modificadores) (Ruiz Yepes 2017).

El otro extremo del continuo lo ocupan las combinaciones libres, que se suelen estudiar en contraposición a las unidades fraseológicas. Se trata de toda combinación posible siguiendo las reglas de la gramática (Cowie 1981). Son, pues, estructuras de significado transparente a las que no se aplican restricciones combinatorias (p. ej. coche negro).

←29 |
 30→

Muchos autores coinciden en hablar de las colocaciones como unidades a medio camino entre las locuciones y las combinaciones libres (Cowie 1981; Benson et al. 1986; Buendía Castro 2013). Se trata posiblemente de las combinaciones que más interés han suscitado en la literatura, dando lugar a diferentes corrientes fraseológicas, como veremos a continuación. En esta monografía reciben especial atención, ya que algunas de sus estructuras coinciden con las de los términos compuestos, lo que ha generado debate en torno a la necesidad de diferenciar o no ambas formas.

Fue en la década de los 50 cuando el término collocation apareció como tal, en Papers in Linguistics, 1934–1951 (Firth 1957). A través de su célebre cita «you shall know a word by the company it keeps» (Firth 1957: 11), Firth abordó el tema desde una perspectiva lingüística y sentó las bases de un enfoque colocacional que tomaría la frecuencia de coaparición como elemento clave para discernir estas unidades, dejando de lado cuestiones de índole semántica o sintáctica. El uso de corpus resulta, de este modo, fundamental. Entre los autores que siguieron las ideas de Firth, cabe destacar las figuras de Sinclair (1991), Halliday (1966), Moon (1998), Stubbs (2001) o Hoey (2005).

Por otra parte, se desarrolló otro enfoque colocacional que estudiaba estas unidades desde una perspectiva semántica. Así, autores como Mel’čuk et al. (1984–1999), Benson et al. (1986) o Hausmann (1989) sostienen que el fenómeno colocacional no se limita exclusivamente a la frecuencia de coaparición de sus componentes, sino que intervienen, además, cuestiones semánticas. En concreto, consideran que las colocaciones están formadas por una base autónoma semánticamente y un colocado que depende de ella. Esta idea de base y colocado también aparecía en los estudios probabilísticos comentados arriba, con la diferencia de que, en aquellos, se denomina nodo a la base y se considera como colocado cualquier elemento que aparezca en el span o ventana colocacional establecida (Sinclair 1991). No obstante, tanto la frecuencia como la semántica por separado no nos parecen suficientes para identificar las colocaciones, por lo que ambos enfoques deben usarse de manera complementaria.

La mayoría de los autores coinciden en que las colocaciones son combinaciones frecuentes de dos3 o más palabras cuyo significado es transparente y se puede deducir del significado de sus partes, es decir, son composicionales (Hausmann ←30 | 31→1989; Lorente Casafont et al. 2017; Ruiz Yepes 2017)4. Constituyen una unidad en el lexicón mental (Ruiz Yepes 2017), admiten variación formal (prestar un servicio, servicios prestados) y están formadas por una base, que conserva su significado habitual, y un colocado, que lo adquiere en función de ella (Vinogradov 1947; Cowie 1981; Mel’čuk et al. 1995; Moon 1998). Por ejemplo, en colocaciones formadas por un verbo y un sustantivo, como prestar servicio, el sustantivo (servicio) es la base y el verbo (prestar) es el colocado, que adquiere su significado al combinarse con la base. Esta idea está relacionada con la selección léxica de la que hablan Mel’čuk et al. (1995), quienes sostienen que, al producir una combinación de palabras, la elección de una de ellas no es libre, sino que viene impuesta por la otra.

La clasificación más extendida es la de Hausmann (1989: 1010), quien propone los siguientes tipos de colocaciones según su estructura sintáctica, válidos para las lenguas germánicas, eslavas y romances (Montero Martínez 2002):

  sustantivo + adjetivo  (epíteto), p. ej. error garrafal5.

sustantivo (sujeto) + verbo, p. ej. desatarse una tormenta.

verbo + sustantivo (objeto), p. ej. hacer balance.

verbo + adverbio, p. ej. negar rotundamente.

adjetivo + adverbio, p. ej. políticamente correcto.

sustantivo + (prep.) + sustantivo, p. ej. racimo de uvas.

Como decíamos anteriormente, las concepciones más amplias de la fraseología también incluyen los compuestos en la lista de unidades fraseológicas (Benson et al. 1986; Pawley 2001; Ramisch 2015; Parra Escartín et al. 2018), si bien estos han recibido menos atención por parte de los estudios fraseológicos que otras unidades, como las colocaciones. Los compuestos se caracterizan por la unión de dos o más lexemas que constituyen una unidad de significado. Estos lexemas se pueden unir y formar una palabra, dando lugar a compuestos gráficos, como sacacorchos, o bien mantenerse separados, siendo entonces compuestos sintagmáticos, como pez espada. Aunque muchos autores han considerado compuestos únicamente a aquellos que presentan unión ortográfica (Kocourek 1982; Corpas ←31 | 32→Pastor 1996; Štekauer et al. 2012), otros muchos también aplican esta denominación a los que cuentan con un espacio entre los lexemas. En esta monografía consideramos compuestos tanto a aquellos que presentan unión ortográfica como a los que no, si bien nos interesamos por estos últimos.

Los compuestos coinciden en forma con otras unidades fraseológicas, como algunos tipos de locuciones y colocaciones (por ejemplo, las de estructura sustantivo + adjetivo). Es por ello que la distinción entre unos y otros no resulta siempre evidente (Montero Martínez y Buendía Castro 2012; Buendía Castro 2013) o siquiera necesaria (Meyer y Mackintosh 1994, 1996; Corpas Pastor 1996; Montero Martínez 2002), como comentaremos más adelante.

Para comprender las diferencias o similitudes de los compuestos con las locuciones y colocaciones nominales, es necesario partir de la diversidad de opiniones existentes respecto a la inclusión de los compuestos entre las unidades fraseológicas. Por una parte, las posturas reacias a considerarlos unidades fraseológicas sostienen, principalmente, que se trata de unidades de la morfología léxica que, por lo tanto, forman parte de la gramática y no de la fraseología (García-Page 2001), y destacan además su formación regular y libre (Zuluaga 1975). Por otra parte, quienes consideran que los compuestos son unidades fraseológicas (Benson et al. 1986; Pawley 2001; Ramisch 2015; Parra Escartín et al. 2018), alegan que poseen los rasgos definitorios de estas unidades. En concreto, se trata de combinaciones frecuentes de dos o más lexemas, cuyos elementos presentan una cierta fijación, menor que la que se da en las locuciones y mayor que la de las combinaciones libres. Así, hay compuestos que admiten variación, como potencia eólica (también llamada potencia del viento) y otros de estructura más estática, como parque eólico (*parque de viento). Deben tratarse como una unidad y presentan una transparencia variable: desde compuestos transparentes como reloj despertador hasta otros más opacos como hombre rana (Osorio Olave y Serra Sepúlveda 2012), por lo que se encuentran a medio camino entre la opacidad de las locuciones y la transparencia de las combinaciones libres. En este libro compartimos estas últimas opiniones, de modo que los compuestos se entienden como unidades fraseológicas. Estos se diferencian de las locuciones por su menor fijación e idiomaticidad (y, por lo tanto, mayor transparencia)6.

←32 | 33→

A la luz de estas características de los compuestos, podríamos decir que se encuentran en el centro del continuo fraseológico junto con las colocaciones. Los intentos de diferenciar los compuestos de las colocaciones nominales son numerosos y subrayan principalmente la función denominativa de los compuestos (como las locuciones) frente al carácter predicativo de las colocaciones (Corpas Pastor 1996: 89). En otras palabras, la función denominativa de las colocaciones se encuentra en el núcleo, que resulta modificado por el otro elemento, mientras que en los compuestos son necesarios todos los elementos para acceder al concepto designado. No obstante, la distinción entre compuestos y colocaciones nominales no siempre es clara y el consenso respecto a esta diferenciación está lejos de alcanzarse, por lo que optamos por no diferenciar las colocaciones nominales de los compuestos, como detallamos más adelante al respecto de estas combinaciones en el lenguaje especializado.

Tras haber abordado las diferentes unidades fraseológicas (locuciones, colocaciones y compuestos), podemos concluir que, en su sentido más genérico, se trata de unidades léxicas formadas por dos o más palabras que coocurren frecuentemente en el discurso y presentan un grado variable de fijación, una estabilidad sintáctica y semántica, y un posible carácter idiomático (adaptado de Gläser [1988] y Montero Martínez y Buendía Castro [2017]).

Como señalábamos al principio, las unidades fraseológicas no solo figuran en la lengua general, sino que también forman parte del discurso especializado. Ya en los años treinta, el ingeniero y lexicógrafo especializado Schlomann comenzó a introducir unidades fraseológicas en sus diccionarios técnicos (Arntz y Picht 1995) y afirmó más tarde que la fraseología es el elemento clave para la comprensión en el ámbito técnico (Schlomann 1968: IX). Sin embargo, a pesar de la importancia que ha cobrado la fraseología especializada en la literatura (Picht 1991; Martin 1992; Pavel 1993; Tercedor Sánchez 1999; Montero Martínez 2002; Lorente Casafont 2002; Bevilacqua 2004; Silva et al. 2004; Aguado de Cea 2007; Buendía Castro 2013; inter alia), los estudios centrados en estas combinaciones especializadas son mucho menos numerosos que los dedicados a la fraseología de la lengua general (Ruiz Yepes 2017).

Además, la representación de unidades fraseológicas en recursos especializados se ha abordado más desde la lexicografía computacional que desde la terminología (Tercedor Sánchez 1999), lo que ha dado lugar a simples recopilaciones de datos, términos y cifras sin estructuración conceptual subyacente (Montero Martínez 2002). Del mismo modo, solo recientemente se están concibiendo las unidades fraseológicas como merecedoras de espacios propios en los recursos terminográficos y no como meros elementos contextuales (L’Homme 2012; San Martín et al. 2017).

←33 |
 34→

Pese a las distintas denominaciones y concepciones con las que se han abordado, parece haber acuerdo en que el sistema de unidades fraseológicas especializadas es más restringido que el de la lengua general, en el sentido de que presenta una menor variedad de unidades fraseológicas. En línea con Gläser (1994), consideramos que la fraseología especializada no constituye un subsistema lingüístico independiente, sino que forma parte de la fraseología general, pues a pesar de las diferencias existentes, comparte muchas de sus características.

De este modo, la fraseología especializada se ha definido como el conjunto de unidades fraseológicas de contenido especializado y uso frecuente en un ámbito de especialidad, que contienen al menos un término y presentan un cierto grado de fijación (Lorente Casafont 2002: 178; Bevilacqua 2004: 28; Aguado de Cea 2007: 54). Por lo tanto, comparten con las unidades fraseológicas generales su carácter pluriléxico y su elevada frecuencia de aparición, así como un cierto grado de fijación, estabilidad y opacidad. No obstante, es cierto que esta mayor o menor opacidad de las unidades fraseológicas especializadas se debe a su contenido especializado, ya que no suelen presentar idiomaticidad en el sentido de la fraseología general (Gläser 1994). Asimismo, las unidades fraseológicas especializadas están sujetas a una mayor variación, por ejemplo, mediante su adaptación a diferentes categorías gramaticales, como en el caso de power generation, generated power y to generate power. Esto se debe a que los conceptos que se combinan en las unidades fraseológicas especializadas permiten diferentes posibilidades formales siempre que se mantenga el patrón combinatorio (en este ejemplo, power + generate).

La relevancia de la combinación de conceptos en las unidades fraseológicas especializadas llevó a autores como Martin (1992) a distinguir las colocaciones léxicas de la lengua general de lo que él denomina colocaciones conceptuales, presentes en el discurso especializado. Las colocaciones léxicas, a pesar de existir en la lengua especializada (p. ej. to confer inmunity [Montero Martínez 2002]), son características de la lengua general y destacan por su carácter arbitrario. Por el contrario, las colocaciones conceptuales son las más habituales en la lengua especializada y no presentan ese carácter impredecible de las combinaciones anteriores, sino que responden a combinaciones conceptuales factibles en un dominio determinado (Picht 1991; L’Homme 2000).

Así, la noción de colocación conceptual de Martin (1992) parte de la estructura argumental de los conceptos, perceptible en la definición. De este modo, los conceptos abren unos slots que se rellenan con otros conceptos de determinados rasgos semánticos. Por ejemplo, la definición de disease incluye un slot de causa, que da lugar a combinaciones como infectious disease. Las aportaciones de Martin (1992) han resultado muy valiosas para el conocimiento de la fraseología ←34 | 35→especializada y constituyen la base de la noción de microcontexto, que desarrollamos en la Sección 4.1.2.

La dicotomía entre colocaciones léxicas y conceptuales también fue abordada por otros autores, como Heid (1994, 2001) o L’Homme (1998, 2000, 2002). Heid (1994, 2001) añade que los slots se rellenan con conceptos de rasgos similares, que se pueden agrupar en clases semánticas. Abundando en la distinción entre colocaciones léxicas y colocaciones conceptuales, Heid (2001: 795) analiza los adjetivos y verbos que se combinan con respect, smell y alcohol en el Collins English Dictionary y el Oxford Advanced Learner’s Dictionary. Encuentra diferentes tipos de combinaciones, como aquellas en las que el adjetivo alude a la intensidad (deep respect) o a alguna cualidad del nombre (bad smell), así como combinaciones en las que el adjetivo posee una mayor carga conceptual (water-soluble alcohol). Estas últimas suelen constituir hipónimos del núcleo nominal (water-soluble alcohol es un tipo de alcohol) y son las más interesantes desde el punto de vista terminológico, ya que dan cuenta del sistema conceptual subyacente. Como vemos en estos ejemplos, la noción de colocación conceptual no se aplica únicamente a las colocaciones propiamente dichas, sino que también resulta patente en los términos compuestos. Más adelante ahondaremos en el debate sobre la distinción entre colocaciones y términos compuestos que también tiene lugar en la terminología.

L’Homme (1998: 514, 2000: 105–106) coincide en que existen diferencias entre las colocaciones de la lengua general y las del discurso especializado. Esta autora denomina colocaciones a las primeras, que constituyen coocurrencias léxicas restringidas de la lengua general, mientras que llama combinaciones léxicas especializadas a las segundas, que representan coocurrencias léxicas libres en el lenguaje especializado. L’Homme (1998, 2000) afirma que estas combinaciones léxicas especializadas suelen ser composicionales y, mediante el análisis de los colocados, se pueden establecer clases conceptuales: por ejemplo, el verbo run se combina con program, operating system, routine o application, que pertenecen a la categoría de program (L’Homme 2002: 5). Estos términos de rasgos semánticos similares suelen compartir patrones colocacionales (p. ej. los miembros de la categoría program se combinarán con el mismo tipo de verbos o adjetivos), algo que no es tan frecuente en las colocaciones de la lengua general.

Las teorías de la Terminología se han interesado de manera desigual por las unidades fraseológicas especializadas. En la Teoría General de la Terminología (Wüster 1968, 1979), al considerarse el término como elemento uniforme y estático, cuyo contexto resulta irrelevante, la fraseología carecía de importancia. Con la llegada de las nuevas teorías terminológicas, que daban cuenta del uso real de la lengua desde una perspectiva descriptiva, se reconoció la importancia del ←35 | 36→análisis de los términos en contexto. Sin embargo, desde la Socioterminología (Gaudin 1993, 2003, 2005) y la Teoría Sociocognitiva de la Terminología (Temmerman 2000, 2007) no se ha distinguido entre términos simples y estructuras de extensión superior, entre las que se encuentran las unidades fraseológicas.

La Teoría Comunicativa de la Terminología (Cabré 1993, 1999), por su parte, sí se ha detenido en el estudio estas combinaciones, como lo demuestran los trabajos de Cabré et al. (1996), Lorente Casafont (2002) o Bevilacqua (2004). No obstante, el principal punto de interés de la Teoría Comunicativa de la Terminología ha sido la distinción entre unidades fraseológicas especializadas y unidades terminológicas polilexemáticas, separando así la fraseología de la terminología (Cabré et al. 1996; Lorente Casafont 2002).

Desde la Terminología Basada en Marcos (Faber et al. 2005, 2006; Faber 2012), en la que se enmarca esta monografía, también se ha prestado especial atención a las unidades fraseológicas especializadas. No resulta extraño, ya que la representación conceptual por medio de marcos representa un escenario ideal para entender la combinación de conceptos que se da en las unidades fraseológicas especializadas. Así, trabajos como los de Tercedor Sánchez (1999), Montero Martínez (2002) y Buendía Castro (2013) proponen un análisis de la fraseología especializada basado en la combinación conceptual, con vistas a paliar la carencia de unidades fraseológicas en los recursos terminográficos. En este libro se parte de las mismas premisas y se asume la fraseología especializada como eminentemente conceptual, basada en combinaciones factibles de conceptos en un dominio, frente a la arbitrariedad e idiomaticidad de las combinaciones generales.

La fraseología representa una parte sustancial de la terminología, pues constituye una puerta de acceso al sistema conceptual subyacente. Meyer y Mackintosh (1996) destacan de manera muy acertada la utilidad de las unidades fraseológicas en el análisis conceptual, con vistas a la creación de bases de conocimiento terminológico. Entre otros aspectos, subrayan el papel de los compuestos en las jerarquías genérico-específicas (p. ej. CD-ROM disk es un tipo de disk). Sostienen que la herencia de colocados también se da en las unidades fraseológicas, de forma que los hipónimos heredan los patrones colocacionales de los hiperónimos. Por ejemplo, «one reads data from a CD-ROM disk because one reads (data) from all computer disks» (Meyer y Mackintosh 1996: 14). Esta idea coincide con las aportaciones de L’Homme (1998, 2000) que hemos comentado previamente, relativas a los patrones colocacionales que comparten los conceptos similares, que en este caso serían más específicos.

Meyer y Mackintosh (1996: 12–13) señalan además la utilidad de los compuestos para detectar la multidimensionalidad, es decir, los casos en los que ←36 | 37→un concepto puede clasificarse desde distintas perspectivas (Bowker 1997), por ejemplo, land/air/water vehicles frente a motorized/non-motorized vehicles. Asimismo, sostienen que las unidades fraseológicas pueden revelar metáforas propias de un dominio, como «Internet is a highway», que se puede apreciar en colocaciones como ride/travel/cruise/navigate the Internet o compuestos como message traffic (Meyer y Mackintosh 1996: 5).

Igualmente, defienden que las colocaciones y los compuestos permiten identificar términos polisémicos y sinónimos. En concreto, sostienen que la combinación con diferentes tipos de colocados suele indicar cambios de significado (esto es, términos polisémicos), mientras que la coincidencia de colocados suele revelar casos de sinonimia. Así, gracias a colocaciones como processes are born, processes sleep o to kill a process, podemos intuir que process ha adquirido un significado especializado en el área de la informática, diferente del que posee en la lengua general o en otros dominios especializados (Meyer y Mackintosh 1996: 17). Por el contrario, hay términos como gallery y library que coocurren con unidades similares, como en el caso de gallery/library of charts, gallery/library of clip art o template gallery/library, lo que apunta a que se trata de términos sinónimos (Meyer y Mackintosh 1996: 18). No obstante, las autoras señalan la necesidad de complementar este análisis con el uso de corpus o la consulta a expertos.

Como se desprende de estas aportaciones, Meyer y Mackintosh (1996) consideran los compuestos y las colocaciones como unidades fraseológicas especializadas, que aúnan bajo la denominación de frasema terminológico. Sin embargo, antes de ahondar en esa cuestión, que surge como respuesta a un profundo debate sobre la distinción entre colocaciones y compuestos, nos parece necesario abordar otro tema no menos controvertido: la consideración de los términos compuestos como unidades fraseológicas.

Los términos compuestos coinciden con las unidades fraseológicas en varios aspectos: se trata de unidades plurilexemáticas que se combinan frecuentemente, funcionan como un todo y presentan un cierto grado de fijación. Por ello, hay autores que los consideran parte de la fraseología. Sin embargo, existen otras posturas reacias a incluirlos en la lista de unidades fraseológicas especializadas. Estas defienden que, a diferencia de las unidades fraseológicas especializadas, los términos compuestos surgen ante una necesidad de denominación (Cabré y Estopà 2005). Además, propugnan que los términos compuestos representan unidades léxicas que funcionan como un constituyente autónomo en la oración (Cabré et al. 1996), mientras que las unidades fraseológicas especializadas son unidades sintácticas (ya que consideran que esta categoría está formada principalmente por estructuras verbales) (Cabré et al. 1996; Lorente Casafont et al. ←37 | 38→1998; Aguado de Cea 2007). Asimismo, se señala la invariabilidad de los términos compuestos frente a la variación presente en las unidades fraseológicas (Cabré et al. 1996).

En este libro también observamos los términos compuestos como mecanismo de respuesta a las necesidades de denominación. Sin embargo, algunos de los criterios expuestos no clarifican la distinción entre términos compuestos y unidades fraseológicas especializadas. Por ejemplo, la consideración de constituyente autónomo no siempre es evidente, ya que hay combinaciones como radiografía del pie que representan un sintagma nominal y, para nosotros, un constituyente autónomo, pero sin embargo no se consideran términos compuestos, ni siquiera fraseología, sino sintagmas frecuentes (Lorente Casafont et al. 1998). Por otro lado, no compartimos la invariabilidad atribuida a los términos compuestos, ya que los resultados presentados en esta monografía, así como los de estudios precedentes (Tercedor Sánchez 1999; Fernández Silva 2018; entre ellos los trabajos fundadores de la Teoría Comunicativa de la Terminología: Cabré 1993, 1999) han demostrado que la variación es una realidad en los términos, tanto simples como compuestos. Además, como afirma Cabré (1993: 145), la variación, entendida en términos de inestabilidad formal o semántica, es un indicador de neología, que también se halla presente en los términos.

Algunos autores sitúan los términos compuestos en la frontera entre la terminología y la fraseología (Sanz Vicente 2011), mientras otras voces han señalado lo borroso de los límites entre ambos grupos (Pavel 1993; Gläser 1994). Argumentan que, a menudo, una unidad fraseológica especializada que describe un concepto va adquiriendo una mayor fijación hasta llegar a utilizarse como etiqueta para ese concepto (Pavel 1993; Gläser 1994). Esta etiqueta, que es un término compuesto, puede sufrir reducciones (a modo de nominalización, adjetivación o verbalización) (Pavel 1993) o bien mantener su carácter pluriléxico (Sager 1990). En esta línea, hay investigadores que apuestan por la inclusión de los términos compuestos entre las unidades fraseológicas especializadas, como Kocourek (1982), Meyer y Mackintosh (1996), Tercedor Sánchez (1999), Montero Martínez (2002), Buendía Castro (2013) o aquellos pertenecientes a la Lingüística Computacional, en la que se consideran multiword expressions todas las estructuras poliléxicas que pueden plantear problemas a un sistema, como los términos compuestos (Ramisch 2015; Parra Escartín 2018). En este libro también consideramos que los términos compuestos son unidades fraseológicas especializadas, pues comparten con estas su carácter pluriléxico, su frecuencia de coaparición, su funcionamiento como unidad y un cierto grado de fijación. Se diferencian de otras unidades fraseológicas especializadas, como las locuciones (p. ej. a tenor de lo establecido), porque representan conceptos del sistema.

←38 |
 39→

Como comentábamos anteriormente, el debate sobre la consideración de los términos compuestos como unidades fraseológicas especializadas va ligado a otra cuestión también controvertida: la distinción entre colocaciones y términos compuestos. Ambas polémicas van de la mano, ya que al distinguir las unidades fraseológicas especializadas de los términos compuestos, se están distinguiendo las colocaciones (principal prototipo de unidades fraseológicas) de estos términos sintagmáticos.

Así, normalmente se afirma que los términos compuestos representan un concepto, mientras que las colocaciones representan dos (Heid 1994; Tercedor Sánchez 1999; Sager 1990; Lorente Casafont et al. 2017). Sin embargo, no es tarea fácil distinguir cuándo una combinación representa un solo concepto o más de uno. Más que tal distinción se debería atender a la relevancia de dicha combinación en un sistema conceptual. Con ello nos referimos a unidades entendidas como colocaciones (p. ej. enfermedad infecciosa) que, aunque podrían considerarse como la suma de los dos conceptos implicados, deberían estar presentes en un sistema conceptual porque establecen relaciones con otros elementos del sistema. Por ejemplo, son un tipo_de enfermedad, causado_por microorganismos patógenos, que causa_síntomas como fiebre, diarrea, fatiga, dolores musculares o tos.

Igualmente se ha añadido que los formantes de los términos compuestos aparecen juntos, mientras que los miembros de las colocaciones pueden mostrarse separados (Heid 1994; Tercedor Sánchez 1999; Lorente Casafont et al. 2017). En este libro compartimos esta apreciación, ya que, aunque los compuestos permiten en ocasiones la introducción de otros elementos (generación eólica > generación de energía eólica), sus componentes no admiten tanta separación como la que puede darse en las colocaciones (generar/producir potencia > la potencia generada por el aerogenerador es superior que la que se produce con reducidos coeficientes de cortadura).

Se suele afirmar, también, que las colocaciones son composicionales, es decir, su significado se puede deducir del significado de sus componentes, mientras que los términos compuestos no son composicionales, esto es, la suma de sus formantes no permite conocer su significado global. Sin embargo, la composicionalidad no es un factor de fácil medición. Así, existen combinaciones que podríamos decir composicionales, como energía eólica (por lo tanto, consideradas colocaciones) y otras cuyos elementos permiten comprender a grandes rasgos el concepto, pero que requieren ahondar en el conocimiento experto para captar su significado al completo (por lo tanto, consideradas términos compuestos). Este es el caso, por ejemplo, de stall-regulated wind turbine. Se puede inferir que se trata de una turbina eólica que se regula y se detiene, pero faltan detalles ←39 | 40→importantes de su significado, como las altas velocidades de viento necesarias para que la turbina se detenga (Cabezas García y Faber 2017a: 153). No obstante, si tenemos en cuenta que tanto energía eólica como stall-regulated wind turbine representan conceptos particulares del dominio de la energía eólica, ambas podrían considerarse también términos compuestos.

Por otro lado, las aportaciones de Cabré et al. (1996) antes expuestas se aplican igualmente a su distinción entre colocaciones y términos compuestos. Estas autoras afirman que dicha diferenciación debe basarse en criterios cuantitativos y formales. Como hemos visto, defienden que los términos compuestos, a diferencia de las colocaciones (principalmente estructuras de base verbal), forman una unidad autónoma en la oración. Además, son unidades fijas cuyo núcleo es un término, mientras que las colocaciones especializadas cuentan con un término en el colocado. Igualmente, las combinaciones que cuenten con un verbo o una unidad deverbal constituirán siempre colocaciones (p. ej. inoculación del virus), pues cumplen el mismo patrón argumental del verbo (Lorente Casafont et al. 2017: 208).

No compartimos este criterio de presencia de un núcleo terminológico para ser considerado término compuesto, así como la asignación de las combinaciones con un elemento verbal al grupo de las colocaciones. Con respecto a la presencia de un núcleo terminológico para ser considerado término compuesto, existen combinaciones como surf zone cuyo núcleo (zone) podría decirse general (por lo tanto, se trataría de una colocación), que designan un concepto especializado o, como preferimos afirmar en este libro, cuentan con un papel relevante en el sistema conceptual, por lo que también podrían considerarse términos compuestos. Por otro lado, nos parece que la distinción entre colocaciones y términos compuestos no puede utilizar el criterio de presencia o ausencia de un verbo. Como indican Sager (1990) o Gagné (2000), los compuestos responden a una combinación conceptual, en la que bien puede intervenir una forma deverbal con sus argumentos. De hecho, existen combinaciones con formas deverbales (consideradas, entonces, colocaciones), como es el caso de horizonte de predicción, cuya presencia en un sistema conceptual es relevante y, por tanto, también podrían considerarse términos compuestos.

Pese a que es cierto que algunos de los criterios comentados permiten delimitar la noción de término compuesto (en concreto, su designación de un concepto, la contigüidad de sus elementos y la frecuente falta de composicionalidad), estos no se aplican al conjunto de la clase. Así, la ausencia de pautas determinantes para diferenciar las colocaciones de los términos compuestos en los textos de especialidad nos lleva a cuestionar la necesidad de tal distinción. Como afirman Meyer y Mackintosh (1994, 1996) y Heid (2001), más que la clasificación de ←40 | 41→ambos fenómenos, es la relevancia que comparten en el análisis terminológico lo que resulta importante. De este modo, Meyer y Mackintosh (1994, 1996) abogan por no distinguir las colocaciones de los términos compuestos en los textos especializados y proponen la denominación de frasema terminológico para englobar a ambas combinaciones.

Desde la Terminología Basada en Marcos (Faber et al. 2005, 2006; Faber 2012) también se defiende la semejanza de las colocaciones y los términos compuestos como herramientas de análisis conceptual (Montero Martínez 2002, 2008). Estos se aglutinan bajo la etiqueta de construcciones fraseológicas, mediante las cuales «se garantiza la coherencia en la estructuración y descripción de las unidades fraseológicas que se incluyen en la base de conocimiento terminológico EcoLexicon» (Montero Martínez y Buendía Castro 2012: 713). Las construcciones fraseológicas pueden ser relacionales, si codifican una relación, o atributivas, si aluden a atributos.

Estas construcciones responden a menudo a repetidas ecuaciones semánticas. Esto llevó a plantear la existencia de esquemas fraseológicos, que representan generalizaciones de las combinaciones semánticas presentes en diversas construcciones (Montero Martínez et al. 2002; Montero Martínez 2008). Los rasgos semánticos transmitidos por los esquemas son heredados por sus construcciones subordinadas (Montero Martínez 2008), lo que guarda una relación directa con la herencia de colocados de la que hablaban Meyer y Mackintosh (1996) y los patrones colocacionales compartidos por conceptos similares (L’Homme 1998, 2000). Así, el esquema fraseológico erosion_affects_earth-crust incluye el esquema más específico erosion_affects_river-bank. Estos pueden materializarse en construcciones de diferente forma: to erode the river bank, river bank erosion, eroded river bank o erosion of the river bank (Montero Martínez 2008: 1019).

Así pues, respecto a la diferenciación de colocaciones nominales y compuestos, en este libro seguimos las ideas de Meyer y Mackintosh (1996) y la Terminología Basada en Marcos (Montero Martínez 2002; Montero Martínez 2008; Montero Martínez y Buendía Castro 2012) y optamos por no diferenciar estas combinaciones. Por el contrario, atendemos a un principio común: su relevancia en el sistema conceptual. De este modo, preferimos denominar a ambas compuestos nominales, pues esta designación cuenta con una amplia aceptación y es válida en los dos casos, ya que refleja la estructura nominal sintagmática que comparten. Los compuestos nominales son el principal tipo de términos compuestos, una etiqueta que, como hemos indicado anteriormente, también engloba otras combinaciones que no tienen un núcleo nominal (p. ej. dose-dependent, highly-eroded), por lo que se corresponden en muchos casos con las ←41 | 42→construcciones fraseológicas que acabamos de presentar (Montero Martínez y Buendía Castro 2012). Sin embargo, preferimos hablar de términos compuestos porque esta denominación refleja la designación de un concepto (término) y la calidad de unidad pluriléxica (compuesto). Además, es comúnmente empleada como designación genérica del principal elemento de la clase: los compuestos nominales.

Fuera de la categoría de términos compuestos quedarían, pues, las unidades fraseológicas de carácter verbal (p. ej. consumir energía, mientras que energía consumida se consideraría término compuesto). Esta distinción se realiza siguiendo a Heid (2001: 791), quien apunta que, para fines terminográficos, puede convenir establecer alguna diferenciación: «When designing a terminological data collection, one should, however, try to establish some explicit internal guideline, e.g., classifying subtype-denoting noun-adjective collocations as (multiword) terms, and noun-verb collocations as combinatory properties of a (nominal) term». Así pues, llamaremos colocaciones a las unidades fraseológicas de estructura sustantivo + verbo, que son consideradas prototipo de colocaciones para diversos autores (Cabré et al. 1996; Lorente Casafont et al. 1998; Aguado de Cea 2007). Estas, junto a los términos compuestos, constituyen el grueso de la fraseología especializada.

3.2 Noción de término compuesto y estudios principales

Los compuestos han recibido multitud de definiciones que, por lo general, destacan su formación por varias unidades, su núcleo nominal en la mayoría de los casos (siendo entonces compuestos nominales, concretamente), su carácter unitario y su función denominativa. Esta última es una de las propiedades de los compuestos que goza de mayor consenso (Zimmer 1971; Downing 1977; Štekauer 1998; Fernández Domínguez 2019). Así, tanto en la lengua general como en la especializada, los compuestos sirven para nombrar conceptos. Esta función denominativa es la que nos lleva a considerar como términos compuestos estructuras de posmodificación preposicional (presentes en inglés, pero especialmente en español), por ejemplo, fuente de energía. El carácter denominativo de los compuestos constituye la principal distinción entre estos y otros sintagmas nominales de naturaleza descriptiva (Zimmer 1971; Downing 1977; Levi 1978). De este modo, mientras que turbina actual comenta un rasgo de la turbina, turbina eólica nombra un nuevo concepto. No obstante, la distinción entre denominación y descripción no siempre es evidente. Para ello, se han propuesto diferentes pautas, como la mayor estabilidad de los compuestos, perceptible en una frecuencia superior (Fernández Domínguez 2019); la existencia de variantes ←42 | 43→monoléxicas en la misma o en otra lengua (Sager et al. 1980; Kocourek 1982; Cabré 1993; Fernández Domínguez 2019); o la presencia de definiciones del compuesto (Kocourek 1982).

Con respecto a la frecuencia, ya hemos mencionado que los compuestos suelen aparecer más veces que las combinaciones libres. Guilbert (1965) señala que, a mayor frecuencia, mayor estabilidad del término y del concepto designado. No obstante, no siempre encontramos cifras elevadas, ya que existen distintos factores que pueden influir en estos números, entre los que destacamos la baja lexicalización que puede darse al inicio del proceso denominador de los términos compuestos (Sager et al. 1980; Sanz Vicente 2011), el carácter neológico presente en muchos de ellos (véase la Sección 3.4.5) o el tamaño reducido que pueda tener el corpus. En cualquier caso, podemos afirmar que la frecuencia de aparición es una de las características de los compuestos que debemos tener en cuenta y que, a pesar de no ser el único criterio para su diferenciación, se complementa con las otras particularidades que comentamos en esta monografía.

No obstante, a pesar del consenso sobre la función designativa de los compuestos, los intentos de definir estas combinaciones divergen en varios puntos, principalmente en el tipo de formantes y en la unión o separación entre estos. En cuanto al tipo de formantes, la mayor parte de los estudios destacan que los compuestos están formados solo por sustantivos, es decir, son series de sustantivos que funcionan como uno solo (Downing 1977; Finin 1980; Gagné 2000), p. ej. ozone layer. Esta concepción parte de la propensión de las lenguas germánicas como el inglés, idioma que suelen analizar estos trabajos, hacia la concatenación de sustantivos como mecanismo de formación de palabras.

Sin embargo, la propia lengua inglesa también es proclive a formar palabras mediante la secuencia Adj+N. Ya lo señalaba Levi (1978), en un estudio pionero al considerar que en los compuestos pueden intervenir modificadores adjetivales. No obstante, esta autora solo analiza compuestos con modificador adjetival si se trata de lo que ella denomina nominal nonpredicating adjectives, es decir, adjetivos procedentes de sustantivos que establecen relaciones semánticas (p. ej. maternal). No compartimos este punto, ya que consideramos compuestos aquellos que cuentan con modificadores adjetivales de todo tipo (además de aquellos que pertenecen a otras categorías gramaticales, como los participios). Tras Levi (1978), otros autores también reconocieron la presencia de modificadores que no eran sustantivos (p. ej. adjetivos, adverbios), como Sager et al. (1980), Lauer (1995), Daille (1999, 2001, 2017), Estopà (2000) o Maniez (2009, 2014). No obstante, la mayor parte de los trabajos siguen centrándose en términos compuestos en los que solo intervienen sustantivos, a pesar de la gran cantidad de compuestos cuyos modificadores pertenecen a otras categorías gramaticales.

←43 | 44→

Por otra parte, tanto en español como en inglés, la noción de compuesto no está libre de controversia, ya que unos la atribuyen únicamente a los compuestos con unión ortográfica, mientras que otros la utilizan también para compuestos con espacios entre sus formantes. En la mayoría de trabajos, estos se conciben como la unión de dos o más palabras en una sola, por ejemplo, breakwater o rompeolas (Kocourek 1982; Corpas Pastor 1996). Sin embargo, la línea divisoria entre lo que se suele denominar compuestos gráficos y compuestos sintagmáticos no resulta fácilmente perceptible (Jespersen 1942; Downing 1977; Warren 1978; Fernández Domínguez 2019). Con frecuencia se han utilizado criterios gráficos, fonológicos y semánticos para diferenciar a unos y otros, aunque ninguna de estas pautas ha resultado ser concluyente. A esto se suma el hecho de que no todas las lenguas utilizan los mismos mecanismos de formación de palabras y, mientras unas lenguas crean compuestos gráficos con mayor facilidad (como es el caso del inglés), otras tienden a la formación de compuestos sintagmáticos (como ocurre en español) (Sanz Vicente 2011; Štekauer et al. 2012; Fernández Domínguez 2019).

Por ello, siguiendo la línea de algunas de las autoras más influyentes en el campo de los compuestos, como Downing (1977), Levi (1978) y Warren (1978), denominamos compuestos tanto a los que presentan unión gráfica como a los que cuentan con separación entre sus formantes. Se trata de una opción unificada y sistemática que engloba las diferentes formas que puede adquirir la composición en distintas lenguas. No obstante, nos centramos en los compuestos sintagmáticos, en concreto en los de tipo nominal presentes en el discurso especializado. Así, entendemos los términos compuestos como combinaciones que suelen presentar un núcleo nominal modificado por otras unidades, como sustantivos, adjetivos o sintagmas preposicionales, que pueden aparecer unidos o separados gráficamente, constituyen una unidad léxica y forman parte de un sistema conceptual especializado.

Probablemente el único aspecto indudable de estas combinaciones sea su importancia a distintos niveles. Por un lado, se trata de unidades muy frecuentes en el discurso especializado de diferentes lenguas, ya que constituyen el principal procedimiento de formación terminológica (Sager et al. 1980; Kocourek 1982; Fernández Domínguez 2016). Por otro lado, pueden plantear dificultades, por ejemplo al identificarlos, analizarlos sintáctica y semánticamente, traducirlos o representarlos en recursos lingüísticos. Por ello, no es de extrañar que los términos compuestos se hayan abordado desde distintas disciplinas, como la Lingüística teórica, la Terminología, la Lexicografía, la Lingüística Computacional o la Psicolingüística.

←44 |
 45→

Desde la Lingüística teórica, diversos autores se han centrado en aspectos formales, gramaticales y semánticos de los compuestos. En uno de los estudios más conocidos sobre compuestos en inglés, Downing (1977) se interesa por los patrones de creación de nuevos compuestos, que difieren según la categoría semántica del núcleo (p. ej. human, animal, plant) (Downing 1977: 831). Destaca, además, la función denominativa de los compuestos y afirma que estos no son siempre composicionales, por lo que se necesitan conocimientos pragmáticos para acceder a su significado (Downing 1977: 834). En este libro también se considera el contexto como un elemento fundamental para determinar la carga conceptual de un término compuesto, si bien es cierto que no todos los autores aceptan este enfoque pragmático. En esta línea y, siguiendo a Jespersen (1942), Downing (1977) señala que no es posible realizar una clasificación fija de las relaciones semánticas presentes en los compuestos.

La década de los 70 resultó especialmente prolífera, pues se publicaron varios de los grandes trabajos consagrados a los compuestos. Así, las aportaciones de Levi (1978) y Warren (1978) resultaron muy valiosas y sentaron las bases de investigaciones posteriores. El de Levi (1978) es probablemente el estudio más conocido acerca de los compuestos, que ha servido de referencia para la mayoría de trabajos de todas las áreas. Desde una perspectiva generativa, Levi (1978) estudia la formación de estas combinaciones en inglés. Como ya hemos mencionado, destaca por incluir compuestos con modificadores adjetivales. Defiende que estos se forman a partir de un predicado subyacente, mediante un proceso de nominalización o de omisión de dicho predicado, una postura que compartimos. Para los casos de omisión del predicado, propone un conjunto de nueve recoverably deletable predicates, con los que pretende dar sistematicidad a las relaciones semánticas subyacentes en este tipo de compuestos. A pesar de que encontramos algunas limitaciones, como el carácter eminentemente sintáctico que adopta en muchos casos (p. ej. cuando habla de sujeto u objeto del verbo, véase la Sección 3.3), no cabe duda de que se trata de una obra de referencia en el campo de los compuestos.

Asimismo, Warren (1978), en otro de los estudios principales del ámbito, explora los patrones semánticos en la formación de compuestos en inglés, utilizando categorías (place, material, etc.) y clases semánticas (animate, inanimate, etc.), que se combinan con cada relación semántica. No analiza en este trabajo los compuestos en los que intervienen nominalizaciones, ya que su objetivo es explorar la relación semántica implícita, que en este tipo de compuestos se hace explícita por medio de la nominalización. Por ejemplo, in sunshine, the sun shines (Warren 1978: 58). El punto débil de su enfoque es la falta de sistematicidad de la que la autora hace gala, pues pretende establecer un inventario fijo ←45 | 46→de las combinaciones semánticas que se dan en los compuestos. Sin embargo, encontramos muchos que no responden a la norma y otras normas que presentan muchas acepciones.

Posteriormente, Štekauer (1998, 2005) estudia la formación de palabras en inglés desde una perspectiva semántica, en la que utiliza categorías y roles semánticos. Se detiene en los compuestos, de los que destaca su función denominativa y dentro de los cuales presta especial atención a los compuestos exocéntricos (véase la Sección 3.3). En Štekauer et al. (2012), se interesan no solo por la formación de palabras en inglés, sino también en otras lenguas menos estudiadas como el bretón, el georgiano o el hausa, por lo que constituye una gran aportación al campo de la formación léxica.

En todos los trabajos comentados hasta ahora se abordan compuestos pertenecientes a la lengua general, mientras que los compuestos del discurso especializado (términos compuestos) han recibido menos atención, a pesar de ser este su hábitat natural. Entre los lingüistas que han examinado los términos compuestos de áreas especializadas, cabe destacar a Fernández Domínguez (2016), quien realiza un estudio contrastivo de la formación de términos en inglés y español pertenecientes a la industria del aceite de oliva. Entre los mecanismos de formación de términos, que analiza morfológica y semánticamente, destaca el papel de la composición, que se presenta de diferentes formas en inglés y en español. Se trata de un enfoque muy interesante, pues aborda un aspecto poco explorado, como es la dimensión interlingüística de la formación de términos. Además, incorpora cuestiones semánticas, que muchas veces se relegan en los estudios lingüísticos.

Desde la Terminología, que se centra en las unidades presentes en el lenguaje especializado, se ha contribuido también al conocimiento de los términos compuestos, fundamentalmente en lo que respecta a su formación y su traducción. Un ejemplo lo constituyen los trabajos de Sager, centrados en la terminología en general y en la formación de términos en particular. Así, Sager et al. (1980) estudian las características de la lengua inglesa de especialidad, en la que destacan la presencia de términos compuestos y su relevancia en los sistemas terminológicos. Plantean una serie de patrones semánticos genéricos que se observan en la formación de términos compuestos (p. ej. whole-part > pedestal body) (Sager et al. 1980: 270). En concreto, destacan por su investigación de la relación semántica entre los formantes del término compuesto desde el ámbito de la terminología, ya que la mayor parte de estos estudios se han realizado desde la Lingüística Computacional, como veremos más adelante. Abordan las características de los términos compuestos de forma superficial, lo que se justifica por la variedad de temas que tratan en el libro. No obstante, ello se suple con la ←46 | 47→diversidad de aspectos de los términos compuestos que plantean. Por lo tanto, constituye un primer enfoque a la riqueza y complejidad que presentan estas combinaciones.

En trabajos posteriores, Sager (1990, 1997) desarrolla lo presentado en Sager et al. (1980). Además, destacando también el papel de la composición, plantea la distinción entre formación primaria y secundaria de términos. La formación primaria acompaña al nacimiento de un concepto y es monolingüe, mientras que la formación secundaria surge tras la revisión de un término en la lengua de la formación primaria o bien mediante la transferencia de conocimiento a otra comunidad lingüística que carece de denominación para ese concepto (Sager 1990).

Como Sager et al. (1980), Oster (2003, 2005, 2006) profundiza en las relaciones semánticas entre los formantes de los términos compuestos. Basándose en el campo de la cerámica, analiza términos compuestos unidos o separados gráficamente en alemán y español, para incluir las formas típicas de las dos lenguas. Propone un inventario de esquemas relacionales genéricos de estructura binaria (p. ej. place-determined entity), con el objetivo de plasmar la semántica de los formantes, frente a las tradicionales relaciones simples del tipo causes, located_at, etc.

Por su parte, Maniez (2008, 2009, 2013, 2014) ha explorado específicamente los términos compuestos, como los compuestos nominales y los adjetivos compuestos (p. ej. HIV-infected). Se centra principalmente en el discurso médico y sus aportaciones resultan de gran interés porque pasa de la frontera de los compuestos formados por dos términos para trabajar con términos compuestos más extensos. Asimismo, destaca por ser uno de los principales autores en dedicarse a los términos compuestos formados por adjetivos (Maniez 2009, 2014). En su investigación deja de lado cuestiones semánticas para centrarse en la búsqueda y comparación de equivalentes de estos términos compuestos, fundamentalmente entre el inglés y el francés, aunque en algunos trabajos también incorpora el español y el italiano (p. ej. Maniez 2014). Por lo tanto, es uno de los pocos estudiosos que se centra en profundidad en la traducción de los términos compuestos. En este sentido, es un defensor del uso de corpus y textos paralelos en internet para este fin (Maniez 2008, 2013).

También desde la Terminología, Sanz Vicente (2011, 2012) es una de las escasas autoras que abordan los términos compuestos en inglés y español. Basándose en un corpus de teledetección, parte de los términos compuestos en inglés para estudiar su influencia en la formación secundaria de términos en español, por lo que concede especial importancia a la neología en la traducción.

←47 |
 48→

Como comentábamos, también desde la Lexicografía se ha mostrado interés en los términos compuestos. Meyer y Mackintosh (1994, 1996) parten del dominio de la informática para explorar la utilidad de los frasemas terminológicos (la denominación con la que aúnan términos compuestos y colocaciones) en el análisis conceptual. Su finalidad es incluir información en bases de conocimiento terminológico. A pesar de que las autoras utilizan términos en inglés, su trabajo es un punto de partida muy interesante para explorar formas de análisis conceptual en otras lenguas.

En efecto, Montero Martínez (2002, 2008) sigue esta línea y también defiende la utilidad de los términos compuestos y las colocaciones en el análisis conceptual, con vistas a la alimentación de bases de conocimiento terminológico. Para ello, analiza estas combinaciones en inglés y español en el dominio de la Oncología (Montero Martínez 2002, Montero Martínez et al. 2002) y, más tarde, en el del medio ambiente (Montero Martínez 2008; Montero Martínez y Buendía Castro 2012, 2017). En su investigación merece especial atención la estructuración conceptual de estos frasemas terminológicos, que hemos comentado en la Sección 3.1.

Pecman (2012, 2014) investiga la fraseología especializada y la formación de términos en el dominio de las ciencias de la Tierra. Como mecanismo fundamental de formación terminológica, los términos compuestos ocupan un lugar central en sus trabajos, en los que analiza términos en inglés y en francés para luego aplicar sus resultados a la base de datos terminológica ARTES (Kübler y Pecman 2012). Uno de los ejes fundamentales de su investigación son los aspectos cognitivos y retóricos que subyacen a la variación terminológica, que analiza en términos compuestos del tipo permeability distribution vs. distribution of permeability (Pecman 2012, 2014; Gledhill y Pecman 2018).

Por otra parte, la Lingüística Computacional ha sido un área especialmente fructífera en la investigación sobre compuestos. No resulta extraño si consideramos que son un tipo de multiword expressions o expresiones poliléxicas, que atraen el interés de los investigadores de esta disciplina por la complejidad que plantean a los sistemas de procesamiento del lenguaje natural. En concreto, los compuestos presentan complicaciones a dos niveles: (i) su detección y extracción y (ii) su tratamiento automático, que pasa necesariamente por su análisis sintáctico (donde el bracketing suele ser el aspecto más problemático) y semántico (con la identificación de la relación semántica interna como tema predilecto en las investigaciones). Se suelen estudiar principalmente compuestos formados por dos sustantivos y pertenecientes a la lengua general, con la biomedicina como dominio privilegiado cuando se utilizan textos especializados.

←48 | 49→

Así pues, Finin (1980) se centró en la interpretación de compuestos en inglés, con diferente número de formantes y pertenecientes a distintos tipos de discurso. En su búsqueda por la precisión semántica, propuso el empleo de verbos específicos para plasmar la relación semántica entre los formantes de un compuesto, siendo así precursor de las paráfrasis verbales que más tarde plantearían Nakov y Hearst (2006, 2008) y que utilizamos en este libro. Además, utiliza un enfoque basado en marcos para representar conceptos y sus relaciones, y defiende la herencia de propiedades a medida que se desciende en la jerarquía conceptual (Finin 1980: 310). Por tanto, las aportaciones de Finin (1980) constituyen un importante esfuerzo inicial hacia la interpretación sistemática de los compuestos.

Por su parte, Rosario (2005) subraya la importancia de los términos compuestos entre las expresiones poliléxicas, pues es en estas combinaciones donde reside el conocimiento (Rosario et al. 2002: 247). De este modo, se centra en la interpretación de términos compuestos en inglés formados por dos sustantivos y correspondientes al área de la biomedicina. Destaca por su estudio de las relaciones semánticas que se dan en los términos compuestos, con vistas a la clasificación automática de estas unidades, y por su propuesta de relaciones semánticas, que constituye uno de los pocos inventarios que incorpora relaciones específicas7 de un dominio especializado, p. ej. en migraine patient, patient is a person afflicted by a disease (migraine) (Rosario et al. 2002). En este libro compartimos la opinión de Rosario y, además de emplear relaciones generales, consideramos que en algunos casos es necesario utilizar o acuñar relaciones específicas de cada dominio (p. ej. uses_resource en el campo de las energías).

También con miras a la clasificación automática de los términos compuestos, Rosario et al. (2002) plantean su propuesta de Descent of Hierarchy, en la que estudian si los mismos pares de categorías semánticas codifican la misma relación en los términos compuestos. Esta noción resulta primordial, pues subyace en el proceso cognitivo de interpretación de los términos compuestos. Así, si en steel knife, knife is_made_of steel, es muy probable que en plastic knife, knife is_made_of plastic (Rosario et al. 2002: 248). Por eso, nos inspiramos en sus ideas cuando hablamos de inferencia de relaciones semánticas en los términos compuestos. De igual forma, estos autores defienden la «estructura argumental» del ←49 | 50→núcleo de los compuestos, una noción que subyace en la propuesta de microcontextos, que presentamos en la Sección 4.1.2.

Un ejemplo de interrelación entre la Lingüística Computacional, la Terminología y la Traducción lo encontramos en Daille (1999, 2001, 2017), quien aplica técnicas computacionales para investigar la traducción (Daille et al. 2004) y, sobre todo, la variación (Daille 1999, 2001, 2017) de los términos compuestos. Analiza términos compuestos del francés formados por dos o más elementos, principalmente en el dominio de la agricultura. Entre los formantes de los compuestos dedica especial atención a los modificadores adjetivales, que suponen una fuente importante de variación (Daille 1999, 2001, 2017). En Daille (2017) encontramos su trabajo más exhaustivo sobre la variación en los términos compuestos, en el que utiliza corpus de diferentes temáticas especializadas en distintas lenguas (entre ellas, el español). No obstante, a pesar de la minuciosidad del análisis, echamos en falta una visión más conceptual de la variación. Sin embargo, la propia autora reconoce que el análisis semántico que realiza es muy limitado, debido al uso de criterios puramente formales para la identificación de variantes (Daille 2017: 2). En cualquier caso, su posición nos parece especialmente interesante, pues aúna el conocimiento de la Terminología y la Traducción, enriquecido desde una perspectiva computacional.

Nakov (2008, 2013) desarrolla uno de los enfoques más completos de los compuestos. Analiza estas combinaciones de dos o más sustantivos en inglés general desde la óptica computacional. Su interés por la semántica interna de los compuestos le llevó a plantear, junto a Hearst e inspirado por Finin (1980), el que nos parece el método más acertado para alcanzar y desgranar la relación semántica interna de los términos compuestos: las paráfrasis verbales (Nakov y Hearst 2006, 2008; Nakov 2008), que veremos con más detalle en la Sección 3.4.3.2. Estas consisten en la caracterización de la semántica de los compuestos por medio de varios verbos. Por ejemplo, shoe factory puede entenderse como a factory where shoes are produced/made/manufactured (Nakov y Hearst 2006: 7). Más tarde, Nakov (2013) realiza su estudio más detallado de los compuestos, en el que aborda los aspectos sintácticos y semánticos de estas unidades y su interés en los sistemas de procesamiento del lenguaje natural.

Nos gustaría destacar también las aportaciones de Parra Escartín et al. (2013, 2018) quienes, a pesar de no estudiar específicamente los compuestos, han realizado algunos de los escasos trabajos existentes sobre las expresiones poliléxicas en español desde la Lingüística Computacional. Principalmente se centran en la traducción y la representación de expresiones poliléxicas en recursos generales y especializados (Parra Escartín et al. 2013) y en la tipología de expresiones poliléxicas en español (Parra Escartín et al. 2018).

←50 | 51→

Otra de las disciplinas que ha dedicado especial atención a los compuestos ha sido la Psicolingüística, que se ha interesado especialmente en la combinación conceptual que subyace en estas unidades, así como en la faceta cognitiva de su interpretación y producción. Fue desde esta disciplina desde la que, en la década de los 90, se generaron las principales teorías de combinación conceptual, centradas en los compuestos (Murphy 1988, 1990; Wisniewski 1996; Gagné y Shoben 1997), que retomaremos con mayor detalle en la Sección 3.3.

Así pues, una de las contribuciones más significativas realizadas desde la Psicolingüística ha sido la apertura de slots por parte del núcleo. En este sentido, destaca la figura de Murphy (1988, 1990), quien defiende que el modificador rellena uno de los slots abiertos por el núcleo (p. ej. [habitat] dog > appartment dog). Murphy (1988, 1990) estudia sintagmas nominales del inglés general en los que interviene un sustantivo modificado por otro sustantivo o adjetivo. Es decir, no siempre se trata de compuestos como los entendemos en este libro, con una cierta fijación y frecuencia, sino que muchos constituyen combinaciones libres de la lengua. Además, se interesa por el papel del modificador en el procesamiento de estas combinaciones. Así, defiende la mayor carga conceptual de los sustantivos y adjetivos relacionales frente a los adjetivos calificativos. Por tanto, los sintagmas nominales que cuenten con un sustantivo o un adjetivo relacional requerirán un mayor tiempo de procesamiento (Murphy 1988: 539; 1990: 259). Este estudio de los modificadores de carácter nominal o adjetival resulta muy atractivo, ya que se enfoca desde una perspectiva menos común en terminología y traducción: su carga conceptual e influencia en el procesamiento de los compuestos.

Por otro lado, Wisniewski (1996, 1997) se centra en sintagmas nominales formados por dos sustantivos en inglés que crea de manera aleatoria, combinando categorías semánticas para analizar su semántica interna. Propone que los formantes de un compuesto pueden estar unidos por una relación (p. ej. en robin snake, snake eats robins) o una propiedad (p. ej. en robin snake, snake has a red underbelly) (Wisniewski 1996: 434).

Gagné (2000, 2001) también destaca por sus contribuciones a la combinación conceptual. Para ello, se basa en sintagmas nominales del inglés general formados por dos sustantivos, que pueden constituir compuestos o combinaciones libres. No se adhiere a la apertura de slots defendida por Murphy (1988, 1990), sino que propone que los compuestos se forman mediante el establecimiento de una relación semántica que vincula los dos conceptos (Gagné y Shoben 1997; Gagné 2000, 2001). Por ejemplo, a snowman is a man MADE OF snow. A pesar de coincidir con Wisniewski (1996, 1997) en la existencia de relaciones semánticas entre los formantes de un concepto combinado, no comparte la relevancia ←51 | 52→que este atribuye a las propiedades y se centra únicamente en las relaciones. En este libro defendemos la distinción entre relaciones y propiedades en los compuestos, ya que la existencia de una u otra determinará el análisis semántico de estos términos compuestos.

A partir de los estudios comentados, podemos concluir que los compuestos se han investigado sobre todo en la lengua general, especialmente aquellos formados por dos unidades, en su mayoría, sustantivos. El inglés ha sido la lengua por excelencia, mientras que los compuestos del español han recibido mucha menos atención. Por otra parte, las teorías que explican la combinación conceptual, que supone la base de la formación de estas unidades, han obviado estos procesos cognitivos y comunicativos en el lenguaje especializado. No obstante, la combinación conceptual cobra especial relevancia en este tipo de discurso, como elemento fundamental de transmisión del conocimiento.

3.3 Tipología y formación de términos compuestos

Los términos compuestos más frecuentes, aquellos que cuentan con un núcleo nominal, se dividen en dos grandes grupos: los compuestos endocéntricos y los compuestos exocéntricos (Levi 1978; Štekauer 1998; Nakov 2013). Existe, además, un tercer grupo minoritario: los compuestos coordinados (Warren 1978; Fernández Domínguez 2019). Esta distinción se basa en el núcleo de estas combinaciones, como veremos a continuación.

En los compuestos endocéntricos, uno de los formantes es el núcleo y, el otro, el modificador, que añade características al núcleo (Nakov 2013). Por ejemplo, en wind resource, el núcleo es resource y el modificador es wind. Aunque el término compuesto conste de más de dos formantes, estos pueden reducirse al esquema de núcleo y modificador, como vemos en offshore wind farm, donde offshore modifica al núcleo wind farm. De esta manera, la estructura binaria de los compuestos endocéntricos representa la semejanza con otro concepto por medio del núcleo, que indica la pertenencia a una categoría, a la vez que especifica las diferencias con este por medio del modificador, que señala el criterio de subdivisión (Warren 1978; Bowker 1998; Gagné 2000; Collet 2003; Maguire et al. 2010a). Así, el nuevo concepto resultante de la combinación constituye un hipónimo del núcleo (Downing 1977; Sager 1990, 1997; Štekauer 1998). Por ejemplo, offshore wind farm es un tipo de wind farm. Los compuestos endocéntricos son, con diferencia, los más habituales en inglés y español, fundamentalmente en el discurso especializado, ya que son uno de los mecanismos principales para la formación de términos y la construcción de sistemas terminológicos, un aspecto que ha abordado en profundidad Sager (1990, 1997).

←52 | 53→

Por otro lado, los compuestos exocéntricos son menos frecuentes en la lengua general y menos aún en el discurso especializado. Se caracterizan porque carecen de núcleo (Levi 1978; Warren 1978; Štekauer 1998; Bauer 2008; Nakov 2013), como vemos en saber tooth, donde ninguno de los formantes designa la categoría a la que pertenece el compuesto (no se trata de un diente ni de un sable, sino de un felino). Ello les confiere un carácter más idiomático y menos transparente, por lo que Nakov y Hearst (2013: 44) señalan que deben incluirse en los recursos lingüísticos. Autores como Levi (1978) y Štekauer (1998) sostienen que los compuestos exocéntricos provienen de compuestos endocéntricos que han perdido el núcleo mediante las diferentes transformaciones sufridas hasta adquirir su forma final. Así, por ejemplo, birdrain procede de una estructura antecedente del tipo *birdrain haver (Levi 1978: 58). Pese a que este procedimiento puede ser válido en muchos casos, no consideramos que sea aplicable a la totalidad de los compuestos exocéntricos o, en su caso, no creemos que se pueda inferir siempre con facilidad. Así, en ejemplos como diente de león, no es tarea sencilla reconocer esa estructura auxiliar.

Como decíamos, se suele hablar de una tercera categoría de compuestos: los coordinados. También llamados compuestos copulativos o dvanda, por su nombre en sánscrito, son poco frecuentes y se caracterizan porque no cuentan con un núcleo y otro elemento que lo modifique, sino que los dos formantes se encuentran al mismo nivel (Warren 1978; Nakov 2013; Fernández Domínguez 2019). Por ello, existe una mayor compactación, que a veces se consigue formando un compuesto unido ortográficamente (girlfriend) o bien utilizando un guion (secretary-treasurer).

Una vez abordados los diferentes tipos de compuestos, profundizaremos en las combinaciones que nos interesan en esta monografía: los compuestos endocéntricos sintagmáticos. Como hemos comentado, los compuestos endocéntricos poseen un núcleo nominal y están modificados por una o más unidades. La categoría gramatical y la posición de estos modificadores están determinadas por los patrones de formación de términos de cada lengua (Levi 1978; Sager 1997; Fernández Domínguez 2016). Así, en inglés los compuestos suelen formarse por premodificación (Nakov 2013), es decir, el núcleo se sitúa a la derecha, precedido por el modificador. Este suele ser un sustantivo (speed ratio), un adjetivo (reactive power) o un participio con valor adjetival (rated power). No obstante, las estructuras de posmodificación también están presentes en inglés, aunque en menor medida. En este caso, el núcleo se encuentra a la izquierda, seguido de un sintagma preposicional que lo modifica (angle of attack). A menudo se ha negado el carácter de compuesto de estas estructuras; sin embargo, dado que ←53 | 54→también están formadas por varios lexemas con un núcleo nominal y desempeñan una función denominativa, en este libro las consideramos compuestos.

Frente a la yuxtaposición típica de las lenguas germánicas, como el inglés, en las lenguas romances encontramos estructuras más extensas que recurren a preposiciones para enlazar los sustantivos del término compuesto, ya que la compactación de nombres resulta poco habitual (Sager 1997; Fernández Domínguez 2016; Cordeiro et al. 2016; Parra Escartín et al. 2018). Así, los compuestos en español se suelen formar por posmodificación, en la que distinguimos la posmodificación adjetival (potencia instalada) y la posmodificación preposicional que acabamos de comentar (hueco de tensión). Existen también casos de premodificación adjetival (alta frecuencia), aunque son poco frecuentes. Las distintas configuraciones que adopta la combinación conceptual en inglés y español son una de las causas de los problemas de traducción de los términos compuestos, como veremos en la Sección 3.5.

En cuanto al tipo de formantes, queremos recalcar la presencia de modificadores que no son sustantivos, como se ha venido afirmando tradicionalmente. Así, los términos compuestos en inglés y español cuentan frecuentemente con modificadores de tipo adjetival, entre los que se encuentran también adjetivos compuestos formados por un participio y su complemento (área barrida por la pala). Los adjetivos que pueden modificar a los núcleos nominales en los términos compuestos pueden ser de dos tipos: relacionales o atributivos.

Los adjetivos relacionales son los que representan un concepto y, por tanto, pueden establecer relaciones semánticas con otros elementos (infección ocular > infección que afecta al ojo). A pesar de las diferentes denominaciones que han recibido, los estudios coinciden en su frecuente carácter denominal, ya que suelen proceder de sustantivos o raíces griegas o latinas a las que se añade un sufijo (Levi 1978; Daille 1999, 2001, 2017; Maniez 2009).

Para formar el adjetivo relacional, se pueden dar modificaciones en el sustantivo de base, como la modificación fonológica o gráfica (trópico > tropical), la adición de sílabas o vocales (nombre > nominal) o la modificación de la raíz con su etimología clásica (corazón > cardiaco) (Harastani et al. 2013: 315). En cuanto al sufijo, Levi (1978) defiende que este no puede tener contenido semántico (blood test > *bloody test) (Levi 1978: 152). Por el contrario, Maniez (2009: 118) señala que, en ocasiones, es precisamente gracias al sufijo del adjetivo que podemos obtener con mayor facilidad la relación semántica entre N+Adj, lo que ilustra con el ejemplo francés de lésion fracturaire, en el que el adjetivo implica el resultado de una fractura. A nuestro parecer, los términos compuestos con adjetivos relacionales sí pueden incluir adjetivos con sufijos cargados semánticamente, siempre que estos contribuyan a la semántica general del concepto. Por ejemplo, ←54 | 55→floral incluye el sufijo –al, que indica abundancia o relación con algo, por lo que resulta adecuado en ofrenda floral (ofrenda consistente en un conjunto de flores). En algunos casos, también se pueden añadir prefijos que expliciten el vínculo entre el núcleo y el modificador (p. ej. tratamiento antideslizante).

Como vemos en los ejemplos, muchos de estos adjetivos relacionales son cultismos que proceden del griego o el latín, por lo que elevan el nivel de especialización del término (p. ej. enfermedad hepática vs. enfermedad del hígado). Por ello, se dan más en las lenguas de origen latino que en las de procedencia germánica, y no resulta extraña su importancia en los campos de especialidad (Daille 1999, 2001, 2017; Maniez 2009).

Es preciso señalar que, a menudo, la designación de relacional o denominal se usa indistintamente. Sin embargo, los adjetivos denominales son aquellos que proceden de sustantivos (capacidad > capaz); mientras que los adjetivos relacionales son los que pueden establecer relaciones semánticas con otros elementos (contaminación marina > contaminación que afecta al mar). Por tanto, no podemos olvidar que todos los adjetivos relacionales no son denominales y viceversa. Por ejemplo, en error garrafal, el adjetivo procede del sustantivo garrafa (es, por tanto, denominal), pero no existe relación semántica entre los formantes (es decir, no es un adjetivo relacional), ya que garrafal alude a la intensidad del error en lugar de al sustantivo subyacente.

Los adjetivos relacionales cuentan con las siguientes características, que permiten distinguirlos de los de tipo atributivo, que comentaremos a continuación:

Por otro lado, Levi (1978) señala que los adjetivos relacionales no permiten la formación de nuevos sustantivos. Sin embargo, encontramos ejemplos como ambiental > ambientalización. Por último, Daille (1999, 2001) y Estopà (2000) defienden que, cuando el núcleo está modificado por varios adjetivos, el más cercano al núcleo es relacional, p. ej. energético en sector energético emergente. Esto se debe a que es necesario determinar (es decir, nombrar el concepto) antes de calificar (Harastani et al. 2013: 316).

Por otra parte, los términos compuestos pueden incluir adjetivos atributivos (eje horizontal), que añaden una propiedad al núcleo. Como hemos comentado en el ejemplo de error garrafal, pueden ser denominales, pero no serán relacionales. En este sentido, Wisniewski y Love (1998) señalan que las combinaciones atributivas no presentan mayor complicación que las relacionales. Por el contrario, en línea con Gagné (2000), en este libro se considera que las combinaciones en las que subyacen propiedades son más difíciles de interpretar que las que cuentan con relaciones, ya que el vínculo interno es más difícil de percibir, tanto en el término compuesto como en el sistema conceptual subyacente.

A pesar de la elevada presencia de adjetivos en los términos compuestos y su importancia a distintos niveles, como en la formación o la variación de los compuestos (Sección 3.4.4), la mayoría de los estudios han obviado los compuestos que incluyen categorías gramaticales diferentes al sustantivo. Se trata de una visión restrictiva, porque no comprende todo el espectro de compuestos, oscureciendo así muchos rasgos de estas combinaciones. Uno de los principales estudios en destacar la relevancia de los adjetivos en los compuestos fue el de Levi (1978), quien estudia los compuestos de la lengua general prestando especial atención a los que incluyen nominal nonpredicating adjectives (p. ej. eye > ocular), es decir, adjetivos que provienen de sustantivos y establecen relaciones semánticas. Sin embargo, en este libro no compartimos varios puntos de su análisis, como la visión sintáctica de la derivación de estos adjetivos (tidal wave proviene de la secuencia wave be caused by tide > wave be tide-caused) (Levi 1978: 131), que preferimos abordar desde una perspectiva semántica; o la necesidad de que un adjetivo sea denominal o relacional para que intervenga en un compuesto (p. ej. aunque large no es un adjetivo denominal ni relacional, entendemos que large wind turbine es un término compuesto dada su relevancia en el sistema conceptual).

←56 | 57→

En lo que respecta a la terminología, el escaso interés recibido por los adjetivos en los términos compuestos es consecuencia del papel marginal que han desempeñado tradicionalmente los adjetivos, a menudo entendidos como simples modificadores y no como transmisores de conocimiento (Durán Muñoz 2019). Sin embargo, su papel es fundamental en los términos compuestos, ya que, como hemos indicado, pueden atribuir una propiedad al núcleo (intestino grueso) o establecer su relación con otro concepto (contaminación fluvial), contribuyendo así a la formación del concepto combinado. Además, son una fuente importante de variación, como veremos detenidamente en la Sección 3.4.4. Por ello, estudios como los de Sager et al. (1980), Daille (2001, 2017), Maniez (2009, 2014), Estopà (2000) o Alonso y Torner (2010) destacan la presencia de adjetivos en los términos compuestos.

En cuanto al número de elementos de los compuestos, habitualmente se han estudiado aquellos formados por dos unidades, si bien en el discurso científico-técnico son frecuentes los términos compuestos con más de dos formantes. No obstante, la frecuencia de los compuestos empieza a reducirse a medida que aumenta el número de constituyentes (Barrière y Ménard 2014). Creemos que esto se debe a la mayor dificultad de procesamiento que plantean los términos compuestos más extensos y que suele desembocar en la omisión de formantes (wind power generation system > wind system). Por otra parte, la existencia de compuestos extensos se ha justificado a menudo por la concatenación de otros compuestos, formando lo que se denomina compound-within-compounds (Warren 1978; Levi 1978; Sager et al. 1980; Sager 1997), p. ej. horizontal axis + wind turbine > horizontal-axis wind turbine. Como Warren (1978), consideramos que su estructura se puede reducir a los dos formantes básicos: núcleo y modificador. Para ello, es necesario establecer agrupaciones internas, en un proceso que se conoce como bracketing (wind [power plant]) y que comentaremos en detalle en la Sección 3.4.1. No obstante, a pesar de que algunos trabajos reconocen la existencia de estas combinaciones extensas (Warren 1978; Levi 1978; Sager et al. 1980; Sager 1997; Meyer y Mackintosh 1996; Quiroz 2008; Fernández Domínguez 2019), es necesario profundizar en este tipo de compuestos, principalmente en lo que concierne a su formación, su desambiguación estructural y sus implicaciones en la traducción.

Una vez que hemos conocido estos aspectos básicos de la formación de los términos compuestos, conviene señalar los criterios fundamentales para que se pueda formar un compuesto. La idea fundamental es que el modificador debe representar una característica distintiva del nuevo concepto (Downing 1977; Levi 1978; Warren 1978; Meyer y Mackintosh 1996), una particularidad que lo diferencie de los otros conceptos de la categoría designada por el núcleo. De ←57 | 58→este modo se contribuye a la función clasificadora de los términos compuestos mediante la formación de hipónimos. En este sentido, el modificador no puede expresar información redundante.

Asimismo, en el compuesto no se plasman aquellas características que establezcan una relación de negación, ya que estas dificultan la comprensión del concepto combinado (Zimmer 1971; Downing 1977; Levi 1978). Por ejemplo, no sería lógico hablar de generador de electricidad para referirse a un generador que no produce electricidad.

Por otro lado, es necesario que entre los formantes del compuesto exista una relación que no sea temporal, sino permanente, ya que se facilita así la interpretación por parte del receptor (Downing 1977; Levi 1978). Cuando la relación no es permanente, la estructura sintagmática no se lexicalizará (Downing 1977) y estaremos hablando de una combinación libre. Levi (1978: 242) lo ilustra de manera muy clara en el siguiente ejemplo: «If I tell you that I have seen an aquatic bird this morning, but I mean a chicken that had been thrown into Lake Michigan, I would be violating this principle since you would (justifiably) have assumed I meant a bird that is habitually rather than fortuitously around water, such as a duck or a seagull».

En definitiva, para que se forme un compuesto, es necesario que el modificador añada una característica distintiva y permanente del núcleo, que no sea redundante ni se base en la negación. De este modo, los términos compuestos son el resultado de la condensación de información (Levi 1978; Kocourek 1982), que se consigue, principalmente, mediante la omisión de la relación semántica, pero también mediante la transformación de categorías gramaticales o la elisión de formantes de la que ya hemos hablado. Todo ello nos lleva a la idea central desde la que entendemos la formación de los términos compuestos: la existencia previa de proposiciones que se condensan para dar lugar a los compuestos (Levi 1978; Sager et al. 1980). Esta condensación contribuye a la impersonalidad y la cohesión del texto (Kocourek 1982).

La formación de compuestos a partir de proposiciones subyacentes se ha defendido en trabajos anteriores, como los pertenecientes a la lingüística generativa. En esta corriente destacan los estudios de Levi (1978), quien propuso una de las teorías más influyentes sobre la formación de compuestos. Esta autora expone que los compuestos surgen a partir de la omisión o la nominalización del predicado subyacente. Así, defiende que en términos compuestos como viral disease se ha suprimido el verbo (virus cause disease), mientras que en otros como financial analyst, se ha nominalizado (analyze > analyst).

←58 |
 59→

Levi (1978: 77) propone que, en los casos de omisión, el predicado8 elidido es uno de los siguientes: cause, have, make, be, use, for, in, about y from. A estos los denomina recoverably deletable predicates, que abordaremos con mayor detalle en la Sección 3.4.3.

Cuando se da la nominalización del predicado, este figura como sustantivo en el núcleo del compuesto (aunque consideramos que el modificador también puede ser un verbo nominalizado). Según Levi (1978: 167), el modificador puede derivarse del sujeto o el complemento directo, aunque también hay compuestos con varios modificadores que cumplen ambas funciones, p. ej. industrial water pollution. La autora diferencia cuatro tipos de nominalizaciones: las nominalizaciones de acción (dream analysis), de producto (oil import), de agente (city planner) y de paciente (designer creation) (Levi 1978: 168).

La propuesta de Levi (1978) es la más extendida, si bien existen contribuciones similares, basadas en la presencia explícita o no del verbo. En esta línea, autores como Warren (1978) o Štekauer (1998) han hablado de compuestos verbales (también denominados sintéticos o explícitos), en los que figura el verbo y, por tanto, se corresponden con las nominalizaciones del predicado de Levi (1978). En el lado opuesto se encuentran los compuestos no verbales, también conocidos como primarios o implícitos, en los que el verbo no aparece de manera explícita y, por tanto, están relacionados con la omisión del predicado de la que habla Levi (1978) (Warren 1978; Štekauer 1998).

En esta monografía se defiende que todos los compuestos son verbales, pues a pesar de que el predicado no figure en la superficie, este se encuentra en su origen. Así, y como hemos mencionado anteriormente, los compuestos están formados por un predicado subyacente y sus argumentos. Por tanto, compartimos los mecanismos de formación propuestos por Levi (1978), basados en la existencia de proposiciones en los compuestos. No obstante, sostenemos que dichas proposiciones son de tipo conceptual más que sintáctico. Por ello, preferimos utilizar roles semánticos (p. ej. agente, paciente), pues expresan de manera más acertada la relación del verbo con sus argumentos (Fillmore 1977, 1982, 1985).

A pesar de que Levi (1978) realiza también aportaciones de corte semántico, como su tipología de nominalizaciones, su propuesta se caracteriza por adoptar un enfoque sintáctico, que le ha valido diversas críticas. Estas se centran principalmente en la necesidad de incorporar aspectos semánticos a su análisis. Por ←59 | 60→ejemplo, desde una visión meramente sintáctica, se podría decir que, en anthropogenic pollution, anthropogenic es tanto el sujeto (el hombre contamina) como el complemento agente del verbo (X contaminado por el hombre). Por tanto, afirmar que el modificador es el sujeto del verbo no sería siempre exacto, sino que dependería de la forma oracional desde la que se inicie el análisis. En cambio, al utilizar la semántica de los formantes, podríamos decir que anthropogenic es el agente que causa la contaminación, una afirmación cierta independientemente de la estructura subyacente desde la que se parta. Asimismo, la propuesta de Levi (1978) sería más consistente si las relaciones semánticas se estudiaran en todos los compuestos en lugar de aplicarse únicamente a los formados por supresión del predicado. Del mismo modo, los roles desempeñados por la nominalización (agente, instrumento, etc.) también podrían extenderse a los compuestos formados por la omisión del predicado, ya que la propia autora señala que todos los compuestos cuentan con un verbo subyacente.

Todas estas cuestiones destacan la relevancia de la semántica en la formación de términos compuestos. Esta debe entenderse no solo desde los mecanismos de transformación que acabamos de comentar, sino también y especialmente desde la combinación conceptual de la que resultan estos términos compuestos. Desde la Psicolingüística se desarrollaron diversas teorías que explican la combinación conceptual típica de los términos compuestos.

Murphy (1988, 1990) propone una de ellas, conocida como Schema Modification Theory o Concept Specialization Theory, que distingue dos fases en la formación de conceptos combinados. En primer lugar, el modificador rellena uno de los slots abiertos por el núcleo. Por ejemplo, en apartment dog, el modificador apartment rellena el slot de habitat de dog. De este modo, el significado del núcleo determina los slots que este puede abrir y, con ello, los modificadores que pueden rellenar dichos slots. En segundo lugar, interviene nuestro conocimiento del mundo para refinar el significado del concepto combinado. Así, identificamos a este tipo de perro como más pequeño y tranquilo que uno que viva en el campo (farm dog) (Murphy 1988: 532–533).

Por su parte, Wisniewski (1996, 1997) propone otra teoría de combinación conceptual, denominada Dual-Process Theory, según la cual existen dos formas de procesamiento de los conceptos combinados: (i) por un lado, el núcleo y el modificador pueden estar unidos por una relación (p. ej. en robin snake, snake eats robins) o bien (ii) el modificador transfiere una propiedad al núcleo (p. ej. en robin snake, snake has a red underbelly) (Wisniewski 1996: 434). Por tanto, justifica la combinación conceptual por medio de relaciones y propiedades (Wisniewski 1996, 1997; Wisniewski y Love 1998). Este enfoque se encuentra en sintonía con el análisis semántico de los compuestos que se plantea en este libro, ←60 | 61→ya que también consideramos que, cuando un concepto se añade a otro, puede modificarlo por medio de una relación semántica o bien mediante propiedades atributivas, como ocurre a menudo con los adjetivos calificativos de los términos compuestos.

Gagné y Shoben (1997) consideran que las propiedades no revisten tanta importancia en los compuestos, sino que, por el contrario, las relaciones son la base de la formación de estas combinaciones conceptuales. Así, proponen la teoría denominada Competition Among Relations In Nominals (CARIN) para explicar el trasfondo de la combinación de conceptos. En primer lugar, se selecciona una relación que vincule los dos conceptos. Una vez que se ha considerado semánticamente apropiada, se desarrolla el sentido completo de la combinación utilizando conocimiento externo. Por ejemplo, en snowman identificamos primero la relación: man MADE OF snow. Después, inferimos que un muñeco de nieve es frío y no caliente (Gagné y Spalding 2013: 104), en un proceso de elaboración conceptual similar al de Murphy (1988, 1990). Por otro lado, Gagné subraya el papel del modificador como indicador de la relación, porque es este el encargado de señalar las diferencias con el hiperónimo. De esta manera, las distintas relaciones que puede establecer el modificador compiten (de ahí el nombre de la teoría) y gana la más fuerte, es decir, la que facilita en mayor medida la interpretación de la combinación (Gagné y Shoben 1997; Gagné 2000; Gagné y Spalding 2013).

Compartimos con los trabajos de Gagné la importancia de la relación semántica entre los formantes del término compuesto. Sin embargo, consideramos que el núcleo también influye en la selección de la relación, pues esta vincula dos conceptos y, por tanto, no debe determinarse de manera unilateral. Por ejemplo, para afirmar que en wind erosion la relación semántica es causes, es necesario considerar no solo las características semánticas de wind sino también las de erosion. Solo así se puede establecer el modo en que ambos conceptos encajan. En un trabajo posterior, Spalding et al. (2010) desarrollan la teoría de Gagné y Shoben (1997) y reconocen la importancia del núcleo, así como la del modificador, en la selección de la relación.

Más tarde, Maguire et al. (2010b) analizan de manera muy interesante los patrones semánticos que se dan en los compuestos y su utilidad en la interpretación de compuestos formados por dos sustantivos en inglés general. Así, en línea con Rosario et al. (2002), sostienen que los núcleos que son similares semánticamente abren slots también similares, que se completan con el mismo tipo de modificadores (Maguire et al. 2010b). En otras palabras, los miembros de una categoría semántica se suelen combinar de la misma forma (p. ej. area+animal > animal located_at area: water mammal, freshwater fish, etc.), lo que tiene ←61 | 62→implicaciones sobre la inferencia de relaciones semánticas, como veremos con más detalle en la Sección 3.4.3. De este modo, las aportaciones de Maguire et al. (2010b) son claves para nuestro enfoque de los términos compuestos, ya que encontramos en las categorías semánticas una de las principales formas de hallar patrones en estas combinaciones, aplicables a su formación y su interpretación.

Como se observa, las teorías de combinación conceptual propuestas desde la Psicolingüística han estudiado unidades de la lengua general. Llama la atención que, en Terminología, un campo que se centra en los términos y los conceptos que estos designan, el único acercamiento a la combinación conceptual haya sido la noción de colocación conceptual propuesta por Martin (1992) y adoptada por trabajos como los de Heid (1994, 2001), L’Homme (1998, 2000, 2002), Montero Martínez (2002, 2008) o Buendía Castro (2013). Como hemos comentado en la Sección 3.1, Martin (1992) defiende que los conceptos presentan una estructura argumental que puede extraerse de su definición. Estos slots se rellenan con otros conceptos de determinadas características semánticas. Así, aplica la idea de apertura de slots a las combinaciones especializadas, si bien estas no constituyen necesariamente compuestos. Por tanto, esta monografía se nutre de las teorías de combinación conceptual de la Psicolingüística y las colocaciones conceptuales de la Terminología, así como de los mecanismos de formación de compuestos de Levi (1978), con vistas a explorar la formación de términos compuestos (Sección 4.1.2).

3.4 Análisis de los términos compuestos

El correcto análisis de los términos compuestos resulta vital para la comprensión de estas unidades y sus posteriores aplicaciones, como pueden ser la traducción o la representación terminográfica. Sin embargo, este análisis no está exento de complicaciones. Algunas de ellas resultan de la especialización de los formantes, la omisión de la relación semántica entre estos, la formación de términos extensos con tres o más constituyentes o la inestabilidad que a menudo presentan estas combinaciones. Por tanto, se debe profundizar en diversos aspectos de los compuestos, como son el bracketing o análisis de las dependencias internas, la semántica de los formantes y la relación que los vincula, así como la variación y neología que suele observarse en estos términos compuestos.

3.4.1 Desambiguación estructural: bracketing

Los compuestos formados por más de dos elementos han recibido menos atención que las combinaciones binarias. Resulta sorprendente si consideramos que ←62 | 63→presentan una particularidad: su ambigüedad estructural (Lauer 1995; Girju et al. 2005; Nakov 2013; Kim y Baldwin 2013; Barrière y Ménard 2014). Así, en términos compuestos como permanent magnet synchronous generator, es necesario identificar las dependencias internas entre los formantes, pues de ello dependerá el correcto análisis semántico del compuesto y sus posteriores aplicaciones. En un proceso que se conoce como bracketing9, se agrupan los elementos que dependen entre sí, de manera que se reduce el término compuesto a su estructura básica de núcleo y modificador. Con esta configuración reducida, podremos estudiar la relación semántica principal del compuesto, que se establece entre los dos formantes elementales que hemos identificado. Por tanto, si no sabemos que permanent magnet es el modificador de synchronous generator, en una estructura de bracketing del tipo [permanent magnet][synchronous generator], el análisis y tratamiento que hagamos del término será probablemente desafortunado.

El bracketing es un proceso complejo que requiere no solo de nociones lingüísticas, sino especialmente de conocimiento del mundo y técnicas (manuales o computacionales) para su realización. Desde la Lingüística Computacional se han llevado a cabo la mayoría de los trabajos a este respecto (Lauer 1995; Girju et al. 2005; Nakov y Hearst 2005; Vadas y Curran 2011; Barrière y Ménard 2014), pues el bracketing es una de las grandes dificultades que encuentran los sistemas de procesamiento del lenguaje natural. En esta disciplina se han propuesto los dos modelos principales de bracketing, aplicados a compuestos de tres formantes: el modelo de adyacencia y el modelo de dependencia.

Por una parte, el modelo de adyacencia (Marcus 1980; Pustejovsky et al. 1993) compara si, en un compuesto del tipo p1p2p3, p2 se relaciona más con p1 o con p3. Para ello, se comprueba si hay más ocurrencias de p1p2 o, por el contrario, de p2p3. Por ejemplo, en renewable energy technology hay una mayor asociación entre renewable energy que entre energy technology, por lo que podemos decir que se da una estructura de bracketing a la izquierda: [renewable energy] technology.

Por otra parte, el modelo de dependencia (Lauer 1995) estudia si, en un compuesto del tipo p1p2p3, p1 tiene una mayor vinculación con p2 o con p3. Es decir, el análisis no parte del término central, como plantea el modelo de adyacencia, sino que lo hace desde el término inicial. Así, estaremos ante una estructura de bracketing a la izquierda si la asociación principal es p1p2 ([tip speed] ratio), ←63 | 64→mientras que se tratará de bracketing a la derecha si la dependencia se da entre p1 y p3 (mean [wind speed]). No obstante, hemos observado que, a menudo, las dos combinaciones posibles presentan una frecuencia similar. Por tanto, la desambiguación estructural que plantean estos modelos debe incorporar otros factores.

Así, además de la frecuencia, criterio por excelencia en el bracketing, Nakov y Hearst (2005: 19–21) proponen otros signos que pueden aclarar la configuración de los compuestos en inglés. Estos se basan principalmente en la búsqueda de variantes denominativas en la web que presenten los indicativos que figuran en la tercera columna de la Tabla 1, pues estos señalan la formación de un grupo interno.

Tabla 1: Indicativos para el bracketing propuestos por Nakov y Hearst (2005: 19–21)

Término compuesto

Variante denominativa

Indicativo del bracketing

Bracketing

cell cycle analysis

cell-cycle analysis

guion

[cell cycle] analysis

brain stem cell

brain’s stem cell

genitivo sajón

brain [stem cell]

plasmodium vivax malaria

Plasmodium vivax Malaria

mayúscula interna

[plasmodium vivax] malaria

leukemia lymphoma cell

leukemia/lymphoma cell

barra interna

leukemia [lymphoma cell]10

growth factor beta

growth factor (beta)

paréntesis

[growth factor] beta

tumor necrosis factor

Details

Pages
278
ISBN (PDF)
9783631829264
ISBN (ePUB)
9783631829271
ISBN (MOBI)
9783631829288
ISBN (Book)
9783631825600
Language
Spanish
Publication date
2020 (July)
Published
Berlin, Bern, Bruxelles, New York, Oxford, Warszawa, Wien, 2020. 278 p., 29 il. blanco/negro, 28 tablas

Biographical notes

Melania Cabezas-García (Author)

Melania Cabezas-García es doctora en Traducción e Interpretación por la Universidad de Granada. Su docencia se centra en la traducción y la interpretación, y sus áreas de investigación son la terminología, la lingüística de corpus y la traducción especializada.

Previous

Title: Los términos compuestos desde la Terminología y la Traducción