Loading...

El castellano y el catalán en contacto

Efectos sobre el vocabulario

by Maribel Serrano Zapata (Author)
©2024 Monographs 200 Pages

Summary

Este libro es resultado de una investigación sobre disponibilidad léxica en Lleida. El objetivo principal es reflejar la estratificación social del léxico, a partir de la covariación con diversos factores lingüísticos y sociales. Dada la situación de bilingüismo social de esta área, estudiamos las dos lenguas en contacto, el castellano y el catalán, y analizamos cuantitativamente diecisiete centros de interés y cinco variables sociales (sexo, tipo de centro, zona geográfica, nivel sociocultural y lengua materna). Nuestro análisis se basa en una sola muestra compuesta por 240 estudiantes, a partir de la cual se determina tanto la productividad de las dos lenguas como la incidencia de las distintas variables sobre los dos corpus de léxico disponible obtenidos.

Table Of Contents

  • Cubierta
  • Título
  • Copyright
  • Sobre el autor/el editor
  • Sobre el libro
  • Esta edición en formato eBook puede ser citada
  • ÍNDICE
  • INTRODUCCIÓN
  • CAPÍTULO 1 MARCO TEÓRICO
  • 1.1. Disponibilidad léxica y sociolingüística
  • 1.2. Estudios realizados en España en comunidades bilingües
  • 1.3. Disponibilidad léxica en zonas de contacto castellano-catalán
  • CAPÍTULO 2 SITUCIÓN SOCIOLINGÜÍSTICA DE LA PROVINCIA DE LLEIDA
  • 2.1. Breve historia de la lengua catalana
  • 2.2. El castellano y el catalán en Lleida
  • 2.3. El catalán nord-occidental
  • CAPÍTULO 3 METODOLOGÍA
  • 3.1. La muestra
  • 3.2. Las variables sociales
  • 3.3. Obtención y procesamiento de los datos
  • 3.4. Criterios de edición
  • 3.4.1. Pautas particulares de cada centro de interés
  • CAPÍTULO 4 ANÁLISIS DE LOS DATOS
  • 4.1. Resultados globales por centros de interés
  • 4.1.1. Total de palabras
  • 4.1.2. Promedio de palabras
  • 4.1.3. Análisis estadístico de la diferencia en la producción de palabras
  • 4.1.4. Total de vocablos
  • 4.1.5. Índice de cohesión
  • 4.2. Incidencia cuantitativa de las variables sociales
  • 4.2.1. Variable social sexo
  • 4.2.2. Variable social tipo de centro
  • 4.2.3. Variable social zona geográfica
  • 4.2.4. Variable social nivel sociocultural
  • 4.2.5. Variable social lengua materna
  • 4.2.6. Valoración de los resultados según las variables sociales
  • CAPÍTULO 5 CONCLUSIONES
  • APÉNDICE. LAS 50 PALABRAS MÁS DISPONIBLES EN CASTELLANO Y EN CATALÁN

INTRODUCCIÓN

El presente trabajo se enmarca en los estudios de léxico-estadística que otorgan, mediante diversos métodos, índices estadísticos a las unidades léxicas que integran una lengua. En los años 50, un grupo de investigadores intentó determinar, con una finalidad esencialmente pedagógica, cuál era el léxico “fundamental” de la lengua francesa. De este modo daban comienzo los estudios de disponibilidad léxica, que han contribuido de forma determinante en la consolidación de la lingüística aplicada en España (Mateo García y García Marcos, 2019). Humberto López Morales continuó la senda abierta por los lingüistas franceses y asumió el reto de establecer, mediante un ambicioso proyecto coordinado, el léxico disponible general del mundo hispánico.

Nuestro trabajo pretende ocuparse de una parcela dentro de este proyecto: el estudio de la disponibilidad léxica en la provincia de Lleida. Con la finalidad de retratar fielmente la realidad lingüística, analizamos el léxico disponible de las dos lenguas que están en contacto en Lleida: el castellano y el catalán. Además, el hecho de contar con una única muestra de informantes que completa la encuesta en las dos lenguas ofrece posibilidades de análisis muy interesantes. Seguimos un enfoque sociolingüístico, presente desde los mismos inicios de la disponibilidad, dado que ya se ha demostrado sobradamente que puede establecerse una estratificación social a partir de los datos que aporta el análisis conjunto de campos léxicos y de distintas variables sociales. Por esta razón, partimos de la hipótesis de que unos determinados centros de interés1 y los factores sociales elegidos covariarán en menor o mayor medida con los resultados y que, tras realizar el análisis pertinente, podremos llegar a conclusiones significativas en cuanto a la distribución social del léxico.

De las conclusiones alcanzadas en los trabajos ya finalizados en distintos puntos del mundo hispánico (Samper Padilla y Samper Hernández, 2006; López González, 2014) y en otras comunidades bilingües (Serrano Zapata, 2020) extraemos las siguientes hipótesis:

  1. 1) Sobre la covariación de los datos con los centros de interés, consideramos que:
  2. (a) la producción de palabras variará en función del estímulo. En este sentido, las dos lenguas mostrarán un patrón de variación semejante en cuanto al número de palabras recabado, y su distribución, en cambio, diferirá más en relación con el número de vocablos (o palabras distintas) obtenido.
  3. (b) Tanto la productividad (el número de respuestas hallado bajo cada estímulo) como la riqueza léxica (el número de palabras diferentes) serán mayores en lengua catalana. Este hecho reflejará, de un lado, la extensión social que tiene esta lengua en la comunidad estudiada y, de otro, que el catalán es la lengua materna mayoritaria.
  4. 2) En relación con las cinco variables sociales contempladas en esta investigación, creemos que:
  5. (a) la estratificación social que se dé en las dos lenguas tenderá a ser similar, esto es, las variables mostrarán significación estadística desde un punto de vista sociolingüístico, o bien en las dos lenguas o bien en ninguna de ellas;
  6. (c) el léxico disponible de los dos idiomas covariará de forma significativa con el factor sexo, otorgando una productividad mayor a las mujeres;
  7. (d) en relación con la variable tipo de centro, los promedios serán superiores entre los informantes de los centros concertados tanto en castellano como en catalán;
  8. (e) el factor zona geográfica discriminará las respuestas de los informantes a favor del alumnado de las instituciones educativas ubicadas en la capital;
  9. (f) la variable nivel sociocultural estratificará el léxico disponible en función del nivel social del informante de forma que, a un nivel sociocultural mayor, le corresponderá un promedio superior de respuestas en los dos idiomas y
  10. (g) con respecto a la lengua materna, es de esperar que en lengua castellana presenten mejores promedios aquellas personas cuya lengua materna sea el castellano y en lengua catalana suceda lo mismo con el alumnado con el catalán como primera lengua.

Por lo tanto, el objetivo principal que nos proponemos es determinar cuál es el léxico disponible en lengua castellana y catalana en diferentes campos léxicos de una muestra representativa de estudiantado preuniversitario de Lleida. Al mismo tiempo, pretendemos conocer la incidencia que tienen ciertos factores sociales en la evocación del vocabulario disponible en una comunidad bilingüe. Para ello seguimos unas pautas metodológicas ya avaladas por todas las investigaciones que se suman al Proyecto Panhispánico de Léxico Disponible (véase www.dispolex.com).

Con el fin de poder alcanzar estos objetivos, en el primer capítulo nos ocupamos de los presupuestos teóricos en los que se sustenta este trabajo, con especial atención a la relación entre disponibilidad léxica y sociolingüística, y a los estudios desarrollados en comunidades españolas con dos lenguas oficiales. El segundo capítulo se dedica a retratar el marco sociolingüístico en el que se sitúa nuestra investigación, caracterizado por el contacto histórico entre el castellano y el catalán. En el tercero se detallan las características de la metodología aplicada en el trabajo de campo y las decisiones relativas a los criterios de edición de los datos que conforman los dos corpus.

El cuarto capítulo se dedica al análisis. Tras volcar los datos en Dispolex y obtener los resultados cuantitativos, utilizamos el programa SPSS (Statistical Package for the Social Sciences) para determinar la influencia que tienen las distintas variables sociales sobre la productividad léxica en lengua castellana y catalana. Partiendo del análisis de las palabras que se enumeran bajo cada estímulo verbal, observamos si las diferencias entre la producción en cada una de las dos lenguas son significativas y si también lo son las halladas entre las medias de cada uno de los grupos sociales en todas las áreas semánticas. En el capítulo quinto recogemos las conclusiones y destacamos los resultados más relevantes. La obra se cierra con un apéndice donde se incluyen las cincuenta palabras más disponibles en castellano y en catalán2.


1 Utilizamos las expresiones “centros de interés”, “campos léxicos”, “estímulos verbales”, etc. como sinónimas. Sobre el origen de este término, véase Sánchez-Saus (2019, pp. 15–20).

2 La presente monografía es una versión resumida y actualizada de nuestro trabajo de 2014, al cual remitimos en varias ocasiones a lo largo de estas páginas.

CAPÍTULO 1 MARCO TEÓRICO

La léxico-estadística se ocupa de realizar cómputos léxicos mediante procedimientos estadísticos; dicho de otro modo, trata de establecer, por medio de diferentes métodos, índices matemáticos para las distintas unidades léxicas de una lengua. Uno de los principales objetivos de esta corriente de estudio ha sido el de precisar cuál es el vocabulario usual de una comunidad, es decir, qué conjunto de palabras utiliza habitualmente una persona a lo largo de su vida. En torno a este objetivo, se ha perfilado, desde el comienzo, una finalidad esencialmente pedagógica, por cuanto conocer el léxico usual de una comunidad lingüística permite elaborar una planificación adecuada de la enseñanza de ese idioma, ya sea como lengua materna o como lengua extranjera.

Los estudios de disponibilidad léxica también tratar de establecer cuál es el léxico más usual de una comunidad. La primera obra que utiliza este índice, con la finalidad de identificar los elementos imprescindibles de una lengua para ser aprendida como segunda lengua es la de Gougenheim et al. (1964). Tal y como sus mismos autores reconocen, René Michéa tiene el mérito de haber creado la noción de léxico disponible, tradicionalmente definido como el caudal léxico utilizable en una situación comunicativa dada. Este vocabulario ahonda en una serie de campos que resultan muy cotidianos para los hablantes y señala qué palabras concretas se podrían utilizar en un contexto comunicativo dado. Tras varios experimentos realizados con escolares, Michéa ideó unas pruebas asociativas, denominadas centros de interés, en torno a las cuales se enumeran unidades léxicas.

Este tipo de estudios, desde su nacimiento con los pioneros franceses, ha tenido un notable desarrollo, sobre todo en el mundo hispánico. En su concepción teórica, la tesis de Natividad Hernández Muñoz (2006) responde a cuestiones intrínsecas fundamentales relacionadas con el concepto mismo de disponibilidad. Por ejemplo, la autora afirma que la definición tradicional de léxico disponible tendría que ser matizada, toda vez que no podemos comprobar que alguien que incluye una palabra en el listado de léxico disponible sea capaz de utilizarla en un determinado contexto real o, dicho de otra forma, ser capaz de nombrar una palabra no equivale a ser capaz de usarla (Hernández Muñoz, 2006, pp. 29–32 y 46–47). Además, la investigadora comprueba cómo las variables cognitivas que afectan significativamente al léxico disponible son, por este orden, la tipicidad, la familiaridad y la edad de adquisición. Es decir, “las palabras más típicas de una categoría, las más familiares y las aprendidas más temprano son más disponibles que las palabras menos típicas, menos familiares y aprendidas más tarde” (Hernández Muñoz, 2006, p. 188).

Por otra parte, la metodología de la disponibilidad, es decir, el control del número de asociaciones con palabras estímulo en más de un idioma, se ha utilizado también para conocer los efectos del bilingüismo y descubrir así cuál de las dos lenguas predomina en el individuo bilingüe. Las asociaciones realizadas en cada idioma pueden diferir en función de los referentes culturales que se asocien a cada una de ellas o según la distribución en ámbitos de las dos lenguas, teniendo en cuenta la situación sociolingüística concreta que se dé. En las investigaciones que nos preceden se apunta a que la disponibilidad léxica de una persona bilingüe será mayor en una lengua u otra en función del área semántica analizada (Baetens, 1989, p. 22; Appel y Muysken, 1996, pp. 153–154 y 170). En concreto, en el contacto entre el castellano y el catalán, se realizaron estudios muy similares a finales de los años 80 como instrumento para conocer la competencia lingüística del individuo bilingüe (Bastardas, 1986; Boix, 1993).

1.1. Disponibilidad léxica y sociolingüística

A pesar de las múltiples aplicaciones que puede tener el estudio de la disponibilidad léxica, la sociolingüística es una de las principales perspectivas desde la que se aborda. De hecho, ambas disciplinas están relacionadas desde el inicio, ya que los pioneros francófonos dieron cuenta de la importancia de algunos factores sociales como el sexo o el medio geográfico al analizar las palabras obtenidas en las listas de disponibilidad (Gougenheim et al., 1964, pp. 163–182).

En la actualidad, se estudia la relación que hay entre las respuestas de los informantes y los factores sociales que se toman en consideración. De este modo, se describen las características que diferencian la producción léxica de cada grupo social, tanto cuantitativa como cualitativamente. Para comprobar que las diferencias entre los grupos no son fruto del azar, los datos se analizan con programas estadísticos que prueban que las diferencias halladas son realmente significativas. En cuanto al análisis cualitativo, predominan los cotejos entre los distintos subgrupos de cada variable para determinar cuál es el léxico compartido y cuál el divergente y, más allá, se observa qué palabras concretas difieren de un sociolecto a otro y se buscan explicaciones que justifiquen este hecho.

Todos los estudios que se suman al Proyecto Panhispánico de Léxico Disponible incorporan las mismas variables: sexo, nivel sociocultural, zona geográfica y tipo de centro. Hasta la fecha, ya se han podido constatar algunas tendencias comunes (Samper Padilla y Samper Hernández, 2006, pp. 79–84; López González, 2014, pp. 103–118). Por ejemplo, con respecto a la variable sexo, por lo general, se advierte que —aunque no con grandes diferencias— las adolescentes alcanzan mejores promedios, sobre todo en algunas áreas temáticas. En relación con la variable nivel sociocultural, la gran mayoría de los trabajos publicados coincide en señalar su importancia frente a otras variables. En general, la mejor producción léxica se relaciona con los estratos más altos de la sociedad, definidos habitualmente en función del nivel de instrucción y de la profesión de los progenitores. Otra de las variables estudiadas es la zona geográfica, clasificada normalmente en la dicotomía urbana/rural según la ubicación del centro educativo. En función de la comunidad, este factor se divide en diversas regiones, o simplemente diferencia la capital del resto de la provincia. En general, el estudiantado de las zonas urbanas muestra una productividad léxica mayor, aunque la importancia de esta variable difiere según la comunidad de la que se trate.

La última variable que incorporan todos los estudios adscritos al Proyecto es el tipo de centro educativo. Hasta ahora predominan las investigaciones donde, al contrastar los datos, los centros privados o concertados alcanzan mejores resultados cuantitativos. Se ha discutido mucho sobre la independencia de este factor, a menudo relacionado con el nivel sociocultural de la familia, aunque se opta por incluirlo de forma separada, pues no siempre hay una correspondencia exacta entre el alumnado de los estratos más altos y el de los centros privados.

Details

Pages
200
Publication Year
2024
ISBN (PDF)
9783631897683
ISBN (ePUB)
9783631897690
ISBN (Hardcover)
9783631897676
DOI
10.3726/b20587
Language
Spanish; Castilian
Publication date
2024 (December)
Keywords
Catalán Castellano Bilingüismo Léxico disponible Disponibilidad léxica Lenguas en contacto
Published
Berlin, Bruxelles, Chennai, Lausanne, New York, Oxford, 2024. 200 p., 2 il. en color, 21 il. blanco/negro, 35 tablas
Product Safety
Peter Lang Group AG

Biographical notes

Maribel Serrano Zapata (Author)

Maribel Serrano Zapata es profesora del Departamento de Filología y Comunicación de la Universitat de Lleida. Obtuvo su doctorado en 2014 tras disfrutar de una beca predoctoral de investigación concedida por la Generalitat de Cataluña. Su especialidad es la sociolingüística, y concretamente, el estudio del léxico disponible en comunidades bilingües.

Previous

Title: El castellano y el catalán en contacto