Show Less
Open access

Wege zu einer erklärungsorientierten Linguistik im systemtheoretischen Paradigma

Grundlagentheoretische Untersuchungen

Series:

Walther Kindt

Was der Verhaltensbiologie gelungen ist – nämlich die Entwicklung von einer beschreibenden zu einer erklärenden Wissenschaft – das sollte auch Ziel der Linguistik sein. Der Autor zeigt auf, wie sich dieses Ziel im systemtheoretischen Rahmen erreichen lässt. Zunächst ist das Grundlagenproblem unzureichender Begriffsdefinitionen und Testverfahren zu lösen, um zu korrekten Beschreibungen und induktiv abgeleiteten Gesetzmäßigkeiten zu gelangen. Dadurch lassen sich bereits viele neue Erkenntnisse gewinnen. Sodann kann man für empirisch ermittelte Sachverhalte nach Erklärungen suchen, die auf allgemeinen Prinzipien oder Erwartungen beruhen. Diese Suche ist unter anderem dann zumeist erfolgreich, wenn sie durch Symmetriebrüche und eine konsequente Faktorenanalyse erleichtert wird.

Show Summary Details
Open access

4. Die synchrone Linguistik aus systemtheoretischer Perspektive

←150 | 151→

4.Die synchrone Linguistik aus systemtheoretischer Perspektive

In den klassischen Teilgebieten der synchronen Linguistik geht es u.a. um die Ermittlung von Äußerungs-, Bedeutungs-und Handlungsstrukturen. Diese von Menschen erzeugten Strukturen lassen sich aber nicht immer unmittelbar empirisch identifizieren. Vielmehr kann man sie oft nur durch einen Rückschluss auf die verwendeten Verarbeitungsverfahren und die zugehörigen Prinzipien ermitteln. Das wurde schon exemplarisch demonstriert. Deshalb setzt man bei einer systemtheoretischen Konzeptualisierung von Kommunikation voraus, dass jede an einer Kommunikation beteiligte Person P ein eigenes Input-Output-System bildet. P kann sprachliche Äußerungen als Output produzieren oder als Input rezipieren, aber auch andere Informationen aus der Umgebung wahrnehmen und als Kontextwissen nutzen. Jeder Input kann zu einer Veränderung des Zustands von P und ggf. zu einer verbalen oder nonverbalen Reaktion führen. Ein schwieriges methodisches Problem für die Ermittlung der Analyse-und Verstehensresultate für eine Äußerung A beruht darauf, dass Rezipierende oft keine für andere Kommunikationsbeteiligte erkennbare Reaktion auf A zeigen und deshalb auch nicht klar ist, wie sie A strukturiert und verstanden haben. Dem Umstand, dass trotzdem eine Reaktion auf A vorliegen kann, trägt die eingeführte Systemdefinition mit der Möglichkeit systeminterner Outputs Rechnung. Umgekehrt sind oft auch systeminterne Inputs Auslöser für die Produktion von Äußerungen.

←151 | 152→

Ein weiterer, für die Linguistik wichtiger Aspekt des eingeführten Systemkonzepts besteht darin, dass die Interaktion von zwei oder mehreren Systemen selbst ein System bildet. Dabei lässt sich einerseits jedes Verhalten eines Teilsystems auch als partielles Verhalten des Gesamtsystems auffassen. Andererseits können durch Output-Input-Verkettungen, also durch den Umstand, dass der Output eines Teilsystems als Input eines anderen Teilsystems fungiert etc., komplexe Verhaltensweisen im Gesamtsystem zustande kommen. In diesem Sinne liefert die Systemtheorie auch eine Grundlage für die Modellierung des Verhaltens einer sozialen Gruppe oder sogar einer Kommunikationsgemeinschaft. Allerdings soll nachfolgend i.Allg. nur der Fall einer Interaktion von zwei Beteiligten bei einer zusammenhängenden Kommunikation betrachtet werden. Ein einfaches Beispiel dafür bilden schon kooperative Satzproduktionen, deren Untersuchung in der gängigen Grammatikforschung wie erwähnt bisher weitgehend vernachlässigt wurde. Umgekehrt liegt die Wahl eines Modellierungsansatzes nahe, nach dem sich das Verhalten jeweils einzelner Beteiligter bei ihrer Sprachverarbeitung evtl. aus den Prozessen partiell autonomer und miteinander interagierender Teilsysteme zusammensetzt, was in der Linguistik ja auch oft mit der Annahme unterschiedlicher Verarbeitungsmodule im System der Beteiligten unterstellt wird.

4.1Zum Stellenwert bisheriger linguistischer Forschungsansätze

Die Spezifik des systemtheoretischen Paradigmas für die synchrone Linguistik wird nachfolgend zunächst noch einmal dadurch verdeutlicht, dass ein Überblick über einige etablierte linguistische Forschungsansätze aus Syntax, Semantik und Pragmatik gegeben wird, um zu skizzieren, an welche Leistungen dieser Ansätze das systemtheoretische Paradigma z.B. anknüpfen kann und an welchen Stellen Weiterentwicklungen erforderlich sind. Auf eine Diskussion des von Kuhn (1970) eingeführten Paradigmenbegriffs soll hier aber verzichtet und der Einfachheit halber angenommen werden, dass ein wissenschaftliches Paradigma durch die untersuchten Gegenstände, die Zielsetzungen mit ihren Fragen und Antworten, die vorausgesetzten Hintergrundtheorien und die jeweils verwendeten Methoden bestimmt ist. Insofern kann man von einem Paradigmenwechsel sprechen, wenn in einer Wissenschaft ein neuer Forschungsansatz entsteht, der sich in mindestens einem dieser Aspekte wesentlich von den bisher gängigen Richtungen unterscheidet.

Historisch betrachtet hat man sich schon lange vor der Etablierung der Linguistik als akademischer Disziplin und auch schon in der Antike mit synchronen Eigenschaften und Verwendungsweisen von Einzelsprachen beschäftigt. Systemtheoretisch relevant ist, dass man bereits die Regelhaftigkeit von Sprachen erkannte und dass erste Grammatiken formuliert wurden. Zudem existierten schon elementare semantische Vorstellungen über die Zuordnung zwischen Sprach-, Gedanken-und Umweltentitäten, mit denen sich bestimmte Aspekte von Verständigungsprozessen erklären ließen. Auch die Kontextabhängigkeit von Bedeutungen wurde bereits thematisiert.

4.1.1Überblick über einige theoretische und empirische Ansätze in der Syntaxforschung

←152 | 153→

Mit dem Paradigmenwechsel von der historischen Linguistik zum Strukturalismus zu Beginn des 20. Jahrhunderts endete gegenstandsbezogen die Präferenz einer diachronen Erforschung dynamischer Sprachaspekte. Dafür wurde im Paradigma des sog. amerikanischen Strukturalismus eine Methodologie für die Erforschung von Sprachen als statischen Systemen entwickelt, die großteils bis heute zum Kernbestand linguistischer Vorgehensweisen zählt. Das gilt vor allem für die Verfahren der Segmentierung und Klassifikation von Einzeläußerungen, weil jede methodologisch reflektierte Untersuchung sprachlicher Objekte eine solche Strukturanalyse benötigt. U.a. mit den üblichen Tests der Konstituentenanalyse (IC-Analyse) ist aber das bereits erwähnte Problem verbunden, dass sie manchmal zu widersprüchlichen Resultaten und jedenfalls nicht immer zu eindeutigen Ergebnissen führen, was z.B. Grewendorf (1988: 18) für das Deutsche genauer ausgeführt und kritisiert hat. Mit einem solchen wissenschaftslogisch problematischen Resultat hätte man sich aber nicht abfinden müssen, sondern genauer überprüfen können, welche dieser Tests unter welchen ggf. noch zu präzisierenden Bedingungen für eine Strukturermittlung geeignet sind (vgl. Abschnitt 4.1.2 und Kindt 2016b: 346ff.). So darf man aus theoriendynamischer Sicht in der Anfangsphase von Strukturanalysen zur Vermeidung von Zirkularität natürlich keine Tests verwenden, die schon grammatiktheoretisches Vorwissen voraussetzen. Insofern ist z.B. eine Anwendung des Koordinationstests zumindest vorerst unzulässig.

Ein anderer wichtiger Strukturierungsansatz basiert auf der Entdeckung von Drach (1937), dass sich elementare Sätze des Deutschen in zwei Felder unterteilen lassen. Für Sätze wie Karl ist nach Berlin gefahren mit dem Auto ist gegenwärtig eine fünfteilige Untergliederung in Vorfeld, linke Satzklammer, Mittelfeld, rechte Satzklammer und Nachfeld üblich (vgl. etwa Dürscheid (2003: 90). Diese Unterteilung wird hier aus zwei Gründen dadurch vereinfacht, dass die linke und die rechte Satzklammer dem Mittelfeld zugerechnet werden. Erstens stimmt dann das Mittelfeld in vielen Fällen mit der sog. Verbalphrase und ggf. mit der von dieser Sequenz gebildeten Konstituente überein. Zweitens liegt der so definierten Feldstruktur sogar ein universelles gestaltorientiertes und besonders einfaches Prinzip der Untergliederung von Objekten in drei Teile zugrunde. Dieses Prinzip wird auch bei anderen sprachlichen Einheiten befolgt: Silben lassen sich i.Allg. in Onset, Nukleus und Koda unterteilen, Wörter in Präfix, Stamm und Suffix, einfache Nominalphrasen in Determinator, Adjektiv und Nomen sowie Reden in Einleitung, Hauptteil und Schluss. Insofern stellt sich die Frage, in welchem Verhältnis solche Dreiteilungen oder andere formal definierbare Untergliederungen zu funktional begründeten Strukturen stehen. Jedenfalls wurde in Abschnitt 3.4.4 für die Beziehung zwischen Feld-und Konstituentenstruktur schon ein weitgehend geltendes Konvergenzprinzip angenommen (s. auch Abschnitt 4.3.1).

←153 | 154→

Als ein weiterer strukturtheoretischer Ansatz sei noch einmal die von Tesnière (1959) entwickelte Dependenzgrammatik angesprochen, in der die Abhängigkeitsbeziehung zwischen Wörtern teilweise zu Recht als eine eigenständige Relation aufgefasst wird. Auch in neueren Darstellungen dieses Ansatzes (vgl. etwa Welke 2011) sind aber weder seine theoretischen noch seine methodischen Probleme hinreichend gelöst und zugleich ist das Verhältnis von Dependenzbzw. Valenz-und Konstituentenstrukturen ungenügend geklärt (vgl. Kindt 2016b: 361ff.). U.a. reicht es nicht, Dependenzen nur zwischen Wörtern zu betrachten. Zudem wurde zu Beginn von Kapitel 3 schon an Beispielen gezeigt, dass es unterschiedliche Arten von Abhängigkeitsbeziehungen gibt und dass nicht nur einseitige Beziehungen vorliegen (s. auch Kapitel 8). Alle genannten strukturalistischen Ansätze haben überdies das Problem, dass die empirische Adäquatheit der ermittelten Strukturen nicht ausreichend nachgewiesen wird. Einerseits sollte man hierzu auf Erkenntnisse über generelle menschliche Strukturbildungsverfahren wie den Gestaltprinzipien als Hintergrundtheorie zurückgreifen. Andererseits wären für Nachweise der Strukturadäquatheit auch psycholinguistische Untersuchungen wünschenswert, wie sie früher ansatzweise für die Relevanz von Phrasenstrukturen im Englischen mit den sog. Klickexperimenten von Fodor und Bever (1965) und mit der Untersuchung der sog. transibility error probability von Johnson (1965) durchgeführt wurden (vgl. hierzu etwa Engelkamp 1974: 45f. und Rickheit et al. 2002: 41).

←154 | 155→

Die vergangenen 50 Jahre waren in der Syntaxforschung von einer besonderen Parallelität verschiedener theoretischer Ansätze geprägt, die zwar alle bestimmte Teilaspekte einer systemtheoretischen Konzeption fokussieren, aber ihren Gesamtzusammenhang nicht genügend reflektieren. Einer der Gründe für den Übergang vom Strukturalismus zum Paradigma der generativen Grammatik war die Unzufriedenheit mit den teilweise uneindeutigen Ergebnissen der eingeführten Analyseverfahren. Man hätte dort aber auch nach Möglichkeiten einer Optimierung dieser Verfahren und insbesondere der problematischen Konstituententests als einer notwendigen empirischen Grundlage für die Entwicklung von Grammatikmodelle suchen können. Stattdessen wurde zunächst unter Rückgriff auf die in Logik und Mathematik entwickelten Theorien über Semi-Thue-Systeme und Automaten ausschließlich die neue und natürlich wichtige Zielsetzung verfolgt, explizite formale Systeme zur syntaktischen Modellierung von Satzproduktion und -rezeption einzuführen. Die so entwickelten Grammatikmodelle sind allerdings zumeist höchstens beobachtungsadäquat. Demgemäß verlangt man lediglich, dass die von ihnen erzeugten bzw. akzeptierten Äußerungen syntaktisch akzeptable Sätze der jeweiligen Sprache bilden. Ob die dabei entstehenden Strukturen aber den realen Verarbeitungsgegebenheiten entsprechen, wird i.Allg. nicht empirisch überprüft. Das gilt z.B. auch für die Annahme der oft zugrundegelegten X-bar-Theorie, dass die gängigen Phrasentypen endozentrische Konstruktionen bilden und dass jede Phrase als obligatorischen Bestandteil einen sog. Kopf besitzt, der seine Eigenschaften auf die gesamte Phrase überträgt (vgl. z.B. Dürscheid 2003: 135). Diese Annahme ist jedenfalls für das Deutsche falsch, weil schon Nominalphrasen nicht endozentrisch sind. So bilden in der Nominalphrase ein Mann weder der Artikel noch das Nomen selbst eine Nominalphrase. Außerdem ergeben sich die Werte in den Nebenkategorien von Nominalphrasen nicht immer aus nur einem Teil der Phrase. Z.B. stammt die Genus-und Numerusinformation der Nominalphrase der Mann zwar vom Nomen, der Kasus wird aber vom Artikel bestimmt. Insgesamt gesehen war das generative Paradigma zwar in verschiedenen seiner Ziele erfolgreich. Es wurde aber nicht thematisiert, welche Art von Systemen für eine empirisch angemessene Modellierung von Sprachverarbeitung in Frage kommen und welche davon für welche Verarbeitungsaufgaben besonders gut geeignet sind.

←155 | 156→

Neben den zeitweise dominanten und seit einiger Zeit wieder weit verbreiteten, auf Chomsky zurückgehenden Varianten der generativen Grammatik gab es in der Syntaxforschung noch andere Arten theoretischer Ansätze, von denen hier drei erwähnt werden sollen. Ein zentraler Modellierungsaspekt kategorialgrammatischer Ansätze betrifft die aus der mathematischen Logik als Kompositionsprinzip übernommene Forderung, dass syntaktische und semantische Strukturen weitgehend parallel aufgebaut sind und dass sich die Bedeutung von Konstituenten jeweils aus den Bedeutungen ihrer Teile ermitteln lässt. Das in diesen Ansätzen eingeführte grammatische Kategoriensystem wird jedoch den Verknüpfungseigenschaften von Konstituenten nicht gerecht. Es ist zweifellos theoretisch elegant, aber empirisch nicht adäquat, weil i.W. angenommen wird, dass sich bei jeder Verknüpfung von Konstituenten eine von ihnen als Funktor und die anderen als Argumente einstufen lassen. Diese Annahme ist schon für Nominalkomposita nicht angemessen. Denn weder das Grund-noch das Bestimmungswort können den Status eines Funktors haben, was man z.B. daran erkennt, dass sich Ledertasche mit Tasche aus Leder paraphrasieren lässt. Syntaktisch bleibt der Funktor also implizit und das ist generell bei Bedeutungsverknüpfungen sehr oft der Fall. Als relevant erwähnt sei weiterhin der Ansatz der Unifikationsgrammatiken, in dem mit einem bestimmten, zur mathematischen Lösung von Gleichungssystemen analogen Verfahren durch die Verbindung von Merkmalsstrukturen das Problem gelöst wird, wie sich die Resultate aus unterschiedlichen Verarbeitungsschritten zu einem Gesamtergebnis verrechnen lassen. Z.B. soll ja bei der Nominalphrase die Räder der Wagen aus den möglichen syntaktischen Kategorisierungen ihrer Wörter resultieren, dass die Teilkonstituente der Wagen eine Genitiv-Plural-Phrase bildet. Das Verfahren der Unifikation erfasst aber nur Strukturbildungen nach monotonen Regeln. Erwähnt seien schließlich optimalitätstheoretische Ansätze, die sich mit dem Problem befassen, dass die Verarbeitungsprinzipien von Sprachen verschiedene Resultate für einen Input zulassen können und dass dann zu klären ist, welche Resultate aufgrund welcher Präferenzen mehr oder weniger optimal sind. Beispiele für Optimalitätserwägungen bei Wortstellungsfragen wurden bereits in Abschnitt 3.3.2.2 diskutiert. Insgesamt gesehen haben alle genannten Ansätze den Nachteil, dass sie die Inkrementalität von Sprachverarbeitung nicht berücksichtigen.

4.1.2Methoden des Strukturalismus, Anwendungsprobleme und Lösungen

Weil die strukturalistischen Methoden im Prinzip nach wie vor eine wichtige Grundlage für die empirische Analyse sprachlicher Äußerungen spielen können, lohnt es sich, genauer auf die schon in Abschnitt 1.2.1 angesprochenen Probleme bei ihrer Anwendung einzugehen. Das betrifft einerseits die Segmentierungsmethode der Paaranalyse und andererseits die Methode der Unterteilung von Äußerungen in unmittelbare Konstituenten, also die sog. IC-Analyse. Relativ einfache Verhältnisse liegen vor, wenn es um eine Segmentierung geschriebener Äußerungen geht, die bereits von einschlägigen Konventionen zur Abgrenzung von Wörtern und Sätzen Gebrauch machen. Dabei spielt das Problem, dass die Anwendung dieser Konventionen nicht immer vollständig mit einer linguistisch fundierten Einheitenbildung übereinstimmt, theoriendynamisch nur eine untergeordnete Rolle; denn die vorfindlichen Unterteilungen können zunächst hypothetisch als adäquat angenommen und nach Vorliegen genauerer linguistischer Untersuchungsergebnisse evtl. entsprechend korrigiert werden. Deshalb nutzt man auch für eine Untersuchung mündlicher Äußerungen von Sprachen mit schriftlichem Darstellungsformat das Verfahren, diese Äußerungen durch kompetente Angehörige der jeweiligen Sprachgemeinschaft transkribieren zu lassen und die sich so ergebenden Äußerungssegmente als Ausgangspunkt für Analysen zugrunde zu legen.

←156 | 157→

In linguistischen Lehrbüchern wird üblicherweise nicht genauer dargestellt, wie man von mündlichen Äußerungen einer Sprache ohne schriftliche Repräsentation zu einer Unterteilung in Wörter gelangt. Vielmehr wird in den Teilgebieten von Phonologie und Morphologie die Methode der Paaranalyse zur Unterteilung von Wörtern in Teilwörter, Morphe und Laute i.Allg. ohne Bezug auf eine Definition des Wortbegriffs oder die Angabe eines Tests zur Identifizierung der Wörter in Äußerungen angewendet. Dieses Vorgehen ist sogar wahrnehmungspsychologisch begründbar, weil auch Rezipierende beim Vergleich von Wörtern nach den Prinzipien von Assimilation und Kontrast in die Lage versetzt werden, ungleiche und ungefähr gleiche Anteile zu unterscheiden (vgl. etwa Legewie und Ehlers 1992: 87f.). Allerdings ist man bei der Durchführung einer Paaranalyse auf eigene semantische Urteile oder die anderer Personen angewiesen. Das kann insbesondere für die Ermittlung von Morphen problematisch sein, weil dafür die Testbedingung angesetzt wird, dass es sich bei Morphen stets um kleinste bedeutungstragende Segmente handeln soll (s. hierzu auch Abschnitt 6.1.2). Kann man also davon ausgehen, dass Testpersonen z.B. den beim Vergleich der Wortformen gehe und geht ermittelten Segmenten [e] und [t] problemlos die Eigenschaft zuschreiben, bedeutungstragend zu sein? Bei der Segmentierung von Wörtern in Laute wird dagegen nur die relativ unproblematische Möglichkeit vorausgesetzt, Entscheidungen über die Gleichheit oder Unterschiedlichkeit der Bedeutungen von Wörtern zu fällen. Trotzdem ist es auch bei diesem Fall der Paaranalyse erforderlich, die zugehörige Verfahrenslogik kritisch zu reflektieren. Wenn man in den mündlichen Äußerungen eines deutschsprachigen Korpus zwei Wörter wie z.B. Laus und Maus identifizieren konnte, dann resultieren aus dem Paarvergleich zwei unterschiedliche Anfangsteile, die relativ zum gemeinsamen Wortrest bedeutungsdifferenzierend wirken. Lässt sich anders als bei den Wörtern blau und grau für das Korpus auch nachweisen, dass diese beiden Teile nicht selbst weiter in bedeutungsdifferenzierende Bestandteile zerlegbar sind, dann handelt sich bei ihnen um Laute als minimale bedeutungsdifferenzierende sprachliche Einheiten. Mit der so als Minimalpaaranalyse spezialisierten Methode zeigt man also, dass sich die Eigenschaft der Bedeutungsunterscheidung im Sprachsystem den Lauten zurechnen lässt, die somit funktional relevante Segmente bilden. Dieser Betrachtung fehlt aber der wichtige Aspekt einer quantitativen Relevanz. Die Unterscheidung der beiden Anfangslaute bzw. Phoneme von Laus und Maus und ihre bedeutungsdifferenzierende Funktion lassen sich nicht nur an diesen beiden Wörtern nachweisen, sondern an vielen Wortpaaren, also z.B. auch an Laut vs. Maut und Last vs. Mast. Hinzu kommt, dass die beiden Laute in gleicher Weise gegen andere Laute des Deutschen abgrenzbar sind. Wichtig in diesem Zusammenhang ist schließlich, dass sich allenfalls bedeutungstragende Vokale in Äußerungen ohne Verlust der Akzeptabilität isoliert aussprechen lassen. Dagegen ist für Silben eine voneinander getrennte und die Akzeptabilität erhaltende Aussprache möglich.

←157 | 158→

Unabhängig von den Problemen der Paaranalyse ist noch zu klären, wie man von den Äußerungen im zugrundegelegten Korpus zu ihrer Unterteilung in Wörter gelangt. Offensichtlich eignet sich die Paaranalyse nicht ohne weiteres für eine solche Segmentierung, weil im Korpus i.Allg. nur wenige Äußerungen vorkommen werden, die sich in genau einem Wort von einer anderen Korpusäußerung unterscheiden. Dagegen kann man im Korpus nach kurzen und durch Pausen voneinander getrennten übereinstimmenden Äußerungsteilen suchen. Speziell wenn solche Teile häufig vorkommen, lässt sich das als Indiz für eine eigene semantische Funktion werten. Günstigenfalls sind auf diese Weise u.a. schon bestimmte Artikelformen, Konjunktionen und korpusspezifische Nomina als Wörter zu identifizieren. Trotzdem wird ein systematischeres Verfahren zur Segmentierung von Äußerungen in Wörter benötigt. Dazu bedarf es einer Definition des Wortbegriffs. Diesbezüglich wird man allerdings mit dem Sachverhalt konfrontiert, dass in der Linguistik ebenso wie bei dem in Abschnitt 3.1 diskutierten Satzbegriff keine Einigkeit über eine angemessene Explikation des Wortbegriffs besteht und dass teilweise sogar angenommen wird, eine allgemein verbindliche Wortdefinition anzugeben, sei unmöglich. Mit einer solchen Auffassung kann man sich aus wissenschaftslogischer Sicht nicht zufriedengeben. Ohnehin ist es schon vortheoretisch beurteilt nicht plausibel anzunehmen, dass Wörter nicht von anderen sprachlichen Einheiten unterscheidbar sind, obwohl sie eine Grundlage des natürlichsprachigen Zeichensystems bilden und beim Spracherwerb teilweise isoliert erlernt werden. Wie sich der Wortbegriff operationalisieren lässt, ist also für gesprochene Äußerungen noch zu klären, weil deren Wörter nicht eindeutig getrennt voneinander produziert werden. Nach dem in Abschnitt 3.4.4 eingeführten gestalttheoretischen Prinzip der Distanz liegt es dann nahe, ein Pendant zur Getrenntschreibung von schriftsprachlichen Wörtern zu suchen. Dafür kann man den Sachverhalt nutzen, dass sich in gesprochenen Äußerungen zwischen Silben und somit auch zwischen Wörtern kurze Pausen machen lassen. Tatsächlich ist das Pausenkriterium manchmal für eine Definition des Wortbegriffs vorgeschlagen worden. Bei einem entsprechenden Test durch Einfügung von Pausen muss man dann zusätzlich fordern, dass sich durch das Hinzukommen der Pausen die Akzeptabilität und die Bedeutung der Äußerung nicht ändern. Allerdings ist das Pausenkriterium „nicht völlig sicher“, weil sich innerhalb von mehrsilbigen Wörtern ebenfalls Pausen machen lassen (so z.B. zu Recht die Argumentation von Crystal 1995: 91). Dieses Problem kann man jedoch weitgehend dadurch umgehen, dass man in den gesprochenen Äußerungen des untersuchten Korpus zwischen den Silbengrenzen jeweils längere akustische Pausen einfügt. Dass der entsprechende Pausentest dann erfolgreich anwendbar ist, soll nachfolgend am Beispiel der unsegmentiert transkribierten Äußerung dieserlöwebrülltelaut illustriert werden. Graphisch dargestellt lässt dieser Satz also modifizieren zu

←158 | 159→

die serlöwebrülltelaut vs. dieser löwebrülltelaut vs. dieserlö webrülltelaut vs. dieserlöwe brülltelaut vs. dieserlöwebrüll telaut vs. dieserlöwebrüllte laut.

Sowohl die Originalversion als auch die veränderten Äußerungen kann man sprachkompetenten Versuchspersonen vorspielen und sie dazu auffordern zu entscheiden, ob für sie ein Akzeptabiltäts-oder Bedeutungsunterschied zwischen der originalen und den modifizierten Äußerungsversionen besteht. Erfahrungsgemäß erhält man von Versuchspersonen oft relativ einheitliche Urteile darüber, welche Äußerungsversionen bedeutungsgleiche und noch akzeptable Äußerungen bilden. Das sind nämlich die zweite, die vierte und die sechste Version. Als ein Wort einstufen lassen sich deshalb die erste und die letzte Silbensequenz vor bzw. nach einer ‚unschädlichen‘ Pause und außerdem alle Silbensequenzen, die unmittelbar zwischen zwei ‚unschädlichen‘ Pausen liegen. Diese Einstufung ist damit zu begründen, dass ‚unschädliche‘ Pausen im Unterschied zu ‚störenden‘ eine Trennung der semantisch zusammengehörigen Bestandteile eines Wortes vermeiden. Konkret ergibt sich dann für die analysierte Äußerung, dass die Silbensequenzen dieser, löwe, brüllte und laut als bedeutungstragende Wörter einzustufen sind. Je mehr Wörter man auf diese Weise ermittelt hat, desto größer ist auch die Chance, weitere Äußerungen durch einen Paarvergleich mit diesen Wörtern direkt zu segmentieren. Allerdings stellt sich bei einer empirisch breiter und systematischer angelegten Untersuchung heraus, dass der zur Wortidentifizierung eingesetzte Pausentest noch aus einem, m.W. in der Literatur nicht diskutierten Grund problematisch ist (s. Abschnitt 6.1.1).

Statt einer Anwendung des Pausentests bietet sich auch die Nutzung eines anderen Verfahrens an. Man kann man Personen der untersuchten Sprachgemeinschaft nämlich – sofern eine entsprechende Verständigung mit ihnen möglich ist – auch eine Sequenz von geeignet angefertigten Bildern vorlegen und sie um deren Beschreibung bitten. Dieses Verfahren war jedenfalls bei einer Erprobung im Rahmen einer Lehrveranstaltung erfolgreich. Als Resultat würde man, wenn es z.B. um deutschsprachige Beschreibungen des Verhaltens von Tieren in einem Zoo ginge, u.a. Äußerungen folgender Art erhalten.

derlöwestehtvordembaum/dertigerstehtvordembaum/diegiraffestehtvordembaum

←159 | 160→

Ersichtlich lässt sich die Methode der Paaranalyse im Fall von so elizitierten Äußerungen auch für eine Ermittlung von Wörtern nutzen und dann ergibt ein Vergleich der ersten beiden Äußerungen, dass die Segmente löwe und tiger Wörter bilden. Außerdem ist zu vermuten, dass der nur aus einer Silbe bestehende Äußerungsteil der ebenfalls ein Wort ist. Wenn die auf den Bildern gezeigten Tiere und ihr Standort relativ zu unterschiedlichen Objekten systematisch variiert werden, dann erhält man – so legen die drei Äußerungsbeispiele nahe – schon spezifische Informationen über die Einstufung bestimmter Segmente als Wörter, die später mit dem Substitutionstest in die Klassen der Artikel, der Nomina und Präpositionen eingeordnet werden können.

Als Nächstes geht es um eine Einschätzung der nach einer Äußerungssegmentierung in Wörter einsetzbaren Testverfahren der IC-Analyse zur Unterteilung von Sätzen in Konstituenten. Worin besteht also genau das schon mehrfach erwähnte Problem, dass eine Anwendung der verschiedenen Tests oft zu keinen eindeutigen Ergebnissen führt? Zunächst muss man im Sinne der Überlegungen in Abschnitt 3.2 vor der Formulierung dieser Tests eine partielle Definition des Satzbegriffs angeben, um mit ihrer Hilfe bestimmte Äußerungen aus dem zugrundeliegenden Korpus als Sätze einstufen zu können. Außerdem hätte sich bei einer Kenntnis des Distanzprinzips als Erstes die Anwendung eines m.W. in der IC-Analyse nicht genutzten Unterteilungstests angeboten, der darauf beruht, dass die Rezeption von Konstituenten als unterschiedlich eng zusammengehörigen Äußerungsteilen durch die Einfügung längerer Einschübe teilweise unproblematisch und teilweise erschwert ist. Was ergibt dieser Test also, wenn man im schriftlich präsentierten Satz

(4/1a) Der Affe aus Afrika frisst eine Banane.

z.B. die Wortsequenz schau mal dorthin jeweils zwischen den Wörtern von (4/1a) einfügt und dann Versuchspersonen folgende Äußerungsvarianten vorlegt?

(4/1b) Der schau mal dorthin Affe aus Afrika frisst eine Banane.

(4/1c) Der Affe schau mal dorthin aus Afrika frisst eine Banane.

(4/1d) Der Affe aus schau mal dorthin Afrika frisst eine Banane.

(4/1e) Der Affe aus Afrika schau mal dorthin frisst eine Banane.

(4/1f) Der Affe aus Afrika frisst schau mal dorthin eine Banane.

(4/1g) Der Affe aus Afrika frisst eine schau mal dorthin Banane.

←160 | 161→

Bei einer Befragung von Studierenden zeigte sich, dass (4/1e) und (4/1f) i.Allg. als akzeptabel eingeschätzt werden und (4/1b), (4/1d) und (4/1g) als inakzeptabel. Nicht eindeutig fiel das Urteil über die Akzeptabilität von (4/1c) aus. Deshalb lässt sich (4/1c) als eingeschränkt akzeptabel werten. Diese Befragungsergebnisse belegen wegen der Inakzeptabilität von (4/1b) zunächst, dass mit Der in (4/1a) eine Konstituente beginnt, die wegen der eingeschränkten Akzeptabilität von (4/1c) und der Akzeptabilität von (4/1e) mit Afrika endet. Auf die Frage, welche interne Struktur diese Konstituente hat, wird am Ende dieses Abschnitts eingegangen. Weiterhin besagt die Akzeptabilität von (4/1e) und (4/1f), dass frisst allein eine Konstituente bildet. Schließlich ergibt sich aus der Akzeptabilität von (4/1f) und der Inakzeptabilität von (4/1g), dass eine Banane eine Konstituente bildet. Insgesamt führt die Anwendung des Einschubtests also zu einer Unterteilung von (4/1a) in drei Konstituenten und das sind – grammatiktheoretisch vorweggenommen – gerade die Satzglieder von (4/1a). M.a.W. der konkret formulierte Test eignet sich offensichtlich für eine Satzgliedermittlung. Außerdem wäre zu klären, ob man durch eine Variation der Länge oder Art der Einschübe zu weiteren Anwendungsmöglichkeiten dieses Tests gelangen kann. Insbesondere gilt aber, dass der Pausentest nur einen Spezialfall des Einschubtests bildet.

Gestalttheoretisch begründbar ist auch der bekannte strukturalistische Permutationstest, von dem in der einschlägigen Literatur oft behauptet wurde, mit ihm seien bestimmte nicht lösbare Probleme verbunden. Allerdings mangelte es auch an geeigneten Lösungsversuchen (vgl. hierzu Kindt 2010: 50ff.). Das soll nachfolgend exemplarisch an der Darstellung von Grewendorf (1988) und Dürscheid (2003) gezeigt werden. Grewendorf untersucht (vgl. S. 15) den Satz

(4/1h) Ich habe mir gestern den schönen Teppich aus Seide gekauft.

und wählt für den Permutationstest die übliche Formulierung:

„Wortfolgen, die man ohne Beeinträchtigung der Grammatikalität verschieben bzw. umstellen kann, bilden eine Konstituente.“

Diese Formulierung hat wissenschaftslogisch den Nachteil, dass man zum vorliegenden Zeitpunkt der Theorieentwicklung noch gar nicht über einen Grammatikalitätsbegriff verfügt. In der Testformulierung lässt sich dieser Begriff allerdings durch den unspezifischen Begriff der von sprachkompetenten Personen beurteilbaren Akzeptabilität ersetzen. Bei Anwendungen des Tests geht man nämlich bereits von (akzeptablen) Äußerungen (bzw. schon als Sätzen eingestuften Äußerungen) der jeweiligen Sprache aus und kann dann überprüfen, ob die modifizierten Äußerungen ebenfalls als zur Sprache gehörig eingestuft werden. Grewendorf führt nun verschiedene Permutationen in (4/1h) durch und folgert z.B. aus der Inakzeptabilität der Variante

(4/1i) Aus Seide habe ich mir gestern den schönen Teppich gekauft,

←161 | 162→

dass aus Seide nach dem Permutationstest keine Konstituente sei, obwohl eine Anwendung des Substitutionstests dies nachweise. Diese Folgerung ist in dreierlei Hinsicht problematisch. Erstens überprüft Grewendorf gar nicht, zu welchem Resultat andere Umstellungsmöglichkeiten von aus Seide führen; z.B. lässt sich in (4/h) aus Seide ins Nachfeld verschieben. Allerdings muss man die Anwendung des Permutationstests wegen bestimmter jetzt nicht zu diskutierender Probleme ohnehin auf den Fall von Topikalisierungen, also von Voranstellungen in die Erstposition von Sätzen beschränken. Insofern ist jetzt zu fragen, was die Inakzeptabilität von (4/1i) genau bedeutet. Zweitens ist Grewendorfs Argumentation inkorrekt, weil nach seiner Testformulierung aus der Unzulässigkeit einer Permutation nicht auf das Nichtvorliegen einer Konstituente geschlossen werden darf. Also belegt die Inakzeptabilität der Voranstellung von aus Seide in (4/1i) auch noch nicht, dass diese Wortsequenz keine Konstituente von (4/1h) bildet. Drittens lässt sich mit dem Topikalisierungstest nur überprüfen, ob eine Wortsequenz ein Satzglied bildet und insofern ist es sogar ein positives Ergebnis, dass sich aus Seide in (4/1h) als nicht topikalisierbar erweist.

Grewendorfs Testformulierung ist noch mit zwei anderen Problemen verbunden. Eines von ihnen beruht darauf, dass er nicht systematisch überprüft, ob die von ihm beobachtete Inakzeptabilität generell auftritt. Das wird deutlich, wenn man z.B. im Satz

(4/1j) Eine Banane holt sich der Affe aus dem Käfig.

die Wortsequenz aus dem Käfig topikalisiert und dann den akzeptablen Satz

(4/1k) Aus dem Käfig holt sich der Affe eine Banane.

erhält. Dieses Ergebnis spricht nach Grewendorfs Testformulierung zwar dafür, dass aus dem Käfig eine Konstituente bildet. Dann ist aber erklärungswürdig, warum die Topikalisierung in (4/1k) anders als in (4/1h) gelingt. Der Grund hierfür lässt sich leicht erkennen. (4/1k) hat nämlich nicht dieselbe Bedeutung wie (4/1j) in der Lesart, bei der der Affe aus dem Käfig das Subjekt bildet. Insofern muss für den Topikalisierungstest gefordert werden, dass die Voranstellung bedeutungserhaltend ist, d.h. dass sich der zugeordnete Sachverhalt nicht ändert.

Ein weiteres Problem der Testformulierung hängt mit dem Fehlen einer Minimalitätsbedingung zusammen. Bei Anwendungen des Topikalisierungstests wurde nämlich schon häufig beobachtet, dass er in der vorliegenden Formulierung bei bestimmten Sätzen sowohl größere Sequenzen als auch Teile von ihnen als Konstituenten auszeichnet. Interessant ist in diesem Zusammenhang z.B. die von Dürscheid (2003: 49) vorgebrachte Argumentation. Betrachtet man den gegenüber Dürscheids Beispiel etwas vereinfachten Satz

(4/1l) Ich möchte an Weihnachten ein Buch lesen.

dann sind folgende Voranstellungen akzeptabel.

(4/1m) An Weihnachten ein Buch lesen möchte ich.

(4/1n) Ein Buch lesen möchte ich an Weihnachten.

(4/1o) An Weihnachten möchte ich ein Buch lesen.

(4/1p) Ein Buch möchte ich an Weihnachten lesen.

(4/1q) Lesen möchte ich an Weihnachten ein Buch.

←162 | 163→

Welche der an den Satzanfang verschiebbaren Wortsequenzen sind Satzglieder? Dürscheid würde alle gemäß (4/1m) -(4/1q) topikalisierbaren Sequenzen als Konstituenten einstufen und dann wegen (4/1m) und (4/1n) folgern, ein positives Resultat des Topikalisierungstests sei nur ein notwendiges, aber kein hinreichendes Kriterium für den Status einer Konstituente als Satzglied. Zuvor hatte Dürscheid nämlich schon die traditionellen Satzgliedtypen eingeführt (S. 32ff.), was wieder theoriendynamisch inkonsequent ist, weil dieser Einführung die Unterteilung von Sätzen in Satzglieder vorausgehen muss. Wenn somit eine wichtige Aufgabe der IC-Analyse darin besteht, eine hinreichende Bedingung für die Einstufung von Wortsequenzen als Satzglieder anzugeben, dann sollte auch ein geeigneter Test für diese Definition zur Verfügung stehen. Dürscheid behauptet diesbezüglich unter Berufung auf den Duden (1998: 627), für eine entsprechende Einstufung müsse neben der Voranstellbarkeit evtl. zusätzlich die Substituierbarkeit gefordert werden. Diese Behauptung ist falsch. Vielmehr reicht es aus, wenn man die Bedingungen im Topikalisierungstest so modifiziert, dass jeweils eine minimale am Satzanfang positionierbare Wortsequenz gesucht wird. Genauer gesagt erfüllt eine Wortsequenz genau dann die betreffende Minimalitätsbedingung, wenn sie sich nicht so in Teilsequenzen zerlegen lässt, dass alle diese Sequenzen ebenfalls am Satzanfang stehen können. Eine Anwendung des so präzisierten Tests ergibt dann: Die Akzeptabilität von (4/1o), (4/1p), (4/1q) und die Nichttopikalisierbarkeit der einzelnen Wörter an, Weihnachten, ein und Buch zeigen, dass an Weihnachten, ein Buch und lesen jeweils Satzglieder von (4/1l) sind; zugleich weisen (4/1o), (4/1p) und (4/1q) aber nach, dass die beiden Sequenzen an Weihnachten ein Buch lesen und ein Buch lesen keine Satzglieder in (4/1l) bilden.

Es bleibt zu klären, ob der Voranstellungstest auch geeignet ist, Satzgliedsequenzen in (4/1l) als mögliche Konstituenten zu identifizieren, wenn auf die Geltung der Minimalitätsbedingung verzichtet wird. Eine systematische Diskussion über die Konstituentenstruktur von (4/1l) kann man zwar nur im Zusammenhang mit einer Untersuchung der Frage führen, welche Strukturen sog. Verbalphrasen haben können und welche von ihnen unter welchen Kontextbedingungen präferiert werden (s.u. und vgl. Kindt 2016b: 353ff.). Im Vorgriff auf diese Diskussion lässt sich aber jedenfalls für die beiden Sätze (4/1m) und (4/1n) mit einem Einwort-Ersetzungstest schon zeigen, dass die in ihnen jeweils vorangestellte Satzgliedsequenz eine Konstituente bildet. Sie lässt sich nämlich z.B. wechselseitig mit dem infiniten Verb wandern aus folgendem Satz substituieren.

(4/1r) Wandern wird er gerne.

←163 | 164→

Wenn man Wandern in (4/1m) für An Weihnachten ein Buch lesen einsetzt, entsteht wieder ein akzeptabler Satz und das Umgekehrte gilt für eine Ersetzung von Wandern durch An Weihnachten ein Buch lesen in (4/1r). Analog dazu lassen sich von Wandern und Ein Buch lesen wechselseitig füreinander ersetzen.

An dieser Stelle lässt sich ein vorläufiges Fazit zum Umgang mit dem Permutations-und dem Topikalisierungstest ziehen. Erstens war die Diskussion über diese Tests nicht so differenziert, dass ihr genauer Stellenwert und die Notwendigkeit einer Präzisierung erkannt wurde. Zweitens kann man Sätze mit dem Topikalisierungstest zwar schon weitgehend in Satzglieder unterteilen. Es ist aber noch zu klären, wie die so nicht erfassbaren Segmente, nämlich z.B. Abtönungspartikeln, als Satzglieder eingestuft werden (vgl. Kindt 2016b: 349). Drittens ist es oft erforderlich, Satzglieder in Konstituenten oberhalb der Wortebene zu unterteilen und/oder zu größeren Konstituenten zusammenzufassen. Also müssen auch für diese beiden Fälle geeignete Tests angegeben werden.

Auch die drei anderen in der Literatur empfohlenen Tests sind großteils mit Problemen verbunden. So ist eine Anwendung des Koordinationstests (vgl. etwa Dürscheid 2003: 53f.) – wie in Abschnitt 4.1.1 erwähnt – schon deshalb abzulehnen, weil in der ersten Phase der Ermittlung von Konstituenten noch kein Wissen über syntaktische Konstruktionen vorliegt. Hinzu kommt ein Detailproblem bei der Durchführung dieses Tests, wenn gesagt wird, ein Satzsegment bilde eine Konstituente, falls es sich mit einem anderen koordinieren lasse. Ergänzt man z.B. den Satz

(4/1s) Peter kauft heute neue Kartoffeln.

durch und saftige Äpfel, wie soll dann entschieden werden, wo die linke Grenze der zu ermittelnden Konstituente liegt? Ungeeignet ist auch der Eliminierungstest, nach dem „das, was zusammen weggelassen werden kann, in der Regel eine Konstituente“ sei (so Dürscheid 2003: 52). Selbst wenn man den Test auf eine Tilgung benachbarter Sequenzen beschränkt, ist mit Sätzen wie

(4/1t) Der Affe holt sich eine Banane mit brauner Schale in den Käfig.

←164 | 165→

zu rechnen, bei denen sich nicht zusammengehörige Teile von Satzgliedern gemeinsam eliminieren lassen, nämlich in (4/1t) die Wortsequenz mit brauner Schale in den Käfig. Deshalb bleibt nur noch der Substitutionstest als diskussionswürdig übrig, der ohnehin als Verfahren für die Klassifikation von Konstituenten eine wichtige Rolle spielt. Ein Nachteil dieses Tests besteht aber darin, dass bei seiner Anwendung eine generelle bzw. eine auf geeignete Testsätze bezogene wechselseitige Ersetzbarkeit der jeweiligen Wortsequenzen zu fordern ist. Die Notwendigkeit einer solchen Überprüfung wird in der Literatur aber oft übersehen und das führt zu unvollständigen Argumentationen oder sogar zu Fehlschlüssen. Eine Sonderform des Substitutionstests stellt der Pronominalisierungstest dar, den Dürscheid (2003: 50) entsprechend verkürzt so formuliert:

„Wenn sich eine Wortkette im Satz durch ein Pronomen oder – allgemeiner gesagt – durch eine Proform ersetzen lässt, dann handelt es sich um eine Konstituente“.

Genauer zu fordern ist hier zunächst wieder eine Ersetzung ohne Verlust der Akzeptabilität. Außerdem setzt dieser Test eine vorherige Einführung des Pronomen-bzw. Proformbegriffs in der Morphologie voraus. Eine solche Explikation könnte man durch eine explizite Aufzählung der Wörter erreichen, die als Proformen gelten sollen, oder durch Rückgriff auf ihre semantischen oder morphologischen Eigenschaften. Einfacher ist es allerdings, diesen Test zu einem Einwort-Ersetzungstest zu verallgemeinern. Unabhängig davon ist schon zu erkennen, was ein solcher spezieller Test leistet. Wenn eine Wortsequenz und ein bestimmtes einzelnes Wort unter Einhaltung der erforderlichen Bedingungen wechselseitig füreinander einsetzbar sind, dann stellt diese Wortsequenz eine Äußerungseinheit dar, deren Bedeutung sich schon durch ein Wort ausdrücken lässt oder jedenfalls funktional einer Wortbedeutung entspricht. M.a.W. mit dem Einwort-Ersetzungstest kann man starke, also semantisch abgeschlossene Konstituenten ermitteln.

Die obige Formulierung des Proformtests drückt die Ersetzbarkeitsbedingung aber nicht nur verkürzt aus, sondern Dürscheid wendet den Test auch inkorrekt an. So ersetzt sie z.B. im Satz

(4/2a) Der Junge trifft seine neue Freundin.

die Wortsequenz seine neue Freundin durch das Pronomen sie und glaubt, mit dem positiven Ersetzungsresultat den Konstituentenstatus der Sequenz nachgewiesen zu haben. Nach dem Prinzip von Dürscheids Argumentation könnte man nämlich auch folgern, dass im Satz

(4/2b) Der Junge beschreibt seiner Freundin die neue Wohnung.

die Wortsequenz WS seiner Freundin die neue Wohnung eine Konstituente bildet. Dieses unerwünschte Resultat kommt nicht zustande, wenn die Testformulierung auch die umgekehrte Ersetzung in geeigneten Sätzen verlangt, also z.B. die Einsetzung von WS für sie im Satz

(4/2c) Der Lehrer besucht sie.

←165 | 166→

Diese Einsetzung führt jedoch zu einer inakzeptablen Äußerung. Für den Proformtest sind also noch Vergleichsätze für die umgekehrten Ersetzungen anzugeben. Ohnehin ist dabei eine Verwendung des Pronomens sie wegen seiner syntaktischen Mehrdeutigkeit unzweckmäßig.

Nachfolgend soll die Problematik der Konstituentenanalyse noch an zwei weiteren Fragestellungen illustriert werden. Eine von ihnen betrifft die These, im Deutschen bilde die sog. Verbalphrase (VP) generell eine unmittelbare (starke) Konstituente von Sätzen. Genauer gilt diese These zunächst höchstens für elementare Aussagesätze mit einem Subjekt in Erstposition und sie kann dann mit einem Verb-Ersetzungstest überprüft werden. Statt von Verbalphrasen soll hier allgemeiner bei Satzgliedsequenzen, die aus einem Verb und zu ihm passenden Satzgliedern bestehen und somit zu einem Satz verlängerbar sind, von Verbalsequenzen gesprochen werden. Als ein Beispiel für den Nachweis des Konstituentenstatus einer Verbalsequenz behandelt Dürscheid (2003: 51) den Satz

(4/2d) Er schreibt an einem Roman.

Wegen ihrer unzureichenden Testformulierung glaubt Dürscheid, dass die Verbalsequenz VS schreibt an einem Roman deshalb in (4/2d) eine Konstituente bildet, weil man in (4/2d) für VS das Wort arbeitet einsetzen kann und dann zu dem akzeptablen Resultat

(4/2e) Er arbeitet.

gelangt. In Wirklichkeit muss zusätzlich wieder nachgewiesen werden, dass VS umgekehrt in mindestens einem Testsatz für arbeitet akzeptabel einsetzbar ist. Dafür würde sich z.B. der Satz

(4/2f) Sie arbeitet zu lange an ihrem Vortrag.

nicht gut eignen. Das zeigt das Ersetzungsresultat

(4/2g) Sie schreibt an einem Roman zu lange an ihrem Vortrag.

Offensichtlich ist es zweckmäßiger, syntaktisch minimale Testsätze zu verwenden. Das gilt z.B. für

(4/2h) Die Frau arbeitet.

←166 | 167→

Tatsächlich lässt sich in (4/2h) arbeitet ohne Akzeptabilitätsverlust durch VS ersetzen. Allerdings müsste jetzt eigentlich noch geklärt werden, wie viele Testsätze welcher Art ausreichen, um die VP-These für Sätze des Typs von (4/2d) zu überprüfen. Unabhängig davon ist zu berücksichtigen, dass VS in (4/2d) zwar eine Konstituente bilden kann, aber nicht muss. Wenn (4/2d) nämlich z.B. auf die Frage Wer schreibt woran? antwortet, dann wird Er topikalisierend hervorgehoben und an einem Roman prädikativ, auch wenn das an einer schriftlichen Version von (4/2d) nicht zu erkennen ist. In diesem Fall bilden dann Er und an einem Roman zusammen eine schwache Konstituente. Also können schreibt und an einem Roman nicht mehr zu einer starken Konstituente verknüpft werden. Expliziter lässt sich das an einer entsprechenden Gappingkonstruktion nachweisen.

(4/2i) Er schreibt an einem Roman und sie an einem Gedicht.

In (4/2i) führt nämlich eine Ersetzung von VS schreibt an einem Roman durch arbeitet zu einem Akzeptabilitätsverlust. Das belegt die Äußerung

(4/2j) Er arbeitet und sie an einem Gedicht.

Dieses Resultat ist damit zu erklären, dass im ersten Konjunkt von (4/2j) ein Satzglied fehlt, mit dem sich an einem Gedicht parallel valenzverknüpfen lässt. Mit einer Anwendung des Einwort-Ersetzungstests kann man also bisher nur mögliche Konstituentenstrukturen ermitteln. Insofern ist zu fragen, ob es nicht auch eine Testformulierung mit einem eindeutigen Resultat gibt. Für eine Beantwortung dieser Frage ist es zweckmäßig, Sätze mit einer etwas komplexeren Verbalsequenz als in (4/2d) zu betrachten, also z.B. den Satz

(4/2k) Er schreibt mit großem Eifer an einem Roman.

←167 | 168→

In (4/2k) kann man die drei Verbalsequenzen VS1 schreibt mit großem Eifer, VS2 schreibt an einem Roman und VS3 schreibt mit großem Eifer an einem Roman ohne Akzeptabilitätsverlust durch arbeitet ersetzen und das Umgekehrte gilt z.B. für (4/2h). Nun ist aber kein Grund dafür zu erkennen, warum außer in speziellen Kotexten entweder VS1 und an einem Roman oder VS2 und mit großem Eifer zwei getrennte unmittelbare Konstituenten von (4/2n) bilden sollten. Vielmehr ist nach dem Konvergenzprinzip für Feld-und Konstituentenstrukturen und nach Gestaltprinzip des „Aufgehens ohne Rest“ (vgl. Abschnitt 3.4.4) zu erwarten, dass nach begonnener Erstellung der Konstituente VS1 ihr noch an einem Roman hinzugefügt wird. Deshalb bildet VS3 eine unmittelbare Konstituente von (4/2n). Das bedeutet wiederum, dass man im Einwort-Ersetzungstest – wie auch schon in Abschnitt 3.4.4 dargestellt wurde – zusätzlich die Geltung einer Maximalitätsbedingung fordern sollte. In diesem Fall stellt sich heraus, dass in (4/2i) die maximale Verbalsequenz, die eine (starke) Konstituente bildet, nur aus dem finiten Verb schreibt selbst besteht. Weiterhin gibt es dann bei (4/2k) vorerst keinen Grund für eine zusätzliche interne Unterteilung von VS3 entweder in die beiden Konstituenten VS1 und an einem Roman oder in VS2 und mit großem Eifer; sie könnte allenfalls kotextabhängig erforderlich werden. Insofern ist davon auszugehen, dass VS3 mit der Untergliederung in seine drei Satzglieder i.Allg. eine flache Konstituentenstruktur besitzt. Genauer lässt sich das semantiktheoretisch damit begründen, dass die beiden Satzglieder mit großem Eifer und an einem Roman das Verb schreibt semantisch unabhängig voneinander spezifizieren (analog zu der für (3/1a) in Abschnitt 3.4.5 angegebenen semantischen Struktur).

Eine andere Fragestellung, bei der eine Anwendung des Einwort-Ersetzungstests von Interesse ist, bezieht sich auf die interne Struktur von Nominalphrasen wie den schönen Teppich aus Seide im Satz (4/1h). Anstelle der früher generell vorgeschlagenen Unterteilung in die beiden Konstituenten den schönen Teppich und aus Seide, die bei Anwendung einer Paaranalyse auf bereits identifizierte Phrasen wie z.B. das Kleid aus Seide naheliegt, werden jetzt oft andere Strukturen präferiert. Z.B. setzen Zifonun et al. (1997: 1017) für die NP die Elf aus Bayern aus semantischen Gründen eine hierarchische Struktur an: Zunächst wird das Nomen Elf mit der PP aus Bayern zu einer Konstituente verbunden und dann Elf aus Bayern mit die zu einer Nominalphrase. Tatsächlich ist es bei einer restriktiven Lesart von aus Bayern plausibel, dass für eine Bestimmung der Bedeutung der Gesamtphrase zuerst die Bedeutungen von Elf und von aus Bayern kombiniert werden und danach unter den Fußballmannschaften aus Bayern diejenige als Referentin auszuwählen ist, die im aktuellen Kontext fokussiert wurde. Genauso gut lässt sich bei einer explikativen Leseart aber erst mit die Elf eine im Kontext bereits zugängliche Referentin benennen und anschließend mit aus Bayern eine Zusatzinformation geben. Welcher dieser Fälle vorliegt, kann man kontextfrei nicht entscheiden. Ist deshalb der Vorschlag von Eisenberg (1999: 39) angemessener, z.B. die Sequenz die Landung auf der Startbahn aus valenztheoretischen Gründen in die drei unmittelbaren Konstituenten die, Landung und auf der Startbahn zu unterteilen? Eine Antwort auf diese Frage lässt sich nur mithilfe des Einwort-Ersetzungstests geben. Wenn man ihn z.B. auf den Satz

(4/3a) Ich bestelle mir den/diesen Wein aus Baden.

anwendet, dann sind die Sequenz Wein aus Baden und das Wort Schnaps im Satz

(4/3b) Du trinkst den Schnaps.

wechselseitig austauschbar. Dagegen ist den/diesen Wein durch das Wort Sekt aus dem Satz

(4/3c) Er verkauft Sekt.

←168 | 169→

ersetzbar und umgekehrt. Beide Sequenzen erfüllen also die Testbedingung der Maximalität, schließen sich aber als Konstituenten aus. Nicht möglich ist dagegen eine dreiteilige flache Konstituentenstruktur von den/diesen Wein aus Baden, weil der Determinator den/diesen und die PP aus Baden das Nomen Wein semantisch nicht unabhängig voneinander spezifizieren. Vermutlich wählen Rezipierende für (4/3a) bei der Version den Wein oft die Konstituentenbildung mit der restriktiven Lesart von aus Baden; bei der Version diesen Wein legt das Demonstrativpronomen aber evtl. nahe, dass der zugehörige Referent eindeutig bestimmt ist und dass die PP aus Baden eine Zusatzinformation über (diesen Wein)’ liefert. Ähnlich verhält es sich möglicherweise beim Satz

(4/3d) Ich bestelle mir einen Wein aus Baden.

Ohne die PP interpretiert man (4/3d) ggf. als eigenständige Aussage, die danach durch die von der PP gegebene Information ergänzt wird. Zugleich wird am Beispiel von (4/3a) und (4/3d) deutlich, dass man die PP bei einer restriktiven bzw. einer explikativen Funktion referenzherstellend bzw. prädikativ verwendet; zudem muss damit auch eine andere Art der Valenzverknüpfung oder ihrer Interpretation verbunden sein (s. Abschnitt 7.2). Um die unterschiedliche Struktur der PP formal darzustellen, wird folgende Notation für Konstituenten K eingeführt. §K soll besagen, dass die Verarbeitung der jeweils betrachteten und K umfassenden Konstituente bei K beginnt. Die Notation K⇓ bzw. K⇑ K wird für eine referenzielle bzw. prädikative Funktion von K verwendet. Außerdem lässt sich mit den Pfeilen ⇒ und ⇐ die Richtung serieller Valenzverknüpfung anzeigen. Insofern stellt

((einen⇓ ⇐ §Wein⇓)⇓ ⇒ (aus⇓ ⇒ Baden⇓)⇑)⇓

den explikativen Fall dar, bei dem in (4/3d) die PP aus Baden zwar eine prädikative Funktion hat, bei dem aber die gesamte NP einen Wein aus Baden und die Teil-NP einen Wein referenziell verwendet werden. Dagegen hat die PP bei einer restriktiven Lesart die Struktur

(einen⇓ ⇐ (§Wein⇓ ⇒ (aus⇓ ⇒ Baden⇓)⇓)⇓)⇓.

4.1.3Anmerkungen zu theoretischen Ansätzen in der linguistischen Semantik

←169 | 170→

Was die semantische Forschung betrifft, so zwingt eine systemtheoretische Konzeption dazu, genauer zu klären, wie der Bedeutungsbegriff zu explizieren ist, welche Arten von Bedeutungen unterschieden werden müssen, wie man Zugang zu ihnen erhält und auf welche Weise sie sich repräsentieren lassen. Diesbezüglich zeigen sich an der in Lehrbüchern dargestellten lexikalischen Semantik verschiedene Probleme. Für diesen Gegenstandsbereich wurden hauptsächlich zwei theoretische Ansätze entwickelt (vgl. etwa Schwarz und Chur 2001). In der Merkmalssemantik wird der extensionale, auf die jeweilige externe Situation bezogene Aspekt von Wortbedeutungen, der insbesondere für Eigennamen und Pronomina zentral ist, gar nicht thematisiert. Stattdessen unterstellt man, die (sog. intensionale) Bedeutung jedes Worts sei eine Menge von Merkmalen, die anders als objektsprachliche Wörter in Großbuchstaben notiert werden. Dem Wort Mann etwa soll man dann u.a. die Merkmale LEBENDIG, MÄNNLICH und ERWACHSEN zuordnen. Dabei dient z.B. das Merkmal ERWACHSEN einer Abgrenzung der Bedeutung von Mann gegen die Bedeutung von Junge. Bei einer mentalistischen Deutung dieser Merkmale wird davon ausgegangen, sie bildeten Grundkategorien der Perzeption oder Kognition von Menschen. Insofern stellt sich die Frage, wie man zu empirisch begründeten Aussagen über Merkmalszuordnungen gelangt. Hierfür wird die Anwendung eines aber-Tests vorgeschlagen. Dass z.B. der Satz

(4/4a) Peter ist ein Mann, aber nicht erwachsen.

generell ungültig ist, wird dann als Nachweis dafür gewertet, dass ERWACHSEN ein Merkmal von Mann bildet. Genauso gut könnte man fordern, dass der Satz

(4/4b Peter ist ein Mann, also ist er erwachsen.

eine Folgerung darstellt. Diese Formulierung hätte den Vorteil, dass der zentrale Folgerungsbegriff aus der Logik eingeführt und die Kontextabhängigkeit alltagslogischer Folgerungen thematisiert werden könnte. Umgekehrt soll die mögliche Geltung z.B. von

(4/4c) Peter ist ein Mann, aber nicht dick.

oder anders formuliert die Inkorrektheit der Folgerung

(4/4d) P ist ein Mann, also ist er dick.

←170 | 171→

zeigen, dass DICK kein Merkmal von Mann ist. Der aber-und der also-Test sind allerdings mit drei Problemen verbunden. Erstens werden bei ihm semantische Urteile über objektsprachliche Sätze abgefragt und deshalb wäre in Lehrbüchern genauer darzustellen, unter welchen Bedingungen sich solche Urteile auf welcher logischen Grundlage erheben lassen. Zweitens müsste auch der Fall mehrdeutiger Wörter berücksichtigt und insbesondere angegeben werden, wie man den Faktor der Kontextabhängigkeit von Bedeutungen kontrollieren kann. Und drittens wäre zu problematisieren, warum Wortbedeutungen in der lexikalischen Semantik statt durch Merkmale nicht von vornherein – wie in Wörterbüchern – durch objektsprachlich formulierte Folgerungen repräsentiert werden. Immerhin werden die Aussagen der Merkmalssemantik noch um eine wichtige Einsicht aus der Kognitionspsychologie ergänzt. Danach sind für Wortbedeutungen neben den notwendigen oft auch bestimmte prototypische Merkmale bzw. Eigenschaften wichtig, die in unterschiedlichem Grade erfüllt sein können. Situativ zugestandene Abweichungen von diesen Eigenschaften bilden nämlich die Grundlage für das in 2.2.3 diskutierte Vagheitsphänomen.

In einem zweiten theoretischen Ansatz der lexikalischen Semantik werden mithilfe der sog. Sinnrelationen Aussagen über bestimmte semantische Relationen zwischen Wörtern gemacht, also u.a. über Hyponymie, Kohyponymie und Inkompatibilität. Ebenso wie in der Merkmalssemantik fehlen in Darstellungen dieses Ansatzes genauere Hinweise zur Lösung der Probleme bei der Formulierung zugehöriger Tests und zur Wahl einer geeigneten logischen Grundlage. Vielmehr wird der Eindruck erweckt, als könne man die Sinnrelationen ohne Bezug auf andere Theorien definieren. Tatsächlich müsste eine Definition der betreffenden Relationen wieder von der Folgerungsbeziehung der Logik Gebrauch machen und berücksichtigen, dass die Sinnrelationen auf kontextabhängigen Folgerungen beruhen. Z.B. weist schon Lyons (1980: 282) zu Recht darauf hin, dass die Geltung der kontradiktorischen Beziehung zwischen ledig und verheiratet von den Konventionen der jeweiligen Gesellschaft abhängt. Er hätte aber auch anmerken können, dass aus der Aussage x ist ledig nicht generell die Aussage x ist nicht verheiratet folgt, weil ein lediger Mann im übertragenen Sinne mit seinem Hobby verheiratet sein kann. Wegen der Vieldeutigkeit natürlichsprachiger Wörter liegen also wesentlich komplexere Verhältnisse vor, als üblicherweise in Semantiktheorien thematisiert wird, und insbesondere muss man vor der Definition der Sinnrelationen einen geeigneten systemtheoretischen Rahmen für eine Dynamische Semantik formulieren. Davon abgesehen besteht der Nutzen der lexikalischen Semantik u.a. darin, dass sich mithilfe der eingeführten Sinnrelationen sog. semantische Felder definieren lassen, die zeigen, welche Wörter für die Darstellung bestimmter Sachverhalte in der jeweiligen Sprache zur Verfügung stehen. Auf diese Weise wird z.B. deutlich, dass semantische Felder teilweise Lücken haben: So gibt es im Deutschen zwar zu hungrig einen Gegenbegriff, nämlich satt, nicht aber zu durstig.

←171 | 172→

Auch zur Beantwortung der Frage, wie sich aus den Bedeutungen von Wörtern die Bedeutung größerer Einheiten ergibt, haben die Untersuchungen in der linguistischen Semantik relativ wenig beigetragen, sondern man hat dort vor allem von Erkenntnissen aus Logik und Psycholinguistik profitiert. Erwähnenswert ist z.B. die an Resultate der logischen Semantik anschließende linguistische Beobachtung, dass Adjektive A semantisch unterschiedlich auf Nomina N einwirken können. Bei sog. extensionalen Adjektiven ergibt sich die Extension der Verknüpfung von A und N als Durchschnitt aus den Extensionen von A und N. Dagegen erhält man die Intension des Verknüpfungsresultats durch eine Vereinigung der Merkmalsmengen von A und N. Das trifft z.B. für die Kombination jugendlicher Mörder mit dem extensionalen Adjektiv jugendlich zu, nicht aber für mutmaßlicher Mörder, weil es hier um eine Geltungseinschätzung der Zugehörigkeit eines Referenten zur Extension von Mörder geht. Allerdings nimmt nicht jede Verwendung eines extensionalen Adjektivs Einfluss auf die Bestimmung der Extension bzw. des Referenten der zugehörigen Nominalphrase. Das gilt nämlich nicht, wenn das Adjektiv in der jugendliche Mörder nicht restriktiv, also explikativ verwendet wird, um eine Zusatzinformation über einen bereits bekannten Mörder zu geben. Trotzdem gehört die Eigenschaft der Jugendlichkeit auch in diesem Fall zur Intension der Nominalphrase. Daraus ergibt sich insbesondere, dass eine Semantiktheorie sowohl extensionale als auch intensionale Bedeutungen untersuchen muss.

Eine besondere Relevanz hat die Frage, wie sich die Bedeutung elementarer Sätze aus den Bedeutungen der in ihnen vorkommenden Satzglieder zusammensetzt? Diese Frage ist nur unvollständig beantwortet, wenn man wie z.B. Schwarz und Chur (2001: 70ff.) darauf verweist, dass die Valenz von Verben festlegt, mit welcher syntaktischen Art von Satzgliedern sie kombinierbar sind und welche semantische Rolle die Satzglieder dabei einnehmen können. Damit weiß man nämlich noch nicht, welche Informationsstruktur für den jeweiligen Satz gewählt wird. Davon hängt aber wiederum ab, wie die verschiedenen Satzglieder miteinander verknüpft werden und welche Aussagen der Satz macht. Das wurde in Abschnitt 3.4 am Beispiel der Einbindung prädikativ hervorgehobener Satzglieder in die rollensemantische Struktur gezeigt. Daneben können aber noch andere Faktoren darüber entscheiden, welche Sachverhalte sich in Sätzen darstellen lassen. Das belegen folgende Beispiele.

(4/4e) Den Wein kauft der Vater, trinkt aber der Sohn.

(4/4f) Der Vater kauft den Wein, trinkt aber der Sohn.

(4/4g) Der Vater kauft den Wein, trinkt aber das Bier.

(4/4h) Den Wein kauft der Vater, trinkt aber das Bier.

←172 | 173→

Obwohl die semantischen Rollen der Satzglieder in (4/4e) -(4/4f) übereinstimmen, lässt sich mit der Sequenz trinkt aber der Sohn in (4/f) semantisch nicht der Teilsachverhalt den Wein trinkt aber der Sohn darstellen. (4/4f) ist im Unterschied zu den anderen Beispielen auch inakzeptabel. Insofern liegt in (4/4e) -(4/4h) wieder ein Symmetriebruch vor, der erklärt werden muss. Offensichtlich steht das Akkusativ-Objekt den Wein in (4/4f) nicht für eine Verknüpfung mit dem zweiten finiten Verb trinkt zur Verfügung, weil kauft den Wein im ersten Teil von (4/4f) eine starke, z.B. durch schläft substituierbare Konstituente bildet. Dagegen ist in (4/4h) eine Rückanknüpfung von trinkt an das nachgestellte Subjekt im ersten Konstruktionsteil vermutlich deshalb problemlos möglich, weil kauft der Vater in (4/4h) keine starke Konstituente bildet (s. auch Abschnitt 7.4.3).

Alle semantiktheoretisch ambitionierten Ansätze der Linguistik greifen auf Modellvorstellungen der Logik zurück und versuchen, explizite Systeme für die Interpretation von Äußerungen nach dem Kompositionsprinzip zu definieren. Dabei kommt u.a. die wichtige Rolle der extensionalen Seite von Bedeutungen in den Blick. Trotzdem ist es empirisch nicht adäquat, die für eine Modellierung natürlichsprachiger Kommunikation linguistisch erforderliche intensionale und dynamische Semantikkonzeption auf eine extensionale Semantik zurückzuführen. Schon die Kenntnis und Verwendung der Bedeutung z.B. des Worts Affe ist nämlich nicht mit der Fähigkeit gleichzusetzen, in jeder Situation die Menge der von Affe bezeichneten Individuen bestimmen zu können und dann bei einer Rezeption der von einer Person P formulierten Aussage A Er ist ein Affe lediglich die Geltung von A in einer konkreten Situation S dadurch zu überprüfen, ob der Referent R von Er in S zu der betreffenden Menge gehört. Stattdessen führt die Äußerung von A bei Rezipierenden schon zu relativ komplexen Verarbeitungsprozessen. Zunächst wird man anhand seines Wissens über R oder aufgrund einer möglichen Beobachtung von R in S entscheiden, ob R die dem Wort Affe in S primär zuzuordnenden Eigenschaften hat. Wenn sich das nicht entscheiden lässt, kann man sein Wissen je nach Einschätzung der Glaubwürdigkeit von P durch den von A dargestellten Sachverhalt erweitern, die eventuelle Fragwürdigkeit von A vorerst hinnehmen oder P gegenüber eine zugehörige Rückfrage stellen. Im Fall der Geltung von A wird man die Einschätzung von P ggf. bestätigen und den betreffenden Sachverhalt seinem Wissen hinzufügen, falls man ihn erst durch die Beobachtung von R in S erkannt hat. Wenn A dagegen nicht in S gilt, dann gibt es folgende Reaktionsmöglichkeiten. Erstens kann man A verbal anzweifeln oder A explizit widersprechen oder P sogar der Lüge bezichtigen. Zweitens nimmt man die angenommene Inkorrektheit von A vielleicht stillschweigend hin, stuft P aber unausgesprochen als inkompetent oder verlogen ein. Drittens kann die Erwartung der sachlichen Korrektheit von A dazu führen, dass man es für denkbar hält, bei seiner Interpretation von A nicht den von P intendierten Referenten von Er und/oder nicht die von P gemeinte übertragene Bedeutung von Affe ausgewählt zu haben. In diesem Fall wird man entweder eine Rückfrage vom Typ Meinst du? stellen oder A selbst schon so uminterpretieren, dass A bei dieser Bedeutung als wahrscheinlich geltend anzunehmen ist.

←173 | 174→

So einfach das eben diskutierte Interpretationsbeispiel auch ist, so wünschenswert wäre es doch, wenn das Semantikkapitel linguistischer Einführungsbücher dazu genutzt würde, die Komplexität von Verstehensprozessen für Leser/innen transparenter zu machen. Man sollte dazu auch noch interessantere Beispiele analysieren (s. Abschnitt 4.3.3). Prinzipiell ist aber vor einer Entwicklung semantiktheoretischer Ansätze zu klären, welche besonderen semantischen Eigenschaften natürliche Sprachen besitzen, die von vornherein zu berücksichtigen sind, um empirisch angemessene Modellierungen zu ermöglichen. Eine erste solche, im obigen Beispiel nicht erwähnte Eigenschaft besteht darin, dass sich die Bedeutung und grammatische Verwendung von Verbalsequenzen nicht mit den in der Logik betrachteten mehrstelligen Prädikatenkonstanten erfassen lassen, weil Verben nicht auf Relationen zwischen Individuen, sondern auf Handlungen, Prozesse oder Zustände referieren, die mithilfe semantischer Rollen in Beziehung zu den Referenten der anderen Satzglieder gesetzt werden. Zweitens müssten aus systemtheoretischer Sicht in jedem Fall die Mehrdeutigkeit und semantische Flexibilität von Konstituenten und ihrer Verknüpfung sowie die erwartungsgesteuerte Struktur-und Interpretationswahl inkl. der Bedeutungserweiterung durch Inferenzen im Detail erfasst werden. Drittens wäre zu klären, welche Arten mentaler Bedeutungen sich unterscheiden lassen und welche Beziehungen es zwischen ihnen gibt. Diesbezüglich legen psycholinguistische Erkenntnisse nahe, dass gleichermaßen sprach-und vorstellungsnahe Repräsentationen von Sachverhalten anzusetzen sind (vgl. Rickheit et al. 2010: 39). Bisher fehlt m.E. aber ein theoretischer Rahmen, der alle Arten semantisch relevanter Verarbeitungsprozesse erfassen und die zugehörigen Probleme lösbar machen würde.

4.1.4Relevante Untersuchungsaspekte in Pragmatik und Kommunikationsanalyse

←174 | 175→

Aus systemtheoretischer Sicht war es konsequent, mit der expliziten Einbeziehung pragmatischer Fragestellungen in die neuere Linguistik die vorherige Einschränkung auf Untersuchungen der Äußerungseinheit „Satz“ aufzugeben und zunehmend größere kommunikative Einheiten als genuine linguistische Gegenstände zu begreifen. Dabei ist aber nicht nur das Systemverhalten einzelner Teilnehmer/innen zu erforschen, sondern auch die Interaktion von Systemen. Zunächst ergab sich aus der Sprechakttheorie, dass die zu ermittelnden Einheiten von Kommunikationsstrukturen jeweils aus bestimmten aufeinander folgenden Handlungen bestehen. Damit kommt die wichtige Frage nach der pragmatischen Funktion von Äußerungen und nach den unterschiedlichen Aufgaben einer Kommunikation in den Blick. Man muss also in Kommunikationsanalysen bestimmen, welche Sprechhandlungen aufgrund welcher Bedingungen typischerweise mit welchen Äußerungen realisiert werden und welche Regeln für die Abfolge der betreffenden Handlungen gelten. Dieses Ziel zu erreichen, ist theoretisch und methodisch relativ schwierig (vgl. auch Abschnitt 1.2.1). Z. B. sollten alle für Sprechhandlungen vorgeschlagenen Explikationen ggf. noch präzisiert, genauer empirisch überprüft sowie evtl. modifiziert werden. Erschwerend kommt hinzu, dass die Zuordnung von Handlungen zu Äußerungen oft auf komplexen Inferenzprozessen beruhen und dass man für eine Rekonstruktion dieser Prozesse u.a. auch bisher nicht berücksichtigte Ergebnisse aus der Theorie der Alltagsargumentation benötigt (vgl. die Beispiele (1/9) in Abschnitt 1.3 und (3/5n) -(3/5r) in Abschnitt 3.4). Die genannten Erfordernisse lassen sich auch an folgendem, typisch sprechakttheoretischen Beispiel illustrieren.

Es soll vorkommen, dass eine Mutter MU morgens ihrem noch im Bett liegenden Sohn SO zuruft:

(4/4f) Peter, es ist zehn nach sieben!

Das ist oft eine Aufforderung von MU an SO aufzustehen, nämlich u.a. dann, wenn MU annimmt, dass SO bei einem späteren Aufstehen den morgendlichen Schulbus verpassen würde und deshalb zu spät zur Schule käme. Genauer ist mit der Äußerung (4/4f) und ihrer Interpretation wieder eine Anwendung des in Abschnitt 3.4.1 erwähnten Konsequenztopos verbunden, nach dem man Handlungen mit ausschließlich negativen Folgen vermeiden sollte; m.a.W. von solchen Handlungen (und bei (4/4f) von einer Unterlassung) wird abgeraten. Als Erziehungsberechtigte wird MU jedoch nicht bloß den Rat geben aufzustehen, sondern SO sogar dazu auffordern. Zugleich sollte SO bei seiner Entscheidung, aufzustehen oder im Bett zu bleiben, berücksichtigen, dass er bei Nichtbefolgung MUs Aufforderung mit der zusätzlichen negativen Konsequenz rechnen muss, sich den Unmut von MU zuzuziehen. Anders verhält es sich, wenn SO mit der Aussage

(4/4g) Ich muss heute erst zur zweiten Stunde in der Schule sein.

die Aufforderung von MU indirekt zurückweist, weil sich als Folgerung aus (4/4g) ergibt, dass die befürchtete negative Konsequenz eines Zuspätkommens nicht eintritt.

←175 | 176→

Das eben diskutierte Beispiel zeigt schon, warum indirekt formulierte Sprechhandlungen nicht zwangsläufig zu Verständigungsproblemen zwischen den Beteiligten führen. Das lässt sich entweder mit allgemeinen oder gruppenspezifischen Inferenzkonventionen erklären oder damit, dass in vorausgehenden Interaktionen bestimmte Koordinationsprozesse zwischen den Beteiligten stattgefunden haben. Außerdem gibt es zumindest in der mündlichen Kommunikation verschiedene aktualgenetische Verfahren, um sicherzustellen, dass Äußerungen hinreichend ähnlich interpretiert werden. Eines dieser Verfahren besteht darin, dass der/die Sprecher/in einer Äußerung A an den Reaktionen des/der anderen Beteiligten auf A abzulesen versucht, ob A in seinem/ihrem Sinne ‚richtig‘ verstanden wurde. Hätte SU also im Beispielfall auf MU’s Aufforderung hin

(4/4h) Ich steh’ ja gleich auf.

geäußert oder wäre er sofort aufgestanden, dann könnte MU von einem korrekten Verständnis von (4/4f) bei SO ausgehen, weil das Befolgen der Aufforderung oder eine entsprechende Ankündigung regelgerechte Folgehandlungen auf (4/4f) bilden. Dasselbe gilt auch für die Aussage (4/4g), falls MU sie korrekt als Zurückweisung ihrer Annahme eines Unterrichtsbeginns in der ersten Schulstunde interpretiert. Würde SO dagegen z.B. mit der typischen Problematisierung von (4/4f)

(4/4i) Ja und?

reagieren, dann muss MU annehmen, dass SO ein Verstehensproblem hat und (4/4f) noch nicht als Aufforderung interpretiert (oder ‚bockig‘ ist); denkbar ist natürlich auch, dass MU es jetzt für möglich hält, von einer falschen Zeit des Unterrichtsbeginns ausgegangen zu sein, und dass MU eine diesbezügliche Rückfrage stellt. Genereller gilt: Immer wenn mindestens eine/r der Beteiligten vermutet, dass hinsichtlich einer Äußerung ein Verstehensproblem bei ihm/ihr selbst oder bei anderen vorliegt, sollte er/sie ein Reparaturverfahren zwecks Verständigungssicherung einleiten (vgl. Kindt und Rittgeroth 2009).

←176 | 177→

Ein weiterer wichtiger kommunikationsanalytischer Untersuchungsaspekt betrifft die Ermittlung von Makrostrukturen. Diesbezüglich ist in der gesprächs-und textlinguistischen Forschung m.W. nicht bemerkt worden, dass die Anwendung von Gestaltprinzipien eine zentrale Grundlage auch für die Strukturierung größerer Kommunikationseinheiten bildet. Dabei ist eigentlich ersichtlich, dass die sog. Gliederungssignale wie z.B. die erzählspezifische Wortkombination ja und dann in mündlicher Kommunikation nach dem in Abschnitt 3.4.4 und 4.1.2 erwähnten Distanzprinzip insbesondere die Funktion der Abstandsherstellung zwischen bestimmten Textabschnitten besitzen. Sie definieren also eine formale Unterteilung der Kommunikation (vgl. Kindt 1993: 162ff.). Wenn dagegen mehrere aufeinander folgende Sprechhandlungen derselben kommunikativen Teilaufgabe dienen, dann beruht ihre Zusammenfassung zu einer gemeinsamen makrostrukturellen Komponente auf einer Anwendung des Gestaltprinzips der Ähnlichkeit; damit wird also eine funktionale Unterteilung eingeführt, die allerdings manchmal von der formalen abweicht, was in der gesprächsanalytischen Literatur bisher nicht systematisch genug berücksichtigt wurde. Immerhin liegen mittlerweile für verschiedene Kommunikationsgattungen durch Korpusuntersuchungen begründete Vorschläge für zugehörige funktionale Makrostrukturen vor, die besagen, welche obligatorischen und fakultativen Aufgaben üblicherweise in der jeweiligen Gattung durchgeführt werden. Somit bilden diese Vorschläge analog zu den Verhältnissen in der Syntax Hypothesen über den Verarbeitungsschritt der Strukturierung von Kommunikation.

Die Konstruktion einer kommunikativen Makrostruktur z.B. in einem Gespräch basiert natürlich nicht nur auf den Äußerungen eines einzelnen Teilnehmers, sondern sie kommt stets durch eine Interaktion aller Beteiligten zustande. Das gilt sogar in den Fällen, bei denen die jeweilige Struktur von einem oder mehreren Teilnehmern nur durch Formulierung von Rezeptionssignalen oder durch bloßes Schweigen gebilligt wird. Insofern wird in der Gesprächsforschung auch untersucht, welche Teilnehmer/innen für die Durchführung welcher Aufgaben zuständig sind bzw. welche Aufgaben sie übernehmen, um bestimmte kollektive oder individuelle Ziele zu erreichen.

Weil die Diskussion kommunikationsanalytischer Fragen in der vorliegenden Monographie nicht im Vordergrund steht, werden sie jetzt auch nicht ausführlicher behandelt. Nur auf das Thema „Gliederungssignale und Makrostrukturen“ geht Abschnitt 4.3.1 noch einmal ein.

4.2Systemtheoretische Linguistik als sukzessiv zu entwickelndes Paradigma

Der wissenschaftslogische und historische und Rückblick im vorigen Abschnitt sollte exemplarisch skizzieren, inwiefern in etablierten Paradigmen der synchronen Linguistik bereits Systeme untersucht wurden, inwieweit sie Anschlussstellen für eine systemtheoretisch erweiterte Forschungsperspektive liefern, welche ihrer Grundlagenprobleme noch ungelöst sind und welche Fragen man zukünftig beantworten muss. Nachfolgend wird die anvisierte systemtheoretische Linguistikkonzeption in ihren Zielsetzungen und Vorgehensweisen etwas genauer charakterisiert. Dabei geht es weniger um eine prinzipielle Abgrenzung gegenüber anderen Paradigmen als um bestimmte wünschenswerte Modifikationen oder Erweiterungen vorliegender Theorien und Methoden. Das machen zunächst einige allgemeine Ausführungen zu den vier zentralen wissenschaftslogischen Aspekten von Gegenstandsbereich, Fragestellungen und Zielen, Hintergrundtheorien und Methodologie deutlich.

←177 | 178→

4.2.1Zum Gegenstandsbereich

Ein zentrales, auf der Sprachkonzeption von de Saussure (1916) beruhendes Grundlagenproblem der synchronen Linguistik besteht darin, dass vielfach unklar ist, wie man den Bereich der in einem Zeitraum vorfindlichen oder elizitierbaren sprachlichen Äußerungen (parole) und den Aspekt der menschlichen Sprachkompetenz (langue) als gleichermaßen berechtigte Untersuchungsgegenstände in einen eindeutigen Zusammenhang bringt. So wird z.B. manchmal gesagt, ein für die Linguistik spezifisches Dilemma liege darin, dass ihr genuiner Gegenstand nicht die Menge der sprachlichen Äußerungen, sondern der menschliche Sprachbesitz sei, dass man aber trotzdem nur über die Beobachtungen von Äußerungen zu einer Beschreibung dieses Gegenstandes gelangen könne (vgl. Gauger 1976: 17). In ähnlichem Sinne formuliert Dietrich (2004: 460– 61): „Wir sagen nach wie vor, dass die menschliche Sprachfähigkeit das Explicandum der Linguistik ist, nur: heute besteht zudem weithin Konsens darin, dass der Gegenstand der Linguistik immateriell ist, eine Kompetenz eines idealisierten Sprachbenutzers, eine Fähigkeit eines Wesens, das es per definitionem nicht gibt und das auch nicht via Generalisierung von beobachteten Verhaltensreaktionen zu fassen ist“. Letzterem Urteil ist eindeutig zu widersprechen, weil man aus hinreichend vielen Äußerungsbeobachtungen durch logisch kontrollierte induktive Generalisierungen sehr wohl auf eine Sprachkompetenz und die Geltung zugehöriger kommunikativer Regeln und Prinzipen rückschließen kann.

←178 | 179→

Will man das Problem lösen, das mit der langue-parole-bzw. mit der Kompetenz-Performanz-Unterscheidung verbunden ist, dann empfiehlt sich für eine Definition des Gegenstandsbereichs der Linguistik ein gestuftes Vorgehen. Als Gegenstände der synchronen Linguistik sind zunächst alle Leistungen anzusetzen, die von Menschen bei der Produktion oder Rezeption von Äußerungen und Äußerungssequenzen einer zur Untersuchung ausgewählten natürlichen Sprache L innerhalb eines bestimmten Zeitraums T erbracht werden. Dabei wird vorausgesetzt, dass sich die Äußerungen von L zu verschiedenen Zeitpunkten von T höchstens geringfügig in der Verwendung von Wörtern unterscheiden und dass insoweit noch von einer synchronen Betrachtung gesprochen werden kann. Weil aber nur Laut-und Schriftäußerungen als Gegenstände empirisch unmittelbar zugänglich sind, sollten sie in einer ersten Forschungsphase als primäre Untersuchungsobjekte eingestuft und genutzt werden. Nicht jede durch einen Sprecher/innenwechsel oder zeitlich bzw. räumlich abgegrenzte Laut-bzw. Schriftäußerung A, die von einer für L kompetenten Person innerhalb von T produziert wurde, gehört jedoch zwangsläufig L an. A könnte nämlich auch eine nichtkommunikative Äußerung sein, aus einer anderen Sprache stammen oder nicht regulär gebildet sein. Deshalb muss in Zweifelsfällen vor einer endgültigen Einstufung von A als linguistisch relevanter Gegenstand über die Zugehörigkeit von A zu L entschieden werden. Für derartige Entscheidungen greift man in der Linguistik i.Allg. auf die Sprachkompetenz befragter Muttersprachler/innen zurück. Dazu muss allerdings vorher geklärt sein, welche Personen die gewünschte Kompetenz besitzen. Unabhängig davon ist es jedenfalls aus forschungspraktischen Gründen sinnvoll, so wie in der Grammatiktheorie üblich einen rein materialen Sprachbegriff zugrunde zu legen. Deshalb besteht eine erste linguistische Aufgabe darin, ein möglichst großes und für L relevantes Äußerungskorpus zu erstellen und die dort gesammelten mündlichen und schriftlichen Äußerungen und monologisch oder interaktiv realisierten Äußerungssequenzen genauer strukturanalytisch zu untersuchen. Aus den so gewonnenen Ergebnissen lassen sich dann Hypothesen über zugrundeliegende Regeln und Prinzipien ableiten. Dagegen sollte man empirisch nicht unmittelbar zugängliche Prozesse der Sprachverarbeitung und deren systeminterne Inputs oder Outputs im Prinzip erst später ergänzend mit dafür geeigneten Methoden als relevante Gegenstände erforschen.

←179 | 180→

Ein noch nicht angesprochenes Problem der eben dargestellten Vorgehensweise besteht darin, dass man im Fall einer bisher unerforschten Sprache L eine zirkuläre wechselseitige Definition der beiden Konzepte „natürliche Sprache“ und „Muttersprachler/innen“ vermeiden muss. Somit stellt sich die Frage, wie man die Äußerungen von L und L-kompetente Personen zumindest partiell unabhängig voneinander empirisch identifizieren kann. Für eine Beantwortung dieser Frage hilft die Erkenntnis, dass die Verwendung von natürlichen Sprachen jeweils weitgehend an bestimmte Regionen in der Welt gebunden ist und dass man nach theoriendynamischer Auffassung anfangs für die beiden Konzepte keine vollständigen Definitionen benötigt, die also zwar schon einige hinreichende, aber noch nicht alle erforderlichen Definitionsbedingungen enthalten. Deshalb kann zu Beginn von Untersuchungen das Äußerungsverhalten der Bewohner/innen einer geeigneten, geographisch und kulturell eigenständigen Region RE gewählt werden. Dabei lässt sich hier der Einfachheit halber unterstellen, dass die in RE lebenden und aufgewachsenen Personen nicht generell zweisprachig sozialisiert sind. Wenn man nun die Interaktion von Menschen in RE eine längere Zeit beobachtet, dann wird man evtl. bemerken, dass es eine größere Zahl von Äußerungen (bzw. lautlich oder graphisch ähnliche Realisierungen) gibt, die relativ häufig in bestimmten gesellschaftlichen Situationen vorkommen und evtl. zu speziellen verbalen oder nonverbalen Nachfolgereaktionen führen. Äußerungen dieser Art könnten in einer Region, in der Standarditalienisch gesprochen wird, z.B. sein: Buon giorno/Come sta?/Dove abita?/Grazie/Mi scusi. Wenn außerdem sehr viele in RE wohnende und dort (soweit nachweisbar) aufgewachsene Personen eine derartige rekurrent auftretende Äußerung A verwenden, dann darf man annehmen, dass A wahrscheinlich zu der in RE überwiegend verwendeten Muttersprache L gehört. Die Menge aller Äußerungen mit dieser Eigenschaft wird also vermutlich einen relevanten Teilbereich L0 von L bilden. Umgekehrt ist anzunehmen, dass in RE wohnende und aufgewachsene Personen, die jeweils sehr viele Äußerungen aus L0 verwenden oder die entsprechenden Nachfolgereaktionen zeigen, wahrscheinlich L-kompetent sind; ggf. lässt sich diese Annahme noch durch zusätzliche Informationen über die betreffenden Personen absichern.

←180 | 181→

Die beiden durch Angabe hinreichender Bedingungen vorgeschlagenen partiellen Definitionen von L und L-kompetenten Person lassen sich in nachfolgenden Schritten sukzessiv erweitern. Dieses Verfahren soll hier aber nur für die Sprachdefinition skizziert werden. Zunächst ist es zweckmäßig, das bisher für L zugrundegelegte Korpus zu vergrößern, indem man zusätzliche Äußerungen der mutmaßlich L-kompetenten Personen erhebt oder sogar gezielt elizitiert, weil die Zugehörigkeit solcher Äußerungen zu L ohnehin naheliegt. Grundsätzlich kann man vier Arten der Erweiterung unterscheiden. Erstens gehört eine L bisher nicht zugerechnete Äußerung A im Korpus wahrscheinlich auch dann zu L, wenn sie in gleicher oder ähnlicher Realisierung von einer oder mehreren L-kompetenten Personen produziert wurde. Bei nur einem Vorkommen von A sollte diese Annahme evtl. zusätzlich abgesichert werden, weil das Performanzphänomen zu berücksichtigen ist, dass mit A versehentlich eine partiell inkorrekte Äußerung formuliert wurde (s.u.). Zweitens gehören Äußerungen, die vor oder im Anschluss an eine Äußerung von L vorkommen, vermutlich selbst zu L. Drittens lassen sich Äußerungen, deren Zugehörigkeit zu L noch fraglich ist oder zusätzlich gestützt werden soll, ebenfalls L zurechnen, wenn L-kompetente Personen das in Tests überwiegend bejahen. Auf Aussagen in Wörterbüchern kann man sich für Zugehörigkeitsurteile dagegen nicht immer berufen. Z.B. ist der Eintrag on the rocks zwar im deutschen Rechtschreib-DUDEN (2006) zu finden. Daraus folgt jedoch nicht, dass dieser Teil einer Äußerung wie Ich habe einen Martini on the rocks getrunken zum Standarddeutschen gehört. Bei der Anwendung von Zugehörigkeitstests muss man zudem noch den Fall berücksichtigen, dass befragte Personen aufgrund ihrer normativ geprägten Wahrnehmung eine Äußerung A zwar einheitlich für inkorrekt halten, dass sie aber A oder eine dort verwendete problematische Formulierung – ohne es zu merken – selbst oft benutzen. Dann spricht das Rekurrenzkriterium für die Zugehörigkeit von A zu L. Dieser Fall liegt bei manchen syntaktischen Konstruktionen der gesprochenen Sprache vor, z.B. bei Nachfeld-Ausklammerungen 2. Ordnung (s. Abschnitt 7.2). Viertens schließlich wird häufig dafür argumentiert, dass neben den empirisch ermittelten und als i.W. akzeptabel eingestuften auch alle Äußerungen zu L gehören, die man potentiell und im Einklang mit den Regeln der Sprache produzieren kann. Der Gesamtbereich möglicher Äußerungen lässt sich also erst bestimmen, nachdem auf einer theoriendynamisch vorherigen Stufe für einen kleineren Gegenstandsbereich ermittelt wurde, welche Regeln für die Formulierung sprachlicher Äußerungen von L gelten. Das bedeutet aber nicht, dass das Postulat der der generativen Grammatik zutrifft, jede natürliche Sprache bestünde aus potentiell unendlich vielen Sätzen. Denn eine Formulierung von beliebig langen Sätzen ist wegen der jeweils nur begrenzt verfügbaren Kommunikationszeit weder zugelassen noch empirisch möglich. Zudem lässt sich der abgeleitete Gegenstand der Sprachfähigkeit von Menschen als Beherrschung der für die betreffende Sprache einschlägigen Regeln und Prinzipien explizieren und modellieren.

←181 | 182→

Neben Äußerungen und Äußerungssequenzen können einerseits andere direkt beobachtbare systemexterne Inputs und Outputs, also u.a. nonverbale Reaktionen auf Äußerungen, linguistische Untersuchungsgegenstände bilden, wenn sich aus ihnen Rückschlüsse über die Verarbeitung von Äußerungen ziehen lassen. Das trifft z.B. für das Kopfschütteln als einer nonverbalen Reaktion auf eine Frage zu. Zentrale Gegenstände sind andererseits die empirisch nicht unmittelbar zugänglichen Sprachverarbeitungsprozesse mit ihren jeweils zugehörigen systeminternen Inputs und Outputs. Deshalb muss man insbesondere dann einen erweiterten Gegenstandsbereich zugrunde legen, sobald Aussagen über die Bedeutung von Äußerungen gemacht werden sollen. Einen vergleichsweise direkten Zugang zu mentalen Prozessen und Objekten ermöglichen nur psycho-und neurolinguistische Methoden, bei denen man während der Verarbeitung sog. online-Messungen durchführt (vgl. Rickheit et al. 2010: 22f.); auf ihre Aussagekraft und Probleme kann jetzt nicht näher eingegangen werden. Somit stellt sich die Frage: Erhält man auch durch offline-Methoden, also durch Erhebung von Beteiligtenreaktionen nach Verarbeitungsende und durch Strukturanalysen einen indirekten Zugang zu Bedeutungen? Den an einer Kommunikation Beteiligten sind ihre eigenen Verarbeitungsprozesse i.Allg. nicht vollständig bewusst und deshalb können sie oft keine spezifische Auskunft darüber geben. Günstigenfalls erfährt man z.B., dass bei ihnen der Prozess der Interpretation einer Äußerung aus irgendeinem Grund gestört war. Anders verhält es sich, wenn es um die Resultate von Bedeutungszuordnungen geht. Über solche Resultate können Beteiligte zumindest teilweise Aussagen machen. Diese Fähigkeit müssen sie schon deshalb besitzen, weil aus nicht erwartungsgemäßen Zuordnungen Formulierungs-oder Verstehensprobleme resultieren, die speziell in dialogischer Kommunikation oft unmittelbar im Anschluss an die jeweilige problematische Äußerung sprachlich manifestiert und durch Vorschläge für eine partielle Äußerungs-oder Verstehensmodifikation in Reparaturen gelöst werden. Insofern kann man auch aus der Erhebung und Auswertung von Beteiligtenreaktionen bestimmte Rückschlüsse auf semantische Verarbeitungsprozesse und deren systeminternen Resultate ziehen bzw. zugehörige Hypothesen über Regeln und Prinzipien ableiten, mit denen sich diese Prozesse modellieren lassen.

Insgesamt gesehen ist der vorausgehend umrissene Gegenstandsbereich so weit gefasst, dass alle Gegenstände, die bisher in der synchronen Linguistik untersucht wurden, einbezogen sind. Allerdings erfordert die Zielsetzung, aus der Linguistik eine erklärungsorientierte Wissenschaft zu machen, eine stärkere Fokussierung auf die Erforschung von Verarbeitungsprozessen. Das bedeutet, dass die Inkrementalität der Produktion und Rezeption von Äußerungen untersucht wird und dass die prozeduralen Eigenschaften der Äußerungsverarbeitung eine größere Aufmerksamkeit erhalten. Das betrifft in der Grammatikforschung u.a. die Untersuchung von Linksversetzungen im Vorfeld, von Nachfeldkonstruktionen wie Nachträgen, Ausklammerungen und Rechtsversetzungen sowie von Reparaturen und kooperativen Satzproduktionen. Noch dringlicher ist der Übergang zu einer verarbeitungsbezogenen Forschung in der Semantik. Trotz der schrittweisen Durchführung von Äußerungsinterpretationen und ihrer häufig interaktiven Bedeutungskoordinationen werden die zugehörigen Prozesse bisher nicht ausreichend untersucht und damit bleibt in semantiktheoretischen Ansätzen ein wesentlicher empirischer Zugang ungenutzt.

4.2.2Fragestellungen und Ziele

←182 | 183→

Was den zweiten Paradigma-Aspekt anbetrifft, so ist in einer systemtheoretischen Konzeption ein partieller Perspektivenwechsel erforderlich. Der wesentliche Grund für diesen Wechsel liegt in der Zielsetzung, bei jeder sprachbezogenen Untersuchung den empirischen Zusammenhang mit den zugrundeliegenden, für die Produktion oder Rezeption verantwortlichen Systemen zu berücksichtigen. Konkreter gesagt bedeutet das: Wenn in einem grammatiktheoretischen Ansatz für Äußerungen eines bestimmten Typs eine zugehörige syntaktische Struktur postuliert wird, dann sollte sie den Verarbeitungsverfahren und -resultaten von Kommunikationsbeteiligten möglichst gut entsprechen. Diese Bedingung wird oft nicht erfüllt, wie schon exemplarisch gezeigt wurde. Außerdem ist bei verarbeitungsorientierten Analysen aus Produzierenden-und Rezipierendensicht immer zu fragen: Wenn bereits ein Äußerungsstück oder eine Äußerung A1 formuliert wurde, welche Möglichkeiten einer regelgerechten grammatischen Fortsetzung gibt es dann unter den bestehenden Kontextbedingungen? Welche Regel und/oder welches Prinzip liegt der gewählten Äußerungsfortsetzung A2 evtl. zugrunde, auf welche Weise wird A2 mit A1 verknüpft und welche kommunikative Funktion ist damit verbunden? Die Relevanz dieser Fragen soll zunächst an einem einfachen Beispiel illustriert werden, das die in Abschnitt 3.2 und 3.4.1 angesprochene Thematik der sog. Frage-Antwort-Ellipsen wieder aufgreift.

Als Kontext des Beispiels wird angenommen, dass in einer Schulklasse eine Mathematikarbeit geschrieben wurde. Am Ende der Stunde fragt der Lehrer:

(4/4j) Wer fehlt heute mal wieder?

Auf (4/4j) ist eine Antwort erwartbar und sie ließe sich von einem/r Schüler/in oder vom Lehrer geben. Syntaktisch gesehen besteht keine Einschränkung für eine Fortsetzung der Kommunikation, weil (4/4j) einen abgeschlossenen Satz bilden kann. Deshalb wäre z.B. der eigenständige Satz

(4/4k) Das war natürlich Karl.

eine mögliche Antwort auf (4/4j), die zudem im Einklang mit der früher in Schulen postulierten Norm „Sprich in ganzen Sätzen!“ steht. Effizienter ist es aber, (4/4j) nur mit einer Nominalphrase zu beantworten, und z.B. könnte der Lehrer ironisch gemeint sagen:

(4/4l) Mein besonderer Freund Karl.

Sofern auf (4/4l) noch ein Satz folgt oder die Kommunikation danach endet, bilden (4/4j) und (4/4l) nach dem in Abschnitt 3.2 und 3.4.1 erwähnten Kriterium von Bloomfield (1926) zusammen einen Satz, weil mit ihnen eine maximale grammatisch unabhängige Einheit vorliegt. Insbesondere ist (4/4l) eine syntaktisch korrekte Satzfortsetzung von (4/4j), was sich daran erkennen lässt, dass die Antwort (4/4l) eine NP sein und ihr Kasus mit dem des Fragepronomens wer in (4/4j) übereinstimmen muss. Deshalb hängt (4/4l) vom Fragepronomen grammatisch ab. Möglicherweise hat man diesen für die Modellierung von Frage-Antwort-Sequenzen wichtigen Sachverhalt in Grammatiktheorien wegen der fehlenden inkrementellen Untersuchungsperspektive nicht erkannt.

←183 | 184→

Auch die Diskussionen z.B. über Garden-Path-Sätze in Abschnitt 1.3 und über Abweichungen von Standardwortstellungen in Abschnitt 3.3.1 haben die Zweckmäßigkeit verarbeitungsorientierter Äußerungsanalysen gezeigt. Außerdem besteht ein wesentlicher Vorteil solcher Analysen darin, dass man im Zusammenhang mit ihnen zwangsläufig kausale und funktionale Warum-Fragen stellt und zu beantworten versucht. Dagegen wurden solche Fragen in der Linguistik evtl. aufgrund der vorrangigen Beschreibungserfordernisse bisher teilweise ausgeblendet und dadurch kann auch das Interesse an einer Erklärung relevanter kommunikativer Phänomene verloren gegangen sein. Es wäre aber zugunsten einer größeren Attraktivität der Linguistik wünschenswert, wenn solche Phänomene in Zukunft verstärkt untersucht würden und wenn dann auch Lehrbücher häufiger auf entsprechende Erklärungen eingehen könnten. Stattdessen konzentrieren sich die Lerninhalte dort oft auf eine Einführung von Taxonomien, was zwar eine notwendige, aber von Studierenden als eine eher langweilig empfundene Aufgabe von Wissenschaft bildet. Eine stärkere Aufmerksamkeit ließe sich z.B. auf erklärungswürdige Sachverhalte in Morphologie und Syntax des Deutschen wie den folgenden lenken. Welche Ursachen haben die verschiedenen dynamischen Effekte bei Garden-Path-Sätzen? Warum gilt für pronominale Satzglieder statt der Grundabfolge von Dativ-vor Akkusativobjekt im Mittelfeld die umgekehrte Reihenfolge? Warum gibt es so viele mehrdeutige Formen in den Flexionsparadigmata und erschwert das nicht die erforderliche Strukturzuordnung? Wie erklärt sich, dass es zwar Nomina im Maskulinum und im Neutrum mit einer sog. Nullmorphem-Realisierung des Plurals gibt, nicht aber im Femininum? Warum gibt es im Deutschen diskontinuierliche Konstituenten, die in Sätzen wie z.B.

(4/4m) Maria hörte gestern Abend wegen des Anrufs einer französischen Freundin mit dem Schreiben ihres Manuskripts auf.

←184 | 185→

die inkrementelle grammatische Analyse und die Bedeutungszuordnung erschweren? Die Liste solcher Fragen, die in Einführungsbüchern ungestellt und unbeantwortet bleiben, lässt sich leicht verlängern. Zugehörige Antworten würden sich aber oft dadurch finden lassen, dass man nach den verarbeitungstheoretischen Gründen oder Konsequenzen der betreffenden Phänomene sucht. Das wurde für die ersten beiden Fragen schon in Abschnitt 1.3 und 3.3.1 gezeigt. Zur Beantwortung der dritten Frage kann man zeigen, dass eine Desambiguierung mehrdeutiger Flexionsformen für Rezipienten i.Allg. nicht besonders aufwendig ist, weil sie zumeist schon im lokalen Kotext erfolgt (so z.B. bei Nominalphrasen durch die Kombination von bestimmtem Artikel und Nomen). Weiterhin lässt sich der Unterschied in der Pluralbildung von Nomina möglicherweise damit erklären, dass die Mehrdeutigkeit von Nominalphrasen mit Femina-Nomina ohne Pluralendung relativ groß wäre. Z.B. gibt es bei Maskulina wie Esel nur zwei zweideutige Artikel-Nomen-Kombinationen, nämlich der Esel und die Esel. Eine fehlende Pluralendung beim Femininum Sichel würde dagegen zu der dreideutigen Phrase der Sichel und zur vierdeutigen die Sichel führen. Schließlich hängt die Endstellung des Präfixes auf in (4/4m) damit zusammen, dass ein solches Präfix im Deutschen das Ende des Mittelfeldes signalisiert und dass sich bestimmte Satzglieder dann ins Nachfeld verschieben lassen, um die Verarbeitung von Sätzen zu erleichtern. Im speziellen Fall von (4/4m) hat das allerdings den Nachteil, dass Rezipierende in (4/4m) sehr lange auf das Mittelfeldende warten und ihre Bedeutungswahl für hören evtl. revidieren müssen, bis sie dem Verb aufhören am Satzende die vorgesehene Bedeutung zuordnen können. Dieses Problem würde sich aber durch eine Ausklammerung der Präpositionalphrase wegen des Anrufs einer französischen Freundin vermeiden oder verkleinern lassen, wie folgende Variante von (4/4m) zeigt.

(4/4n) Maria hörte gestern Abend mit dem Schreiben ihres Manuskripts auf wegen des Anrufs einer französischen Freundin.

Dagegen ist die Ausklammerung der obligatorischen PP von (4/4m) nur eingeschränkt akzeptabel.

(4/4o) Maria hörte gestern Abend wegen des Anrufs einer französischen Freundin auf mit dem Schreiben ihres Manuskripts.

Allerdings lässt sich eine Aufzählung obligatorischer Ergänzungen gemäß dem Prinzip der „Verlagerung schwerer Glieder“ akzeptabel ausklammern (vgl. Abschnitt 3.3.2. Das belegt

(4/4p) Maria hörte gestern Abend auf mit dem Naschen, mit dem Grübeln und mit dem Schreiben ihres Manuskripts.

←185 | 186→

Insgesamt gesehen könnte eine Beantwortung derartiger Erklärungsfragen zu einer theoretischen und empirischen Horizonterweiterung bei der Linguistik führen und damit das studentische und öffentliche Interesse an ihren Ergebnissen vielleicht erhöhen. Jedenfalls ist geltend zu machen, dass ein expliziter systemtheoretischer Rahmen die Suche nach kausalen und funktionalen Erklärungen für linguistisch beobachtbare Phänomene erleichtert. Grund hierfür ist das Erfordernis, jedes Verhalten eines Systems auf externe Input-Einflüsse und innere Zustandseigenschaften sowie auf zugrundeliegende Systemregularitäten zurückzuführen und auch die möglichen Auswirkungen auf andere Systeme zu ermitteln. Diese Sichtweise führt außerdem dazu, neue Erklärungsfragen zu stellen, die sich nicht so schnell wie die oben genannten beantworten lassen. Weshalb verfügen natürliche Sprachen nur über ein sehr begrenztes Inventar an Phonemen? Weshalb verläuft bei kleinen Kindern die Sprachentwicklung teilweise so unterschiedlich? Warum sind Sätze mit mehrfachen Vergleichen, wie das bekannte Beispiel Karl ist jetzt doppelt so alt wie Fritz war, als Karl so alt war wie Fritz jetzt ist so unverständlich? Zugunsten welcher Funktion wird im Deutschen in unterschiedlicher Weise von Wortstellungsvarianten in Nominalphrasen Gebrauch gemacht, so z.B. bei Die große rote Kugel vs. Die rote große Kugel oder bei Das erste wichtige Argument vs. Das wichtige erste Argument (s. hierzu Abschnitt 6.3). Natürlich lassen sich solche Fragen auch im systemtheoretischen Rahmen nicht immer schnell beantworten. Aber immerhin ermöglicht ein solcher Rahmen eine gezieltere Suche nach den gewünschten Erklärungen, weil der Zwang zu einer Identifikation relevanter Einflussfaktoren in den beteiligten Systemen erhöht ist. Die positiven Konsequenzen dieses Zugzwangs werden in den nachfolgenden Ausführungen durch weitere Modellierungsvorschläge für bestimmte relevante Phänomene konkretisiert.

4.2.3Hintergrundtheorien

Als eine Hintergrundtheorie für die Linguistik kann man eine Theorie bezeichnen, die für die Entwicklung bestimmter linguistischen Theorien und Methoden hilfreich ist und deren Geltung aufgrund ausreichender positiver Erfahrungen in der Herkunftswissenschaft vorausgesetzt werden darf. So gesehen müsste sich die Linguistik aufgrund der Komplexität ihres Gegenstandsbereichs eigentlich explizit auf eine wissenschaftslogische Konzeption für den Aufbau und die empirische Überprüfung von Theorien beziehen, wie sie mit unterschiedlichen Anteilen in der Logik, in der Philosophie und in anderen empirischen Wissenschaften formuliert wird. Das wurde schon an verschiedenen Beispielen plausibel gemacht.

Wichtige kommunikationsspezifische Hintergrundtheorien für die Linguistik aus der Philosophie waren insbesondere semiotiktheoretische Ansätze, die Sprechakttheorie sowie die Theorie der Konversationsmaximen. Diese Theorien sind zugleich Beispiele dafür, dass Hintergrundtheorien kritisch hinterfragt und für linguistische Zwecke weiterentwickelt werden müssen. Ein anderes solches Beispiel bildet die Argumentationstheorie von Toulmin (1957) (s. Kapitel 8).

Anders verhält es sich mit den Theorien, die in der Semantik aus der Logik übernommen wurden. In diesem Fall hätte man im Rahmen einer interdisziplinären Kooperation klären sollen, wie sich bestimmte logische Konzepte an die Erfordernisse einer Modellbildung in der Linguistik geeignet anpassen oder modifizieren lassen. Das betrifft insbesondere die semantischen Konzepte der Situation, der Interpretation, der Geltung und der Folgerung.

←186 | 187→

Eine unmittelbare Grundlage für die hier vorgeschlagene Linguistikkonzeption bildet die allgemeine mathematische Theorie der Input-Output-Systeme. Aus dieser Theorie ergibt sich nämlich eine geeignete forschungsleitende Konzeptualisierung von Kommunikation. Da es in Systemen außerdem um Eigenschaften und Beziehungen von Objekten geht, kann zugleich auf den Beschreibungsrahmen der Mengentheorie und ihres Strukturkonzepts zurückgegriffen werden. Dabei ist es wegen der besonderen Bedeutung von Teil-Ganze-Strukturen in der Linguistik – wie in Abschnitt 2.1.1 erwähnt wurde – zweckmäßig, die übliche Mengentheorie zu erweitern, indem man einerseits nichtextensionale Objekte zulässt und andererseits die Teilmengenbeziehung zu einer mereologischen Teilbeziehung verallgemeinert. Neben der allgemeinen Systemtheorie sind je nach den zu modellierenden Phänomenen ggf. auch spezielle Arten dieser Theorie von Nutzen. So liegt dem in Abschnitt 2.2.3 für Wahrnehmungen und Bedeutungszuordnungen einschlägigen Vagheits-und Hysteresiseffekt eine Trägheitseigenschaft nichtlinearer Systeme zugrunde und deshalb liefert die Theorie dieser Systeme evtl. weitere für die Modellierung von Kommunikation wichtige Resultate. Möglicherweise kommt für eine Behandlung der dynamischen Phänomene bei der Bedeutungskonstitution auch eine Anwendung anderer Systemtheorien wie z.B. der Synergetik infrage. Vor Vermutungen über entsprechende Einsatzmöglichkeiten empfiehlt es sich, verstärkt empirische Untersuchungen durchzuführen, in denen nach charakteristischen Systemeigenschaften wie Multistabilität, Symmetriebruch etc. gesucht wird.

Aus empirischer Perspektive ist davon auszugehen, dass bestimmte Eigenschaften biologischer, psychischer und sozialer Systeme auch für die Sprachproduktion und -rezeption einschlägig sind. Geltend gemacht wurde vorausgehend für einen Rückgriff auf psychologische Theorien schon, dass die Bildung kommunikativer Strukturen teilweise auf bestimmten emotiven Prozessen sowie auf einer Anwendung von Gestaltprinzipien beruht. Nicht eingegangen wird dagegen auf bestimmte systemtheoretisch wichtige sozialpsychologische und soziologische Theorien, weil die von ihnen angesprochenen strukturellen und dynamischen Phänomene hier kein Thema sind. Letztlich ist aber auch auf dem Feld empirischer Theorien immer genau zu prüfen, bei welchen Fragestellungen die Linguistik von welchen Erkenntnissen anderer Disziplinen im Einzelnen profitieren kann.

4.2.4Relevante Methoden

←187 | 188→

Auch auf den vierten und letzten Paradigma-Aspekt soll hier nur kurz eingegangen werden. Für ihn gilt zunächst: Von den bisher in der Linguistik angewendeten Methoden lässt sich weitgehend auch künftig Gebrauch machen; teilweise müssen sie jedoch präzisiert werden, wie die Überlegungen in Abschnitt 4.1.2 exemplarisch gezeigt haben. Eine viel größere Rolle als bisher sollte aber der Einsatz psycho-und neurolinguistischer Verfahren in experimentellen Untersuchungen spielen. Außerdem gibt es besondere Methoden, mit denen sich bestimmte relevante Systemeigenschaften ermitteln lassen. Von ihnen wurde in Abschnitt 3.1 und 3.3 die Suche nach Symmetriebrüchen zur Entdeckung versteckter Variablen genauer dargestellt. Außerdem sollte die in Abschnitt 3.5.1 exemplarisch vorgestellte integrierte Methodenkonzeption zeigen, wie man verschiedene Arten der empirischen Untersuchung und der sukzessiven Theoriebildung miteinander verbinden kann und wie sich z.B. das Problem ‚blinder‘ Hypothesenformulierungen in der Psycholinguistik vermeiden lässt, wenn ihnen Korpusanalysen vorausgehen.

4.3Diskussion typischer Fragestellungen, Ziele und Vorgehensweisen

Aus der vorangegangenen Charakterisierung linguistischer Gegenstände sowie den resultierenden theoretischen und methodischen Überlegungen lassen sich weitere konkrete Fragestellungen, Ziele und Vorgehensweisen einer systemtheoretischen Linguistikkonzeption ableiten. Besonders wichtig ist dabei die Suche nach geeigneten Modellierungsansätzen. Deshalb soll nachfolgend noch einmal anhand bestimmter relevanter linguistischer Phänomene illustriert werden, welche Aufgaben sich für ihre Untersuchung sich ergeben und in welche Richtung sich eine entsprechende empirische Forschung und Theoriebildung entwickeln sollte.

4.3.1Gliederungssignale als effizientes Mittel der Strukturbildung

←188 | 189→

Die Bildung kommunikativer Strukturen ist systemtheoretisch immer aus der Perspektive der Produktion und Rezeption von Äußerungen zu modellieren. Insofern besteht eine zentrale Aufgabe darin zu untersuchen, auf welche Weise Äußerungen von den Kommunikationsbeteiligten selbst auf den unterschiedlichen Ebenen von Äußerungseinheiten strukturiert und welche semantischen und pragmatischen Funktionen den jeweiligen Einheiten zugewiesen werden. Zur Bewältigung dieser Aufgabe gehört in der Rezeption – wie schon in Abschnitt 4.1.4 angesprochen wurde – auch eine Identifizierung der formalen und der funktionsbezogenen Makrostrukturen. Die betreffenden formalen Strukturen werden in schriftlichen Texten in Anwendung des gestalttheoretischen Distanzprinzips u.a. durch eine Absatzbildung hergestellt und in mündlichen Texten i.Allg. mithilfe von Gliederungssignalen, die neben der primären Bedeutung ihrer Wortbestandteile den Anfang oder das Ende bestimmter Kommunikationseinheiten markieren. Formal definierte Einheiten haben generell den Vorteil, dass sie sich bei der Rezeption leicht identifizieren lassen, weshalb sie i.Allg. als Ausgangspunkt für die Strukturbildung genutzt werden. Für viele mündliche Textgattungen muss man aber noch genauer als bisher untersuchen, welche Gliederungssignale für sie typisch sind und welche Beziehungen zwischen den formal definierten und den mit semantischen oder pragmatischen Aufgaben verbundenen Strukturen jeweils bestehen.

←189 | 190→

Zur empirischen Konkretisierung der Strukturierung von mündlicher Kommunikation und der besonderen Rolle von Gliederungssignalen soll an dieser Stelle die zugehörige Situation für Rezipierende noch genauer dargestellt werden. Mündliche Äußerungen lassen sich zwar nach dem Differenz-und dem Distanzprinzip auch dadurch formal voneinander abgrenzen, dass sie prosodisch durch Tonsprünge voneinander abgehoben sind, dass sie in einem durch Pausen unterbrochenen zeitlichen Abstand aufeinander folgen oder dass sie von unterschiedlichen Sprechenden stammen; letzterer Fall geht häufig mit einer stimmlichen Unterscheidbarkeit der jeweiligen Äußerungen einher. Äußerungsintern wird aber von den Mitteln der Strukturierung durch prosodische Differenz oder zeitliche Distanz nicht so systematisch Gebrauch gemacht, dass Rezipierende z.B. immer eindeutig erkennen könnten, ob durch eine Pause eine bestimmte Äußerungseinheit abgeschlossen wird oder ob diese Pause durch einen längeren Planungsprozess bei der Produktion oder durch eine momentane Abgelenktheit des/der Formulierenden o.Ä. bedingt ist. Dieser Umstand erklärt vermutlich teilweise die Nutzung verbaler Gliederungssignale, mit denen längere Textabschnitte oder teilsatzübergreifende Äußerungen voneinander abgegrenzt werden. Das übliche Repertoire zur Bildung von Gliederungssignalen stammt aus unterschiedlichen Vokabularbereichen, deren Elemente primär andere Funktionen haben. Für mündliche Erzählungen gibt es z.B. schwache, aus einzelnen Wörtern bestehende Signale, nämlich Ratifikationssignale wie ja oder gut, Hesitationssignale wie eh oder ähm, Konjunktionen wie und oder aber und Temporalangaben wie dann; dabei behalten Konjunktionen und Temporalangaben stets ihre Bedeutung und ihre syntaktische Funktion als Satzkonjunktion bei. Schwache Gliederungssignale grenzen kleine Texteinheiten voneinander ab. Starke Gliederungssignale sind häufig aus schwachen Signalen wie z.B. ja und dann zusammengesetzt; sie stellen eine größere Distanz zwischen Äußerungseinheiten her und werden deshalb zur Abgrenzung längerer Abschnitte verwendet (vgl. auch Kindt 1991: 160– 162). Neben allgemein verwendbaren Signalen kommen in Erzählungen aber auch gattungsspezifische Gliederungssignale vor; bei ihnen handelt es sich um funktional besonders wichtige Wörter wie z.B. plötzlich zur Anzeige einer Komplikation oder um Phrasen wie z.B. zu allem Unglück zur Anzeige einer Komplikationsverschärfung (so in der Erzählung in Kindt 1991: 164– 165). Der Gebrauch von Gliederungssignalen soll nachfolgend an einer Pannenerzählung aus dem Korpus von Liedtke (1990: 324– 25) illustriert werden, die hier als Wortprotokoll wiedergegeben ist und in der die mehrteiligen Gliederungssignale unterstrichen wurden.

ja gut also ähm als wir unser auto neu gekauft hatten das war ganz spannend weil wir wollten n gebrauchtes auto kaufen das sollte nicht mehr als zweitausend mark kosten naja und denn habn wir und das sollte n großes auto sein und wir haben dann auch n großes auto gefunden und wir haben noch einen kommilitonen von der HfT mitgenommen und äh mit dem habn wir einige annoncen abgefahrn und dann hatten wir n auto gefunden ein ford taunus war das n weißer n kombi der hatte n unheimlich großes handschuhfach und ich fand dieses große handschuhfach so toll und naja das auto selbst das war nicht so gut aber auf jeden fall mußte es dann das auto sein mitm großen handschuhfach n anderes kam nicht mehr in frage naja und denn haben wir durch zufall in delmenhorst beim händler son äh ford taunus mit som großen handschuhfach gefunden für 2000 mark und das war baujahr 70 glaub ich und der hatte noch zwei jahre TÜV naja und denn haben wir den geholt und mit den roten nummernschildern und die sollten wir am nächsten tag wieder hinbringn ja und der wohnte war ja in delmenhorst beziehungsweise wildeshausen der händler naja und auf dem weg von bremen nach äh wildeshausen fing der wagen so an zu ruckeln bei höheren geschwindigkeiten und denn äh sind wir angehalten und ausgestiegen und zur nächsten tankstelle gegangn und wir habn vermutet die benzinpumpe sei kaputt und denn habn wir ne gebrauchte benzinpumpe gekauft und der äh tankwart meinte die wolln sie selbst einbauen und löffelte seine nudelsuppe immer das schaffen sie ja gar nicht naja und wir haben die denn auch eingebaut aber das war nicht der fehler dann sind wir ganz langsam nach wildeshausen gefahrn und habn dem hemd dem händler erzählt dass wir ja eigentlich schon zwei stunden eher da gewesen wärn wenn wir nicht die panne gehabt hätten und da hat er gefragt was ne panne das kann nich sein das reparier ich ihnen noch naja und denn war bei der vorherigen reparatur warn die benzinleitungen äh war n kleines loch reingebrannt worden und deshalb war die kraftstoffversorgung unterbrochen gewesen und das wurde denn repariert und seitdem hatten wir nie mehr ne panne gehabt

←190 | 191→

Abgesehen von der texteinleitenden Signalkombination ja gut also ähm, in der auch das für mündliche Texte typische Anfangssignal also vorkommt, ist naja und denn die einzige in dieser Erzählung vorkommende dreigliedrige Wortsequenz aus dem gängigen Repertoire von Gliederungssignalen. Sie kommt insgesamt fünfmal vollständig vor (einmal mit diskontinuierlich nachgetragenem denn), dreimal verkürzt als und dann bzw. und denn und zweimal verkürzt als und naja bzw. naja und. Die Erzählung wird also deutlich in sechs große Abschnitte untergliedert, die aus inhaltlichen Gründen allerdings unterschiedlich lang ausfallen. Zur weiteren Unterteilung der längeren Abschnitte von ihnen dienen dann die aus nur zwei Wörtern bestehenden Signale. Das Signal und dann bzw. und denn wird seiner Bedeutung entsprechend nur verwendet, wenn das nachfolgend dargestellte Ereignis eindeutig zeitlich später eintritt als das vorausgehende. Genau genommen handelt es sich bei allen Sätzen der Pannenerzählung, die unmittelbar nach einem die Konjunktion und enthaltenden Gliederungssignal anfangen, um Hauptsätze, die einen vorher begonnenen Hauptsatz fortführen. Für die praktische Durchführung der Segmentierungsaufgabe für solche Erzähltexte bedeutet das, dass Rezipierende statt selbständiger Sätze oft sukzessiv die jeweils miteinander verbundenen Teilsätze ermitteln.

←191 | 192→

Auch die zur formalen Untergliederung der Pannenerzählung gehörige funktionale Makrostruktur ist relativ komplex und weicht von der bekannten, aber ohnehin nur teilweise korrekten Unterteilung in Orientierung, Komplikation und Auflösung (vgl. Labov und Waletzky 1967) in verschiedenen Aspekten ab. Der erste Abschnitt dient wie üblich der Formulierung einer Vorausschau, mit der die Darstellung eines spannenden, von dem Erzähler und einer zweiten Person erlebten Geschehens anlässlich eines Gebrauchtwagenkaufs angekündigt wird. Der zweite Abschnitt schildert mit einem ersten Teil der zum Verständnis darzustellenden Vorgeschichte, wie es dazu kam, dass sich der Erzähler wegen des besonders großen Handschuhfachs auf den Kauf eines bestimmten Ford Taunus festlegte. Im kurzen zweiten Teil der Vorgeschichte, also im dritten Abschnitt, wird berichtet, dass die Suche nach dem gewünschten Wagentyp bei einem Autohändler erfolgreich war. Im vierten Abschnitt erfährt man zunächst, dass der Erzähler das betreffende Auto kauft, aber am nächsten Tag mit ihm noch einmal zur Rückgabe von roten Schildern zu dem Händler fahren muss. Auf dieser Fahrt kommt es dann zu einer Komplikation, weil das Auto bei höheren Geschwindigkeiten nicht problemlos funktioniert. Allerdings haben der Erzähler und seine Begleitperson eine Vermutung, wie sich dieses Problem durch den Kauf und Einbau einer gebrauchten Benzinpumpe lösen lässt. Im fünften Abschnitt wird geschildert, dass der entsprechende Problemlösungsversuch zwar misslingt; eine Auflösung des Problems deutet sich aber nach der verzögerten Ankunft beim Autohändler schon dadurch an, dass der Händler verspricht, die erforderliche Reparatur durchzuführen. Im sechsten und letzten Abschnitt wird schließlich als gutes Ende des Geschehens dargestellt, dass die versprochene Reparatur gelingt und dass das Auto auch in der Folgezeit keine Panne mehr hat. Besonders interessant am fünften und sechsten Abschnitt ist zweierlei. Einerseits gibt es hier im Unterschied zu den vorherigen Abschnitten eine gewisse Diskrepanz zwischen der formalen und der funktionalen Makrostruktur, weil der fünfte Abschnitt zuerst den Misserfolg des Einbaus der Benzinpumpe und die negative Folge der verspäteten Ankunft beim Autohändler schildert, zugleich aber schon die Problemauflösung vorwegnimmt, dass der Händler das Auto erfolgreich repariert. Andererseits belegt der sechste Abschnitt, dass Erzählungen auch Argumentationen enthalten können; in diesem Abschnitt wird nämlich erklärt, was die Ursache für die Autopanne war.

Das Phänomen der makrostrukturellen Gliederungssignale lässt sich auf den Bereich formaler Mikrostrukturen verallgemeinern, wenn man fragt, woran Rezipierende jeweils erkennen, dass ein neuer Satz bzw. Teilsatz und in ihm neue Satzkonstituenten beginnen. In schriftlichen Texten bildet natürlich die Interpunktion ein einfaches formales Verfahren zur Abgrenzung und Unterteilung von Sätzen. Insbesondere werden Punkt, Frage-und Ausrufezeichen sowie Semikolon i.Allg. als distanzherstellende Endsignale zwischen selbständigen Sätzen und zugehörigen Sprechhandlungen verwendet. Dagegen dient das Komma als Signal für das Ende von Teilsätzen oder Satzkonstituenten. Zudem weiß man, dass die mit einem Frage-oder Ausrufezeichen endenden Äußerungen pragmatisch vorrangig als Fragehandlungen bzw. als Ausrufe oder Aufforderungen zu interpretieren sind. Insgesamt gesehen gibt es also eine weitgehende Übereinstimmung zwischen formalen und funktionalen Strukturen. In der mündlichen Kommunikation werden zwar – wie erwähnt – teilweise auch Pausen und prosodische Mittel zur formalen Abgrenzung und Unterteilung von Sätzen verwendet; ihre Rollen sind aber weniger eindeutig festgelegt. Deshalb muss es noch andere Gliederungsmittel für gesprochene Äußerungen geben, die sich dann aber auch für die Strukturierung geschriebener Äußerungen verwenden lassen. In dieser Hinsicht ist zunächst klar, dass hypotaktische Konjunktionen und Nebensätze einleitende Pronomina Anfangssignale bilden, weil mit ihnen jeweils neue Teilsätze beginnen. Parataktische Konjunktionen können dagegen auch als Anfangssignale für Satzkonstituenten dienen und deshalb fangen nach ihnen nur teilweise neue Teilsätze an; im positiven Fall handelt es sich bei ihnen aber um Hauptsätze, die im Prinzip auch als selbständige Äußerungen vorkommen könnten. Ausnahmsweise ist in der mündlichen Kommunikation eine mit der Konjunktion und beginnende und einen neuen Gesprächsabschnitt eröffnende Äußerung sogar als eigenständiger Satz einzustufen, falls die Äußerung an ein kommunikativ früher behandeltes Thema anknüpft. Das gilt z.B. für

(4/5a) Und wie war nun deine Fahrt nach Berlin?

←192 | 193→

Hypotaktisch verwendete Konjunktionen und Pronomina bilden dagegen immer dann das Anfangssignal für einen neuen Satz, wenn sich der mit ihnen beginnende Teilsatz nicht mehr mit dem evtl. vorausgehenden Satz verknüpfen lässt. Nun ist jedoch zu vermuten, dass es neben den schon genannten Gliederungssignalen noch andere gibt, mithilfe derer Rezipierende elementare Sätze oder wortübergreifende Konstituenten identifizieren können, wenn sie ein entsprechendes Wissen über die Wortsegmentierung und -kategorisierung besitzen (s. auch Kapitel 6). Tatsächlich sind Determinatoren und Präpositionen typische Anfangssignale von einfachen definiten oder indefiniten Nominal-bzw. Präpositionalphrasen und Nomina dienen oft als Endsignale dieser Phrasen. In solchen Nominalphrasen können aber zwischen Determinator und Nomen auch noch Adjektive liegen und auf die vorangestellte Präposition einer Präpositionalphrase folgt i.Allg. eine einfache Nominalphrase. Unabhängig von ihrer genauen internen Struktur bilden einfache Nominal-und Präpositionalphrasen jedenfalls Satzkonstituenten und befolgen somit das in Abschnitt 3.4.4 und 4.1.2 erwähnte Konvergenzprinzip. Weiterhin ist für die Feldstruktur sogar eindeutig festgelegt, welche Satzteile unter welchen Bedingungen jeweils Anfangs-und Endsignale des Mittelfelds elementarer Sätze bilden. Und zwar fungiert in Hauptsätzen das finite Verb gleichzeitig als Signal für die Einleitung des Mittelfelds; dagegen dient – sofern vorhanden – das letzte infinite Verb oder ggf. das akzentuierbare Präfix als Endsignal des Mittelfelds. Die Signalverhältnisse bei Nebensätzen sind allerdings komplexer. Das einen Nebensatz einleitende Wort bildet nicht nur das Anfangssignal dieses Satzes, sondern auch das Anfangssignal seines Mittelfelds; zudem ist das nachgestellte finite Verb das Mittelfeld-Endsignal. Weiterhin haben die Gliederungssignale von Nebensätzen je nach Position dieser Sätze im übergeordneten Hauptsatz unterschiedliche Funktionen für den Hauptsatz. Besonders oft kommen die beiden Fälle vor, dass ein Nebensatz einem übergeordneten Hauptsatz entweder unmittelbar vorausgeht oder ihm unmittelbar nachfolgt. Im ersten Fall ist das Anfangssignal des Nebensatzes also auch das Anfangssignal des Hauptsatzes. Zugleich endet dann mit dem Nebensatz das Vorfeld des Hauptsatzes und deshalb ist das finite Verb des Nebensatzes zumindest in dem Fall gleichzeitig das Endsignal des Hauptsatz-Vorfelds, wenn der Nebensatz kein Nachfeld besitzt. Eine Ausnahme von diesen Verhältnissen machen nur Konditionalsätze, die ohne einleitende hypotaktische Konjunktion formuliert sind und bei denen das finite Verb in die Nebensatz-Erstposition rückt wie z.B. im Satz

(4/5b) Fährt Maria nach Hamburg, betreut ihre Mutter das Baby.

←193 | 194→

Im zweiten Fall eines nachgestellten Nebensatzes beginnt mit ihm meistens auch das Nachfeld des Hauptsatzes und dann ist das finite Verb des Nebensatzes gleichzeitig das Endsignal des Nebensatz-Mittelfelds und des Hauptsatz-Nachfelds, sofern der Nebensatz selbst kein Nachfeld besitzt. Ein Beispiel für den Fall, dass im Nachfeld eines nachgestellten dass-Nebensatzes ebenfalls ein Nebensatz formuliert wird, ist in der Pannenerzählung in Zeile 19– 20 zu finden.

(4/5c) und habn dem hemd dem händler erzählt dass wir ja eigentlich schon zwei stunden eher da gewesen wärn wenn wir nicht die panne gehabt hätten

Welchen Beitrag zur Strukturbildung das Wissen über die mikrostrukturelle formale Gliederung speziell für die gespochene Sprache leistet, soll jetzt an einigen Sätzen aus der Pannenerzählung veranschaulicht werden. Schon bei ihrem ersten Satz fallen zwei Besonderheiten auf.

(4/5d) als wir unser auto neu gekauft hatten das war ganz spannend weil wir wollten n gebrauchtes auto kaufen

Erstens ist in (4/5d) sofort ersichtlich: Mit der Konjunktion als beginnt ein Nebensatz, sein Mittelfeld endet mit der finit verwendeten Verbform hatten, die Wortsequenz unser Auto ist wegen Einhaltung der Kongruenzbedingungen eine Nominalphrase und aus den übrigen Wörtern lassen sich keine mehrteiligen Phrasen bilden. Allerdings müssen Rezipierende schon über ein ausreichendes valenzgrammatisches Wissen verfügen, um zu erkennen, dass das Pronomen das nicht mehr als Nachfeldbesetzung zur infiniten Verbform gekauft passt und dass der Erzähler entgegen der üblichen Reihenfolgeregeln im anschließenden Hauptsatz statt der Abfolge war das die Abfolge das war wählt. Zweitens muss Rezipierenden für die Verarbeitung des auf den Hauptsatz folgenden Teilsatzes bekannt sein, dass sich die Konjunktion weil in der gesprochenen Sprache ähnlich wie die kausale Version der Konjunktion denn auch parataktisch verwenden lässt. Diese Nutzung von weil erklärt, warum der betreffende Teilsatz in der Hauptsatz-Wortstellung mit einer Vorfeld-Besetzung durch das Pronomen wir formuliert wird und warum die Mittelfeld-Einrahmung durch die finit verwendete Verbform wollten und die infinit verwendete Verbform kaufen syntaktisch korrekt ist. Außerdem kann man auch gestalttheoretisch erklären, warum bei dieser Art der Nutzung der Konjunktion weil üblicherweise eine auffällige Pause zwischen der Konjunktion und dem Vorfeldanfang gemacht wird: Diese Distanz verdeutlicht nämlich, dass die Konjunktion nicht selbst zum nachfolgenden Teilsatz gehört. Schließlich ist erwähnenswert, dass die Sequenz n gebrauchtes Auto als Kandidat für eine Einstufung als Nominalphrase infrage kommt, weil der unbestimmte Artikel ein in der gesprochenen Sprache oft zu n verkürzt wird.

Der nächste für die mikrostrukturelle Gliederung interessante Teilsatz

(4/5e) denn habn wir und das sollte n großes auto sein und wir haben dann auch n großes auto gefunden

←194 | 195→

beginnt am Ende der 2. Zeile mit der Formulierung denn habn wir und er müsste danach eigentlich mit einer zur Valenz von habn passenden Konstituente fortgesetzt werden. Er bricht aber ab und statt seiner wird der ihm vorausgegangene Hauptsatz das sollte nicht mehr als zweitausend mark kosten durch eine parataktische und-Verknüpfung mit dem Hauptsatz das sollte n großes auto sein fortgeführt, um eine wichtige Information über die gewünschten Eigenschaften des zu kaufenden Autos nachzuliefern. Auf letzteren Satz folgt wiederum durch eine parataktische Verknüpfung mit und ein weiterer Hauptsatz, der vermutlich den ursprünglich für den abgebrochenen Satz vorgesehenen Sachverhalt darstellt. Der Satzabbruch selbst ist grammatiktheoretisch aber nicht als syntaktisch inkorrekt einzustufen, weil er – rückwirkend gesehen – den Regeln für den Einschub von Parenthesen an syntaktisch zulässigen Stellen folgt. Das hier vom Erzähler verwendete Reparaturverfahren kann man deshalb eine syntaktische „Überbrückungskonstruktion“ nennen (vgl. Kindt und Rittgeroth 2009: 132). Weitere wichtige, auf der formalen Feldstruktur aufbauende Konstruktionen sind in in Zeile 5, in Zeile 6/7 sowie in Zeile 7/8 zu finden.

(4/5f) ein ford taunus war das n weißer n kombi

(4/5g) das auto selbst das war nicht so gut

(4/5h) auf jeden fall mußte es dann das auto sein mitm großen handschuhfach

←195 | 196→

Das Nachfeld von (4/5f) enthält die beiden Nachträge n weißer und n Kombi, die Nominalphrase das Auto selbst in (4/5g) ist eine der Vorfeldkonstituente das vorausgehende sog. Linksversetzung und die Präpositionalphrase mitm großen handschuhfach bildet im Nachfeld von (4/5h) eine Ausklammerung 2. Ordnung (s. Abschnitt 7.2). Bei einem Vergleich von (4/5f) und (4/5h) fällt auf, dass sich Nachträge und Ausklammerungen auf definite oder auf indefinite Nominalphrasen beziehen können. Damit ist ein wichtiger semantischer Unterschied verbunden. In (4/5f) wird die im Mittelfeld gemachte und bestehenbleibende Aussage durch zwei Zusatzinformationen ergänzt. Dagegen verändert sich die in (4/5h) gemachte Mittelfeld Aussage, weil die Referenzherstellung für das auto im Prinzip revidiert wird; allerdings ergibt sich schon aus dem Kotext von (4/5h), dass es um (das auto mit dem großen handschuhfach)’ geht. Trotzdem wäre zu klären, ob sich dieser Unterschied auch auf die grammatische Struktur von (4/5f) und (4/5h) auswirkt. Und zu (4/5g) ist noch anzumerken, dass man sich in der Literatur über Konstruktionen der gesprochenen Sprache bei Linksversetzungen nicht einig darüber ist, ob diese Konstituente selbst zum Vorfeld oder zu einem sog. Vor-Vorfeld gehört (vgl. Auer 1997: 56f.). Bisher wurde aber m.W. nicht untersucht, ob Linksversetzungen evtl. mit dem jeweils nachfolgenden Pronomen eine gemeinsame Vorfeldkonstituente bilden. Genau das ist nach dem Konvergenzprinzip zu vermuten und auch leicht mit dem Ersetzungstest zu überprüfen. So kann in (4/5g) die Wortsequenz das Auto selbst das ohne Akzeptabilitätsverlust z.B. durch das Pronomen es ersetzt werden und das Umgekehrte gilt z.B. im Satz es hat mir gut gefallen für eine Ersetzung von es durch das Auto selbst das. Insofern ist auch die Wortsequenz das Auto selbst das als eine mithilfe einer appositionsähnlichen Konstruktion gebildete Nominalphrase einzustufen. Allerdings gilt die wechselseitige Substituierbarkeit nur für Testsätze mit einer Erstposition von es und deshalb liegt hier der m.W. linguistisch bislang nicht berücksichtigte Fall einer positionsrestringierten Konstituentenbildung vor.

In Erzählungen kommen natürlich i.Allg. keine Hauptsätze mit einer fehlenden Vorfeldbesetzung, also mit einer Erstposition des finiten Verbs vor. Dieser Fall lässt sich an folgendem Beispiel einer fiktiven, von einem Lehrer an Schüler/innen gerichteten Äußerung A diskutieren, die der Lehrer etwa nach einer längeren Kommunikationspause formuliert. Die mündliche Realisierung von A wird wieder durch eine unsegmentierte Transkription dargestellt.

(4/5i) ichleseeuchjetzteinegeschichtevorkönntihretwasruhigerseinseidjetztbittestill

←196 | 197→

Auf welche Eigenschaften können sich die Schüler/innen bei der – intuitiv beurteilt – grammatisch problemlosen Unterteilung von (4/5i) in drei Sätze stützen? Das Fehlen eines Fragepronomens am Anfang von (4/5i) und die Zweitposition des finiten Verbs lese deuten bereits darauf hin, dass es sich beim ersten Satz um einen Aussagesatz handelt. Bei einer Erstposition des Verbs würde dagegen i.Allg. eine Entscheidungsfrage formuliert. Eine Ausnahme von dieser Regularität liegt aber vor, wenn in einer Äußerung ein leicht ergänzbares pronominales Subjekt fehlt und somit eine Ellipse im strikten Sinne vorliegt. So hätte die in der Pannenerzählung zitierte Aussage des Autohändlers statt das kann nich sein in Zeile 20 genauso gut kann nich sein lauten können (vgl. die in Abschnitt 6.1.1 zitierte Äußerung hat aber nicht funktioniert). Ein mögliches Ende des ersten Satzes von (4/5i) erkennt man am nachgestellten und zu lese passenden Präfix vor; zumindest markiert es das Ende des Mittelfelds. Mit dem nachfolgenden finiten Modalverb könnt kann weder eine koordinative Fortsetzung noch ein Nachfeld des ersten Satzes anfangen. Insofern muss mit diesem Verb ein zweiter Satz beginnen, der wegen des fehlenden Vorfelds entweder einen Frage-oder einen Ausrufesatz bildet. Zwar lässt sich mithilfe des in der 2. Person Plural verwendeten Modalverbs können eigentlich direkt keine Aufforderung, sondern nur eine Frage formulieren. Weil Schüler/innen aber die prinzipielle Fähigkeit besitzen, im Unterricht ruhig zu sein, ist der zweite Satz von (4/5i) eher als indirekte Aufforderung zu interpretieren. Weiterhin muss ein mit einem Modalverb begonnenes Mittelfeld i.Allg. – von ‚umgangssprachlichen‘ Äußerungen wie Ich muss jetzt in die Schule abgesehen – mit einem infiniten Verb enden. Diese Bedingung erfüllt nur das später nachfolgende und entsprechend analysierbare Wort sein. Dass auch der zweite Satz kein Nachfeld besitzt, ist damit zu erklären, dass mit dem auf sein folgenden finiten Verb seid nur ein dritter Satz beginnen kann. Da in ihm kein Subjekt vorkommt, ist er nur als Aufforderung zu verstehen. Schließlich endet der dritte Satz mit dem Wort still, falls (4/5i) nicht mit einer weiteren, eine Kommunikationspause verhindernden Äußerung fortgesetzt wird.

Aus der am Beispiel von (4/5i) erneut illustrierten Einsicht, dass Verben als Gliederungssignale fungieren, resultiert noch eine weitere Erkenntnis, die ebenfalls für die Unterteilung von Äußerungssequenzen in Sätze wichtig ist. Das zeigt eine Analyse z.B. der folgenden schriftlich wiedergegebenen Aussage-Frage-Antwort-Sequenz, mit der sich die Diskussion in Abschnitt 4.2.2 über die grammatische Struktur dialogischer Frage-Antwort-Ellipsen vertiefen lässt.

(4/6a) A1 Maria hat gestern einen langen Brief geschrieben. F1 An wen? A2 An ihren Vater.

←197 | 198→

Die Äußerung A1, die eine Aussage über eine Schreibhandlung von Maria’ macht, lässt sich zwar auch allein als ein kommunikativ selbständiger Satz verwenden. Bei Tilgung von A1 wäre der restliche Teil F1+A2 aber keine akzeptable Äußerungssequenz mehr. Also kann A1 trotz des Punkts am Ende kein Satz in A1+F1+A2 sein. Erst recht sind die Frage F1 nach dem Adressaten des Schreibens und die zugehörige Antwort A2 trotz ihrer Interpunktion keine Sätze in A1+F1+A2, weil ihnen jeweils ein finites Verb fehlt und weil sie deshalb keine eigenständigen Äußerungen bilden. Außerdem hängt F1 grammatisch von A1 ab und A2 von F1 und indirekt von A1. Eine Ersetzung der Verbalsequenz in A1 z.B. durch schläft führt aber zu einer inakzeptablen Äußerungssequenz und ebenso eine Ersetzung von F1 durch Wem. Insofern bildet nur die gesamte Sequenz A1+F1+A2 nach dem Kriterium von Bloomfield (1926) einen Satz, und zwar einen kooperativ produzierten. Die durch den Rederechtswechsel bedingte Unterteilung von A1+F1+A2, die auch durch die Interpunktion unterstützt wird, stimmt dagegen mit der Unterteilung in Sprechhandlungen überein. Dabei ist der grammatische und semantische Rückbezug von F1+A2 auf A1 auch konstitutiv für ein Verständnis der beiden mit F1 und A2 verbundenen Sprechhandlungen. Schließlich muss das in der grammatiktheoretischen Literatur nicht behandelte Problem gelöst werden, durch welche syntaktische Konstruktion F1 mit A1 und A2 mit F1 verknüpft werden. Jedenfalls bilden F1 und A2 wegen des durch das infinite Verb geschrieben abgeschlossenen Mittelfelds von A1+F1+A2 das zugehörige Nachfeld. Wenn man F1 in (4/6a) in die Position zwischen dem Akkusativobjekt einen langen Brief und dem infiniten Verb geschrieben verschiebt, dann entsteht ein Fragesatz, der sich durch A2 beantworten lässt. In diesem Fall muss F1 seriell mit geschrieben valenzverknüpft werden und A2 wegen der Kasusidentität parallel mit F1, so dass eine indirekte serielle Verknüpfung von A2 mit dem infiniten Verb entsteht. Letzteres liegt deshalb nahe, weil die Verknüpfung von F1 und A2 dem Muster einer parallelen Valenzverknüpfung zweier koordinierter Satzglieder folgt. Insgesamt gesehen kann man also annehmen, dass valenzbezogen dieselben Verknüpfungsverhältnisse auch bei einer Position von F1 im Nachfeld von (4/6a) vorliegen. Insofern muss jetzt noch der Konstituentenstatus von F1 und A2 geklärt werden. Zunächst ist nach dem Konvergenzprinzip davon auszugehen, dass F1 und A2 eine gemeinsame Konstituente bilden. Ohne F1 würde es sich bei A2 um die Ausklammerung eines im Mittelfeld noch nicht formulierten Satzglieds handeln. Die Sequenz F1+A2 bildet aber keine Ausklammerung, wie die Inakzeptabilität von

(4/6b) Maria hat gestern einen langen Brief an wen? an ihren Vater geschrieben.

belegt. Grund für diese Inakzeptabilität ist vermutlich der Umstand, dass im Mittelfeld von Sätzen kein Rederechtswechsel zulässig ist. Möglich wäre allenfalls ein Einschub von an wen? als eine selbst adressierte Parenthese, die ausführlicher an wen war das noch? lauten könnte. Dagegen lässt sich F1+A2 in (4/6a) z.B. akzeptabel durch die Präpositionalphrase an die Bank aus dem Satz

(4/6c) Eva hat die 1000 Euro zurückgezahlt an die Bank.

ersetzen und das Umgekehrte gilt für eine Ersetzung von an die Bank in (4/6c) durch F1+A2. Insofern lässt sich F1+A2 als eine positionsrestringierte Nachfeldkonstituente einstufen.

Die bisherige grammatische Analyse von (4/6a) ist noch durch zwei Aussagen zu ergänzen. Erstens lässt sich die Folgerung, dass A2 nur indirekt seriell mit dem infiniten Verb verknüpft wird, wieder zusätzlich mit dem Argument belegen, dass Beispiele wie

(4/6d) Wer schreibt den Brief an die Bank? Ich.

←198 | 199→

trotz Inkongruenz von schreibt und Ich einen korrekten Satz bilden. Zweitens: Weil Fragewörter in derselben Weise wie die zu ihnen korrespondierenden Phrasen grammatisch verknüpft werden, ist ihre Besonderheit i.W. semantisch und pragmatisch begründet. M.a.W. referenzsemantisch bezieht sich z.B. in (4/6d) die Bedeutung des Fragepronomens Wer in einer Situation S auf die Menge M von Personen ansetzen, die für das Schreiben des betreffenden Briefs infrage kommen. Pragmatisch ist mit dem Pronomen dann die Aufforderung verbunden, die Person(en) aus M zu benennen, die besagte Handlung in S durchführt/en. Überdies kann man jetzt die semantische Analyse prädikativ hervorgehobener Konstituenten in Abschnitt 3.4.5 auch für (4/6d) geltend machen. Die Antwort Ich besagt dann nämlich gerade, dass Ich auf ein Element von M referiert.

4.3.2Weitere Funktionen der Nachfeldbesetzung

Nach Darstellung der jeweiligen Möglichkeiten für eine Identifizierung der Feldstruktur von Sätzen wird jetzt auf die Frage eingegangen, welche unterschiedlichen Funktionen die drei Felder haben können. Im Prinzip ist diese Frage natürlich für alle Felder zu untersuchen. Nach einer kurzen allgemeinen Charakterisierung der allgemeinen Funktion von Vor-und Mittelfeld soll aber eine Funktionsanalyse für die Nachfeldbesetzungen im Vordergrund stehen. Insbesondere ist eine solche Analyse noch nicht im Hinblick auf die Informationsstruktur durchgeführt worden. Im Standardfall eines kontextfrei präsentierten elementaren Aussagesatzes ohne besondere Hervorhebungen besteht das Vorfeld aus genau einem Satzglied, das die Rolle des Topiks einnimmt, so dass dann im Mittel-und ggf. im Nachfeld ein Kommentar formuliert wird. Eine Ausnahme von dieser Regularität machen wahrscheinlich schon präpositionale Satzglieder im Vorfeld, die dann zusammen mit dem finiten Verb zum Kommentar gehören (s. Abschnitt 7.4.3). Verdeutlichen lässt sich die Topikfunktion des erstpositionierten Satzglieds in gesprochenen Sätzen auch durch einen fallend-steigenden Akzent. Umgekehrt ist ein steigend-fallender Akzent als Zugehörigkeit dieses Satzglieds zum Kommentar zu deuten und ggf. positionsbedingt als eine besonders starke prädikative Hervorhebung.

←199 | 200→

Für die Positionierung eines oder mehrerer Satzglieder im Nachfeld gibt es verschiedene Gründe. Einer von ihnen basiert nach dem Prinzip der „Verlagerung schwerer Glieder“ auf dem Umstand, dass bei den Konstituenten im Vor-oder Mittelfeld aus grammatik-und verstehenstheoretischen Gründen eine zu große syntaktische Komplexität vermieden werden sollte und dass deshalb die Verschiebung einer oder mehrerer Konstituenten ins Nachfeld zweckmäßig sein kann. Dieser Fall wurde in Abschnitt 4.2.2 mit den drei Beispielen (4/4m) -(4/4o) illustriert. Ein anderer, insbesondere für gesprochene Äußerungen wie (4/5f) und (4/5h) naheliegender Grund für eine Formulierung bestimmter Konstituenten im Nachfeld beruht auf der Inkrementalität des Produktionsprozesses: Im Nachfeld werden dann – ähnlich wie satzübergreifend in Beispiel (4/5e) – wichtige, präzisierende oder korrigierende Informationen nachgeliefert, die während der Äußerung des Nachfelds noch nicht fertig geplant oder für eine Produktion verfügbar waren. Dass die Formulierung von Konstituenten im Voroder Nachfeld auch kommunikationsstrategische Gründe haben kann, ist schon wegen des primacy-und des recency-Effekts naheliegend (vgl. Abschnitt 3.4.2 und 3.4.9). Dieser Vorteil wurde schon in der Figurenlehre der Rhetorik postuliert und er lässt sich zumindest an bestimmten Beispielen plausibel machen. So kann man für die noch nicht illustrierte Konstruktion der sog. Rechtsversetzung bei Sätzen wie

(4/7e) Er war ein genialer Feldherr, der berühmte Alexander der Große.

annehmen, dass die noch fehlende Möglichkeit einer Referenzherstellung für das Pronomen Er eine gewisse Spannung bei Rezipierenden aufbaut, die erst mit der späteren Nachfeldinformation aufgelöst wird. Zugleich verstärkt sich dabei evtl. die positive Bewertung des jetzt explizit genannten Referenten. Auch für das folgende, im Rhetoriklehrbuch von Schlüter (1974: 38) aus dem Schreiben eines Studenten an den Deutschen Bundestag zitierte Ausklammerungsbeispiel lässt sich eine affektive Funktion vermuten.

(4/7f) Ist es demokratisch, daß [] einige Mächtige die Entscheidungen treffen – über den Kopf der Abgeordneten, Mitglieder, Arbeitnehmer und Studenten hinweg?

Das Nachfeld hat aber noch eine andere informationsstrukturelle Funktion. Das belegt das obige Beispiel (4/6a). Endsignale des Mittelfelds zeigen nämlich in Gesprächen die erste korrekte Möglichkeit für eine zumindest temporäre Rederechtsübernahme durch Rezipierende innerhalb des Nachfelds an. Statt der Formulierung einer Rückfrage könnte dort auch eine Fremdreparatur eingeleitet und evtl. durchgeführt oder eine aus Sicht des/der Rezipierenden relevante Zusatzinformation gegeben werden. Umgekehrt versuchen Äußerungsproduzierende manchmal, eine Rederechtsübernahme nach dem Mittelfeld dadurch zu verhindern, dass sie mit einer pronominalen, referenziell noch nicht interpretierbaren Realisierung bestimmter Satzglieder oder mit einer geeigneten prosodischen Gestaltung bereits eine Fortsetzung ihrer Äußerung ankündigen. Auf solche strategischen Aspekte wird hier aber im Unterschied z.B. zur Untersuchung von Uhmann (1993) nicht näher eingegangen. Stattdessen liegt es im Anschluss an die Diskussion über die Nachfeldbesetzung in Beispiel (4/6a) nahe, die Rolle des Nachfelds auch für distributive Satzgliedkoordinationen und Gappingkonstruktionen zu diskutieren, die in der gängigen Literatur über Nachfeld-Konstruktionen nicht ausreichend berücksichtigt werden.

Wenn das zweite Konjunkt einer zweiteiligen Satzgliedkoordination diskontinuierlich positioniert wird, dann liegt es zwangsläufig im Nachfeld, weil nur dort Informationen zu den Referenten/innen von Satzgliedern rückwirkend ergänzt werden können. Das zeigen z.B. folgende Äußerungen.

(4/7g) Maria ist und Karl nach Berlin gefahren.

(4/7h) Maria ist nach und Karl Berlin gefahren.

←200 | 201→

(4/7i) Maria ist nach Berlin und Karl gefahren.

(4/7j) Maria ist nach Berlin gefahren und Karl.

(4/7k) Maria fährt nach Berlin und Karl.

(4/7g) -(4/7i) sind im Unterschied zu (4/7j) und (4/7k) keine Sätze. Insofern bildet und Karl in (4/7k) trotz fehlendem Mittelfeld-Endsignal das Nachfeld von (4/7k); üblich ist in einer mündlichen Version aber eine kurze Sprechpause zwischen Berlin und und. Der Vorteil einer Positionierung von und Karl im Nach-feld besteht darin, dass in (4/7j) und (4/7k) im Gegensatz zur benachbarten Formulierung Maria und Karl die Möglichkeit einer gemeinsamen Fahrt ausgeschlossen wird. Erklärungswürdig ist dann aber, warum diskontinuierliche Koordinationen zwar für infinite, nicht aber für finite Verben möglich sind (vgl. Kindt 2016b: 374).

(4/7l) Maria wandert morgen nach Berlin oder fährt.

(4/7m) Wandern will Maria morgen nach Berlin oder fahren.

Grund für die Inakzeptabilität von (4/7l) ist, dass mit fährt ein zweites finites Verb auftritt. Somit gehört oder fährt nicht mehr zum Nachfeld des vorausgehenden Satzes, sondern kann allenfalls ein zweites koordinativ angeschlossenes Prädikat mit links ausgeklammertem Satzglied Maria bilden und müsste dann z.B. mit nach Potsdam vervollständigt werden.

Etwas andere Verhältnisse liegen bei Gappingkonstruktionen vor. Zwar kann man im Satz

(4/7n) Maria fährt nach Berlin und Karl nach Bonn.

auch nicht erkennen, ob und Karl nach Bonn im Mittel-oder Nachfeld liegt. Eine Mittelfeldposition ist aber möglich und korrekt, wie der Satz

(4/7o) Maria ist nach Berlin und Karl nach Bonn gefahren.

belegt. Die Akzeptabilität von (4/7o) scheint aber etwas geringer zu sein als die mit einer Nachfeldposition von und Karl nach Bonn wie in

(4/7p) Maria ist nach Berlin gefahren und Karl nach Bonn.

Dieser Akzeptabilitätsunterschied lässt sich leicht erklären. Durch die Koordination der parallelen Satzgliedsequenzen zwischen finitem und infinitem Verb in (4/7o) wird nämlich die Verknüpfung der beiden Verbteile erschwert; eine Nachfeldposition des zweiten Konjunkts ist also günstiger. Genereller gilt: Je mehr Satzglieder eine Gappingkonstruktion enthält, desto ungünstiger ist eine Position der koordinierten Satzgliedsequenzen im Mittelfeld. Das belegen folgende Sätze.

←201 | 202→

(4/7q) Maria ist gestern nach Berlin und Karl nach Bonn gefahren.

(4/7r) Maria ist gestern nach Berlin gefahren und Karl nach Bonn.

(4/7s) Maria ist mit der Bahn nach Berlin und Karl mit dem Auto nach Bonn gefahren.

(4/7t) Maria ist mit der Bahn nach Berlin gefahren und Karl mit dem Auto nach Bonn.

Überprüfen sollte man jetzt noch, ob sich derselbe Effekt auch bei Gappingkonstruktionen in Nebensätzen zeigt, die sich im Vor-oder Nachfeld z.B. von Aussagesätzen befinden. Bei Konstruktionen im Nachfeld ist das offensichtlich der Fall.

(4/7u) Ich habe auch schon gehört, dass Maria mit der Bahn nach Berlin und Karl mit dem

Auto nach Bonn gefahren ist.

(4/7v) Ich habe auch schon gehört, dass Maria mit der Bahn nach Berlin gefahren ist und

Karl mit dem Auto nach Bonn.

Immerhin scheint die Akzeptabilitätseinschränkung von (4/7u) geringer zu sein als die von (4/7s) und das lässt sich wahrscheinlich damit erklären, dass die beiden Verbteile ist und gefahren in (4/7u) im Unterschied zu (4/7s) nicht durch die koordinierten Satzgliedsequenzen getrennt werden. Bei Gappingkonstruktionen in Vorfeld-Nebensätzen ergibt sich vermutlich ein anderer Befund.

(4/7v) Dass Maria mit der Bahn nach Berlin und Karl mit dem Auto nach Bonn gefahren

ist, habe ich auch schon gehört.

(4/7w) Dass Maria mit der Bahn nach Berlin gefahren ist und Karl mit dem Auto nach

Bonn, habe ich auch schon gehört.

M.E. ist die Akzeptabilität von (4/7w) sogar etwas geringer als die von (4/7v) und das könnte damit zusammenhängen, dass eine Nachfeldbesetzung bei einem Nebensatz im Vorfeld des Hauptsatzes als ‚störend‘ empfunden wird, weil sie die Verknüpfung des ersten Nebensatzteils mit dem finiten Verb des Hauptsatzes erschwert. Sowohl die Akzeptabilität von (4/7v) als auch die von (4/7w) kann man aber durch Umformulierung zu einer Linksversetzung erhöhen.

(4/7y) Dass Maria mit der Bahn nach Berlin und Karl mit dem Auto nach Bonn gefahren

ist, das habe ich auch schon gehört.

(4/7z) Dass Maria mit der Bahn nach Berlin gefahren ist und Karl mit dem Auto nach

Bonn, das habe ich auch schon gehört.

Insgesamt ergibt sich also, dass auch Satzgliedkoordinationen und Gappingkonstruktionen aus Effizienzgründen von der Möglichkeit einer Nachfeldbesetzung Gebrauch machen.

←202 | 203→

4.3.3Zur Untersuchung dynamischer Aspekte von Sprachverarbeitung

Die Notwendigkeit, einen systemtheoretischen Rahmen zugrunde zu legen, besteht besonders dann, wenn die Dynamik von Sprachverarbeitung erfasst werden soll. Diese Eigenschaft ist in der Linguistik zwar punktuell diskutiert worden, aber als systematisch zu erforschender Gegenstand hat man sie nicht eingeschätzt. Die wünschenswerte Beachtung dynamischer Phänomene fängt schon bei der Untersuchung der Laut-und Buchstabenerkennung an. So könnte selbst in einführenden Linguistikveranstaltungen und -lehrbüchern die interessante Eigenschaft der Kontextabhängigkeit von Zeichenerkennungen behandelt werden (s. Abschnitt 6.1.3).

Immerhin werden in der Phonologie teilweise dynamische Prozesse wie das der Assimilation thematisiert; sie wären aber m.E. ausführlicher zu behandeln. Bekanntlich kann z.B. das Phonem /n/im Wort /sanft/aufgrund einer regressiven Assimilation zum Phonem /m/‚verschoben‘ werden. Aber wie ist dieser Sachverhalt theoretisch einzuordnen und genauer zu erklären? Geht es um eine kontextabhängige Kategorisierung des Lautes [m] in der Wortrealisierung samft als Phonem /n/oder soll diese Realisierung als Allomorph zu /sanft/gelten? Ähnliche Fragen stellen sich auch bei bestimmten Zuordnungen zwischen Graphemen und Phonemen, also etwa beim Phänomen der Auslautverhärtung oder bei der Aussprache der Buchstabenkombination /ch/als [k] z.B. bei der Nominalphrase der Dachs im Unterschied zu des Dachs.

Für die Grammatikforschung gibt es ebenfalls viele interessante und zu modellierende dynamische Phänomene. Z.B. knüpft die Produktion und Rezeption von Äußerungen manchmal grammatisch direkt an Objekte aus der nonverbalen Umgebung an. Ein solcher Fall liegt vor, wenn jemand ein gefülltes Schnapsglas an seine Nase führt und die im strikten Sinne elliptische Aussage

(4/8a) Riecht gut

←203 | 204→

macht. Dabei lässt sich die (4/8a) vorausgehende Handlung des Heranführens des Glases als Akt einer situativen Referenzherstellung auffassen, der die Formulierung etwa der Nominalphrase der Schnaps ersetzt und der die Produktion eines vollständigen Satzes aufgrund der semantischen Verknüpfung von (4/8a) mit dem nonverbalen Referenzakt unnötig macht. Trotzdem ist die Wahl der Verbform dadurch bedingt, dass es um eine Aussage über ein einzelnes Referenzobjekt und nicht über mehrere Objekte geht. Es wäre also syntaktisch inkorrekt gewesen, Riechen gut zu sagen. Grammatiktheoretisch noch relevanter sind Umgebungseinflüsse auf die Wortstellung in Sätzen haben. Das lässt sich z.B. an Bildbeschreibungen nachweisen.

Ein besonders wichtiger systemtheoretischer Modellierungsaspekt ist die schon mehrfach angesprochene Inkrementalität grammatischer Verarbeitung. Die Produktion und Rezeption von Äußerungen basieren auf Verarbeitungsprozessen, die (u.a. wegen der beschränkten Kapazität des Kurzzeit-Gedächtnisses) stückweise vollzogen werden und deshalb das Problem haben, dass die Resultate aufeinanderfolgender Verarbeitungsstücke kompatibel gemacht werden müssen. Die Inkrementalität der grammatischen Verarbeitung führt insbesondere deshalb zu Problemen, weil man bei der Rezeption vielfach nichtmonotone Schlüsse hinsichtlich der grammatischen Strukturbildung zieht, deren Resultate möglicherweise rückgängig gemacht werden müssen. Das wurde in Abschnitt 1.2.3 bereits hinreichend an Garden-Path-Sätzen demonstriert. Einen weiteren Beleg hierfür liefert z.B. der in Abschnitt 6.2.2 noch genauer untersuchte Satz

(4/8b) Der See ist nicht zu trauen.

Bei ihm muss eine mögliche anfängliche Einstufung von der See als Nominativ-Nominalphrase und als Subjekt nach der Rezeption von zu trauen revidiert werden. Aber auch für die grammatische Verarbeitung bei der Äußerungsproduktion ist eine Berücksichtigung der Inkrementalität von entscheidender Bedeutung. Es gibt nämlich eine Reihe von grammatischen Konstruktionen, deren Produktion sich nur dann adäquat erfassen lässt, wenn man ihren inkrementellen Vollzug berücksichtigt. Besonders deutlich wird das bei Reparaturkonstruktionen, die entgegen dem ersten Anschein auch bestimmten grammatischen Regeln folgen (vgl. etwa Eikmeyer et al. 1995: 135 ff.). Außerdem werden diese Konstruktionen in Gesprächen oft kooperativ durchgeführt. Theoretisch bedeutet das, dass man bei der Modellbildung von interagierenden Verarbeitungssystemen der Beteiligten ausgehen muss, die während der gemeinsamen Satzproduktion ihre Rollen tauschen können, d.h. ein Produzent wird zum Rezipienten und umgekehrt. Empirisch vollzieht sich eine solche Interaktion zwischen zwei Personen P1 und P2 z.B. folgendermaßen.

(4/8c) P1: Und dann nimmst du das ähm die andere gelbe Schraube und das andere oran

gene Teil und schraubst die noch mal zusammen also an dem

P2: an dem zweiten

P1: an dem zweiten genau

←204 | 205→

In diesem Beispiel einer Montageanweisung (vgl. Kindt und Rittgeroth 2009: 150) antizipiert P2, wie der Satz von P1 fortzusetzen ist, und die sachliche Korrektheit seines Formulierungsvorschlags wird anschließend von P1 bestätigt. Kooperative Satzproduktionen kommen aber auch unabhängig von Reparaturen vor, wie schon für Frage-Antwort-Sequenzen gezeigt wurde (so für (4/6a) in Abschnitt 4.3.1). Insofern ist eine theoretische und empirische Erweiterung der bisher i.W. nur die monologische Kommunikation erfassenden Grammatikmodelle wünschenswert.

Grundsätzlich muss man bei einer systemtheoretischen Modellierung immer mit Wechselwirkungen zwischen den Verarbeitungsresultaten unterschiedlicher sprachlicher bzw. kommunikativer Ebenen rechnen. Was dabei die Wechselwirkungen zwischen Syntax und Semantik betrifft, so hat nicht nur die syntaktische Verarbeitung einen entscheidenden Einfluss auf Bedeutungszuordnungen. Auch das Umgekehrte kann zutreffen, wie in Abschnitt 1.2.3 am Vergleich der Sätze (1/2a) -(1/2b) und ihren unterschiedlichen Segmentierungen des Kompositums Wachstube demonstriert wurde. Genereller gilt: Alle Arten syntaktischer Ambiguitäten lassen sich evtl. durch geeignete semantische Informationen auflösen und grammatische Modelle sollte deshalb ein Verarbeitungsteilsystem enthalten, das entsprechende Desambiguierungen ermöglicht. Im Fall von z.B. (1/2a) würde ein solches System in seiner Lexikonkomponente die Information enthalten, dass das Wort Wachstube zwei verschiedene Bedeutungen besitzt, die mit unterschiedlichen Zerlegungen Wach-stube vs. Wachs-tube einhergehen. Zudem sollte dem Lexikon zu entnehmen sein, dass das zum Verb betreten gehörige Akkusativobjekt entweder auf einen Raum oder eine Fläche referiert. Schließlich würde sich ergeben, dass das Akkusativobjekt die Wachstube in Kombination mit betreten die zu Wach-stube gehörige Bedeutung haben muss, weil sein Referent ein Raum ist.

←205 | 206→

In noch stärkerem Maße als für die Syntax gilt für die Semantik, dass eine Modellierung der Dynamik von Sprachverarbeitung notwendig ist. So kann z.B. oft nicht unberücksichtigt bleiben, dass in einer dialogischen Kommunikation im Prinzip beide Interaktionspartner an der Zuordnung gemeinsamer Äußerungsbedeutungen mitwirken. Um diesen Sachverhalt zu erfassen, sind aber die zugehörigen interaktiven Verfahren der Verständigungsherstellung und -sicherung zu untersuchen und in die Modellierung einzubeziehen (vgl. Kindt und Rittgeroth 2009). Ein weiterer, zentraler Untersuchungsaspekt betrifft das Zusammenspiel von Sprachverarbeitung und Wahrnehmung. Die Prozesse der konzeptuellen Interpretation sollten nämlich nicht unabhängig von den Sachverhalten modelliert werden, die Kommunikationsbeteiligte gleichzeitig in ihrer Umwelt wahrnehmen. Umgekehrt basiert die Zuordnung extensionaler Bedeutungen maßgeblich auf den jeweiligen Resultaten der konzeptuellen Sprachverarbeitung. Aber selbst in den Fällen, bei denen Umgebungseinflüsse keine unmittelbare Rolle für die Bedeutungskonstitution spielen, steht die Semantikforschung vor der Aufgabe, die verschiedenen, während einer inkrementellen Rezeption stattfindenden und sich oft wechselseitig beeinflussenden Verarbeitungsprozesse zu modellieren. Dass die diesen Prozessen zugrundeliegenden semantischen Regeln und Prinzipien genauer und teilweise im Zusammenhang mit sprechakttheoretischen Fragen erforscht werden müssen, lässt sich gut am Beispiel eines früheren Anti-Alkohol-Slogans demonstrieren, der jetzt im Detail darauf hin analysiert werden soll, wie seine Interpretation zustande kommt.

(4/8d) Nur Flaschen müssen immer voll sein.

In (4/8d) sind die beiden Wörter Flaschen und voll doppeldeutig, so dass im Prinzip vier Lesarten unterschieden werden müssen. Sogar ohne das Wissen, dass der Satz (4/8d) ursprünglich einer Antialkoholkampagne diente, interpretieren Versuchspersonen ihn nach dem Ergebnis einer informellen Befragung so, dass sie sowohl für Flaschen als auch für voll jeweils die übertragene Bedeutung auswählen. Wie lässt sich das erklären? Einerseits scheiden zwei der vier Lesarten wegen eines Kategorienfehlers aus: Von einer Flasche’ im wörtlichen Sinne kann man nämlich bei Wahl der übertragenen Bedeutung nicht ohne weiteres prädizieren, dass sie betrunken sei, und umgekehrt passt zu einer Flasche’ im übertragenen Sinne nicht die wörtlich gemeinte Bedeutung von voll. Andererseits ist auch der Sachverhalt falsch, der in (4/8d) bei der Lesart mit den wörtlichen Bedeutungen von Flaschen und voll als generell geltend behauptet wird. Deshalb wählen Rezipierende die Interpretation von (4/8d) mit den übertragenen Bedeutungen. Diese Wahl ist wahrscheinlich dadurch begründet, dass (4/8d) eine Regularität formuliert, die den Normen der heutigen Gesellschaft entspricht. Zugleich ergibt sich aus (4/8d) inferenziell die semantisch implizite Warnung davor, ständig im Übermaß Alkohol zu trinken: Wer das tut, der muss wegen dieser Regularität mit der negativen Konsequenz rechnen, als ‚Flasche‘ eingestuft zu werden. Will man das vermeiden, sollte man also auf einen übermäßigen Alkoholgenuss verzichten.

←206 | 207→

Natürlich gibt es auch Kommunikationssituationen, in denen für (4/8d) die sog. wortwörtliche Lesart gewählt wird. Z.B. könnte eine Person P1 (4/8d) äußern, wenn eine Person P2 nach dem Öffnen einer Bierdose in Anwesenheit von P1 moniert, dass die Dose erheblich weniger Bier enthält, als es die Dosengröße erwarten lässt. Bei diesem Beispiel ist klar, dass P1 und P2 (4/8d) in der Lesart mit den wörtlichen Bedeutungen von Flaschen und voll interpretieren. Trotzdem muss wieder nach der Geltung der in (4/8d) behaupteten Regularität gefragt werden. Offensichtlich weist P1 mit (4/8d) indirekt darauf hin, dass das von P2 beklagte Problem bei in Flaschen abgefüllten Getränken nicht entsteht und dass Flaschen deshalb voll’ sind, weil man als Kunde/in sonst die unzureichende Flaschenfüllung erkennen und das betreffende Getränk evtl. nicht kaufen würde. Diese Begründung für die Geltung und Erklärung der betreffenden Regularität müssen Rezipierende allerdings mithilfe ihres Weltwissens über die verschiedenen Transparenzeigenschaften von Glas und Metall sowie über die gängigen Strategien der Gewinnmaximierung von Firmen inferieren.

Entgegen dem ersten Anschein ist es also auch bei Sätzen wie (4/8d) möglich zu erklären, welche Regeln und Prinzipien der Konstruktion von Äußerungsbedeutungen zugrunde liegen. Zwar zeigt die bisherige Analyse schon, dass die zu treffenden Interpretationsentscheidungen auf speziellen Wissensvoraussetzungen und relativ komplexen Schlussprozessen beruhen. Aber offensichtlich gibt es nur eine begrenzte Zahl einheitlicher und immer wieder anzuwendender Prinzipien, durch die die erforderlichen Entscheidungen bestimmt werden. Bei Satz (4/8d) sorgt insbesondere die Erwartung der Zuordnung eines plausiblen Sachverhalts zu (4/8d) zunächst für eine Entscheidung zwischen zwei konkurrierenden Interpretationen. Diese Erwartung hat Grice (1975) – wie in Abschnitt 1.2.3 erwähnt – unter dem Namen „Maxime der Qualität“ als zentrales Konversationsprinzip geltend gemacht, das in der linguistischen Pragmatik als Ansatz zur Bedeutungsfindung aufgriffen wurde. Noch wenig berücksichtigt ist in der Linguistik aber, dass zusätzlich spezifische Schlussregeln wie der in Abschnitt 1.2.3 und 4.1.4 für Analysen herangezogene Konsequenztopos als Grundlage für die jeweiligen Inferenzprozesse benötigt werden. Bei Satz (4/8d) lässt sich das in zweifacher Weise belegen. Erstens wird dieser Topos bei der Lesart von (4/8d) mit den übertragenen Wortbedeutungen zur Begründung der impliziten Warnung verwendet. Zweitens ist er bei der Lesart mit den wörtlichen Bedeutungen für die Begründung der formulierten Regularität und für die Erklärung des Verhaltens der Getränkefirmen erforderlich.

←207 | 208→

Wenn man den Konversationsmaximen-Ansatz zu einer systematischen Modellierung und Erklärung interpretationsdynamischer Prozesse heranziehen möchte, muss er noch präzisiert, revidiert und ergänzt werden (vgl. Kindt 2010: 101ff.). Dann eignet er sich auch für eine weiter vertiefte Analyse von (4/8d). So benötigt man von der Maxime der Quantität nur den Teil, der verlangt, dass in Äußerungen die jeweils erforderlichen Informationen gegeben werden; diesen Maximenteil kann man „Vollständigkeitserwartung“ nennen. Mit dieser Erwartung wird u.a. erklärbar, warum sich Rezipierende überhaupt veranlasst sehen, bedeutungserweiternde Inferenzen zu ziehen. Sie tun das nämlich dann, wenn Äußerungen als semantisch nicht vollständig genug formuliert erscheinen. Bei der Lesart von (4/8d) mit den übertragenen Wortbedeutungen gibt es vermutlich zwei Anlässe für die Lesart einer Warnung. Erstens fragen sich Rezipierende evtl., was mit der Äußerung von (4/8d) bezweckt wird. Zweitens deutet die Formulierung einer Regularität generell darauf hin, dass eine unvollständig verbalisierte Argumentation vorliegt, die geeignet ergänzt werden sollte. Speziell bei Konstellationen, die Inferenzen mit dem Schlussmuster des Konsequenztopos nahelegen, sind Kommunikationsbeteiligte sehr erfahren, weil seine Nutzung schon im Kindesalter eingeübt wird. Dies erklärt, warum es Rezipierenden leichtfällt, (4/8d) als Warnung zu interpretieren. Weiterhin regt die Vollständigkeitserwartung auch bei der zur Flaschenabfüllung von Getränkefirmen passenden Lesart von (4/8d) eine Inferenzbildung an. In diesem Fall ist (4/8d) zunächst durch den noch unverständlichen Sachverhalt zu ergänzen, dass in Getränkefirmen Dosen nicht vollgefüllt werden. In diesem Sinne bildet (4/8d) aber eine noch unbefriedigende Erklärung für den geringen Inhalt in Bierdosen und dieser Verstoß gegen die Vollständigkeitserwartung lässt sich anschließend dadurch beheben, dass die schon genannte Firmenstrategie einer Gewinnmaximierung als mutmaßliche ‚tiefere‘ Erklärung inferiert wird. Auch diese Erklärung basiert wieder auf einer Anwendung des Konsequenztopos, weil die vollständige Füllung von Flaschen mit der Vermeidung einer negativen und die unvollständige Füllung von Dosen mit einer positiven Konsequenz für die Getränkefirmen erklärt wird.

←208 | 209→

Stellt man abschließend die Frage, wie sich dynamikbezogene Modelle in der Pragmatik außerhalb der gemeinsam mit der Semantik zu erforschenden Sprechaktinterpretation entwickeln lassen, so dürfte klar sein, dass es in solchen Modellen zunächst um eine Erfassung regulärer Verläufe der kommunikativen Handlungen von Interaktionsbeteiligten in bestimmten Kontexten geht. Hierzu bedarf es einer angemessenen Explikation des Handlungsbegriffs. Präzisiert werden muss dann u.a. die noch vage Unterteilung von Sprechhandlungen in solche, bei denen eine Anpassung von Sprache an die Welt stattfindet, und in solche mit der umgekehrten Anpassungsrichtung (vgl. etwa Rolf 1997: 17). Wie schon in Abschnitt 1.2.1 exemplarisch dargestellt wurde, ist deshalb im Prinzip für jede Sprechhandlung zu klären, bei welchen der beteiligten Systeme durch eine bestimmte Handlung in welcher Weise Zustände verändert werden. Erst auf dieser Grundlage lassen sich anschließend einschlägige Fragestellungen der Art untersuchen, in welchen Situationen bei welcher Kommunikationsgattung an welcher makrostrukturellen Position üblicherweise welche sprachlichen Handlungen mit welchen sprachlichen Mitteln zu welchem kommunikativen Ziel durchgeführt werden. Entsprechende Forschungsergebnisse werden u.a. benötigt, um dynamische Effekte bei der Makrostrukturbildung oder um den Einfluss dieser Strukturen auf Äußerungsinterpretationen zu erfassen. Als Beispiel für die Behandlung einer solchen Frage konnte in Abschnitt 1.1 schon die Diskussion darüber gelten, welche Funktion das Schlusswort einer Rede von Oskar Lafontaine auf einem SPD-Parteitag hatte. Hier war einerseits die makrostrukturelle Kontextinformation wichtig, dass die Schlussworte von politischen Beratungsreden häufig einem Aufruf zum Handeln dienen. Andererseits hatte Lafontaine an dieser Stelle statt eines solchen Aufrufs nur eine bestimmte Gesetzmäßigkeit formuliert. Insofern war anzunehmen, dass die Parteitagsdelegierten selbst eine Lafontaine genehme, ihnen aber nicht vollständig bewusste Schlussfolgerung hinsichtlich ihres zukünftigen Handelns, nämlich der Wahl von Lafontaine zum Parteivorsitzenden, ziehen sollten.