Show Less
Restricted access

Pragmantax II

Zum aktuellen Stand der Linguistik und ihrer Teildisziplinen- Akten des 43. Linguistischen Kolloquiums in Magdeburg 2008- The Present State of Linguistics and its Sub-Disciplines- Proceedings of the 43 rd Linguistics Colloquium, Magdeburg

Series:

Edited By Katrin Schöpe, Renate Belentschikow, Angelika Bergien and Armin Burkhardt

Dieser Band vereinigt 63 Beiträge in deutscher, englischer und französischer Sprache. Er repräsentiert ein breites Spektrum an Themen und Erkenntnissen aus verschiedenen Bereichen der Linguistik und versucht damit eine kritische Bestandsaufnahme des Faches. Die Beiträge widmen sich Fragestellungen aus den Gebieten der Grammatik, Semantik, Text- und Diskurspragmatik sowie der Angewandten Linguistik. Aufsätze zur kontrastiven Linguistik und zur Fremdsprachendidaktik runden den Band ab.
This volume contains the revised versions of 63 papers, written in German, English and French. It considers a broad spectrum of topics and findings from various areas of linguistics and thereby offers a critical review of the field. The authors address questions ranging from grammar, semantics, text and discourse pragmatics to issues from the field of applied linguistics. The volume is concluded by studies on contrastive linguistics and foreign language pedagogy.
Show Summary Details
Restricted access

Der Backtranslation-Score: Automatische Evaluierung maschineller Übersetzungen ohne manuell übersetzte Vergleichstexte

Extract



Reinhard Rapp, Marseille

1 Einführung

Da die manuelle Bewertung der Ergebnisse maschineller Übersetzungssysteme subjektiv und mit viel Aufwand verbunden ist, haben sich ergänzend automatische Verfahren etabliert, die eine maschinell angefertigte Übersetzung mit einer Humanübersetzung vergleichen. Dies geschieht durch Bestimmung der Anzahl der übereinstimmenden Wörter und Wortfolgen. Für diese Verfahren, von denen das bekannteste der BLEU-Score ist (Papineni et al. 2002), wurde unter bestimmten (und in der Praxis häufig gegebenen) Voraussetzungen eine recht gute Übereinstimmung mit manuellen Evaluierungsergebnissen gezeigt (Papineni et al. 2002, Coughlin 2003, Koehn/Monz 2006).

Die Arbeitsweise solcher Verfahren sei beispielhaft anhand des BLEU-Scores gezeigt. Für jeden vom maschinellen System übersetzten Satz wird ausgezählt, wie viele der darin enthaltenen Wörter und Wortfolgen der Längen 1 bis N auch in einer als Referenz verwendeten Humanübersetzung vorkommen. Anschließend wird für jede Länge der Quotient aus der Anzahl der gefundenen Wortfolgen dieser Länge zur Gesamtzahl der in der maschinellen Übersetzung vorhandenen Wortfolgen derselben Länge berechnet. Die erhaltenen N Werte werden nach Papineni et al. (2002) mittels folgender Formel zum BLEU-Score zusammengefasst:

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.