Show Less

Syntaktisch-semantisches Parsing des Italienischen

Implementierung unter Berücksichtigung von Korpusdaten

Carsten Weber

Die Computerlinguistik als interdisziplinäres Forschungsgebiet zwischen Sprachwissenschaft und Informatik legt sowohl Wert auf eine fundierte sprachwissenschaftliche Theorie als auch auf eine effiziente Implementierung. Das Programm LA-it hat zum Ziel, beiden Teilgebieten im Rahmen eines automatischen Syntaxparsers gerecht zu werden, indem es sprachliche Phänomene des Italienischen maschinell verarbeitet. Im theoretischen Teil der Arbeit werden computerlinguistische Grundlagen und der Stand der Forschung näher betrachtet. Die praktische Komponente befasst sich mit morphologischen, syntaktischen und semantischen Konstruktionen, die innerhalb des Syntaxparsers implementiert sind. In einem Evaluationsteil werden sowohl quantitative als auch qualitative Analysen vollzogen.

Prices

Show Summary Details
Restricted access

5 LA-Hear

Extract

Die Implementierung der syntaktisch-semantischen Analyse des Italienischen ist mit JSLIM umgesetzt, dessen Komponenten in Abschnitt 2.3 eingefu¨hrt sind. Innerhalb des Parsers eignet sich die Komponente LA-Hear fu¨r syntaktisch- semantische Analysen. Die Bestandteile von LA-Hear sind Inhalt dieses Kapi- tels. Abschnitt 5.1 beschreibt, welche Typen von Dateien Voraussetzung fu¨r eine lauffa¨hige Grammatik sind. Es sind weiterhin die Funktionsweise und der allge- meine Aufbau der einzelnen Dateien erkla¨rt. Abschnitt 5.2 befasst sich mit den Dateien, die nur zu Beginn des Projekts LA-it erstellt werden mu¨ssen und fu¨r den gesamten weiteren Verlauf gu¨ltig sind. Zudem wird eine allgemeine abstrakte Schreibweise fu¨r Regeln und syntaktisch-semantische Ableitungen definiert. 5.1 Bestandteile Eine Grammatik fu¨r syntaktisch-semantische Analysen besteht aus verschiedenen Typen von Dateien: • Projektdatei (Endung .pro) • Attributdatei (Endung .att) • Operationsdatei (Endung .ops) • Variablendatei (Endung .var) • Regeldatei (Endung .rul) • Lexikondatei (Endung .lex) Jede Datei in LA-it hat hierbei eine spezielle Dateiendung. Die einzelnen Typen von Dateien sind im Folgenden erla¨utert. 74 5.1.1 Projektdatei In der Projektdatei sind alle fu¨r das Projekt relevanten Dateien mittels relativer Pfadangaben eingebunden. Weiterhin ist angegeben, welche Dateien im Bereich der Komponenten LA-Morph (nach dem Schlu¨sselwort lamorph) und LA-Hear (nach dem Schlu¨sselwort lahear) angesiedelt sind. 5.1.2 Attributdatei Die Attributdatei listet die fu¨r die Proplets notwendigen Attribute mit ihren jeweiligen Datentypen auf. Als Datentypen sind Zeichenketten (string), Listen (list), Kombinationstabellen (table), Hash-Tabellen (map) und Ganzzahlen (int) zula¨ssig. Die Deklarierungen in der Attributdatei entsprechen der in Abschnitt 2.2...

You are not authenticated to view the full text of this chapter or article.

This site requires a subscription or purchase to access the full text of books or journals.

Do you have any questions? Contact us.

Or login to access all content.