Show Less
Open access

Multimodale Kommunikation im Social Web

Forschungsansätze und Analysen zu Text–Bild-Relationen

Series:

Christina Margrit Siever

Multimodalität ist ein typisches Merkmal der Kommunikation im Social Web. Der Fokus dieses Bandes liegt auf der Kommunikation in Foto-Communitys, insbesondere auf den beiden kommunikativen Praktiken des Social Taggings und des Verfassens von Notizen innerhalb von Bildern. Bei den Tags stehen semantische Text-Bild-Relationen im Vordergrund: Tags dienen der Wissensrepräsentation, eine adäquate Versprachlichung der Bilder ist folglich unabdingbar. Notizen-Bild-Relationen sind aus pragmatischer Perspektive von Interesse: Die Informationen eines Kommunikats werden komplementär auf Text und Bild verteilt, was sich in verschiedenen sprachlichen Phänomenen niederschlägt. Ein diachroner Vergleich mit der Postkartenkommunikation sowie ein Exkurs zur Kommunikation mit Emojis runden das Buch ab.
Show Summary Details
Open access

9 Analysen zu Text-Bild-Relationen

9  Analysen zu Text-Bild-Relationen

Tags und Notizen sind Elemente von Fotoseiten, die aus linguistischer Sicht noch kaum bzw. noch gar nicht erforscht wurden. Während Tags sich sowohl holistisch als auch partiell auf ein Bild beziehen können, verweisen Notizen, anhand derer sich Ausschnitte auf Fotos präzise markieren und kommentieren lassen, zumeist nur partiell auf ein Bild.

Bezüglich der Funktion ist festzustellen, dass Tags hauptsächlich der Dokumentation dienen: Sie werden für die Inhaltserschließung der Bilder verwendet, um ein Retrieval zu ermöglichen. Folglich handelt es sich bei Tags zu einem Bild um eine besondere Art der Text-Bild-Relation: Die Tags einer Tag-Serie können sich sowohl formal als auch inhaltlich auf das Bild beziehen, außerdem ist danach zu fragen, in welchen semantischen Relationen die einzelnen Tags der Inhaltserschließung zueinander stehen. Um diese Forschungsfrage zu beantworten, wurde das lexikalisch-semantische Wortnetz GermaNet herangezogen, in dem semantische Relationen des deutschen Wortschatzes modelliert sind: Die Tag-Labels wurden mit dem Wörterbuch von GermaNet abgeglichen und die semantischen Relationen entsprechend zwischen den Tag-Labels eruiert (vgl. Kapitel 9.2.3). Neben den semantischen Relationen zwischen den Tags werden auch die Relationen zu den zu taggenden Objekten analysiert (vgl. Kapitel 9.2.4). Eine weitere – für das Retrieval relevante – Relation wird in Kapitel 9.2.5 untersucht: Es wird analysiert, inwiefern die Tags mit den übrigen Metadaten zu einem Bild übereinstimmen bzw. inwiefern Tags im Vergleich zu Bildtitel oder -beschreibung neue Informationen enthalten. Den Analysen zu den verschiedenen Relationen geht eine linguistische Analyse der deutschsprachigen Tags voraus (vgl. Kapitel 9.2.2), da eine solche ein Forschungsdesiderat darstellt.

Notizen dienen in geringfügigem Ausmaß ebenfalls der Dokumentation, die Funktionen liegen jedoch hauptsächlich im Bereich der Kommunikation (vgl. Kapitel 9.3.3). Im Bereich der Relationen zwischen Text und Bild wurden semantische Relationen bereits ausgiebig erforscht, pragmatische Relationen wie in Kapitel 9.3.4 waren hingegen bisher eher selten Untersuchungsgegenstand. In Kapitel 9.3.5 werden dialogische Notizen analysiert, wobei hier insbesondere die Anordnung der Notizfelder im Mittelpunkt steht.

Die Diskussion der jeweiligen Ergebnisse wurde direkt in die entsprechenden Teilkapitel eingearbeitet, da die einzelnen Themenkomplexe sich stark voneinander unterscheiden. Die wichtigsten Erkenntnisse des Empirie-Teils finden sich in der Synopse in Kapitel 9.4. ← 341 | 342 →

Für die Analyse wurden zwei Korpora herangezogen (vgl. Kapitel 9.1). Die daraus zitierten Texte und Bilder wurden aus Platzgründen nicht mit einer Quellenangabe versehen. Bei einzelnen Beispielen, die zur Illustration einem weiteren Korpus entnommen wurden, wurde jedoch die Quelle vermerkt.

9.1  Beschreibung der Korpora

Die Foto-Community Flickr wurde für die vorliegende empirische Untersuchung aus mehreren Gründen gewählt: Flickr ist eine der größten447 und bekanntesten Foto-Communitys und gilt deshalb auch als typischer Vertreter. Wie in Kapitel 4.2 gezeigt, ist Flickr neben der weitaus weniger bedeutenden Social-Sharing-Community Ipernity die einzige Foto-Community, in der neben der Tagging-Funktion auch eine Notizfunktion angeboten wird. Da die Fotoseiten von Flickr größtenteils öffentlich zugänglich sind, können diese als zitierbar gelten (vgl. Kapitel 1.4). Schließlich basieren bisherige Studien zu Foto-Communitys überwiegend auf Flickr-Daten (vgl. Stuart 2013: 143). Aufgrund der Tatsache, dass bei der Analyse technische Rahmenbedingungen berücksichtigt werden müssen, sind folglich Forschungsergebnisse zu ein und derselben Foto-Community vergleichbarer als solche aus unterschiedlichen Communitys.

Für die Analyse der Tag-Bild- und der Notiz-Bild-Relationen wurden deutschsprachige Daten benötigt. Da Flickr eine multilinguale Community ist, musste bei der Datenerhebung überlegt werden, auf welche Art und Weise man an möglichst viele deutschsprachige Texte gelangen kann. Barton und Lee (2013: 45) sind von einer Flickr-Gruppe ausgegangen, in der hauptsächlich Englisch geschrieben wird, doch sie stellten fest, dass über die Hälfte der untersuchten Seiten andere Sprachen als Englisch enthielten (vgl. ebd.: 169). Für die Datenerhebung der vorliegenden Studie wurde ebenfalls gruppenbasiert gearbeitet; ausgewählt wurden die beiden öffentlich zugänglichen Gruppen Wir sprechen Deutsch448 und Flickr-Fotografen Deutschland449. Es wurde somit nicht nur auf Gruppen zurückgegriffen, in denen hauptsächlich auf Deutsch kommuniziert wird, sondern auch auf solche ohne thematische Ausrichtung.450 Dies geschah deshalb, weil davon ← 342 | 343 → auszugehen ist, dass die Bandbreite an unterschiedlichen Bildern und demnach auch an Text-Bild-Relationen hier größer ausfällt als in thematisch restringierten Gruppen. Zudem verfügen die gewählten Gruppen über keine Regeln, was bedeutet, dass jedes Gruppenmitglied unbeschränkt Fotos in den Gruppenpool legen kann. Dies hat jedoch den Nachteil, dass Nutzende auch ganze Fotoalben in der Gruppe ablegen können, die nicht ausgiebig kommentiert werden (können). Dafür liegt ein Vorteil der Datenerhebung in Gruppen darin, dass Restriktionen, welche die Tag-Vergabe sowie das Verfassen von Kommentaren und Notizen betreffen, innerhalb von Gruppen für andere Gruppenmitglieder aufgehoben werden. Folglich sind solche Texte dort eher vorzufinden als auf Fotoseiten, die keiner Gruppe angehören.

Nun könnte man kritisieren, dass Daten aus nur zwei Gruppen zu einseitig ausfallen könnten. Diesem Einwand lassen sich zwei Argumente entgegengehalten: Erstens handelt es sich bei den gewählten Gruppen um zwei der größten deutschsprachigen Gruppen, sodass Bilder und Texte von vielen unterschiedlichen Nutzerinnen und Nutzern darin enthalten sind.451 Große Gruppen verfügen überdies über einen Vorteil hinsichtlich forschungsethischer Aspekte: »[L]arger groups create the possibility for less anonymity, as an individual who expresses sensitive or private information to a group expects confidence to be more realized when a group is smaller« (Rooke 2013: 2). Zweitens liegen die meisten Fotos in mehreren Gruppenpools, was bedeutet, dass Notizen, Tags und Kommentare auch von Flickr-Mitgliedern stammen können, die nicht der Gruppe Wir sprechen Deutsch angehören, wodurch recht heterogene Daten zusammenkommen dürften. Dies bedeutet, dass die Daten wahrscheinlich repräsentativ für die Grundgesamtheit der deutschsprachigen Flickr-Community sind.

Der empirischen Analyse liegen zwei Korpora zugrunde, die im Folgenden als Kleinkorpus und Großkorpus bezeichnet werden. Für das Kleinkorpus wurden Fotoseiten von 1 000 Unique Usern, d. h. 1 000 verschiedenen Flickr-Accounts, erhoben. Eine Auswahl von 1 000 verschiedenen Nutzerinnen und Nutzern wurde ← 343 | 344 → getroffen, damit nicht Idiolekte Einzelner die Ergebnisse verfälschen. Eine Zufallsstichprobe kam für die Erhebung deshalb nicht in Frage, da in der Nutzung – wie noch anhand der konkreten Daten gezeigt wird – eine Long-Tail-Verteilung auszumachen ist. Dies heißt, dass ein kleiner Teil der Flickr-Mitglieder in der Community die meisten Inhalte erstellt.

Bei der Erhebung wurde wie folgt vorgegangen: Startpunkt war am 18. August 2010 das zuletzt in der Gruppe Wir sprechen Deutsch eingestellte Foto; für das Korpus ausgewählt wurde jedes weitere davor veröffentlichte Foto bis zu einer Gesamtzahl von 500, sofern die Urheberin oder der Urheber des Bildes noch nicht im Korpus vertreten war. Dasselbe Prozedere wurde am 19. August 2010 für die Gruppe Flickr-Fotografen Deutschland wiederholt. Dabei wurden Nutzerinnen und Nutzer, die ebenfalls Mitglieder der Gruppe Wir sprechen Deutsch und somit bereits im Korpus vertreten waren, selbstverständlich nicht mehr berücksichtigt. Die Speicherung der so ermittelten 1 000 Fotoseiten wurde bewusst erst vier Wochen später, nämlich am 14. und 15. September 2010, vorgenommen, damit davon ausgegangen werden konnte, dass die Fotos rezipiert und gegebenenfalls mit Notizen oder Tags versehen wurden. Dieses Kleinkorpus liegt der Analyse der Bildtags in Kapitel 9.2 zugrunde. Für die Analyse der Bildnotizen erwies sich das Korpus als ungeeignet, da auf den 1 000 Fotoseiten lediglich 109 Notizen angebracht wurden bzw. nur 58 Fotoseiten überhaupt Notizen aufwiesen. Aus diesem Grund wurde für die Analyse der Bildnotizen auf ein zweites Korpus zurückgegriffen, das eine Vollerhebung der Gruppe Wir sprechen Deutsch (vom 1. Januar 2006 bis zum Datum der Erhebung, dem 24. Februar 2013) darstellt.452 Zu diesem Zeitpunkt befanden sich 150 449 Fotos im Gruppenpool, die von 1 721 verschiedenen Nutzern stammen. Im Durchschnitt wurden also pro Nutzerin oder Nutzer 87 Fotos bei einer hohen Standardabweichung von 379 hochgeladen. Dies ist typisch für eine Long-Tail-Verteilung. In Abbildung 76 ist zu sehen, dass wenige Nutzerinnen und Nutzer ausnehmend viele Fotos (über 10 000) und sehr viele Nutzende nur wenige Fotos in der Gruppe gepostet haben. Allein die Top-20-Userinnen und -User haben mehr als 55 113 Fotos in der Gruppe abgelegt. Die Summe der Fotos von diesen 20 Nutzerinnen und Nutzern beträgt 36,5 % der Fotos im Gruppenpool, d. h. mehr als ein Drittel aller Fotos stammt von nur 1,1 % aller Userinnen und User. 88,3 % der Gruppenmitglieder haben dagegen jeweils weniger als 100 Bilder und 42,7 % der Nutzerinnen und Nutzer weniger als 10 Fotos in der Gruppe veröffentlicht. ← 344 | 345 →

Abbildung 76:  Long-Tail-Verteilung der Fotos pro Unique User in der Gruppe Wir sprechen Deutsch

image

Bei der nun folgenden Analyse von Text-Bild-Relationen interessiert vor allem, in welchem Umfang die Möglichkeiten des Verfassens von Titeln, Tags, Kommentaren, Beschreibungen und Notizen genutzt werden. Praktisch jedes Bild verfügt über einen Titel453, am zweithäufigsten werden Tags vergeben. An dritter Stelle stehen die Kommentare, an vierter die Beschreibungen. Während bei all diesen Textvergabemöglichkeiten die tatsächliche Nutzung bei über 50 % liegt, werden nur rund 5 % der Fotoseiten mit Notizen versehen. Es zeigt sich also: Notizen stellen ein vergleichsweise seltenes Phänomen dar, wohingegen die ebenfalls empirisch untersuchten Tags zusammen mit dem Bildtitel zum Standard einer Fotoseite gehören. In Tabelle 24 sind quantitative Angaben sowohl zur Nutzung der einzelnen Textvergabemöglichkeiten als auch zu deren kombiniertem Auftreten aufgeführt: ← 345 | 346 →

Tabelle 24:  Titel, Tags, Kommentare, Beschreibungen und Notizen im Großkorpus (Klein-korpus)

Anzahl der Fotoseiten mit…

absolut

relativ

Titeln

146 914

97,7 % (85,4)

Tags

129 974

86,4 % (83,8)

Kommentaren

112 097

74,5 % (82,0)

Beschreibungen

96 278

64,0 % (55,1)

Notizen

7 703

5,1 % (5,8)

Titeln, Tags

127 736

84,9 %

Titeln, Kommentaren

109 686

72,9 %

Titeln, Tags, Kommentaren

95 797

63,7 %

Titeln, Beschreibungen

95 012

63,2 %

Titeln, Beschreibungen, Tags

86 228

57,3 %

Kommentaren, Notizen

7 021

4,7 %

Titeln, Tags, Kommentaren, Notizen

6 371

4,2 %

allem (Titel, Tags, Kommentare, Beschreibungen, Notizen)

5 143

3,4 %

Über die Hälfte aller Nutzerinnen und Nutzer nutzt sämtliche der verfügbaren Metadaten (Titel, Beschreibung, Tags), jedoch bei lediglich 3,4 % aller Fotoseiten wurde von allen genannten Möglichkeiten Gebrauch gemacht, d. h. von Community-Mitgliedern wurden zusätzlich Kommentare und Notizen hinzugefügt.

Dass die analysierten Texte – wie in Kapitel 7.3 ausgeführt – als kurze Texte und somit als Randerscheinungen von Textualität einzustufen sind, zeigt Tabelle 25. Dort wird ein Überblick über die maximal mögliche Länge der einzelnen Texte sowie die tatsächlich im Durchschnitt verwendete Zeichenzahl gegeben. ← 346 | 347 →

Tabelle 25:  Kurze Texte bei Flickr (Großkorpus/Kleinkorpus)

image

Bei der Betrachtung der Werte fällt auf, dass die maximale Länge bei Weitem nicht erreicht wird; bei den Titeln werden knapp 7,8 % ausgenutzt, bei den Tags 4,4 %, bei den Beschreibungen 0,3 sowie bei den Kommentaren 0,2 %.

Betrachtet man die tatsächlich genutzte Zeichenzahl, dann können Kommentare mit durchschnittlich 95,4 Zeichen mit SMS und Tweets verglichen werden, deren Umfang auf 160 bzw. 140 Zeichen begrenzt ist. SMS weisen eine durchschnittliche Länge von 93 Zeichen und somit eine Ausnutzung von 58 % auf, Tweets eine Länge von 86 Zeichen, was 61 % der maximalen Länge entspricht (vgl. Siever 2012b: 86), wobei die unterschiedliche prozentuale Ausnutzung darauf zurückgeführt werden kann, dass die Zeichenbegrenzung bei Flickr deutlich höher liegt. Während es sich jedoch bei den SMS, definiert als verbale Nachrichten, im Gegensatz zu MMS und Tweets456 um reine Texte handelt, sind die in Tabelle 25 aufgeführten Texte zumeist in Bezug auf ein Bild zu verstehen, was ein möglicher Grund für ihre Kürze sein könnte. So nennt Schmitz (2005: 210) als Forschungsdesiderat, dass geklärt werden müsse, ob Texte in multimodalen Kommunikaten elliptischer oder fragmentarischer ausfallen. Tatsächlich lassen sich einige Kommentare finden, die lediglich aus einem Zeichen (z. B. image) oder zwei Zeichen (z. B. :)) bestehen. Der längste Kommentar enthält jedoch 4 139 Zeichen; inhaltlich handelt es sich dabei um Ausführungen zu einem abgebildeten »VW Typ 287 Kommandowagen«. ← 347 | 348 →

Die 1 090 268 Kommentare im Großkorpus wurden von 106 693 Unique Usern verfasst, eine enorme Anzahl im Vergleich zu den 1 721 Gruppenmitgliedern. Diese Zahlen bestätigen die Aussage, dass die Kommunikation von Fotos in Gruppenpools nicht auf die Mitglieder der betreffenden Gruppe beschränkt ist, zumal die meisten Fotos – wie erwähnt – in mehreren Gruppen anzutreffen sind. Im Korpus sind pro Nutzerin oder Nutzer durchschnittlich 10 Kommentare vorhanden, allerdings mit einer Standardabweichung von 10. Die Analyse der Kommentare im Kleinkorpus ergab, dass nur 60 % der Fotoseiten, die überhaupt kommentiert wurden, mindestens einen deutschsprachigen Kommentar enthalten. Es kann also davon ausgegangen werden, dass auch in deutschsprachigen Gruppen fast die Hälfte der Kommunikation in anderen Sprachen abläuft, nicht zuletzt deshalb, weil Fotos oftmals auch in Gruppen gepostet werden, die nicht deutschsprachig sind.

Abschließend sei auf einige Schwierigkeiten bezüglich der Datenerhebung sowie -auswertung hingewiesen. Im Gegensatz zu persistenten gedruckten Informationen sind digitale Daten veränderbar und somit instabil (vgl. Debatin 2010: 323). Werden also digitale Informationen zu einem bestimmten Zeitpunkt abgespeichert, wird damit lediglich eine Momentaufnahme erstellt. Dies kann Probleme bei der Datenanalyse mit sich bringen: Weil bei Flickr sowohl die einzelnen Texte verändert oder gelöscht als auch die Nicknames modifiziert werden können, trifft man oftmals Sequenzen kommunikativer Akte an, die auf den ersten Blick (und manchmal auch auf den zweiten) keinen Sinn ergeben. Als Beispiel sei ein Foto mit dem Titel »Die Rheinschleife bei Boppard (Panorama)« genannt. Der erste Kommentar dazu lautet »Hmm, sehr schön. Aber ich habe keine Ahnung, wo. Irgendwo bei Passau?«, im zweiten ist zu lesen: »Sehr schönes Panoramabild, wobei allerdings die Enge der Flussschleife täuscht. Das ist die Rheinschleife bei Boppard (rechts). Auf der anderen Rheinseite liegt Filsen. Die Fotos sind vermutlich von der Anhöhe bei Mühltal aus aufgenommen worden.« Erst im dritten Kommentar, verfasst vom Fotourheber selbst, wird klar, wie die beiden ersten Kommentare zu verstehen sind: »Richtig! Jetzt ändere ich den Titel von ›Wo in Deutschland?‹ in den aktuellen.« Dass aber solche expliziten Hinweise auf Änderungen vorliegen, ist eher selten; vielmehr muss oftmals aufwändig rekonstruiert werden, wie sich die Kommunikation abgespielt haben könnte. Dies gelingt natürlich nicht, wenn einzelne Texte gelöscht werden; ein positiver Aspekt ist allerdings, dass beim Löschen von Accounts auf anderen Seiten angebrachte Kommentare, Notizen oder Tags mit dem Vermerk »gelöscht« – angebracht hinter dem Nickname – bestehen bleiben. Ein weiterer Faktor, der zu unverständlichen Flickr-Texten führen kann, sind nicht mehr aktive Hyperlinks. Bei der Analyse ← 348 | 349 → von Internetdaten muss Forschenden also stets bewusst sein, dass eine Website einst anders ausgesehen haben könnte und die eigene Interpretation zu einem späteren Zeitpunkt deshalb inkorrekt sein kann – gerade auch dann, wenn etwas fehlt, dies aber nicht bemerkt wird.

9.2  Bildtags

Im vorliegenden Kapitel werden Tags zunächst isoliert betrachtet: Nach einem Überblick über die verwendeten Korpora und die darin relevanten Daten folgt in Kapitel 9.2.2 eine linguistische Analyse. Zunächst wird die Zugehörigkeit zu Einzelsprachen geklärt, im Anschluss daran werden die deutschsprachigen Tags hinsichtlich der Schreibung, der Morphologie sowie der Wortarten untersucht. Doch Tags müssen auch im Kontext betrachtet werden. Ein einzelnes Tag kann drei unterschiedliche Relationen zu anderen Elementen aufweisen: zu Co-Tags in der Tag-Serie (Kapitel 9.2.3), zum Bild (Kapitel 9.2.4) sowie zu weiteren auf der Fotoseite vorhandenen Textelementen (Kapitel 9.2.5).

9.2.1  Basisdaten zu Tags

Obwohl die Analyse der Bildtags auf dem Kleinkorpus basiert, werden zunächst allgemeine Zahlen zur Tag-Nutzung aus dem Großkorpus näher betrachtet, da diese für die mittlere Nutzung aussagekräftiger sind. In Abbildung 77 ist die Verteilung der Anzahl von Tags pro Account im Vergleich zu der Anzahl der Fotoseiten pro Account zu sehen. Zum einen zeigen die beiden Long-Tail-Kurven, dass durchschnittlich pro Nutzerin oder Nutzer mehr Tags vergeben als Fotos gepostet werden, zum andern verläuft die rote Kurve flacher als die blaue, was bedeutet, dass die Nutzung von Tags ausgewogener ist als das Hinzufügen von Fotos zur Gruppe. Es gibt nicht nur wenige Heavy User und viele Gruppenmitglieder, die kaum oder gar nicht taggen, vielmehr ist der Übergang zwischen den beiden Polen fließend. ← 349 | 350 →

Abbildung 77:  Anzahl der Tags pro Account im Großkorpus

image

86,4 % aller Fotoseiten sind mit mindestens einem Tag versehen; das Taggen von Bildern ist also eine bei Flickr gängige Praxis. Ein ähnliches Resultat zeigt eine Analyse von Jeong et al. (2011: 166): Bei einer Datenbasis von 150 000 Flickr-Fotos sind in 78 % der Fälle Tags vergeben worden. Die Ergebnisse sind zwar aufgrund der beinahe identischen Grundgesamtheit vergleichbar, doch muss betont werden, dass Jeong et al. (2011: 166) ausschließlich Explore-Fotos berücksichtigen.

Das Großkorpus umfasst insgesamt 2 055 930 Tags, was eine durchschnittliche Anzahl von 13,7 Tags pro Fotoseite bedeutet (bzw. 15,8, wenn man die nicht getaggten Seiten nicht berücksichtigt). Im Kleinkorpus sind 10 370 Tags vorhanden, was folglich 10,4 Tags pro Bild entspricht. Auch hier können zum Vergleich die Resultate von Jeong et al. (2011: 166) herangezogen werden: In ihrem Korpus waren durchschnittlich 9,59 Tags pro Bild vergeben worden (bzw. 12,24, wenn die nicht getaggten Seiten unberücksichtigt bleiben). In einer weiteren Studie wurden 359 Fotoseiten analysiert; die durchschnittliche Anzahl von 2,79 Tags pro Bild (vgl. Heckner et al. 2008: 6) weicht also deutlich von den oben genannten Zahlen ab. Einerseits muss festgestellt werden, dass wahrscheinlich das Korpus zu klein war, um aussagekräftige Ergebnisse zu erhalten, andererseits ist als Kritikpunkt anzufügen, dass nicht erwähnt wird, um welche Art von Fotoseiten es sich bei den erhobenen handelt, was einen Vergleich schwierig macht. ← 350 | 351 →

Abbildung 78:  Verteilung der Tags auf die Bilder im Großkorpus

image

Die Verteilung der Tags auf die Bilder wird in Abbildung 78 ersichtlich. 52 % aller Bilder sind mit 1 bis 11 Tags versehen worden. Seitens Flickr ist die Anzahl der Tags eigentlich auf 75 beschränkt.457 Allerdings scheint es eine Möglichkeit zu geben, diese Begrenzung zu umgehen, wie in Abbildung 78 ersichtlich ist. Auch Jeong et al. (2011: 166) berichten von einer maximalen Anzahl von 76 Tags; entweder ist ihnen ein Tippfehler unterlaufen, oder es befindet sich auch in ihrem Korpus eine Fotoseite, bei der die eigentliche Maximalanzahl überschritten wurde.

Der Gesamtzahl aller Tags von 2 055 930 stehen 139 756 Types gegenüber, was einer Type-Token-Relation von 1:14,7 entspricht. Doch auch dieser Wert allein ist wenig aussagekräftig, wenn nicht die konkrete Verteilung betrachtet wird. In Abbildung 79 sind die 30 häufigsten Tags zu sehen: Germany (45 881 Tokens) und Deutschland (45 811 Tokens) sind die mit Abstand am häufigsten vergebenen Tags. Wie man es vermuten würde, treten die beiden Tags auch meistens – d. h. in 41 222 Fällen bzw. in 82 % aller Fälle – gemeinsam auf einer Fotoseite auf, sie gelten also als Übersetzungen. Hingegen enthalten nur 4 659 Fotoseiten ausschließlich das Tag Germany und 4 589 exklusiv das Tag Deutschland, was einem relativen Anteil von 9,2 % bzw. 9,1 % entspricht. Nach den beiden Tags Germany und Deutschland folgen auf den Rängen 3 bis 6 die französische Übersetzung Allemagne (13 949 Tokens), Berlin (13 435 Tokens), die spanische (13 031 Tokens) und die italienische Übersetzung (12 535 Tokens). Demgegenüber stehen 62 223 unikale Tags, 15 542 Tags kommen im Korpus doppelt und 8 229 dreifach vor. An 11. Stelle ist die chinesische Übersetzung von Deutschland und an ← 351 | 352 → 14. Stelle die russische zu finden. Zudem sind Tags zu einzelnen deutschen Bundesländern oder Regionen (Berlin, Bayern/Bavaria, Franken, NRW) sowie Europa/ Europe und die Schweiz erwähnt. Der Aufnahmeort scheint folglich als wichtig erachtet und häufig getaggt zu werden. Auch die Ausrüstung (Canon, Nikon) wird oft angegeben; das Genre HDR458 scheint sich in der Gruppe der größten Beliebtheit zu erfreuen. Weiter wird der Aufnahmezeitpunkt erwähnt, und zwar einerseits im Bereich der spezifischen Ofness die Jahreszahl 2012, andererseits im Bereich der allgemeinen Ofness Winter und Herbst. Im ersten Moment mag es erstaunen, dass ausgerechnet diese Jahreszeiten als erste genannt werden, sind doch Frühling und Sommer diejenigen Zeiten, zu denen wohl am meisten fotografiert wird. Dass der Winter auf Rang 17 mit 5 581 Tokens vor dem Herbst auf Rang 25 mit 4 188 Tokens liegt, kann damit erklärt werden, dass die Zeichenfolge winter ein intersprachliches Synonym im Deutschen und Englischen darstellt. Dass die beiden Jahreszeiten weit vor den Tags Frühling (Rang 39) und Sommer (Rang 71) liegen, lässt sich damit begründen, dass Frühling und Sommer die unmarkierten Fälle darstellen, die deshalb nicht getaggt werden. Dies gilt auch für Tag- und Nachtaufnahmen, wobei hier die Nachtaufnahmen als markiert gelten: So ist Nacht mit 3 368 Tokens auf Rang 32, Tag mit lediglich 207 Tokens erst auf Rang 1 407 anzutreffen. Insgesamt zeigt sich in den Top 30 des Großkorpus deutlich eine Präferenz für formale Tag-Bild-Relationen. Bei lediglich 8 der 30 Tags besteht eine inhaltliche Tag-Bild-Relation, wobei hier wiederum ausschließlich auf der Ebene der Ofness getaggt wurde. Zwei Bereiche sind bei diesen Ofness-Tags auszumachen: einerseits der Bereich der Natur/Nature mit den Tags Wasser, flower, Landschaft und Schnee, andererseits derjenige der Architektur/ architecture. ← 352 | 353 →

Abbildung 79:  Die 30 häufigsten Tags im Großkorpus

image

Während das Großkorpus repräsentativ für das durchschnittliche Verhalten in der deutschsprachigen Flickr-Community ist, sind im Kleinkorpus die Handlungen der durchschnittlichen Flickr-Nutzerin bzw. des durchschnittlichen Flickr-Nutzers abgebildet. Die in Kapitel 9.1 gezeigte extreme Long-Tail-Verteilung visualisiert, dass die durchschnittliche Handlung in der deutschsprachigen Flickr-Community von sehr wenigen Nutzerinnen und Nutzern geprägt sein dürfte, da wenige Nutzende sehr aktiv und viele Flickr-Mitglieder wenig aktiv sind. Ein Vergleich der Top-30-Tags in beiden Korpora macht deutlich, dass 36,7 % dieser Tags übereinstimmen – die Übereinstimmung würde sogar 47 % betragen, wenn man einerseits zudem die inhaltliche Übereinstimmung von landscape vs. Landschaft und andererseits die Jahreszahl-Tags gleichsetzte (2010 vs. 2012). Betrachtet man nur die Top 15, so kann gar eine Übereinstimmung von 53 % festgestellt werden; die Top 2 sind deckungsgleich (vgl. Tabelle 26). ← 353 | 354 →

Tabelle 26:  Top 15 der Tags im Klein- und Großkorpus

1

germany

germany

2

deutschland

deutschland

3

canon

allemagne

4

2010

berlin

5

nikon

alemania

6

nature

germania

7

sky

bavaria

8

berlin

canon

9

green

natur

10

portrait

europa

11

natur

image

12

clouds

europe

13

bayern

bayern

14

eos

федеративная республика германия

15

summer

nikon

Im Kleinkorpus finden sich bei den nicht übereinstimmenden Tags neben dem Jahreszahl-Tag und der Kamerabezeichnung EOS ausschließlich englischsprachige Tags, die eine inhaltliche Tag-Bild-Relation aufweisen. Im Großkorpus kommen fünf verschiedene Übersetzungen des Tags Deutschland, die Übersetzung des Tags Bayern sowie Europa und Europe vor, die in den Top 15 des Klein-korpus nicht vertreten sind. Aus der insgesamt hohen Übereinstimmung der Tags lässt sich folgern, dass die durchschnittliche Nutzung von Flickr mit den durchschnittlichen Handlungen der einzelnen Nutzenden übereinstimmt. Unterschiede zwischen den Korpora wie die Übersetzungen des Tags Deutschland sind darauf zurückzuführen, dass diese Tags von einigen wenigen Nutzerinnen und Nutzern, jedoch von diesen sehr oft genutzt werden. Das Tag Germany ist von 724 Unique Usern, das Tag Deutschland von 638 verschiedenen Userinnen und Usern vergeben und somit durchschnittlich pro Nutzerin oder Nutzer 63 bzw. 72 Mal verwendet worden. Die Tags Allemagne, Alemania und Germania hingegen wurden lediglich von 63, 30 bzw. 29 Unique Usern den Bildern zugewiesen, d. h. sie wurden im Durchschnitt pro Nutzerin oder Nutzer 221, 434 bzw. 432 Mal benutzt. Die russische und chinesische Übersetzung schließlich (федеративная республика германия und image) wurden gar nur von einem einzelnen Unique User vergeben, der gleichzeitig auch derjenige Nutzer ist, der mit 10 077 Fotos die meisten Bilder im Gruppenpool abgelegt hat. ← 354 | 355 →

Da das Tagging-System von Flickr auf Case Insensitivity beruht, wurde die Case Insensitivity auch bei der Auswertung angewandt, sprich Groß- und Kleinbuchstaben in Tags wurden für die Ermittlung der Type-Token-Relation gleichgesetzt, sodass unter einem Type jegliche Groß- und Kleinschreibvarianten subsumiert sind. Anhand der beiden meistvergebenen Tags im Großkorpus wird beispielhaft gezeigt, was übliche Realisierungen sind. Vorausgeschickt sei, dass es aufgrund der im Flickr-System herrschenden Case Insensitivity für das Retrieval keine Rolle spielt, ob beim Tagging Groß- oder Kleinbuchstaben verwendet werden. Die Zahlen zeigen jedoch, dass bei Wörtern, die laut Orthographienorm großgeschrieben werden, auch in über 80 % der Fälle der Rechtschreibregel entsprochen wird: Das Tag Deutschland wurde in dieser Form in 86 % der Fälle gewählt, die konsequente Kleinschreibung lediglich in 14 % aller Fälle.459 Das Tag Germany wurde auch immerhin zu 81 % in korrekter Schreibung wiedergegeben, lediglich 19 % der Tags sind in konsequenter Kleinschreibung getippt.460 Vereinzelt wird die konsequente Großschreibung oder die Binnengroßschreibung gewählt, alle übrigen Schreibvarianten können als Tippfehler gewertet werden, die durch fehlerhafte Betätigung der Umschalt- oder Caps-Lock-Taste entstehen, wie beispielsweise zwei zu Beginn stehende Majuskeln, die von Minuskeln gefolgt sind. Dass also Nutzende trotz der Case Insensitivity des Flickr-Systems Nomen und Eigennamen regelkonform großschreiben, kann zwei verschiedene Gründe haben: Die Flickr-Mitglieder könnten zum einen nicht wissen, dass das System keine Unterscheidung zwischen Groß- und Kleinschreibung trifft. Zum andern ist es aber auch möglich, dass sie sich dessen bewusst sind und dennoch aus Gründen wie Korrektheit oder ästhetischem Empfinden die normkonforme Schreibung vorziehen.461

Bislang haben wir erst die Top 30 der Tags im Großkorpus betrachtet und bereits hier ist eine enorme Spanne auszumachen: Germany ist mit 45 881 Tokens an erster Position im Korpus vertreten, NRW an 30. Stelle mit lediglich ← 355 | 356 → 3 538 Tokens. Wie bereits erwähnt, sind im Korpus zudem 62 223 unikale Tags vorhanden; die Long-Tail-Verteilung komplett abzubilden, ist demnach wenig sinnvoll, da die Kurve nahezu auf den Achsen des Koordinatensystems liegt. Aus diesem Grund wurden die extremen Werte abgeschnitten und in Abbildung 80 lediglich die Tags aufgeführt, die zwischen 500 und 10 000 Mal vorkommen. Entsprechend kann man sich vorstellen, welche Ausdehnung der Long Tail nach rechts aufweist.

Abbildung 80:  Ausschnitt (500 bis 10 000) aus der Long-Tail-Verteilung (Großkorpus)

image

Tags besitzen eine durchschnittliche Länge von 11,2 Zeichen. In Abbildung 81 ist die Verteilung der Zeichenzahl bei den im Korpus enthaltenen Tags zu sehen. Daraus ist ersichtlich, dass die meisten Tags zwischen 6 und 8 Zeichen lang sind. Nur sehr selten werden pro Tag mehr als 30 Zeichen verwendet; deshalb wird auch in der Abbildung 81 rechts die Verteilung nicht weiter angezeigt. Das längste Tag umfasst 255 Zeichen, was der von Flickr maximal zugelassenen Länge entspricht: Berlin Germany Deutschland Kreuzberg leafs Blätter chairs Stühle grün green chinese food Essen stuff Stoff playground Spielplatz toy Spielzeug Tür door dooropener Türöffner Schloß Holz alt old light Licht Durchgang pathway bike ← 356 | 357 → Fahrrad schmuck jewels flag.462 Sind Tags so lang wie das aufgeführte Beispiel, dann handelt es sich zumeist um eine fehlerhafte Tageingabe, sprich die einzelnen Wörter hätten einzelne Tags darstellen sollen, sind aber versehentlich durch Anführungszeichen zu einem Tag zusammengefasst worden – eine Tag-Serie wurde also irrtümlicherweise zu einem einzigen Tag-Label. Das genannte Beispiel entspricht, das kann bereits vorausgeschickt werden, einer typischen Tag-Serie in der deutschsprachigen Community: Die Tags werden in Deutsch und Englisch angegeben, wobei sowohl formale Relationen (Aufnahmeort) als auch inhaltliche Relationen (allgemeine Ofness) berücksichtigt sind.

Abbildung 81:  Umfang von Tags im Großkorpus (rechts reduziert)

image

Wenn im Folgenden die Tags der 1 000 Unique User aus dem Kleinkorpus analysiert werden, gilt es zunächst zu fragen, wer die Urheber der Tags sind. Lediglich 0,39 % aller Tags im Großkorpus wurden nicht von der Bildurheberin oder dem Bildurheber selbst vergeben. Diese von Dritten vergebenen Tags umfassen 1 720 Unique Tags; dieser Anzahl Types stehen 8 043 Tokens gegenüber, was einer Type-Token-Relation von 1:4,7 entspricht. Vergleicht man diesen Wert mit der Type-Token-Relation aller Tags im Korpus (1:14,7), kann man feststellen, dass die Tags von Dritten homogener ausfallen. Schaut man sich die Top-10-Tags von Dritten an (vgl. Tabelle 27), wird deutlich, welche Funktion solchen Tags üblicherweise zukommt: Es handelt sich dabei um Gruppen-Tags, die oftmals von anderen Gruppenmitgliedern vergeben werden. ← 357 | 358 →

Tabelle 27:  Top-10-Tags von Dritten

Häufigkeit

TOP-10-Tags

630

mywinners

608

DigitalCameraClub

458

APlusPhoto

310

blinkagain

255

ABigFave

210

ringexcellence

151

ColorPhotoAward

134

AnAwesomeShot

134

ColourArtAward

131

worldcars

Im Kleinkorpus ist eine Tag-Serie belegt, die aus drei Tags des Bildurhebers sowie aus 13 weiteren Tags von 11 anderen Nutzerinnen und Nutzern besteht: Igel, Frühling, Spring, behaltmich1, behaltmich2, behaltmich3, behaltmich4, behaltmich5, behaltmich6, behaltmich7, behaltmich8, löschmich, behaltmich9, behaltmich10, löschmich2 und behaltendurchLöschMich! Auch hier handelt es sich wiederum um Gruppen-Tags, und zwar werden Bilder in der Gruppe behalten, wenn von 10 verschiedenen Gruppen-Mitgliedern ein behaltmich (schneller) vergeben wird als 10 Mal löschmich.

9.2.2  Linguistische Analyse von Tags

Aufbauend auf den in Kapitel 5 angestellten Überlegungen wird im vorliegenden Kapitel eine linguistische Analyse der Tags vorgenommen. Dabei wird lediglich von Tag-Labels ausgegangen, die einem einzelnen Lexem entsprechen. Mehrteilige Tags, bei denen ein Tag-Label mehrere Lexeme enthält (wie in Entdecke Kanada, Synergie durch Kommunikation oder schönes Haus), wurden in der vorliegenden linguistischen Analyse nicht berücksichtigt, da mehrteilige Tags vergleichsweise selten vergeben werden und eine Kategorisierung deswegen nicht sinnvoll realisierbar wäre. Zunächst wurden die deutschsprachigen Tags bestimmt (vgl. Kapitel 9.2.2.1), die sodann in Bezug auf Schreibung, Morphologie und Wortarten näher analysiert werden. ← 358 | 359 →

9.2.2.1  Sprachbestimmung

Bei der linguistischen Analyse der Tags ging es zunächst darum, eine Sprachbestimmung der Tags im Kleinkorpus vorzunehmen, denn im Folgenden werden hauptsächlich deutschsprachige Tags untersucht. Konkret sollen dabei die Zeichenfolgen der Tag-Labels einer Einzelsprache zugeordnet werden. In einigen Fällen ist dies problemlos möglich und je länger die Zeichenfolge, desto einfacher fällt eine Zuordnung aus. Während intersprachliche Homonyme normalerweise durch das Bild disambiguiert werden können, bereitet die intersprachliche Synonymie bei der Sprachbestimmung Mühe. Versucht man hier, aufgrund der Sprache der Co-Tags in der Tag-Serie auf die Sprache des zu bestimmenden Tags zu schließen, muss man feststellen, dass viele Tag-Serien teilweise aus deutschen und teilweise aus englischen Tags bestehen, weshalb dieses Vorgehen nicht zielführend ist. Für die vorliegende Analyse wurden solche Tags deshalb der Kategorie Deutsch oder Englisch zugewiesen. In diesem Zusammenhang stellt sich zudem die Frage, zu welchem Zeitpunkt ein Wort aus dem Englischen als der deutschen Sprache zugehörig erachtet wird:

      »Fremdwörter sind Wörter des Deutschen, auch wenn sie ganz oder teilweise aus anderen Sprachen übernommen sind. Ein Fremdwort aus dem Englischen bezeichnet man als Anglizismus und bringt damit zum Ausdruck, dass es sich nicht um ein Wort des Englischen handelt, sondern um eines, das ganz oder in Teilen aus dem Englischen stammt. Der Anglizismus Computer beispielsweise ist insofern ein Wort des Deutschen, als er, anders als im Englischen, großgeschrieben wird und ein Genus (grammatisches Geschlecht) hat« (Eisenberg 2011: 2–3).

Für die vorliegende Analyse wurde so verfahren, dass Lexeme, die im Fremdwörter-Duden aufgeführt sind (beispielsweise Fisheye463), sowohl zum Englischen als auch zum Deutschen gezählt wurden. Darüber hinaus existieren im Bereich der Fotografie zahlreiche Fachtermini aus dem Englischen, die im Deutschen zwar gängig, jedoch nicht im Fremdwörter-Duden verzeichnet sind. Solche Ausdrücke wurden ebenfalls beiden Sprachen zugerechnet. Als Beispiel sei der Terminus HDR genannt, der ein beliebtes Genre bei Flickr darstellt. In Flickr-Texten wird dabei deutlich, dass es sich um ein Neutrum handelt: »Hier erkenne ich das HDR...super«.464 ← 359 | 360 →

In Abbildung 82 wird ersichtlich, dass jeweils rund ein Drittel der Tags eindeutig dem Deutschen oder dem Englischen zugewiesen werden können, 4 % der Tags sind intersprachliche Synonyme im Deutschen und Englischen. Werden die unbestimmbaren und nichtsprachlichen Anteile von der Gesamtanzahl subtrahiert, kommt die Dominanz der beiden Sprachen besonders stark zum Vorschein: 47 % der Tags sind deutschsprachig, 44 % englischsprachig und nur 3 % in anderen Sprachen verfasst (die übrigen 6 % sind deutsch- oder englischsprachig).

Dass diesen beiden Sprachen eine derartige Dominanz zukommt, ist erwartbar: Deutsch wird schon im Gruppentitel propagiert und Englisch ist die Lingua franca, insbesondere bei international relevanten Anwendungen wie Flickr. Ferner geht es nicht nur darum, das Bild für Dritte auffindbar zu präsentieren, sondern auch darum, Inhalt und Fertigkeiten verständlich und transparent zu machen. Auch wenn die Gruppe primär für ein deutschsprachiges Zielpublikum eingerichtet wurde, sollen die darin veröffentlichten Bilder international beachtet werden, was am einfachsten über englischsprachige Tags zu erreichen ist. Anders als bei den Beschreibungen handelt es sich dabei nicht um komplexe Texte, für die eine Grammatik beherrscht werden muss, sondern um einzelne Lexeme, die wie in zweisprachigen Wörterbüchern in der Nennform angegeben werden. Zudem werden oft relativ unspezifische Tags wie Pflanze, Blume, Haus, Landschaft vergeben, für deren Übersetzung eine basale Sprachkenntnis des Englischen ausreicht.

Abbildung 82:  Sprachwahl beim Taggen von Bildern

image ← 360 | 361 →

In der Kategorie nichtsprachlich sind hauptsächlich Zahlen zu finden, zumeist Datumsangaben und gelegentlich Angaben zur Ausrüstung wie 28–75 (Millimeterangaben zu einem Objektiv). Darüber hinaus sind zwei Belege für aus Emojis bestehende Tags anzutreffen: image und image

Lediglich 2 % aller Tags konnten einer anderen Sprache als Deutsch oder Englisch zugewiesen werden. In Abbildung 83 sind die Sprachen im Einzelnen aufgelistet. Latein ist deswegen vertreten, da oftmals zu Fotografien der Flora und Fauna die Gattungen und Arten mit ihrer lateinischen Bezeichnung aufgeführt werden. Es handelt sich dabei also ausschließlich um Internationalismen aus der Biologie. Solche Internationalismen gehören keiner Einzelsprache an und werden aus diesem Grund auch nicht als Fremdwörter des Deutschen gewertet (vgl. Eisenberg 2011: 103). Die Kategorie andere umfasst weitere Einzelsprachen wie Lettisch, Schwedisch, Slowakisch oder Westfriesisch.

Abbildung 83:  Sprachgebrauch beim Tagging

image

Rund ein Viertel aller Tags mussten als unbestimmbar klassifiziert werden. Hierzu zählen einzelne Buchstaben wie beispielsweise x oder z, außerdem Tags mit einzelnen Buchstaben sowie weiteren Zeichen wie /___C_ oder «_q bzw. in Kombination mit einer Ziffer (F2). Insbesondere Kurzformen wie O.T.W können oftmals nicht bestimmt und somit keiner Sprache zugewiesen werden. Es dürfte ← 361 | 362 → sich dabei häufig um Identifizierungstags einzelner Gruppen oder Nutzenden handeln. Während beim genannten Beispiel O.T.W gänzlich unklar ist, was damit bezeichnet werden soll, gibt es auch Fälle, die zwei Deutungsvarianten zulassen. So kann in der Tag-Serie Nikon D700, Nikkor 24–70 2.8, Feld, Weizen, Baden-Württemberg, Wart, Deutschland, bw, Black, White die Abkürzung bw sowohl für Baden-Württemberg als auch für Black und White stehen, weshalb auch in diesem Fall nicht bestimmt werden kann, ob es sich um ein deutsch- oder englischsprachiges Tag handelt.

Ein weiteres Problem stellen Tags wie reflektion oder Gothik dar: Keine der Zeichenfolgen entspricht einem Lexem im Englischen oder Deutschen. reflektion könnte als falsche Schreibung des Englischen reflection gewertet werden, genauso gut könnte man jedoch auch argumentieren, es handle sich um eine fehlerhafte Schreibung des deutschen Lexems Reflexion. Bei diesem Beispiel kann tendenziell eher von einer fehlerhaften Schreibung im Englischen ausgegangen werden, da die Levenshtein-Distanz465 dort nur 1, die zwischen Reflektion und Reflexion jedoch 2 beträgt.466 Beim Tag Gothik hingegen weist die Levenshtein-Distanz sowohl zur korrekten Schreibung im Deutschen als auch im Englischen den Wert 1 auf, weshalb eine Sprachbestimmung nicht möglich ist.

Ebenfalls zu den unbestimmbaren Tags gehören Toponyme, die keiner Sprache eindeutig zugewiesen werden können. Von denjenigen Tags, die als Toponyme klassifiziert wurden, können 48 % eindeutig dem Deutschen (z. B. München) und 24 % klar dem Englischen (z. B. Munich) zugeordnet werden, während 28 % keiner Sprache explizit zugewiesen werden können (z. B. Berlin). Eigen- und Markennamen wurden ebenfalls keiner Einzelsprache zugeteilt und zählen deshalb ebenfalls zu den unbestimmbaren Tags.467 ← 362 | 363 →

Abbildung 84:  Anteil der Toponyme, Marken- und Eigennamen an den Nomen

image

Die Toponyme, Markennamen und Eigennamen müssen schließlich noch in eine Relation zu den übrigen Nomen gesetzt werden. Die Toponyme sind mit 36 % vertreten, gefolgt von den Markennamen sowie den Eigennamen; die übrigen Nomen machen nur rund ein Drittel aus. Die hohe Anzahl der Toponyme kann darauf zurückgeführt werden, dass die meisten Bilder mit dem Aufnahmeort getaggt werden (vgl. Kapitel 9.2.4). Markennamen sind deshalb häufig vertreten, weil viele Fotografinnen und Fotografen auf der Ebene der formalen Relation auch die verwendete Ausrüstung nennen.

Für die Analyse der semantischen Relationen wurde das lexikalisch-semantische Wortnetz GermaNet herangezogen (vgl. Kapitel 9.2.3). Hierbei wurden die Tags mit den Lexical Units von GermaNet abgeglichen: 35 % der Tags stimmen mit einzelnen Lexical Units überein. Obwohl sich diese Prozentangabe mit der in Abbildung 82 zu sehenden Kategorisierung deckt, umfassen die beiden Kategorien unterschiedliche Tags, da bei GermaNet Lexeme mitgezählt wurden, die ich als Deutsch oder Englisch bestimmt hatte. In der von mir vorgenommenen Kategorisierung sind im Gegensatz zu GermaNet flektierte Formen enthalten sowie einzelne Lexeme wie etwa varietätenspezifische Varianten (Fiaker, Velofahrer), Fachtermini aus der Botanik (Butterröhrling, Roseneibisch, Hibiskus) oder umgangssprachliche Ausdrücke (Remmidemmi, abgefahren).

9.2.2.2  Schreibung

Von der deutschen Orthographie kann auf verschiedenen Ebenen abgewichen werden. Im Zusammenhang mit dem Social Tagging interessieren hier zum ← 363 | 364 → einen Rechtschreib- und Tippfehler, zum andern die Groß- und Kleinschreibung. Im ersten Fall ändert sich die Zeichenfolge, im zweiten Fall ändert sie sich nicht, sofern man wie bei Flickr Case Insensitivity voraussetzt. Folglich sind lediglich Rechtschreib- oder Tippfehler für das Retrieval relevant. Die Groß- und Kleinschreibung spielt dafür keine Rolle, doch ist es untersuchenswert, ob sie im Deutschen dennoch beachtet wird. Für das Retrieval wiederum relevant sind Schreibvarianten, im Deutschen insbesondere die Variation von Buchstaben, die nicht zu den 26 Buchstaben des lateinischen Alphabets gehören.

Lediglich 1 % aller Tags enthalten einen Tipp- und Rechtschreibfehler; diese Zahl ist vergleichbar mit dem Ergebnis von Heckner (2009: 126): Seine Analyse der Tags im Dienst Connotea ergab einen Anteil von Tippfehlern in Höhe von 2 %. Die gefundenen Tipp- und Rechtschreibfehler können weiter klassifiziert werden. Am häufigsten wird ein falscher Buchstabe verwendet (Barten statt Garten, FrYhling statt Frühling), gefolgt von fehlenden Buchstaben (Deutchland, deutscland) bzw. überzähligen (Archtitektur, Gemüsse). Buchstabendreher (Deustchland) kommen nur sehr selten vor (vgl. Abbildung 85). Einige »Fehler« resultieren aus einem Problem bei der Codierung, wenngleich diese dank der inzwischen breiten Unicode-Unterstützung stark abgenommen haben. FrYling allerdings wird mit an Sicherheit grenzender Wahrscheinlichkeit auf solche Schwierigkeiten zurückzuführen sein. Wenn die Zeichentabelle und die Codierung nicht aufeinander abgestimmt sind, können Sonderzeichen wie Umlaute (ü) in unerwünschte Zeichen umgewandelt werden (Y).

Abbildung 85:  Tipp- und Rechtschreibfehler in Tags

image

Wie Abbildung 86 zeigt, bestehen 43 % aller Tags komplett aus Minuskeln. Die Initialgroßschreibung tritt in 55 % der Tags auf, und lediglich 2 % aller Tags sind in konsequenter Großschreibung realisiert. Die Binnenmajuskelschreibung ist ← 364 | 365 → mit 0,04 % kaum vertreten; die meisten Belege davon sind auf die Gruppen-Tags flickrTravelAward und flickrAward zurückzuführen. Bei der konsequenten Groß-schreibung handelt es sich vor allem um Abkürzungen und Kurzwörter aus dem Bereich der Fotografie wie HDR, EOS oder DSLR468 oder solche von Toponymen wie NRW oder FVG469.

Abbildung 86:  Groß- und Kleinschreibung von Tags im Großkorpus

image

Im Folgenden sollen nun die Minuskel- und die Initialgroßschreibung näher betrachtet werden. Das Deutsche ist bekanntlich neben dem Luxemburgischen die einzige Sprache, welche die generelle Substantivgroßschreibung kennt; in anderen Sprachen werden lediglich der Satzanfang sowie Eigennamen großgeschrieben. Folglich sind Unterschiede in der Initialgroßschreibung zwischen dem Englischen und Deutschen zu erwarten. Die Daten des Kleinkorpus bestätigen diese Vermutung: 54 % der als Deutsch bestimmten Tags weisen Initialgroßschreibung und 39 % eine konsequente Kleinschreibung auf, wohingegen sich im Englischen 66 % der Tags durch konsequente Kleinschreibung sowie 26 % durch Initialgroßschreibung auszeichnen (vgl. Abbildung 87).470 ← 365 | 366 →

Abbildung 87:  Groß- und Kleinschreibung in Tags nach Sprachen

image

Nun muss natürlich sowohl im Englischen als auch im Deutschen jeweils die Wortart berücksichtigt werden, da die Großschreibung ausschließlich für Nomen und Eigennamen gilt. Im Deutschen wurden 57 % der Nomen (ohne Eigennamen, Markennamen und Toponyme) mit Anfangsmajuskel versehen, im Englischen lediglich 28 %. Dass beinahe ein Drittel der englischsprachigen Nomen großgeschrieben wurde, kann vermutlich auf den Einfluss des Deutschen zurückgeführt werden: Wenn Nutzende ihre Bilder sowohl auf Deutsch als auch auf Englisch taggen, werden englische Nomina – sowie teilweise auch weitere Wortarten, wie die folgende, von einem einzelnen Nutzer erstellte Tag-Serie zeigt – ebenfalls mit großem Anfangsbuchstaben versehen: portrait, Frau, Wife, Women, girl, Lady, Dame, weiblich, Hot, Schnitt, Face, Gesicht, Haut, Haar, Auge, Mund. Interessanterweise ist allerdings ausgerechnet das erste Tag, das sowohl ein französisches oder englisches als auch ein deutsches Lexem sein kann, kleingeschrieben, girl ist im Gegensatz zu Wife und Woman ebenfalls klein-, Hot hingegen großgeschrieben. Es sind jedoch auch Tag-Serien wie die folgende anzutreffen, bei der die Nomina des Deutschen und Englischen in korrekter Groß- bzw. Kleinschreibung zu finden sind: Architektur, Berlin, Gebäude, Haus, Stadt, architecture, building, city, house, town, urban, guessedberlin, gwbthmlamp.471 Es wäre interessant, an einem Vergleichskorpus mit Nutzenden englischer Muttersprache zu prüfen, ob – und ← 366 | 367 → wenn ja: in welchem Umfang – Tags mit Initialgroßschreibung auftreten, von Eigennamen natürlich abgesehen.

Ortsnamen werden im Deutschen im Vergleich zu den Nomen etwas häufiger großgeschrieben, und zwar in 63 % der Fälle. Bei den Eigen- und Markennamen weisen gar 71 % Initialgroßschreibung auf (vgl. Abbildung 88). Dies mag auf Respekt ebenso zurückzuführen sein wie auf die Tatsache, dass diese auch in anderen Sprachen wie etwa im Englischen großgeschrieben werden.

Abbildung 88:  Initialgroßschreibung von Nomen (inkl. Orts- und Eigennamen) im Kleinkorpus

image

Zum Vergleich soll nun ein Blick auf die Groß- und Kleinschreibvarianten in den Top 25 der deutschsprachigen Tags im Großkorpus geworfen werden (vgl. Tabelle 28). Diese Nomina enthalten 5 Markennamen (Canon, EOS, Leica, M9, Nikon) sowie 8 Toponyme (Schweiz, NRW, Hessen, Franken, Europa, Deutschland, Berlin, Bayern). Es zeigt sich, dass die Initialgroßschreibung in rund drei Viertel aller Fälle bevorzugt wird, gefolgt von der konsequenten Kleinschreibung mit 22 %. Die konsequente Großschreibung wird – wie bereits erwähnt – überwiegend bei Abkürzungen wie EOS oder Kurzwörtern wie NRW normkonform verwendet, hat aber ansonsten – wie auch weitere Varianten – keine Bedeutung. ← 367 | 368 →

Tabelle 28:  Top 25 der deutschsprachigen Tags im Großkorpus

image

Rechnet man die Toponyme und Eigennamen heraus, erhält man ein ähnliches Ergebnis: In 75 % der Tags wird ebenfalls die Initialgroßschreibung gewählt, in 24 % die konsequente Kleinschreibung; die konsequente Großschreibung indes ← 368 | 369 → tritt praktisch nicht auf (0,2 %). In den im Großkorpus am häufigsten genutzten Tags wird die Initialgroßschreibung also deutlich häufiger verwendet als im Kleinkorpus.

Zum Schluss sollen noch Schreibvarianten im Kleinkorpus betrachtet werden. Lediglich in 18 Fällen wurden zu einer Ressource zwei Tags vergeben, die als Schreibvarianten zu werten sind. Bei 9 Schreibvarianten-Paaren handelt es sich um eine Variation von Umlauten (VoegelVögel, tuerklopfertürklopfer), bei 8 wurde das Eszett durch Doppel-s ersetzt (weiß–weiss, schloß–schloss472) und nur in einem einzigen Fall konnte eine Variation von <ph> und <f> gefunden werden: photoshootingfotoshooting. Die Schreibvarianten von Umlaut und Eszett wurden wahrscheinlich vor dem Hintergrund der Überlegung gewählt, dass manche Nutzende diese Zeichen nicht auf ihrer Tastatur vorfinden und deshalb die entsprechenden Suchterme nicht eingeben können. Für das Varianten-Paar photoshootingfotoshooting kann dies nicht gelten; es ist vielmehr davon auszugehen, dass der Pseudoanglizismus fotoshooting als Anglizismus angesehen und fälschlicherweise mit photoshooting statt photo shoot übersetzt wurde.

Den Erwartungen am wenigsten entsprochen haben die zahlreichen großgeschriebenen Nomen; über die Hälfte (54 %) werden hier normkonform eingegeben. Als Ursache dafür könnte angenommen werden, dass es sich um (teil-)öffentliche und dauerhaft verfügbare Fotoseiten handelt, bei denen die Nutzerinnen und Nutzer mehr Zeit für die Textproduktion aufwenden als bei anderer Kommunikation. Für diese Annahme spricht auch die Tatsache, dass die Fotoeinstellenden Lob erhalten und zur Veröffentlichung ihrer Fotos in anderen Gruppen eingeladen werden möchten. Auch deshalb müssen Tags in englischer Sprache eingegeben werden, da Englisch die Lingua franca von international agierenden Gruppen ist. Wenn eine Gruppe, die sich auf Sonnenauf- und -untergänge spezialisiert hat, auf der Suche nach neuen potenziellen Exponaten ist, müssten die Suchenden stets die Lexeme aller wichtigen Sprachen angeben, um sie aufzufinden, wenn nicht auch die Tags sunrise und sunset von den Urheberinnen und Urhebern eines Fotos vergeben worden wären.

Für die Großschreibung spricht ebenfalls, dass im Regelfall der Titel und die Beschreibung normkonform geschrieben werden. Da die Tags sicherlich meist zusammen mit diesen Teiltexten eingegeben werden, wird das normkonforme Schreiben dadurch begünstigt. So ist zu vermuten, dass die Nutzenden sich entwe ← 369 | 370 → der bei der Eingabe der Tags an der Schreibweise des Titels bzw. der Beschreibung orientieren oder sie kopieren möglicherweise auch Schlüsselwörter von einem Feld ins andere. Darüber hinaus lassen sich mit der normkonformen Schreibung auch homographe Verben (schreiben) und Nomen (Schreiben) voneinander abgrenzen.

9.2.2.3  Morphologie

Auf der Ebene der Morphologie sollen drei Aspekte näher betrachtet werden, die für das Retrieval relevant sind: flektierte Formen, Reduktionsformen und Komposita.

Im Allgemeinen kann man konstatieren, dass für Tags aus der Perspektive des Retrievals unflektierte Formen bevorzugt verwendet werden sollten, doch gibt es – wie zu zeigen sein wird – auch Ausnahmen. Flektierte Formen sollten vermieden werden; falls die Zeichenfolge des Suchterms nicht mit dem der Ressource zugewiesenen Tag vollständig übereinstimmt, ist eine Suche nicht erfolgreich. Bei der Flexion ist insbesondere der Numerus von Nomina von Bedeutung. Die Analyse der Tags im Kleinkorpus ergab bei den nominalen Tags im Plural einen Anteil von 7 %. Diese Zahl deckt sich praktisch mit dem Ergebnis einer Studie zu englischen Tags bei Flickr, bei der ein Anteil von 8 % Pluralformen ausgemacht werden konnte (vgl. Guy, Tonkin 2006). Gerade in Foto-Communitys ist die Wahl des Numerus von der Text-Bild-Relation abhängig: Ob ein Objekt einmal oder mehrmals abgebildet ist, wird durch den Numerus ausgedrückt. Auch bei Gattungsnamen kommt der Plural zur Anwendung.

Wie in Abbildung 89 zu sehen ist, machen die Pluralformen den Großteil der flektierten Formen aus. Vereinzelt sind flektierte Adjektive, Partizipien, Nomen im Genitiv sowie konjugierte Verben anzutreffen. Flektierte Formen lassen sich zumeist über ihren Kontext erklären. So sind im Ausschnitt der folgenden Tag-Serie zwei Nominalphrasen enthalten, die allerdings auf zwei Tag-Labels aufgeteilt wurden: griechische, insel, island, bluehour, blaue, stunde. In der folgenden Tag-Serie, welche die maximale Anzahl von 75 Tags aufweist, lassen sich verschiedene Arten flektierter Formen finden:

      Köln, Cologne, Germany, deutschland, Allemagne, koeln, d.vonesprod, d.vones, architecture, concept, format, canon, aurelie, artus, art, architektur, wie, leader, der, bin, ich, france, travel, tourisme, catedral, cathedral, catholic, cathedrale, cathédrale, building, bushido, arbeit, archeologia, architekten, bonn, deutsches, deutscher, deutschen, deutsch, deutsche, dirndl, dom, dusseldorf, landschaftspark, landscape, landschaft, könig, kölner, kurfürstendamm, kolner, koln, kleidung, kirchen, kathedrale, kaiserreichs, kaiser, sigma, siegessäule, schweinsteiger, schlos, schlosses, schloss, schachen, phönizier, phéniciens, ← 370 | 371 → photography, paysage, museum, munchen, munich, münchen, nacht, night, nights, mywinners (Herv. CMS)

So ist beispielsweise die konjugierte Form des Verbs sein in die Tag-Serie eingebettet: leader, der, bin, ich. Während hier die Tags quasi einen Satz bilden, kann kölner wiederum als Teil der auf zwei Tag-Labels aufgeteilten Nominalphrase kölner kurfürstendamm angesehen werden. Dass flektierte Formen wie in der zitierten Tag-Serie zum Adjektiv deutsch in derart vielen Varianten auftreten, ist allerdings unüblich. Auch die Genitivformen kaiserreichs und schlosses können nicht durch den Kontext erklärt werden. Auffällig ist hier zudem, dass Kaiserreich im Unterschied zu schloss nicht auch zusätzlich unflektiert auftritt. Bei den Pluralformen steht kirchen keine Singularform gegenüber, nights hingegen schon.

Abbildung 89:  Flektierte Wortformen in Tags

image

Reduktionsformen und Komposita sind relevant für die Tag-Tag-Relationen. Reduktions- und Vollform können als Synonyme gewertet werden, wohingegen ein Kompositum (Butterpilz) ein Hyperonym zu einem dazugehörigen Simplex (Pilz) bildet, sofern dieses das Determinandum des Kompositums ist. Die Analyse der Nomen im Kleinkorpus ergab einen Anteil von 23 % an Komposita. Diese wurden mit den Simplizia verglichen: Bei 27 % aller Komposita ist in derselben Tag-Serie entweder auch das Determinans oder das Determinandum des entsprechenden Kompositums vorhanden. Dabei überrascht, dass in fast der Hälfte (47 %) dieser Fälle zusätzlich zum Kompositum das Determinans angegeben wird; in den übrigen 53 % der Fälle ist das Kompositum zusammen mit seinem Determinandum anzutreffen (WaldWaldboden; KäferMarienkäfer). Treten Komposita ← 371 | 372 → und ihre Konstituenten gemeinsam auf, erfolgt dies in drei Vierteln aller Fälle (76 %) zusammen mit einer Konstituente, in 24 % sind sowohl das entsprechende Determinans als auch das Determinandum in derselben Tag-Serie vertreten (schlossparkschlosspark, KirscheBlüteKirschblüte).

Abschließend sollen Kurzformen betrachtet werden, die in derselben Tag-Serie eine entsprechende nicht-reduzierte Variante aufweisen. Kurzformen sind oftmals homograph und damit polysem, wie wir in Kapitel 9.2.2.1 anhand des Beispiels BW (black-white vs. Baden-Württemberg) feststellen konnten. Sinnvolle Tag-Labels stellen jedoch nur monoseme Kurzformen dar. Werden allerdings neben Kurz- auch die dazugehörigen Langformen angegeben, erhöht sich einerseits die Chance eines erfolgreichen Retrievals, andererseits können sie als Co-Tags die Kurzformen monosemieren. Im Korpus sind immerhin 1,1 % aller Tags Kurzform-Langform-Paare, wobei kurzwort- und abkürzungsspezifische Längen erreicht werden (bei 34 % zwei Zeichen, bei 50 % drei Zeichen. Je kürzer die Kurzform ist, desto polysemer wird sie, insbesondere im multilingualen Kontext (vgl. Siever 2011c: 344). Im Bereich der Fotografie sind zwar Kurzformen wie sw, dof, dri und hdr geläufig; andere wie ck und zd sind seltener und selbst für (Hobby-)Fotografinnen und -Fotografen nicht unbedingt verständlich.473 Die Tags lgs oder aegi dürften nur einer kleinen Zielgruppe ein Begriff sein, wohingegen Kurzformen wie Stasi oder WM gar lexikalisiert im Duden zu finden sind.474 Aufgrund des Multilingualismus bei Flickr sind jedoch zum Teil selbst solche bekannten Kurzformen als Tags nicht für das Retrieval geeignet, wie die Suche danach zeigt: Für WM finden sich die intersprachlichen Homonyme Wal Mart, Waste Management und Western Maryland (Railway). Das Kurzwort Stasi dagegen ist eindeutig.

9.2.2.4  Wortarten

In diesem Kapitel sollen die Wortarten der Tags betrachtet werden. Da die Wortarten von Tags lediglich nach formalen und nicht nach funktionalen Kriterien bestimmt werden können, wurde auf die Glinz’sche Fünf-Wortarten-Lehre zurückgegriffen (vgl. Weber 2010: 63). Die Wortarten werden dabei nach morphologischen Kriterien klassifiziert: Unflektierbare Lexeme werden als Partikel bezeichnet. Bei den flektierbaren Wörtern unterscheidet man zwischen deklinierbaren und konjugierbaren. Konjugierbare Lexeme zählen zu den Verben, bei ← 372 | 373 → den deklinierbaren Lexemen gehören diejenigen mit einem festen Genus zu den Nomen, die steigerbaren Lexeme ohne festes Genus werden als Adjektive klassifiziert und die nicht-komparierbaren als Pronomen.

Betrachtet man das Ergebnis der Wortartenanalyse (vgl. Abbildung 90), wird deutlich, dass eine Klassifikation nach weiteren Kategorien nicht sinnvoll gewesen wäre. Die in der Zehn-Wortarten-Lehre unterschiedenen Wortarten Präposition, Konjunktion und Interjektion, die in der Fünf-Wortarten-Lehre alle unter der Wortart Partikel zusammengefasst werden, machen im Korpus lediglich 0,5 % aus. Auch die Pronomen, zu denen in der Fünf-Wortarten-Lehre ebenfalls die in der traditionellen Zehn-Wortarten-Lehre separat klassifizierten Artikel zählen, sind im Korpus lediglich mit 0,3 % vertreten.

Abbildung 90:  Wortarten der Tags im Kleinkorpus

image

Die Anzahl der Nomen ist annähernd identisch mit einem Ergebnis, das aus einer Analyse zu englischsprachigen Tags bei Flickr stammt: 90 % der Lexeme konnten als Nomen kategorisiert werden (vgl. Guy, Tonkin 2006). Peters und Stock (2008: 88) beziehen sich ebenfalls auf diese Studie, in der keine Angabe darüber gemacht wird, welchen Wortarten die übrigen 10 % der Tags angehören, und fragen entsprechend: »Können wir uns in der Tat auf die Behandlung von Substantiven und Adjektiven beschränken und Verben außer Acht lassen? Wie häufig kommen Verben überhaupt als Tags vor?« Die Ergebnisse der vorliegenden Untersuchung zeigen, dass Adjektive über einen Anteil von 8,2 % verfügen, während Verben mit nur 1,2 % tatsächlich vernachlässigbar sind.

Wenn Verben als Tags vergeben werden, so ist dies oftmals auch aus dem Kontext zu erklären. So ist beispielsweise ein Bild mit den Verben füttern, verboten ← 373 | 374 → getaggt. Die Tags beziehen sich dabei auf den intradiegetischen Text »Das Füttern von Möwen ist verboten.« Auch bei Partikeln und Pronomen kann man feststellen, dass diese meist in einem Kontext stehen, so in grünwalder, straße, stadion, an, der. Eine solche Tagvergabe ist jedoch aus Retrieval-Perspektive sinnlos; vielmehr müsste für ein erfolgreiches Retrieval das Tag Stadion an der Grünwalder Straße vergeben werden. Analoges gilt für die Tag-Serie Analog, (Scan, vom, Positiv), von, 1997; die Klammer, welche die Tags Scan, vom, Positiv umgibt, kann hier als Hinweis dafür gewertet werden, dass intendiert war, die getrennten Tags als ein einziges Tag-Label anzugeben, und dass auch die beiden Tags von und 1997 als Einheit gedacht waren, jedoch fälschlicherweise als getrennte Tags eingegeben wurden.475 Auch die drei Tags frankfurt, am, main gehören an sich zusammen; die Verschmelzung von Präposition und Artikel am ist also auch hier eigentlich Komponente einer größeren Einheit. Es lässt sich zusammenfassend festhalten, dass Partikel, Pronomen und Verben vor allem deshalb auftreten, weil an sich mehrteilige Tags irrtümlicherweise auf verschiedene Tag-Labels aufgeteilt wurden.

Oftmals ist es auch nicht einfach zu entscheiden, ob ein Tag als Verb oder als Nomen zu klassifizieren ist, wie etwa bei der Wortform Pumpen. Dabei könnte es sich sowohl um die Nennform eines Verbs (oder um dessen Konversionsprodukt) als auch um eine flektierte Form des Nomens Pumpe handeln. Oder ein Bild enthält beispielsweise nebst dem Tag dusche auch duschen; da nur eine Dusche abgebildet ist, kann dort davon ausgegangen werden, dass mit duschen nicht eine flektierte Form des Nomens, sondern die Nennform des Verbs gemeint ist. Weitere Schwierigkeiten bereitet die Kategorisierung von Tags wie outdoor oder retro. Outdoor kann sowohl als Nomen im Sinne von »Freizeitaktivitäten im Freien« (Duden 2013) als auch als Adverb in der Bedeutung »draußen, im Freien [befindlich, stattfindend]« (Duden 2012) verstanden werden. Retro kann entweder ein Nomen mit der Bedeutung »[bewusste] Nachahmung von Elementen früherer Stilrichtungen in Musik, Design o. Ä.« (ebd.) oder ein indeklinables Adjektiv im Sinne von »Elemente früherer Stilrichtungen in Musik, Design o. Ä. nachahmend« (ebd.) sein.476 Ob jeweils die eine oder andere Wortart gemeint ist, kann ausschließlich anhand der syntaktischen Verwendung bestimmt werden, die jedoch bei Tags nicht vorhanden ist. Daran zeigt sich, dass eine Kategorisierung von Wortarten auch nach formalen Kriterien nicht unproblematisch ist. ← 374 | 375 →

9.2.3  Tag-Tag-Relationen

Im vorliegenden Kapitel stehen die paradigmatischen semantischen Relationen zwischen den Tags einer Tag-Serie im Zentrum. Einerseits werden die innersprachlichen Relationen näher kategorisiert, andererseits wird auch aufgezeigt, welche Bedeutung den intersprachlichen Relationen zukommt.

Auf der Ebene der innersprachlichen Relationen kann zwischen Äquivalenz-, Hierarchie- und Assoziationsrelationen unterschieden werden. Bei den Äquivalenzrelationen wurden synonymische Relationen sowie solche zwischen Kurz- und Langformen, die als spezielle Form der Synonymie betrachtet werden können, berücksichtigt. Die Hierarchierelationen umfassen die Hyperonymie und die Holonymie, die Assoziationsrelationen wurden unterteilt in Antonymie, Pertonymie und Assoziation.

Für die Analyse der genannten Relationen wurde das lexikalisch-semantische Wortnetz GermaNet herangezogen, »das die wichtigsten und häufigsten Konzepte des deutschen Grundwortschatzes abbildet und die grundlegenden semantischen Relationen zwischen Konzepten und lexikalischen Einheiten wie Hyperonymie, Meronymie und Antonymie modelliert« (Kunze et al. 2007: 271). GermaNet wurde in Anlehnung an das Princeton WordNet entwickelt, und etwa ein Drittel der Daten sind in EuroWordNet477 eingebettet (vgl. ebd.: 271–272). Die Nomen, Verben und Adjektive sind in GermaNet in Wortnetzen, sogenannten Synsets, die aus mindestens einer Lexical Unit bestehen, gruppiert. Unter Lexical Unit wird eine lexikalische Form mit dazugehöriger Bedeutung verstanden (vgl. ebd.: 273), die in einem Synset definiert ist. Die Zeichenfolge <Hahn> kann somit in verschiedenen Lexical Units und Synsets vorkommen, zum einen in der Bedeutung »männliches Haushuhn«, zum andern im Sinne von »Vorrichtung zum Öffnen und Schließen von Rohrleitungen« (Duden 2012). In den Synsets werden also Mengen synonymer lexikalischer Einheiten zusammengefasst; weitere semantische Relationen sind zwischen den Synsets (Hyponymie, Meronymie etc.) oder den Lexical Units (Antonymie, Pertonymie, Partizip) definiert.

Die im April 2013 erschienene Version 8.0 von GermaNet, die für die vorliegende Untersuchung verwendet wurde, umfasst 84 584 Synsets, 111 361 Lexical Units, 96 925 konzeptuelle und 4 081 lexikalische Relationen, wobei bei letzteren die Synonymie nicht mitgezählt wurde.478 ← 375 | 376 →

Um die lexikalischen und konzeptuellen Relationen zwischen Tags einer Tag-Serie zu bestimmen, wurden die einzelnen Tag-Labels mit den Lexical Units abgeglichen (vgl. Kapitel 9.2.2.1) und die semantischen Relationen zwischen den Synsets auf die Tags übertragen. Bei Lexemen, die keiner Lexical Unit bei Germa-Net entsprachen, wurden allfällige Relationen zu den Co-Tags von mir ergänzt.

Für innersprachliche Tag-Tag-Relationen zeigt sich ein klares Bild: Meronymie-Relationen sind weitaus am häufigsten anzutreffen, an zweiter Stelle folgen Hyponymie-Relationen (vgl. Abbildung 91). Relationen zwischen Kurz- und Langform, zwischen flektierten und unflektierten Formen sowie Synonymie treten weitaus seltener auf. Die niedrige Anzahl an Synonymie- und Assoziationsrelationen kann darauf zurückgeführt werden, dass in GermaNet beide Relationen sehr eng definiert sind, was sich auch an der geringen durchschnittlichen Zahl von 1,32 Lexical Units pro Synset zeigt. Antonymie-Relationen sind nur mit einem einzigen Beleg (Süd–Nord) vertreten und sind grundsätzlich auch nicht zu erwarten, es sei denn, in einem Bild wären Gegensätze zu erkennen, die in Tags ausgedrückt werden.

Abbildung 91:  Innersprachliche Tag-Tag-Relationen (1 224 Relationen zwischen 620 Tags)

image

Innersprachliche Relationen machen im Vergleich zu intersprachlichen Relationen einen äußerst geringen Anteil aus (vgl. dazu auch Abbildung 92). Es sei angemerkt, dass es sich dabei ausschließlich um Übersetzungsrelationen zwischen dem Englischen und dem Deutschen handelt; wären weitere Sprachen einbezogen worden, wäre die Anzahl der Übersetzungsrelationen noch höher ausge ← 376 | 377 → fallen. Betrachtet man beispielsweise die Tag-Serie Mørk Skygge, face, gesicht, monochrome, gezicht, boom, tree, baum, wood, forest, bos, wald, bw, blackwhite, zwartwit, schwarzweiss, so können neben dem Username Mørk Skygge und dem Genre-Tag monochrome von den deutschsprachigen Tags gesicht, baum, wald und schwarzweiss vier Relationen zu englischsprachigen Tags ausgemacht werden; gleichzeitig liegen jedoch vier weitere intersprachliche Relationen zwischen dem Englischen und dem Niederländischen (gezicht, boom, bos, zwartwit) vor. Durch das Einbeziehen des Niederländischen hat sich in dieser Tag-Serie die Zahl der erkannten intersprachlichen Relationen verdoppelt. Zudem wurden bei den Übersetzungsrelationen lediglich (quasi-)synonymische Relationen berücksichtigt. Die Anzahl der Übersetzungsrelationen wäre noch höher ausgefallen, wenn weitere intersprachliche semantische Relationen oder innersprachliche Relationen in anderen Sprachen als dem Deutschen berücksichtigt worden wären.479

Zählt man die innersprachlichen und die intersprachlichen Relationen zusammen, zeigt sich, dass im Korpus 3 696 Relationen zwischen 1 819 Tags vorhanden sind, d. h. 18 % aller Tags sind Teil einer der genannten semantischen Relationen, wobei 80 Tags mehr als eine Relation aufweisen. So ist blackwhite in der soeben erwähnten Tag-Serie die Übersetzungsvariante von zwartwit bzw. schwarzweiss, die Langform zu bw und im Englischen auch ein innersprachliches Synonym zu monochrome. Semantische Relationen zwischen Co-Tags einer Tag-Serie konnten im Kleinkorpus bei 52 % der Fotoseiten identifiziert werden.

Die Tag-Serie mit den meisten semantischen Relationen sei im Folgenden präsentiert:

      Summer breeze, nature, blue sky, clouds, landscape, Sommer, Natur, blauer Himmel, Wolke, Wolken, cloud, Landschaft, Feld, Getreidefeld, Juli, July, Farm, Bauernhof, Baum, Bäume, Wald, tree, trees, forest, Burg, Bornstedt, Schweinsburg, Mansfeld-Südharz, Sachsen-Anhalt, saxony-anhalt, Germany, Deutschland, Europa, Europe, Canon, Canon Digital Rebel XSi, Canon Eos 450D, Burgruine, golden, gold, blau, weiss, blue, white, Wind, rural, ländlich , field, grain, grain field, Himmel, sky

Zwischen diesen 52 Tags konnten 26 semantische Relationen ausgemacht werden, und zwar 17 Übersetzungsrelationen, 5 Meronymie-Relationen, 2 Plural-Singular-Pendants (WolkenWolke, BäumeBaum), eine Hyperonymie-Relation (FeldGetreidefeld) sowie eine Pertonymie-Relation (goldgolden). ← 377 | 378 →

Abbildung 92:  Position der Bezugswörter zu den relationalen Tags

image

Interessant ist nun die Frage, in welcher Reihenfolge die Tags der einzelnen Relationen auftreten (vgl. Abbildung 92). Bei den Übersetzungen wird in 58 % der Fälle zuerst das englische Lexem und erst danach die deutsche Übersetzung genannt. Bei der Meronymie-Relation wird zu 60 % das Holonym vor dem Meronym aufgeführt, zu 57 % wird bei der Hyperonym-Relation das ebenfalls hierarchisch höhere Hyperonym zuerst vergeben. Bei den flektierten Tags steht in 79 % der Fälle die unflektierte Form voran, bei den Kurz- und Langform-Paaren geht zu 54 % die Kurzform der Langform voraus.

9.2.4  Tag-Bild-Relationen

Bei der Untersuchung der Art der auf Flickr-Seiten bestehenden Text-Bild-Relationen wurde eine Substichprobe durch Auswahl jeder fünfzehnten Fotoseite des Kleinkorpus gebildet und ausgewertet. Hierbei wurden inhaltliche und formale Relationen unterschieden, die sodann weiter differenziert wurden (vgl. Abbildung 93). Auf der Ebene der inhaltlichen Relationen wurde auf die in der Informationswissenschaft übliche Kategorisierung zurückgegriffen (vgl. Kapitel 5.6). Die Klassifikation der formalen Relationen wurde anhand von Flickr-Tags deduktiv erarbeitet. Hier spielen insbesondere Aspekte der Produktion sowie des Produkts, also der Fotografie, eine große Rolle. Unter Ausrüstung werden Informationen wie der Name der verwendeten Kamera oder des verwendeten Objektivs gefasst, mit Art des Bildes ist gemeint, ob es sich um eine Fotografie oder eine andere Bildart wie beispielsweise eine Zeichnung handelt. Die Zugehörigkeit beschreibt ← 378 | 379 → Tags wie Alben- oder Gruppennamen sowie Tags von Spielen. Die Kategorie Weltwissen zählt weder zu den formalen noch zu den inhaltlichen Relationen; vielmehr werden darunter Informationen verstanden, die über zusätzliche Quellen erschlossen werden müssen, beispielsweise der Name des Architekten eines abgebildeten Gebäudes.

Abbildung 93:  Formale und inhaltliche Relationen zwischen Tag und Bild

image

Gruppiert man die Tags nach formalen und inhaltlichen Relationen sowie nach der Kategorie Weltwissen, entfallen auf formale Relationen 46 %, auf inhaltliche 44 % und 10 % auf die Kategorie Weltwissen. Bei den inhaltlichen Relationen können lediglich 15 % der Aboutness zugerechnet werden. Bei den übrigen 85 % der Relationen auf der Objektebene (Ofness) handelt es sich wiederum bei 81 % um allgemeine Ofness.

Abbildung 94:  Formale Tag-Bild-Relationen

image ← 379 | 380 →

Bei den formalen Tag-Bild-Relationen entfallen 76 % auf Kategorien zur Produktion, lediglich 24 % der Tags beziehen sich auf das Produkt. In Abbildung 94 sind die einzelnen Subkategorien der formalen Relationen aufgeführt: Der Aufnahmeort ist hier die wichtigste Kategorie, gefolgt von der Nennung der verwendeten Ausrüstung sowie des Genres.

9.2.5  Tag-Text-Relationen

Tag-Text-Relationen sind aus der Perspektive des Information-Retrievals inter-essant. Die zentrale Frage dabei lautet, ob in Tags im Vergleich zum übrigen Text Zusatzinformationen enthalten sind oder nicht. Um diese Frage zu beantworten, wurden die Tag-Labels mit den anderen Metadaten, also dem Titel und der Beschreibung, verglichen. Es wurden dabei lediglich diejenigen Fotoseiten in die Analyse einbezogen, die sowohl über Tags als auch über einen Titel oder eine Beschreibung verfügen. Dies war bei 72 % der Fotoseiten im Kleinkorpus der Fall. Bei 45 % dieser Fotoseiten konnten Übereinstimmungen zwischen den Zeichenfolgen der Tag-Labels und des Titels identifiziert werden (vgl. Abbildung 95), d. h. mindestens ein Tag-Label einer Tag-Serie stimmt mit einem Teil des Titels überein. Bei den in Frage kommenden Seiten liegt die Übereinstimmungsrate also bei 62,5 %.

Abbildung 95:  Übereinstimmungen von Wortformen in Tags und Titeln

image ← 380 | 381 →

Auf den 716 Fotoseiten, die nebst Tags auch Titel enthalten, sind 6 174 Tags vergeben worden. Davon stimmen 13 % mit dem Titel überein. Heckner (2008: 8), der die Tag-Titel-Übereinstimmung ebenfalls untersucht, erhält ein etwas niedrigeres Resultat von 8 %.

Lediglich die Hälfte der Fotoseiten im Kleinkorpus weist über Tags hinaus zudem eine Beschreibung auf. Bei denjenigen Fotoseiten, die mit beidem versehen wurden, ist in 28 % der Fälle eine Übereinstimmung zwischen den Tags und der Beschreibung vorhanden. Insgesamt wurden hier 4 398 Tags vergeben, wovon 21 % mit Wortformen in der Beschreibung identisch sind.

Zusammenfassend lässt sich konstatieren, dass 87 % der Tags nicht im Titel enthalten sind und somit neue Informationen bereitstellen. Der Vergleich von Tags und Beschreibungen zeigt, dass 78 % der Tags Informationen enthalten, die in der Beschreibung nicht vorhanden sind. Man kann also festhalten, dass Tags für das Retrieval eine bedeutende Rolle spielen: Würden solche Tags nicht vergeben, könnten die Fotoseiten bei einer entsprechenden Suche nicht gefunden werden.

9.3  Bildnotizen

Bei der Notizenkommunikation handelt es sich um eine Kommunikation über Bilder, die über den Bildern – oder anders gesagt im Bild selbst – stattfindet. Wie auch bei der Analyse der Tags wurden die Notizen zunächst nach Einzelsprachen kategorisiert. Die deutschsprachigen Notizen dienten sodann als Ausgangspunkt für Analysen zur kommunikativen Funktion von Notizen (vgl. Kapitel 9.3.3), zu pragmatischen Notiz-Bild-Relationen (vgl. Kapitel 9.3.4) sowie zu Dialogen (vgl. Kapitel 9.3.5), die mittels Notizen geführt werden.

9.3.1  Basisdaten zu Notizen

Von den im Großkorpus vorhandenen Fotos sind 5,12 % mit Notizen versehen, also enthalten 7 703 Fotoseiten mindestens eine Notiz. Vergleichsdaten können aus zwei Studien herangezogen werden, in denen jeweils 150 000 Fotoseiten ausgewertet wurden, wobei es sich bei sämtlichen Fotos um Interestingness-Bilder handelt. Da diese eine weitaus höhere Anzahl an Seitenabrufen verzeichnen als Fotos in einer Gruppe wie Wir sprechen Deutsch, ist zu erwarten, dass diese Bilder im Durchschnitt häufiger mit Notizen versehen werden. Das Resultat der einen Studie lautet, dass 24,8 % der Interestingness-Fotos mit mindestens einer Notiz versehen wurde (vgl. Zhang et al. 2011: 3), bei der anderen Studie fällt der Wert mit 27 % noch ein wenig höher aus (vgl. Jeong et al. 2011: 166). ← 381 | 382 →

Die Gesamtzahl der Notizen beträgt 12 270. Gerechnet auf die Fotoseiten, die über Notizen verfügen, entspricht dies einem Mittelwert von 1,59 Notizen pro Bild, auf das Gesamtkorpus bezogen sind es lediglich 0,08 Notizen pro Bild. Die Verteilung der Notizen pro Fotoseite ist in Abbildung 96 zu sehen. In den meisten Fällen ist lediglich eine Notiz pro Bild vorhanden; dialogische Notizen, die in Kapitel 9.3.5 analysiert werden, sind demnach eine höchst seltene Erscheinung. Etwas höhere Werte haben Jeong et al. (2011: 166) in ihrer Studie ermittelt: Fotoseiten mit Notizen verfügen im Durchschnitt über 3,36 Notizen, im Gesamtkorpus sind es nur 0,94 Notizen pro Bild. Im Gegensatz zu Tags sind Notizen also ein vergleichsweise seltenes Phänomen.

Abbildung 96:  Verteilung der Notizen pro Fotoseite

image

Die 12 270 Notizen wurden von 2 952 Unique Usern verfasst, was also durchschnittlich 4,16 Notizen pro Unique User bei einer Standardabweichung von 4 entspricht. ← 382 | 383 →

Abbildung 97:  Anzahl der Notizen pro Account im Großkorpus

image

Die in Abbildung 97 zu sehende ausgeprägte Long-Tail-Verteilung bedeutet, dass die Notiz-Funktion von wenigen Nutzenden sehr ausgiebig, von den meisten jedoch selten bis gar nicht genutzt wird. In 47 % der Fälle stammen die Notizen von der Bildurheberin oder vom Bildurheber selbst.

Die durchschnittliche Zeichenlänge einer Notiz beträgt 29,45 Zeichen bei einer Standardabweichung von 32,73. In Abbildung 98 ist die konkrete Verteilung zu sehen.

Abbildung 98:  Umfang von Notizen

image ← 383 | 384 →

Die kürzeste Notiz beträgt lediglich ein einzelnes Zeichen, die längste Notiz umfasst 1 233 Zeichen (vgl. Abbildung 99). Bei der längsten Notiz handelt es sich um eine ASCII-Art-Notiz, die sich auf ein Foto bezieht, auf dem eine attraktive junge Frau abgebildet ist.

Abbildung 99:  Längste Notiz im Großkorpus (1 233 Zeichen)

image ← 384 | 385 →

Die maximale Anzahl an Notizen pro Foto im vorliegenden Großkorpus beträgt 37. In der bereits zitierten Studie von Jeong et al. (2011: 166) wurde ein Maximum von 400 Notizen pro Bild ermittelt.480

9.3.2  Sprachbestimmung

Die Bestimmung der Sprache von Notizen war bedeutend leichter als die Sprachbestimmung von Tags. Da Notizen mit durchschnittlich knapp 30 Zeichen meist kurze Sätze oder zumindest Syntagmen enthalten, kann in den meisten Fällen die Sprache problemlos identifiziert werden. Doch gibt es auch Notizen, die lediglich ein einzelnes Lexem enthalten. In solchen Fällen wurden für die Sprachbestimmung die jeweiligen Bilder und allfällige intradiegetische Texte zur Disambiguierung herangezogen.

Ein Beispiel für eine ohne das dazugehörige Bild nicht bestimmbare Notiz ist »EGE N? ;-)«. Der Notiztext bezieht sich auf einen intradiegetischen, deutschsprachigen Text, der aufgrund von Verwitterung oder durch menschlichen Einfluss nur noch partiell lesbar ist (vgl. Abbildung 100). In der Beschreibung des Fotos wird klar, was mit der Notiz gemeint ist: »Apropos ›gEGEn Nazis‹ […]« (Herv. im Original). Die Notiz wurde folglich als deutschsprachig klassifiziert, auch wenn einzelne Buchstaben fehlen.

Abbildung 100:  Notiz mit Bezug auf intradiegetischen Text481

image ← 385 | 386 →

Ebenfalls zum Deutschen gerechnet wurden Notizen, die in einem deutschsprachigen Dialekt verfasst wurden, beispielsweise dem Berlinischen (finde ick jut :-), kenn icke ;o)) oder einem schweizerdeutschen Dialekt (giligiligili.....chli am büchli chutzele ;-), Also die Rogeli wörd i grad met hei nee förs Schmineefüür!482). Abbildung 101 zeigt, dass über die Hälfte aller Notizen auf Deutsch verfasst wurden, weitere 5 % sind teils in deutscher, teils in einer anderen Sprache geschrieben. Für ein Viertel der Notizen wird Englisch verwendet; lediglich 9 % aller Notizen gehören einer anderen Sprache als Deutsch oder Englisch an, und mehrere andere Sprachen in Kombination sind mit 0,3 % vernachlässigbar. 3 % der Notizen sind nonverbal (image, :-), image, image) und 6 % konnten keiner Sprache eindeutig zugewiesen werden.

Abbildung 101:  Sprachwahl beim Verfassen von Notizen

image

Die 9 % der Notizen, die in Abbildung 101 unter andere gefasst sind, entsprechen den in Abbildung 102 aufgeführten Sprachen. Die drei romanischen Sprachen Spanisch, Italienisch und Portugiesisch sind deshalb so dominant, da unter den Top 5 der Heavy User je eine Person mit italienischer und mit portugiesischer Muttersprache zu finden ist, die jeweils ihre Muttersprache oder in symmetrischer interlingualer Kommunikation Spanisch verwenden. ← 386 | 387 →

Abbildung 102:  Sprachgebrauch in Notizen neben Deutsch und Englisch483

image

Ursprünglich wurde beim Hinzufügen einer Notiz von Flickr automatisch ein Standardtext angezeigt, der sich auch im Korpus finden lässt. Da auf Flickr verschiedene Sprachversionen verfügbar sind, sind diese Standardtexte in unterschiedlichen Sprachen anzutreffen: Im Korpus konnten 20 Belege für Add your note here, 17 für Fügen Sie Ihre Notiz hier ein sowie ein Beleg für Aggiungi la tua nota qui gefunden werden.

9.3.3  Kommunikative Funktionen von Notizen

Bei der Analyse der kommunikativen Funktionen von Notizen wurde folgende Vorgehensweise gewählt: In einer Pilotstudie wurden Notiz-Funktionen anhand eines Korpus ermittelt. Die daraus abgeleitete und bereits in Müller (2012a: 58) publizierte Klassifikation (vgl. Abbildung 103) wurde nun als Ausgangspunkt für die vorliegende Studie gewählt. ← 387 | 388 →

Abbildung 103:  Kommunikative Funktionen von Notizen

image

Zunächst einmal kann man feststellen, dass es Notizen gibt, die nur indirekt einen Bezug zum Bild aufweisen. So sind in Notizen Hyperlinks zu finden, die das Bild beispielsweise mit einem passenden Musikstück oder Videoclip auf einer externen Website verknüpfen oder die auf andere Flickr-Bilder verweisen.

Die Auswertung aller Hyperlinks in Notizen ergab, dass 6,3 % aller Notizen einen Link enthalten. Davon sind 29 % Personenmarkierungen, d. h. auf dem Bild zu sehende Personen wurden mittels einer Notiz mit einem Flickr-Account verknüpft. 38 % der Links verweisen auf andere Flickr-Fotos und 33 % der Links rekurrieren auf externe Websites. 34 % der externen Links führen zur freien Enzyklopädie Wikipedia, 23 % zu YouTube. Neben Notizen mit Hyperlinks lassen sich dialogische Notizen finden, die sich nicht (nur) direkt auf das Bild, sondern oftmals lediglich auf eine andere Notiz beziehen (vgl. Kapitel 9.3.5).

Bei den Notizen mit direktem Bildbezug sind zunächst die vier zentralen Grundaufgaben der Kunstkommunikation des Beschreibens, Deutens, Erläuterns und Bewertens zu nennen, die aus Platzgründen nicht in Abbildung 103 aufgeführt sind. In Abbildung 104 sind Beispiele für die einzelnen Grundaufgaben aufgeführt. ← 388 | 389 →

Abbildung 104:  Kommunikative Grundaufgaben am Beispiel von Notizen (Müller 2012a: 57)

image

Mit Notizen können nicht nur die kommunikativen Grundaufgaben erfüllt werden. Notizen werden darüber hinaus insbesondere für Bildbearbeitungsvorschläge, aber auch für Bezugnahmen auf intradiegetische Texte verwendet; außerdem lässt sich ein kreativ-spielerischer Umgang mit Notizen ausmachen.

Da Foto-Communitys auch dazu genutzt werden, die eigenen fotografischen Fertigkeiten zu verbessern, werden neben Bewertungen von Fotografien teilweise auch Verbesserungsvorschläge unterbreitet. Dabei wird nicht nur die Fotografie an sich, sondern auch deren Bearbeitung in einigen Fällen kritisch kommentiert (vgl. dazu auch Abbildung 124 auf S. 294). Wenn nicht das ganze Bild, sondern nur Ausschnitte bearbeitet werden sollen, eignen sich dafür auch Notizen, vor allem für das sogenannte Cropping (Zuschneiden von Bildern). Die Hoverbox stellt somit quasi ein denkbares Cropping dar. Des Weiteren kann mit den Notiztexten auch auf intradiegetische Texte verwiesen werden. Als Funktion der Notizen konnte hier einerseits die Übersetzung ermittelt werden, andererseits auch die Korrektur oder Veränderung von intradiegetischen Texten. Schließlich werden Notizen auch auf spielerische Art und Weise eingesetzt. Zunächst sei die Figurenrede genannt, die beispielsweise in Comics typischer ← 389 | 390 → weise in Sprechblasen484 erscheint (vgl. Stöckl 2004b: 272). Hoverboxen können analog als Sprech- oder Denkblasen verwendet werden, der Notiztext mutiert sogleich zur Figurenrede.

Abbildung 105:  Figurenrede485

image

Abbildung 106:  Note Art – Portrait486

image

Ein Beispiel für eine Denkblase sehen wir in Abbildung 105, wobei der Text auf die einzelnen Notizen verteilt wurde (gotta do that quicker next time…). Auch in Abbildung 106 sind eine Denk- und eine Sprechblase vorhanden (who will sit next to me..? sowie die Interjektion WOOF !!). Im Gegensatz zur Abbildung 105, in der die Figurenrede einer abgebildeten Person zugeordnet werden kann487, wurden die Person, mit der die Denkblase in Abbildung 106 verknüpft ist, sowie der Hund mit einer Sprechblase durch die Kombination von Hoverboxen kreiert. Diese Notizenverwendung wird Note Art488 genannt. Dabei entsteht durch die Anordnung der Notizen ein Bild, das sich wiederum auf die Fotografie bezieht – in Abbildung 106 also konkret ein Mensch, der auf dem fotografierten Stuhl sitzt, sowie ein Hund, der daneben bellt.

Ebenfalls kreativ können Notizen in fiktionalen oder faktualen Erzählungen auf Bildern eingesetzt werden: »factual narrative is referential whereas fictional ← 390 | 391 → narrative has no reference (at least not in ›our‹ world)« (Schaeffer 2009: 98). Als Beispiel für faktuale Erzählungen seien mit Notizen versehene Karten genannt, die für eine topologisch statt chronologisch aufgebaute Autobiographie verwendet werden (vgl. Ryan 2012: 113). Abgebildete Orte werden auf solchen Bildern mit Erinnerungen an Erlebtes verknüpft. Bei fiktionalen Narrationen489 hingegen fungiert die Fotografie gewissermaßen als Bühnenbild und konstituiert zusammen mit der theatralen Kommunikation den virtuellen Bühnenraum (vgl. Müller 2010: 246). So wie es Beißwenger (2002c: 101) für den Chat zeigt, kann ein solcher Bühnenraum auf Flickr gleichermaßen erst durch einen deklarativen Sprechakt zu einem fiktiven Schauplatz werden.

Für die Analyse der kommunikativen Funktionen von Notizen wurde aus den im Korpus vorhandenen Seiten mit Notizen eine Stichprobe gezogen, in die jede fünfzehnte Fotoseite aufgenommen wurde. In Abbildung 107 sind die Resultate der Analyse der Funktionen von Notizen mit direktem Bildbezug visualisiert.

Abbildung 107:  Funktionen von Notizen mit direktem Bildbezug (N = 64)

image ← 391 | 392 →

Die Nomination als Lösung der kommunikativen Grundaufgabe des Beschreibens stellt klar die Hauptfunktion von Notizen mit direktem Bildbezug dar. Ihnen kommt somit wie den Tags die Funktion der Dokumentation zu, nur dass sie nicht – wie die Tags – dem Bild global zugewiesen sind, sondern vielmehr einen Ausschnitt des Bildes beschreiben. Diese Nomination kann auf unterschiedliche Art und Weise erfolgen (vgl. Abbildung 108). In 58 % der Fälle handelt es sich um reine Nomination. Als Beispiele hierfür seien die Notizen Aprikosen, Alpen und Auge genannt, die man auch für Tags halten könnte.

Abbildung 108:  Nominationstypen von Notizen

image

In 30 % der Fälle ist die Nomination in eine Aussage eingebunden wie beispielsweise in der Notiz Gut versteckt: die Bibliothekarin ;-). Attribuierte Nominationen wie aber ein süßer Zopf! <:-) oder goldige Hamsterbäckchen sind in der Stichprobe mit 9 % vertreten, in 3 % liegen indirekt beschreibende Nominationen wie in Mit diesen Routinestörungen (System 2) durften sich andere Leute abgeben... vor. Ferner fällt auf, dass Prädikationen im Vergleich zu Nominationen in Notizen kaum vorkommen. Auch die Funktionen der Textkorrektur und der Übersetzung sind in der Stichprobe des hier verwendeten Großkorpus nicht vertreten. Abbildung 109 und Abbildung 110 zeigen deshalb Beispiele aus dem Korpus, das für die Pilotstudie verwendet wurde. ← 392 | 393 →

Abbildung 109:  Korrektur eines intradiegetischen Textes

image

Abbildung 110:  Übersetzung eines Textes

image

Auch für die beiden kreativ-spielerischen Funktionen sind in der gezogenen Stichprobe keine Beispiele enthalten, allerdings ließen sich in der für die Analyse der dialogischen Notizen (vgl. Kapitel 9.3.5) verwendeten Stichprobe Beispiele dafür finden.

In Abbildung 111 ist ein Beispiel für Note Art zu finden, bei der auf der Ebene der Notizfelder die Buchstaben E, M und C und die Notizfelder zur bekannten physikalischen Formel E = mc2 zusammengesetzt wurden. Auf der Ebene der Notiztexte kann aus den einzelnen Texten der Satz this is a new dimension of digital ART zusammengesetzt werden, den Notiztexten kommt hier also eine metakommunikative Funktion zu.

Abbildung 111:  Note Art im Großkorpus

image ← 393 | 394 →

In Tabelle 29 sind 22 Notiztexte zu einem Bild chronologisch angeordnet. Wie bereits erwähnt, sind Notizen zwar nicht mit einem Timestamp versehen, doch über den Seitenquelltext kann immerhin eruiert werden, in welcher Reihenfolge die Notizen verfasst wurden. Alle Notizen außer Notiz 7 sind in Dialoge eingebunden, die der fiktionalen Narration zugerechnet werden können.

Tabelle 29:  Fiktionale Narration in Notizen

Nickname

Notiztext

1

Mr.Pixel

....da komm ich mit meiner Raumkapsel... :)

2

Mr.Pixel

Bitte wenden Sie.... :)

3

~babsy~

bitte im kreisverkehr die 2. abfahrt nehmen

4

dolce geraldo

hier gehts richtung ERDE , erst Richtung Bommerlunder dann immer geradeaus , nach 384401 km haben Sie ihr Ziel erreicht

5

dolce geraldo

Landebahn für F10 Ghost bitte weiträumig freihalten :)

6

dolce geraldo

im Landeanflug...

7

Steffen Jakob

Major Tom

8

dolce geraldo

Achtung Achtung... Löschfahrzeuge bereithalten ----> F10 Ghost im Landeanflug------

A C H T U N G

9

~babsy~)

löschfahrzeuge im direktanflug ohne umweg

10

dolce geraldo

Tower an alle----> bitte räumen sie unverzüglich den Flughafen :)

11

Mr.Pixel

An Tower, wie siehts mit den Amis aus ? Sind die schon weg ? Landebahn frei ??

12

dolce geraldo

Tower an Ghost --->Luft rein Stinkbomben entschärft--- Ready for landing

13

Mr.Pixel

Roger, F10Ghost continue final approach...beep

14

Mr.Pixel

rutsch.....rumpel.....brrr ist das kalt hier.....

15

dolce geraldo

a bisserl zweit grutscht--- F10 hääää ?? wo bistn jetzt ?

16

~babsy~

platz für die kölner fahne, oder hat porz eine eigene ??

17

dolce geraldo

F10 F10 F10 F10*schrei*

18

~babsy~

Umleitung

19

dolce geraldo

Mayday Mayday ---Notruf von F10 empfangen

20

Mr.Pixel

Hülfäääää....schickt das Spaceshuttle.....rettet mich...beep...

21

~babsy~

spaceshuttle mit kölsch an bord zur rettung von ghost

22

Mr.Pixel

Da seid ihr ja endlich...juju... ← 394 | 395 →

Um die Dialoge verstehen zu können, ist die Information hilfreich, dass der Nutzer Mr. Pixel, der die fiktionale Narration initiiert, einst den Nickname F10 Ghost verwendete. Somit zeigt sich an diesem Beispiel, dass solche Veränderungen es erschweren, Relationen zwischen einzelnen Texten herzustellen. In Abbildung 112 ist eine nachgestellte Sicht des Bildes und der dazugehörigen Notizen zu sehen; die Nummern wurden zwecks Zuordnung der Notiztexte hinzugefügt.

Abbildung 112:  Notizfunktion der fiktionalen Narration

image

In den Notizen 1 bis 4 werden die Ansagen eines Navigationsgerätes bei einem Flug auf den Mond scherzhaft imitiert, in den Notizen 5 bis 13 wird die Landung auf dem Mond inszeniert, wobei in den Notizen 10 bis 13 ein Gespräch zwischen Pilot und Tower nachgeahmt wird. In den Notizen 15 bis 22 schließlich geht es um die Rettung desjenigen Nutzers, dessen Landung auf dem Mond inszeniert wurde. Ein weiteres, ausführlich diskutiertes Beispiel für fiktionale Narration in Notiztexten ist nachzulesen in Müller (2010: 242–250).

Eine letzte kommunikative Funktion von Notizen sei an dieser Stelle erwähnt: Es existieren nicht nur Relationen zwischen Notizen und Bild oder zwischen mehreren Notizen, sondern auch zwischen Notizen und anderen Textelementen auf Flickr-Seiten wie Bildtiteln, Beschreibungen, Kommentaren oder Tags. In der vorliegenden Stichprobe liegt ein solcher Bezug in immerhin einem Prozent aller Notizen vor. ← 395 | 396 →

9.3.4  Pragmatische Notiz-Bild-Relationen

In diesem Kapitel werden die in Kapitel 7.6 diskutierten Arten der pragmatischen Text-Bild-Relationen am Beispiel der Notizen untersucht. Die Datengrundlage bildete eine Stichprobe von 200 Fotoseiten mit mindestens einer deutschsprachigen Notiz. Wie es zu erwarten ist, tritt die Deixis bei den pragmatischen Notiz-Bild-Relationen am häufigsten auf (vgl. Abbildung 113), denn mit Deiktika kann in der Kommunikation über Bilder die basale Aufgabe des Bezugnehmens gelöst werden (vgl. Hausendorf 2011: 518). Im Folgenden soll deshalb zunächst auf die verschiedenen Formen der expliziten Deixis eingegangen werden. Im Anschluss daran werden implizit deiktische Relationen näher betrachtet. Bei diesen können die Agens- oder Patiens-Tilgungen im Text als Verweis auf das Bild gedeutet werden, in dem die getilgten semantischen Rollen realisiert sind.

Abbildung 113:  Notiz-Bild-Relationen (N = 200)

image

Bei den deiktischen Verweisen und auch bei den pragmatischen Notiz-Bild-Relationen generell ist die Lokaldeixis am häufigsten vertreten. Zumeist wird mit den Ortsadverbien da, dahinter oder dahinten auf das Bild verwiesen, hier ist die zweithäufigste Variante (vgl. Abbildung 114). Zum Adverb so seien der Anschaulichkeit halber die beiden Belege angeführt: wenn rechts nicht mehr ist, würde ich so schneiden. und die helle schleife wegstempeln. und Ich weiß, Du machst das ja nicht so gerne, aber ich würde es wirklich so beschneiden., wobei so im Sinne von da, in dem Notizfeld verstanden werden muss. ← 396 | 397 →

Abbildung 114:  Lokaldeiktische Ausdrücke (N = 22)

image

Bei den objektdeiktischen Ausdrücken stehen die bestimmten Artikel in der Funktion von Demonstrativa an erster Stelle, noch vor den Demonstrativpronomina (vgl. Abbildung 115).

Abbildung 115:  Objektdeiktische Ausdrücke (N = 17)

image

Schließlich können personaldeiktische Ausdrücke ausgemacht werden. Am häufigsten verwendet werden Personalpronomen, aber auch Artikel in demonstrativer Funktion werden genutzt (vgl. Abbildung 116). ← 397 | 398 →

Abbildung 116:  Personaldeiktische Ausdrücke (N = 7)

image

In einem weiteren Schritt wurden die Notizen auf Relationen hin untersucht, bei denen auf sprachlicher Ebene das Agens, das Patiens oder weitere semantische Rollen getilgt wurden, die aber dennoch im Bild realisiert sind. Wie in Kapitel 7.6 ausgeführt, sind es – was die sprachliche Realisierung betrifft – vor allem Ellipsen sowie Passivkonstruktionen, in denen semantische Rollen ausgespart werden.

Als Beispiel für eine Patiens-Tilgung in einer elliptischen Konstruktion sei die Notiz musste alles verrammelt werden, da das industriedenkmal von horden der linken szene besetzt war genannt, in der zu Beginn nicht wie zu erwarten das oder es steht; vielmehr ist der betreffende Teil im Bild mit einem Notizfeld versehen worden.

Abbildung 117:  Patiens-Tilgung in einer elliptischen Konstruktion

image ← 398 | 399 →

In Abbildung 118 ist ein Beispiel für eine Agens-Tilgung in einer elliptischen Konstruktion zu finden, wobei das im Bild realisierte Agens sogar an der Stelle steht, an der es in der sprachlichen Realisierung stünde. Es handelt sich hier um eine Topik-Ellipse: »Die Topiks, die im Deutschen im Vorfeld vorkommen, bleiben unerwähnt, besonders in der gesprochenen Sprache, in der die Gesprächsteilnehmer zum Äußerungskontext direkten Zugang haben« (Tanaka 2011: 122). Die sprachliche Realisierung von Notizen kann demnach – wie in Gesprächssituationen auch – elliptischer ausfallen.

Abbildung 118:  Agens-Tilgung in einer elliptischen Konstruktion

image

Ellipsen sind insbesondere dann auffällig, wenn das Subjekt wie in Abbildung 118 getilgt wird. Ein fehlendes Subjekt oder ein unbesetztes Vorfeld im Aussage-Modus wirken als Auslöser für die Suche nach den fehlenden Informationen (vgl. Zifonun et al. 1997: 415). Während in Abbildung 118 der Ersatz für das getilgte Subjekt im Bild, d. h. die Meerjungfrau, an einer zu erwartenden Stelle steht, ist in Abbildung 119 eine Notiz mit Agens-Tilgung zu finden: zupft ihr immer Federn aus. Aufgrund des realisierten Personalpronomens ihr und des markierten Fehlens der Federn kommt als Agens nur der Gänserich namens Gustav in Frage. Nun wäre zu erwarten, dass die Hoverbox demnach auf Gustav platziert würde, doch es ist nicht das Agens, sondern das Patiens markiert. Grund dafür ist, dass durch die gewählte Position der Hoverbox im Bild zusätzlich angezeigt wird, an welcher Stelle der weiblichen Gans die Federn ausgezupft werden. ← 399 | 400 →

Abbildung 119:  Agens-Tilgung in einer elliptischen Konstruktion mit Notizfeld auf Patiens

image

Im gezeigten Beispiel ist also das fehlende Subjekt weder explizit noch implizit über die Hoverbox ausgedrückt, sondern es muss kognitiv erschlossen werden.

In Abbildung 120 ist ein Beispiel für eine Agens-Tilgung in einer Passivkonstruktion zu finden: An ganz bestimmten Flügeladern werden die Stridulationstöne erzeugt. Das Notizfeld ist auf dem Agens – einer sogenannten Roesels Beißschrecke – platziert, gleichzeitig sind die in der Notiz genannten Flügeladern und somit das Instrument markiert.

Abbildung 120:  Agens-Tilgung in einer Passivkonstruktion

image

Als Letztes seien zwei Notizen genannt, in denen sowohl das Agens als auch das Patiens ausgespart ist (vgl. Abbildung 121). ← 400 | 401 →

Abbildung 121:  Inflektive: Agens- und Patienstilgung

image

Die Inflektive enthaltenden Notizen *streichel* :)) und *kraul* :) können über den Kontext interpretiert werden: Das Agens ist mit Nickname in der Notiz genannt, das Patiens ist im Bild zu sehen.

9.3.5  Dialogische Notizen

Für die Analyse der dialogischen Notizen wurde eine Stichprobe von 482 Fotoseiten zusammengestellt, wobei die Bedingung war, dass auf der Seite mindestens zwei Notizen vorhanden sein müssen und zumindest eine davon deutschsprachig sein muss. Rein fremdsprachige Dialoge wurden somit nicht berücksichtigt, es sei denn, sie kamen in den analysierten Daten neben deutschsprachigen Dialogen auf einer Fotoseite vor. Wie bereits in Kapitel 9.3.3 erwähnt, kann die Erstell-Reihenfolge der Notizen über den Seitenquelltext anhand ihrer IDs eruiert werden, wodurch diese in der vorliegenden Untersuchung rekonstruiert wurde. Den meisten Flickr-Mitgliedern dürfte diese Möglichkeit jedoch nicht bekannt sein.

Wenn zwei oder mehrere Notizen zu einem Bild Bezüge untereinander aufweisen, kann man von dialogischen Notizen sprechen. In der Pilotstudie konnte ich zeigen, dass 30 % der Notizen dialogisch sind, wobei es sich in drei Viertel der Fälle um zwei sich aufeinander beziehende Notizen handelt, also um klassische Adjazenzpaare (vgl. Müller 2012a: 61). In den übrigen Fällen bestanden die Dialoge aus drei bis maximal fünf Notizen. In der vorliegenden Untersuchung sind ← 401 | 402 → lediglich 12 % der deutschsprachigen Notizen dialogisch. Jeong et al. (2011: 170) konnten in ihrer Analyse feststellen, dass 10 % der Flickr-Notizen Frage-Antwort-Sequenzen darstellen, in denen nach dem Abgebildeten oder nach Hintergrundinformationen dazu gefragt wurde. Für die Anzahl der Notizen pro Dialog zeigt sich in der vorliegenden Studie ein ähnliches Bild wie in der Pilotstudie: 73 % der Dialoge bestehen aus zwei Notizen, immerhin 16 % aus drei. Der längste Dialog in der analysierten Stichprobe umfasst 10 Notizen und entstammt einem weiteren Beispiel für fiktionale Narration (vgl. Kapitel 9.3.3).

Abbildung 122:  Anzahl der Notizen pro Dialog

image

In Kapitel 9.3.1 wurde bereits darauf hingewiesen, dass Notizen ein vergleichsweise seltenes Phänomen sind. Dialogische Notizen sind noch seltener und mehr als ein Dialog pro Fotoseite kommt kaum vor (vgl. Abbildung 123). ← 402 | 403 →

Abbildung 123:  Seiten nach der Dialoganzahl je Fotoseite (N = 180)

image

Wie sich in einigen bereits zitierten Beispielen bereits abgezeichnet hat, ist in Notizen oftmals ein informeller Sprachgebrauch zu beobachten. Auf welche Faktoren dies zurückgeführt werden kann, wäre zu untersuchen. Bereits genannt wurde die konzeptionelle Mündlichkeit, die Anrede fällt in Notiz-Dialogen ebenfalls informell aus. So konnten in allen deutschsprachigen dialogischen Notizen 149 Belege gefunden werden, in denen Nutzende von anderen geduzt werden. Die formelle Anrede hingegen ist gar nicht belegt.490 Was also für Chats oder Kommentare in Weblogs gilt, ist auch für Notizen bei Flickr zutreffend: Es werden auch unbekannte Personen geduzt (vgl. Dürscheid 2007: 38). Manche vermuten in dieser Informalisierungstendenz einen Einfluss des Englischen oder Skandinavischen (vgl. Besch 2008: 2624), andere interpretieren das Duzen als »Symptom einer gemeinsamen virtuellen Lebenswelt« (Kretzenbacher 2010: 11).

Die Kommunikation anhand von Notizen ist im Allgemeinen nicht linear angeordnet wie beispielsweise diejenige in einem Chat oder in einem Forum. Vielmehr können die Kommunikationsteilnehmenden die Anordnung der Hover ← 403 | 404 → boxen in der Fläche theoretisch beliebig bestimmen. Wir sind es jedoch gewohnt, »räumliche Nähe auf einem Textträger […] als Zeichen der Zusammengehörigkeit [zu interpretieren]: bei Bildüber- oder -unterschrift, bei Schrift innerhalb der Bildfläche, bei Sprech- oder Denkblasen im Bild usw.« (Sandig 2000: 10). Es ist aus diesem Grund zu erwarten, dass dialogische Notizen im Normalfall ein bestimmtes Näheverhältnis aufweisen. Die Hoverboxen können demnach nebeneinander platziert werden, ohne dass sie sich jedoch berühren. Bei solchen Adjazenzpaaren müssen die Nutzer die Zusammengehörigkeit über den Notizentext herstellen (vgl. Müller 2012a: 63). Darüber hinaus gibt es zwei weitere Anordnungsmöglichkeiten: die Überschneidung (vgl. Abbildung 124). bzw. Berührung und die Verschachtelung.

Abbildung 124:  Dialogische Notizen: Adjazenzpaar491

image

Die Analyse der Stichprobe ergab, dass 34 % der Notizen nebeneinander und ohne Berührung platziert sind, 29 % sind überschneidend (inkl. berührend) und nur 3 % der Notizen sind überlagernd, sprich ineinander verschachtelt (vgl. Abbil-dung 125). In 57 % der verschachtelten Notizen wird die zweite Notiz in die erste hineingeschrieben. Bei der umgekehrten Positionierung ergibt sich das Problem, dass die erste Notiz, die sich dann quasi hinter der zweiten befindet, nicht mehr aufrufen lässt. ← 404 | 405 →

Abbildung 125:  Positionierung von Notizen: Anordnung

image

Untersuchenswert erscheint nun die Frage, welcher Art das oben genannte Näheverhältnis ist. So wurde überprüft, ob die Anordnung der Dialoge der zu erwartenden Leserichtung, nämlich von links nach rechts bzw. von oben nach unten entspricht (vgl. Stöckl 1998: 78). Wie Abbildung 126 zu entnehmen ist, werden tatsächlich in den meisten Fällen die sich überschneidenden Notizen nach unten rechts angeordnet.

Abbildung 126:  Positionierung von Notizen: Ausrichtung bei Überschneidung

image ← 405 | 406 →

Noch deutlicher wird die klare Präferenz für die Richtung nach rechts unten, wenn man die Ergebnisse gruppiert: Total 41 % der überschneidenden Notizen sind nach rechts/unten angeordnet, an zweiter Stelle ist mit 21 % die entgegengesetzte Richtung (oben/links) vertreten, knapp gefolgt von oben/rechts (20 %) sowie links/unten (18 %).

9.4  Synopse

Die prototypische deutschsprachige Flickr-Seite enthält neben einem Foto einen kurzen Titel (von 20 Zeichen), eine kurze Beschreibung (139 Zeichen) und 14 Tags, die ausnahmslos vom Urheber vergeben werden. Das dargestellte Foto wird 7 Mal kommentiert, jedoch nicht mit einer Notiz versehen. Die prototypische Flickr-Nutzerin bzw. der prototypische Flickr-Nutzer aus dem deutschsprachigen Raum lädt 16 Fotos bei Flickr hoch, verwendet für den Titel 18 Zeichen, fügt eine Beschreibung mit 181 Zeichen hinzu und hinterlässt zwei Kommentare. Die Notizfunktion nutzt die Person jedoch nicht. Die eigenen Fotos versieht die Nutzerin bzw. der Nutzer mit 10 Tags, zu denen die Tag-Labels Germany und Deutschland, die Angabe eines Markennamens (Ausrüstung) sowie die des Aufnahmeortes gehören.

Die Resultate der empirischen Analyse zeigen, dass die untersuchten kommunikativen Praktiken des Social Taggings und der Notizenkommunikation unterschiedlich populär sind. Tags sind auf über 85 % aller Fotoseiten anzutreffen, wobei durchschnittlich 10 Tags pro Fotoseite vorhanden sind. Mit Notizen versehen sind hingegen lediglich rund 5 % aller Fotoseiten, was einem äußerst geringen Anteil von 0,08 Notizen pro Bild entspricht. Aus diesem Grund mussten für die Untersuchung der Notizen eine Datenbasis von rund 150 000 Flickr-Seiten herangezogen werden, die gleichzeitig auch für valide statistische Angaben zur Kommunikation auf Flickr verwendet wurde. Bezüglich der Sprachverwendung in der multilingualen Community Flickr lässt sich feststellen, dass über die Hälfte aller Notizen auf Deutsch verfasst sind, Englisch macht nur ein Viertel der verwendeten Sprachen aus. Die Tags sind in über einem Drittel auf Deutsch und in knapp einem Drittel der Fälle auf Englisch verfasst; die Bedeutung des Englischen ist demnach im Bereich der Dokumentation größer als im Bereich der Kommunikation. Dieses Ergebnis verwundert nicht, denn für das Übersetzen von Tags werden weniger Sprachkenntnisse benötigt als für das Verfassen von Notizen: Es reicht dafür aus, ein Wörterbuch zu benutzen – um Sätze zu verfassen, sind grammatische Kenntnisse erforderlich.

Tags, so zeigt die empirische Analyse, werden beim Social Tagging auf Flickr zum größten Teil von den Urheberinnen und Urhebern der Fotos vergeben. Le ← 406 | 407 → diglich 0,39 % aller Tags werden von anderen Community-Mitgliedern eingetragen. 90 % der Tag-Labels konnten als Nomen klassifiziert werden; nur 7 % davon werden als Pluralform angegeben. Auffällig ist, dass 63 % der Nomen auf Eigennamen (inkl. Markennamen und Toponyme) entfallen. Bezüglich der Schreibung sind zwei Resultate von Bedeutung: Aus Sicht der Retrievals ist es relevant, dass lediglich in 1 % aller Tags Tipp- oder Rechtschreibfehler enthalten sind. Die Groß-und Kleinschreibung spielt für das Retrieval keine Rolle. Umso erstaunlicher ist es, dass auf eine korrekte Großschreibung der Nomina und insbesondere der Eigen- und Markennamen geachtet wird. Im Bereich der Morphologie konnte festgestellt werden, dass bei einem Drittel der Komposita in derselben Tag-Serie als Co-Tag das Determinans oder Determinandum enthalten ist. Bei Komposita mit dazugehörigem Determinandum kann zwischen den beiden Tag-Labels eine Hyperonymie-Relation ausgemacht werden; bei Komposita mit entsprechendem Determinans handelt es sich um Meronymie- oder Assoziationsrelationen.

Bei den Tag-Tag-Relationen ist die Meronymierelation die häufigste und die Hyperonymie-Relation die zweithäufigste. Dass die Meronymierelation an der Spitze steht, lässt sich damit erklären, dass bei den Tag-Bild-Relationen auf der Ebene der formalen Relationen der Aufnahmeort am wichtigsten ist. Zumeist wird dieser mittels Begriffsleitern auf mehreren Ebenen angegeben (Zürich-Schweiz-Europa), was zu einer großen Anzahl an Meronymierelationen führt. Bei den beiden dominanten Relationen, die auch als Hierarchie-Relationen bezeichnet werden, werden meist zuerst hierarchisch höhere Tag-Labels vergeben, erst danach niedrigere. Insgesamt weisen 18 % aller Tags eine semantische Relation zu einem Co-Tag auf. Innersprachliche Relationen machen jedoch im Vergleich zu intersprachlichen Relationen (v. a. Englisch-Deutsch) einen äußerst geringen Anteil aus. Hierbei ist bemerkenswert, dass selbst in einer deutschsprachigen Community in den meisten Fällen zuerst das englische Tag-Label und erst danach das deutschsprachige vergeben wird.

Die Analyse der Tag-Bild-Relationen ergab, dass die Verteilung auf formale und inhaltliche Relationen ausgewogen ausfällt. Wie bereits erwähnt, ist bei den formalen Relationen der Aufnahmeort mit Abstand am wichtigsten, darüber hinaus werden bei Flickr oft auch Angaben zur verwendeten Ausrüstung gemacht.

Schließlich wurden die Tag-Text-Relationen hinsichtlich der Verteilung des Informationsgehalts untersucht. Zusammenfassend kann festgehalten werden, dass die Tags in rund 80 % der Fälle Informationen bereitstellen, die so nicht im Titel oder der Beschreibung derselben Fotoseite vorhanden sind. Folglich sind Tags für das Retrieval von großer Bedeutung, sie haben also einen Zusatznutzen. ← 407 | 408 →

Notizen sind an sich schon ein vergleichsweise seltenes Phänomen, dialogische Notizen kommen sogar nur in 12 % aller deutschsprachigen Notizen vor. In drei Vierteln bestehen Notizen-Dialoge lediglich aus zwei sich aufeinander beziehenden Notizen. Anhand der dialogischen Notizen konnte gezeigt werden, dass in der Community – wie in vielen Angeboten des Internets auch – informelle Anredeformen verwendet werden. Dialogische Notizen-Kommunikation ist deshalb untersuchenswert, da die Texte im Raum nach Belieben platziert werden können. In der Analyse konnte gezeigt werden, dass die Anordnung der Notizfelder entsprechend der gewohnten Leserichtung, also nach rechts und unten, angeordnet werden.

Bei den Notiz-Bild-Relationen wurden explizit und implizit deiktische Relationen untersucht, bei denen die Informationen auf Text und Bild verteilt sind, sprich es wurden ausschließlich komplementäre Text-Bild-Relationen analysiert. Explizit deiktische Relationen sind – wie zu erwarten – häufiger vertreten als implizit deiktische Relationen. Es wurden hier auf der Ebene der Sprache Beispiele für elliptische Konstruktionen sowie Passivkonstruktionen analysiert, sofern das Agens und das Patiens (sowie allenfalls weitere semantische Rollen) auf Text und Bild verteilt waren.

Im Folgenden sollen aufgrund der Ergebnisse des empirischen Kapitels die Folgen für die Praxis diskutiert werden. Konkret werden Empfehlungen für Dienstanbieter von Taggingsystemen ausgesprochen:

Wie die Analysen gezeigt haben, sind die Urheberinnen und Urheber von Fotos, die diese bei Flickr zur Verfügung stellen, häufig bereit, Tags zu vergeben – und dies sogar zweisprachig. Eine erste Maßnahme zur Unterstützung der Userinnen und User bei der Tagvergabe könnte folglich darin bestehen, automatische Vorschläge für Übersetzungen zu eingegebenen Tags anzubieten.

Überhaupt wäre es sinnvoll, wenn im Hintergrund Wörterbücher zur Verfügung stünden, um den Nutzern Vorschläge zu unterbreiten, die neben der Übersetzung der Disambiguierung von Tags dienen, Kurzformen auflösen, Synonyme präsentieren sowie weitere relationale Tags wie Hyperonyme und Hyponyme, Meronyme etc. anbieten. Auch Rechtschreibfehler könnten reduziert werden, wenn unbekannte Wörter unter der Voraussetzung einer automatisch ermittelten oder manuell eingestellten Sprache auf Ähnlichkeiten hin analysiert werden. Auch damit würde die Qualität des Retrievals verbessert.

Die Analysen haben gezeigt, dass die Taggenden häufig nicht mit mehrteiligen Tags umgehen können. Um diese einzugeben, bedarf es der Verwendung von Anführungszeichen. Einige Tags weisen allerdings eindeutig darauf hin, dass die Nutzerinnen und Nutzer davon keine Kenntnis oder die Anwendung vergessen ← 408 | 409 → haben, weshalb flektierte Funktionswörter wie am (bei den drei Tag-Labels Frankfurt, am, Main) oder Nomen wie kaiserreichs, kölner in den Tag-Serien zu finden sind. Für die Tag-Eingabe relevante Informationen müssten folglich deutlicher hervorgehoben werden. Der alternative Einsatz von Unterstrichen, Interpunktionszeichen oder gar Bindestrichen ist von den Taggenden eine selbst gewählte Strategie zur Problemlösung, doch aus der Retrieval-Perspektive wenig sinnvoll. Bei Flickr wird zwar nicht unterschieden zwischen einem Spatium und einem Unterstrich, da beide Zeichen bei der Suche getilgt werden, doch können sie auch Wortgrenzen disambiguieren, sofern sie erhalten bleiben.

Darüber hinaus sollten typographische Anführungszeichen genauso wie Satzzeichen gefiltert werden, um Tags wie »April 2010« oder »Baltijas valstis« zu verhindern. Sie sollten folglich den geraden (für die Programmierung entscheidenden) Anführungszeichen gleichgestellt, als Trennungsmarker von mehrteiligen Tags akzeptiert und damit getilgt werden.

Durch eine sprachspezifische Analyse könnten auch die durchaus sinnvollen, jedoch selten mitgetaggten Schreibvarianten das Retrieval verbessern, indem etwa automatisch geprüft wird, ob Tags mit durch ss ersetztem ß angegeben worden sind (straße/strasse). Entsprechend könnte man mit Umlauten (hütte/huette) und Schreibvarianten, insbesondere von Fremdwörtern (Foto/photo), verfahren.

Die Analyse zu Tag-Bild-Relationen zeigt, dass jeweils knapp die Hälfte der Tags der formalen bzw. der inhaltlichen Erschließung dient. Auch bei herkömmlichen Wissensorganisationssystemen werden diese beiden Ebenen strikt getrennt. Es ist deshalb zu überlegen, ob man entsprechend eine Zweiteilung der Tags vornehmen soll. In Anbetracht dessen, dass die Nomination die am häufigsten verwendete Funktion von Notizen darstellt, was einem Tagging von Bildausschnitten entspricht, stellt sich auch bei den Notizen die Frage, ob man eine Zweiteilung in Notizen-Tags und Notizen-Kommentare anbietet. Optional könnten die Notizen-Tags auch zusätzlich bei den Tags aufgeführt werden. ← 409 | 410 → ← 410 | 411 →


447   Die Größe der Community ist deshalb relevant, weil Daten von einer größeren Menge und vielen unterschiedlichen Nutzenden heterogener ausfallen dürften.

448   http://www.flickr.com/groups/92751773@N00 (08.08.2013).

449   http://www.flickr.com/groups/_flickr-fotografen-_deutschland_/pool (08.08.2013).

450   In der Gruppenbeschreibung von Wir sprechen Deutsch steht kurz und bündig »Gruppe deutschsprachiger flickr´s :)«, bei der Gruppe Flickr-Fotografen Deutschlands ist zu lesen: »Eine Gruppe für alle Hobbyfotografen nicht nur aus Deutschland. Bei uns kann jeder, der Hobbyfotograf ist, seine Fotos der Gruppe zufügen. Die Gruppensprache ist Deutsch. Hier wird es allen Hobbyfotografen ermöglicht, ihre Bilder, egal wo sie gemacht wurden, zu zeigen. […] Es sind alle Motive zugelassen, außer Pornografie und Bilder mit radikal politischem Inhalt« (Herv. entfernt).

451   Die Gruppe Germany (http://www.flickr.com/groups/germany, 08.08.2013) ist mit knapp 11 000 Mitgliedern und über 285 000 Fotos ebenfalls eine große, explizit deutschsprachige Gruppe, doch ist die Gruppe einerseits thematisch auf Deutschland beschränkt, andererseits gibt es in dieser Gruppe die Regel, dass Mitglieder täglich maximal zwei Fotos in den Gruppenpool stellen dürfen.

452   An dieser Stelle möchte ich Torsten Siever recht herzlich für die Bereitstellung der Daten des Großkorpus danken.

453   146 914 Bilder sind mit einem Titel versehen, 3 270 Bilder sind mit »Unbenannt« betitelt; diese Bezeichnung wird von Flickr automatisch vergeben, wenn kein Titel hinzugefügt wird, weshalb sie nicht zu den Titeln gerechnet wurde. Darüber hinaus haben jedoch 55 Bilder weder einen Titel noch sind sie mit »Unbenannt« beschriftet, d. h. die Nutzenden haben das automatisch generierte »Unbenannt« gelöscht.

454   Diese Angabe bezieht sich – wie auch die durchschnittliche Zeichenzahl – lediglich auf deutschsprachige Kommentare, und zwar wurde jeweils lediglich der erste deutsch-sprachige Kommentar erfasst.

455   Früher war die Länge der Notizen auf 300 Zeichen begrenzt (vgl. Müller 2012a: 54), inzwischen ist keine Zeichenbeschränkung mehr vorhanden.

456   Die Daten der zitierten Zahlen wurden allerdings 2009 erhoben, als die Einbettung von Bildern auf Twitter noch nicht möglich war: http://corpora.mediensprache.net/de/corpora/show.aspx?cid=119.

457   http://www.flickr.com/help/tags/ (01.07.2015).

458   High Dynamic Range. Ein High Dynamic Range Image (HDRI, zu Deutsch meist HDR-Bild) ist, wie es der englische Ausdruck besagt, ein Bild mit hohem Dynamikumfang, also ein digitales Hochkontrastbild (vgl. https://de.wikipedia.org/wiki/High_Dynamic_Range_Image, 10.08.2013).

459   Weitere Schreibvarianten sind belegt, doch liegen diese unter der Promillegrenze und können deshalb vernachlässigt werden. Für die konsequente Großschreibung sind 9 Belege vorhanden, zudem ist je einmal dEUTSCHLAND und einmal DeutschlanD belegt. Bei dEUTSCHLAND kann vermutet werden, dass die Caps-Lock-Taste versehentlich betätigt war, bei DeutschlanD wurde wahrscheinlich die Umschalttaste für das nächste Tag bereits gedrückt, denn das darauf folgende Tag beginnt ebenfalls mit einem großen D.

460   Auch für dieses Tag konnten 15 Belege in konsequenter Großschreibung gefunden werden.

461   Die Groß- oder Kleinschreibung spielt zwar für das Retrieval keine Rolle, wird aber bei der Anzeige auf der Fotoseite so wiedergegeben, wie es die Nutzenden eingeben.

462   Die englische Übersetzung des Tags Blätter müsste leaves heißen, hier wurde die falsche Pluralform leafs verwendet.

463   »Fotografisches Objektiv mit extrem weitem Bildwinkel u. entsprechend kurzer Brennweite; Weitwinkel-, Fischaugenobjektiv« (Duden 2010).

464   Auch dem aus dem Japanischen stammenden Ausdruck Bokeh wird im Deutschen das Neutrum zugewiesen: »Das Bokeh mag ich ganz besonders. =)«. In vielen Fällen dürfte allerdings eine Reduktion vorliegen; so ist beim hier genannten Beispiel vermutlich die Konstituente Foto/Bild getilgt worden (das Bokeh-[Foto] oder das HDR-[Bild]; vgl. auch die SMS-[Nachricht]).

465   »The Levenshtein distance is a simple distance metric derived from the number of edit operations needed to transform one string into another« (Greenhill 2011: 689).

466   Ein weiteres Beispiel mit denselben Levenshtein-Distanzen ist das Tag Kommunism.

467   Eisenberg (2011: 94) bezeichnet Markennamen als besonderen Typ von Eigennamen. Unter Eigennamen sind in der vorliegenden Arbeit Namen von Personen und nach Personen benannte Objekte gefasst, wohingegen mit Markennamen sowohl Produktnamen als auch Firmennamen gemeint sind.

468   High Dynamic Range (Image), Electro-Optical System, Digital Single-Lens Reflex.

469   Nordrhein-Westfalen, Friuli-Venezia Giulia.

470   Die Summe der Prozentwerte liegt unter 100, weil Tags mit Binnengroßschreibung in der Abbildung nicht dargestellt wurden.

471   Bei den letzten beiden Tags handelt es sich um Gruppen-Tags der Gruppe Guess Where Berlin, in der in Berlin aufgenommene Fotos gepostet werden, deren genauer Aufnahmeort von den anderen Gruppenmitgliedern erraten werden soll. Das Tag guessedberlin bedeutet, dass das Rätsel bereits gelöst wurde, und gwbthmlamp zeigt an, von wem (thmlamp).

472   Seit der Rechtschreibreform wird Schloss ohnehin ohne Eszett geschrieben. Die Schreibvariante mit Eszett ist aber dann sinnvoll, wenn es sich um einen bis dato nicht der Reform angepassten Eigennamen handelt (Schloß Bückeburg).

473   Schwarz-weiß, depth of field, dynamic range increase, high-dynamic-range, colour key und zuiko digital.

474   Landesgartenschau, Aegidientorplatz, Staatssicherheit und Weltmeisterschaft.

475   Leerschläge werden bei Flickr als Beginn eines neuen Tags gewertet; mehrteilige Tags müssen in Anführungszeichen gesetzt werden, um in einem einzigen Tag-Label und nicht in mehreren zu erscheinen.

476   Nach der Fünf-Wortarten-Lehre wäre retro als Partikel zu klassifizieren, die jedoch funktional adjektivisch auftritt.

477   Im EuroWordNet wurden verschiedene einzelsprachliche lexikalisch-semantische Wortnetze miteinander verknüpft, und zwar diejenigen zur niederländischen, italienischen, spanischen, deutschen, französischen, tschechischen und estnischen Sprache (vgl. Vossen 1998: 75).

478   http://www.sfs.uni-tuebingen.de/lsd/ (17.08.2013). Weiterführende Informationen zu GermaNet finden sich in Kunze (2005; 2010) sowie im Kapitel 6 von Kunze und Lemnitzer (2007).

479   Neben intersprachlichen semantischen Relationen könnten auch weitere Relationen untersucht werden. Exemplarisch sei die im Kleinkorpus belegte »intervarietätische« Hyperonymie-Relation zwischen dem Standarddeutschen Schnecke und dem Schweizerdeutschen Rosschnägg genannt.

480   In einem weiteren Korpus, das für einen Beitrag erhoben wurde, ist eine Fotoseite mit 232 deutschsprachigen Notizen zu finden (vgl. Müller 2012a: 52): http://www.flickr.com/photos/flexgordon/196567841 (19.08.2013).

481   http://www.flickr.com/photos/schubi74/5153654925/in/pool-92751773@N00/ (19.08.2013).

482   Übertragung ins Standarddeutsche: Killekillekille… ein wenig am Bäuchlein kitzeln ;-), Also diese Rundhölzer würde ich gerade mit nach Hause nehmen für das Kaminfeuer!

483   In Abbildung 102 nicht aufgeführt sind folgende Sprachen, für die jeweils lediglich ein Beleg vorliegt: Albanisch, Bulgarisch, Finnisch, Japanisch, Hebräisch, Slowakisch, Slowenisch und Türkisch.

484   Die Verwendung von Text in Sprechblasen ist nur eine von vier Funktionen der Schrift in Comics. Schrift tritt darüber hinaus in den Comic-Bildern intradiegetisch auf, in Erzählerkommentaren (auch captions genannt) sowie in Onomatopoetika, die in das Bild integriert sind (vgl. Schmitz-Emans 2012: 73).

485   http://www.flickr.com/photos/aqui-ali/11132800/ (07.07.2013).

486   http://www.flickr.com/photos/realjer/6115154/ (07.07.2013).

487   Quicker korrespondiert zudem mit der Verschwommenheit der Aufnahme, da Unschärfe als Darstellung von Bewegung gedeutet werden kann (vgl. Wetzchewald 2012: 341).

488   Weitere Beispiele für Note Art sind in Müller (2010: 241; 2012a: 59) zu finden.

489   Nach Fix (2011b: 78) würde man diese als »narrative Strukturen« bezeichnen, d. h. es sind nicht bestimmte erzählende Gattungen gemeint. Zwar kann fiktionale Prosa als Prototyp für narrative Belletristik genannt werden, doch auch die Gattung Theaterstück kann unter die fiktionale, narrative Literatur subsumiert und mit Methoden der Narratologie erforscht werden (vgl. Hühn, Sommer 2009: 228).

490   Es lassen sich zwar 21 Belege finden, in denen eine Höflichkeitsform auszumachen ist, doch handelt es sich dabei bei 17 Notizen um den von Flickr automatisch vergebenen Standardtext Fügen Sie Ihre Notiz hier ein, in zwei Fällen handelt es sich um eine Kommentierung des Bildes und in zwei Fällen um die Navigationsansagen aus dem Beispiel der fiktionalen Narration in Kapitel 9.3.3.

491   In der Abbildung 124 schlägt ein User mit dem Nutzernamen Herr Olsen vor, einen Teil der Fotografie zu retuschieren. Es handelt sich also hierbei um ein Beispiel, bei dem wie beim Cropping auf die zu bearbeitende Stelle verwiesen wird. Der Urheber der Fotografie reagiert darauf mit dem Argument, der Arbeitsaufwand für die Retusche sei für die Publikation im Internet, bei der Bilder nur in geringerer Auflösung veröffentlicht werden können und folglich der Makel der Fotografie unauffälliger ist, nicht lohnenswert. Erst seit dem Flickr-Relaunch vom 20. Mai 2013 werden die Fotos in hoher Auflösung angezeigt.