Seit dem 18. Jahrhundert hat sich Bergsteigen zu einer Tätigkeit entwickelt, die von Historiker*innen als außerordentlich wichtig dafür gewertet wird, wie sich die sogenannte westliche Welt Begriffe wie Eroberung, menschliche Errungenschaft und Wildnis vorstellt. Die Berge und vor allem der Alpinismus sind in Europa bedeutungsvoll, ebenso die Diskurse darüber. Gerade beim Bergsteigen ist das Sprechen oder Schreiben darüber absolut zentral für das Tun selbst.
Das Projekt Semantics for Moutaineering History (Sem4Hist, SEMOHI) hat zum Ziel das Korpus Alpenwort semantisch anzureichern und zwar durch die Identifizierung und Verschlagwortung von:
- Orten wie Bergen, Regionen, Wegen oder Hütten
- Personen wie Bergsteiger*innen, Führer*innen oder Wissenschaftler*innen und
- Erstbesteigungsereignissen, wie z.B. die Erstbesteigung des Großvenedigers durch Josef Schwab 1841
Dafür verwendet das Projekt das Korpus Alpenwort (2014 – 2016), ein im Vorgängerprojekt Alpenwort lingusitisch annotiertes Korpus der Zeitschrift des Österreichischen und Deutschen Alpenvereins.
Was heißt „semantisch anreichern“?
Eine semantische Anreicherung ermöglicht interessante Anfragen an Texte zu stellen, wie z.B.
Was wäre eine Liste aller im Zusammenhang mit der Venedigergruppe genannten Personen bis zum Jahr 1914?
Welche Orte wurden zwischen 1935 und 1960 beschriebenen?
Was waren die Erstbesteigungen in den Julischen Alpen?
Um solche Fragen beantworten zu können, müssen Vokabulare für Orte und Personen erstellt werden, die für die Alpinismusgeschichte wichtig sind.
Für Orte wurde eine wichtige Quelle vorbereitet, die durch dieses Projekt erstmals öffentlich zugänglich gemacht wird: Das Lichtbilderverzeichnis des ÖAV aus den Jahren 1927 bis 1941, das Beschreibungen für ca. 32.000 Fotos enthält, von denen ca. 85% irgendeine Art von Ort behandeln. Zusätzlich wird auf andere, bereits frei im Internet verfügbare Quellen zurückgegriffen, um Vokabulare für Orte und Menschen zu erstellen. Links zu Internetquellen bilden ein Netzwerk von Informationen, die erforscht werden können (Stichwort Linked Open Data). Unsere Vokabulare integrieren diese Quellen und beziehen sich somit auf die damit verbundenen Informationen im Internet. In einem weiteren Schritt werden Vokabulareinträge für bestimmte Personen und Orte im Korpus Alpenwort identifiziert und stellen so einen Bezug von den Orten und Personen im Internet zu den sie beschreibenden Texten im Korpus her.
Zur Generierung unserer Projektdaten werden internationale Standards und semantische Web-Community-Technologien verwendet, die der Forschung und der interessierten Öffentlichkeit zur Verfügung gestellt werden.
Die entwickelte Methodik wird Möglichkeiten zur Anreicherung und Abfrage von Textkorpora bieten, die über die Möglichkeiten der traditionellen Volltext- und sogar Korpussuche hinausgehen. Die erstellten Vokabulare und das semantisch angereicherte Alpenwort-Korpus werden Quellen für die Forschung und eine weitere Anreicherung anderer Quellen liefern und zeigen somit das Potenzial der Digital Humanities.
Die Projektziele in aller Kürze:
- Identifikation von Orts- und Personennamen in den Quellen
- Workflow für automatisierte Orts- und Personennamenerkennung (Named Entity Recognition – NER / Named Entity Linking – NEL)
- Identifikation von Erstbesteigungen im Alpenwortkorpus
- Semantische Annotation und Repräsentation von Erstbesteigungen, Orten und Personen in maschinenlesbarer Form
- Visualisierung der in den Quellen angegebenen Orte im räumlichen und zeitlichen Kontext
- Open access/online Dissemination