In dieser Folge sprechen wir über ein Thema, das in den Digital Humanities oft implizit mitgedacht wird, aber selten klar im Mittelpunkt steht: Mehrsprachigkeit. Wir haben Jana-Katharina Mende (Martin-Luther-Universität Halle-Wittenberg), Cosima Wagner (Freie Universität Berlin, Universitätsbibliothek) und Till Grallert (Humboldt-Universität zu Berlin) von der AG Multilingual DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More zu Gast. Gemeinsam mit unseren Gästen diskutieren wir, wie Sprache, Infrastruktur und Forschungsrealität zusammenhängen, und warum digitale Methoden manchmal nur so gut funktionieren wie die sprachlichen Voraussetzungen, auf denen sie beruhen.
Von Anfang an wird deutlich, wie eng persönliche Forschungspraxis und strukturelle Fragen miteinander verwoben sind. Im Gespräch erfahren wir, wie schnell man an Grenzen stößt, wenn man mit Sprache arbeitet, die in vielen Tools schlicht nicht vorgesehen sind. Das betrifft sowohl die linguistische Vorverarbeitung als auch die Korpuserstellung und das Forschungsdatenmanagement. Die Beispiele reichen von europäischen Sprachen, die in digitalen Werkzeugen sehr ungleich behandelt werden, bis zu Sprachen, die mit anderen Schriften geschrieben werden und deren gesellschaftliche und kulturelle Bedeutung darum in digitalen Infrastrukturen kaum angemessen abgebildet ist.
Unsere Gäste berichten, wie sich diese Lücken im Alltag bemerkbar machen: bei fehlenden Taggersystemen, bei OCR-Modellen, die bestimmte Schriftsysteme nicht zuverlässig erkennen, oder bei Infrastrukturen, die nur eine Sprache pro Datensatz zulassen. Gleichzeitig wird uns klar, dass das selten böser Wille ist, sondern vielmehr historische Entwicklungen, Ressourcenverteilung und Annahme darüber, was ‚typische‘ Daten der DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More sind, spiegelt. Genau hier setzt die AG Multilingual DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More an, indem sie versucht, diese Vorannahmen sichtbar zu machen und neue Perspektiven in bestehende Strukturen einzubringen. Ein zentraler Gedanke unseres Gesprächs ist, dass Mehrsprachigkeit nicht nur im Forschungsgegenstand steckt, sondern auch in den Werkzeugen, mit denen wir arbeiten. Wir sprechen darüber, wie Metadaten, Interfaces und Softwaredesign bestimmte Sprachen bevorzugen, und darüber, wie wichtig es ist, auch darüber nachzudenken, wer eigentlich mit welchen Sprachen arbeitet. Viele Herausforderungen entstehen nicht erst in der Tool-Nutzung, sondern schon davor, in der Frage, wie Forschung geplant wird, wie Ressourcen verteilt werden/sind und welche Sprachen aus welcher Perspektive als als Mehr- oder Minderheitensprachen gelten.
Unsere Gäste erzählen, wie die AG versucht, diese Dimensionen zusammenzubringen. Sie organisieren offene Treffen, Community-Diskussionen und arbeiten an einem Manifest, das grundlegende Handlungsmöglichkeiten für den Umgang mit Mehrsprachigkeit in den DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More formulieren soll. Dabei steht weniger die Festlegung auf bestimmte Lösungen mit To-Dos im Vordergrund, sondern vor allem das Sichtbarmachen einer Problemlandschaft, in der viele Punkte miteinander verbunden sind (von technischen Fragen bis zu sozialen und epistemischen). Ein weiterer wichtiger Aspekt ist der Blick auf die DHd‑Commmunity. Wir kommen darauf zu sprechen, welche Rolle Mehrsprachigkeit auf Konferenzen spielt, wie sich unterschiedliche Verständnisse von Sprachenvielfalt in Einreichungen widerspiegeln und wie stark der Wunsch nach Austausch in diesem Bereich ist. Besonders spannend ist der Einblick in ein geplantes Projekt der AG, das die Sprachen in bisherigen DHd‑Beiträgen sichtbar machen soll. Dabei geht es nicht um ein Ranking, sondern um die Möglichkeit, eigene Routinen sichtbar zu machen, um zu hinterfragen und zu schauen, welche Räume noch geöffnet werden können.
Im Verlauf unseres Gesprächs wird deutlich, wie breit das Thema Mehrsprachigkeit überhaupt ist. Mehrsprachigkeit betrifft nicht nur philologische Fächer, sondern auch Geschichtswissenschaft, Bibliotheken, Infrastrukturdienste und alle, die mit Text, Daten oder Nutzer*innen arbeiten. Unsere Gäste sprechen darüber, wie oft Sprachfragen erst zu spät im Forschungsprozess auftauchen und wie hilfreich es wäre, diese Fragen viel früher mitzudenken. Gleichzeitig zeigen sie auf, dass bereits viel passiert, ist: Kooperationen entstehen, Communities wachsen, und immer mehr Menschen beschäftigen sich mit den Voraussetzungen, unter denen ihre Tools funktionieren sollen.
Zum Ende der Folge richten wir den Blick in die Zukunft: auf die nächsten Aktivitäten der AG, auf offene Austauschformen wie die monatliche Community Hour und auf die Hoffnung, dass Mehrsprachigkeit in den DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More stärker als gemeinsames Thema wahrgenommen wird.
- Reinhören und dran denken, dass Digitale Geisteswissenschaft nur dann wirklich offen und inklusiv sein kann, wenn die sprachliche Vielfalt ihrer Forschungspraxis ernst nimmt!
- 耳を傾け、デジタル人文科学は、その研究実践における言語の多様性を真剣に受け止めることによってのみ、真にオープンで包括的になることができることを心に留めておいてください。
- Posłuchajcie i pamiętajcie, że cyfrowe nauki humanistyczne mogą być naprawdę otwarte i integracyjne tylko wtedy, gdy poważnie traktują różnorodność językową swoich praktyk badawczych!
- Luister en onthou dat digitale geesteswetenskappe slegs werklik oop en inklusief kan wees as hulle die taaldiversiteit van hul navorsingspraktyke ernstig opneem!
- နားထောင်ပြီး မှတ်ထားပါ၊ ဒစ်ဂျစ်တယ် လူ့ဗေဒသည် သုတေသန လုပ်ငန်းစဉ်များတွင် ဘာသာစကားအမျိုးမျိုးကို တန်ဖိုးထား ဂရုစိုက်မှသာ တကယ့်အပြည့်အစုံ ဖွင့်လှစ်ပြီး အားလုံးပါဝင်နိုင်ပါသည်။
- Nụ ma cheta na mmụta mmadụ dijitalụ nwere ike ịbụ nke mepere emepe n’eziokwu ma gụnye mmadụ niile naanị ma ọ bụrụ na ha were iche iche asụsụ dị na omume nchọpụta ha n’uche nke ọma!
- Послухайте і пам’ятайте, що цифрові гуманітарні науки можуть бути по-справжньому відкритими та інклюзивними лише тоді, коли мовна різноманітність їхньої дослідницької практики сприймається серйозно!
- सुनऽ आ याद राखऽ कि डिजिटल ह्यूमैनिटीज़ तबहीं सचमुच खुलल आ समावेशी हो सकेला जब ऊ लोग अपना रिसर्च प्रैक्टिस के भाषाई विविधता के गंभीरता से लेवे!
- გაიგეთ და გახსოვდეთ, რომ ციფრული ჰუმანიტარული მეცნიერებები მხოლოდ მაშინ იქნება ნამდვილად ღია და ინკლუზიური, თუ ისინი სერიოზულად მოეკიდებიან თავიანთი კვლევითი პრაქტიკის ლინგვისტურ მრავალფეროვნებას!
_______________
Zur AG Multilingual DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More: https://digitalhumanities.de/ag-multilingual-dh/ oder/und http://multilingualdh.de/
From Global to Local? Digitale Methoden in den Geisteswissenschaften im deutschsprachigen Raum: ein Triptychon (Call for Abstracts; Volldruck folgt)
Literatur, die im Gespräch erwähnt wurde:
Burr, Elisabeth; Elwert, Frederik; Grallert, Till; Kraneiß, Nathalie; Matić-Chalkitis, Milanka; Mende, Jana-Katharina; Müller-Laackman, Jonas; Tikhonov, Aleksej; Vertan, Cristina; Wagner, Cosima. Digitale Glokalisierung: Sogenannte Kleine Fächer, Digital Humanities und die Herausforderungen der Mehrsprachigkeit. In: Wuttke, Ulrike; Nunn, Christorpher; Schröter, Christian; Seltmann, Melanie; Wachter, Christian (Hrsg.): From global to local. Digitale Methoden in den Geisteswissenschaften im deutschprachigen Raum: Ein Tritptychon. Melusina Press (im Druck)
Fiormonte, Domenico (2021) ‚Taxation against Overrepresentation? The Consequences of Monolingualism for Digital Humanities‘. In: Kim D., Koh A. (eds) Alternative Historiographies of the Digital Humanities, pp. 333–76. Santa Barbara: Punctum Books.
Horváth, Alíz ; Cosima Wagner; David Joseph Wrisley; Joanne Bernardi; Aanya Chadha; Danielle Garcia; Till Grallert; Sharanya Ghosh; Yuri Ishida; Aleksandra Kaye; Ahac Meden; Kiyonori Nagasaki; Dylan Palmer; Hugo Scheithauer; Marta Świetlik; Jeffrey Tharsen; Yifan Wang (2025). Who are the users in multilingual digital humanities? Digital Scholarship in the Humanities. https://doi.org/10.1093/llc/fqaf091
North, Madeleine (2025). Generative AI is trained on just a few of the world’s 7,000 languages. Here’s why that’s a problem – and what’s being done about it. World Economic Forum, 6.10.2025. https://www.weforum.org/stories/2025/10/generative-ai-languages-llm/
Weiterführende Literatur zum Thema:
Harrasse, Abir, Florent Draye, Zhijing Jin, und Bernhard Schölkopf. 2025. „Tracing Multilingual Representations in LLMs with Cross-Layer Transcoders“. Preprint, November 13. https://doi.org/10.48550/arXiv.2511.10840.
Chen, Jing, & Spence, Paul (2025). Transnational connections and barriers in DHDH steht für Digital Humanities, also digitale Geisteswissenschaften. More: a UK-Chinese case study (1.0 (Presented at ADHO Digital Humanities conference in Lisbon July 18th 2025)). Zenodo. https://doi.org/10.5281/zenodo.16035797
Saji, Alan, Jaavid Aktar Husain, Thanmay Jayakumar, Raj Dabre, Anoop Kunchukuttan, und Ratish Puduppully. 2025. „RomanLens: The Role Of Latent Romanization In Multilinguality In LLMs“. arXiv:2502.07424. Preprint, arXiv, Juni 9. https://doi.org/10.48550/arXiv.2502.07424.