en suchen
  • Summerschool 2023Digital History

Summerschool: »A digital Workflow for Historical Corpora - from HTR to NER«

Wann?   26.-28. August
Wo?        Online und dezentral via Zoom
Wer?      Studierende, aber auch Historiker:innen jeder Qualifikationsstufe, vom BA bis zur Professur,
                  Archivar:innen und alle anderen Interessierten

Inhalt

Historisch arbeitende Wissenschaftler*innen müssen sich aktiv den vielfältigen Möglichkeiten und Methoden stellen, die sich durch die rasanten Entwicklungen im Bereich der Digitalisierung und künstlichen Intelligenz ergeben. Digital Humanities bzw. Digital History verändern derzeit das historische Arbeiten in vielerlei Hinsicht und eröffnen neue Arbeitsweisen sowie Zugänge zu Quellen. Besonders im Bereich der Handschriftenerkennung und der Verarbeitung großer Datenmengen können umfassende Fortschritte verzeichnet werden. Vor diesem Hintergrund bietet die FGHO in Zusammenarbeit mit den Universitäten Bern und Bielefeld eine praxisorientierte Sommerschule an, die dieses Jahr im Kontext des gemeinsamen Forschungsprojekts „The Flow – from Deep-Learning to Digital Analysis and their Role in the Humanities. Creating, Evaluating and Critiquing Workflows for Historical Corpora“ durchgeführt wird.  

Insbesondere die Arbeit mit Originalquellen und die damit verbundenen Kompetenzen unterliegen einem Wandel. Im Bereich der Handwritten Text Recognition (HTR) werden ständig neue Tools entwickelt, die die Transkription handschriftlicher Quellen unterstützen. Den Überblick über die zahlreichen Algorithmen und Anwendungen mit all ihren Vor- und Nachteilen zu behalten, ist für Forschende nicht immer einfach. Deswegen widmet sich der erste Block der Veranstaltung dem Vergleich verschiedener Anbieter. Nach einer Einführung liegt der Fokus auf der Arbeit mit dem frei zugänglichen Tool eScriptorium. Teilnehmende bekommen die Möglichkeit die nötigen Arbeitsschritte der HTR – vom Upload der Dateien, über die Segmentierung bis hin zur Erkennung des Textes - an vorbereitetem Übungsmaterial auszutesten.  
Der zweite Themenblock befasst sich mit der Named Entity Recognition bzw. der Nested Entity Recognition: Welche Fragen lassen sich mit Hilfe von NER beantworten? Welche Vorteile bietet NER für geschichtswissenschaftliches Arbeiten? Nach einer Einführung in das Thema werden verschiedene Tools vorgestellt, um im Anschluss den Teilnehmenden die Möglichkeit zu bieten, mit dem Annotationstool INCEpTION NER-Tagging einzuüben.  

Der zweite Themenblock befasst sich mit der Named Entity Recognition bzw. der Nested Entity Recognition: Welche Fragen lassen sich mit Hilfe von NER beantworten? Welche Vorteile bietet NER für geschichtswissenschaftliches Arbeiten? Nach einer Einführung in das Thema werden verschiedene Tools vorgestellt, um im Anschluss den Teilnehmenden die Möglichkeit zu bieten, mit dem Annotationstool INCEpTION NER-Tagging einzuüben.  

Anmeldung

 

Eingeladen sind Studierende und Historikerinnen und Historiker jeder Qualifikationsstufe, vom BA bis zur Professur, Archivmitarbeitende und weitere Interessierte. Die Bewerber*innen sollten bereits erste Erfahrungen im Bereich der HTR gesammelt haben. Die Veranstaltung findet auf Englisch statt. Die Teilnehmenden müssen über einen Internetzugang sowie einen Google-Account verfügen. Interessierte bitten wir um einen kurzen Lebenslauf (max. 1 A4) und ein Motivationsschreiben von maximal einer Seite, in dem auch auf vorhandene Vorkenntnisse und persönliche Erwartungen oder eigene aktuelle Projekte eingegangen werden sollte. Bei Interesse senden Sie bitte die oben genannten Informationen bis zum 10. August 2024 in einer PDF-Datei an info@fgho.eu. 

Programm

Montag, 26.08.
9:30-12:00: Begrüßung und Einführung in die Sommerschule; Einführung in das Projekt „The Flow“
12:00-13:30: Mittagspause 
13:30-15:30: Einführung HTR/NER
15:30-16:00: Kaffeepause  
16:00-17:00: Input 
 
Dienstag, 27.08.
9:30-12:00: Einstieg im Vergleich verschiedener HTR Anbieter
12:00-13:30: Mittagspause  
13:30-15:30: Fokus auf eScriptorium und die einzelnen Arbeitsschritte incl. Zeit zum Testen an vorbereitetem Material 
15:30-16:00: Kaffeepause  
16:00-17:00: Zeit für Rückfragen
17:00: Virtueller Apero 
  
Mittwoch, 28.08. 
9:30-12:00: Einführung in NER; Arbeit mit Schemata; Vorstellung Vergleich Annotationstools; Einblicke in Anwendung 
12:00-13:30: Mittagspause  
13:30-15:30: Arbeit mit INCEpTION und Ausprobieren an vorbereitetem Material 
15:30-16:00: Kaffeepause 
16:00-17:00: Abschluss mit offenen Fragen und Diskussion