Kürzlich veröffentlichte Google DeepMind einen Artikel in der Zeitschrift Nature und stellte ein neues Produkt namens Aeneas
ein Modell der künstlichen Intelligenz, das die Art und Weise, wie Historiker antike Inschriften untersuchen, verändern soll. Das Tool kann Forschern dabei helfen, alte Texte, die sich in einem schlechten Zustand befinden, besser zu interpretieren, zuzuordnen und zu reparieren.
Schrift war im alten Rom praktisch allgegenwärtig und fand sich auf allem, von kaiserlichen Monumenten bis hin zu Alltagsgegenständen. Diese Inschriften, die von politischen Graffiti über Liebesgedichte bis hin zu Handelsgeschäften und sogar Geburtstagseinladungen reichen, bieten modernen Historikern einen umfassenden Einblick in das Alltagsleben in der römischen Welt. Die meisten der etwa 1 500 neuen Inschriften, die jedes Jahr entdeckt werden, sind jedoch dem Zahn der Zeit, der Witterung oder menschlicher Beschädigung zum Opfer gefallen. Ohne kontextbezogene Informationen sind Restaurierung, Datierung und Provenienzbestimmung nahezu unmöglich.
Traditionell stützen sich Historiker auf persönliches Fachwissen und professionelle Ressourcen, um "ähnliche Texte" zu finden, d. h. andere Inschriften mit Ähnlichkeiten in Wortlaut, Syntax oder Herkunft. Aeneas
hat sich entwickelt, um diesen zeit- und arbeitsintensiven Prozess drastisch zu beschleunigen. Es kann Tausende von lateinischen Inschriften in Sekundenschnelle verarbeiten und tief verwandte textliche und kontextuelle Ähnlichkeiten finden, um Historiker bei ihrer Interpretationsarbeit zu unterstützen.
Aeneas
wird von Google DeepMind und der Universität Nottingham in Zusammenarbeit mit Forschern der University of Warwick, der University of Oxford und der Athens University of Economics and Business entwickelt. Das Projekt ist nicht auf Latein beschränkt; seine Modellierung kann auch auf andere antike Sprachen, Schriften und Medien wie Papyri und Münzen angewandt werden, was das Potenzial hat, eine Verbindung zu einem breiteren Spektrum an historischen Belegen herzustellen. Um die akademische Forschung zu fördern, hat das Team predictingthepast.com
Die Website bietet eine kostenlose Aeneas
eine interaktive Version davon und stellte den Code und den Datensatz zur Verfügung.
Kernkompetenzen von Aeneas
Aeneas
Benannt nach den Helden der griechisch-römischen Mythologie, baut es auf der früheren Verwendung altgriechischer Inschriften zur Restaurierung, Datierung und Lokalisierung der Ithaca
auf der Basis des Modells. Allerdings Aeneas
Sie geht noch einen Schritt weiter und soll Historikern dabei helfen, isolierte Fragmente zu kontextualisieren, ihnen einen Sinn zu geben und schließlich ein umfassenderes Verständnis der antiken Geschichte zu entwickeln.
Zu ihren Kernkompetenzen gehören:
- Ähnliche TextsucheDurch eine Technologie namens Embeddings.
Aeneas
Die Text- und Kontextinformationen (z. B. Sprache, Herkunftsort, Datum) jeder Inschrift werden in einem einzigartigen "historischen Fingerabdruck" kodiert. Auf diese Weise ist es möglich, tiefe Zusammenhänge zwischen der riesigen Zahl lateinischer Inschriften zu erkennen, was Historikern hilft, einzelne Inschriften in einen breiteren historischen Kontext einzuordnen. - Multimodale Eingabeverarbeitung::
Aeneas
ist das erste Modell, das in der Lage ist, multimodale Eingaben (d.h. Text und Bilder) zu verwenden, um den geografischen Ursprung von Inschriften zu bestimmen. Diese Funktion erweitert die Analyse über die Beschränkung auf den Text hinaus. - Unbekannte Länge SpaltreparaturAngesichts eines stark beschädigten Textes mit einer unbekannten Anzahl fehlender Zeichen.
Aeneas
Zum ersten Mal ist es gelungen, eine wirksame Restaurierung durchzuführen. Dies macht es zu einem flexibleren und leistungsfähigeren Instrument für den Umgang mit Materialien in schlechtem Erhaltungszustand. - Branchenführende Leistung: sowohl bei der Reparatur von beschädigten Texten als auch bei der Vorhersage, wann und wo sie geschrieben wurden.
Aeneas
Beide setzen neue technologische Maßstäbe.
Funktionsweise und Leistung
Aeneas
ist ein multimodales generatives neuronales Netzwerk. Das Forschungsteam integrierte zunächst die drei großen Inschriftendatenbanken (EDR, EDH und EDCS-ELT), um einen maschinenlesbaren Datensatz (LED) mit über 176.000 lateinischen Inschriften zu erstellen.
Das Modell basiert auf dem Transformator Decoder für die Verarbeitung der Texteingabe und ein spezialisiertes Netzwerk für die Zeichenrestaurierung und Datierung. Für die geografische Zuordnung analysiert das Modell sowohl den Text als auch das Bild der Inschrift.
Was die Leistung betrifft. Aeneas
Die Leistung ist hervorragend. Die "historischen Fingerabdrücke", die es erzeugt, sind viel deutlicher als die anderer allgemeiner lateinischer Megasprachmodelle, wenn sie Inschriften chronologisch gruppieren.
Wenn Sie Lücken von bis zu 10 Zeichen fixieren, wird die Aeneas
der 20 besten Wortkandidaten mit einer Genauigkeit von 731 TP3T; selbst bei der schwierigen Aufgabe unbekannter Lückenlängen bleibt die Genauigkeit bei 581 TP3T. Durch die Verwendung visueller Daten ist das Modell in der Lage, Inschriften mit einer Genauigkeit von 721 TP3T einer der 62 antiken römischen Provinzen zuzuordnen und den Datierungsfehler des Textes auf weniger als 13 Jahre zu begrenzen.
Neue Perspektiven für die historische Debatte
Zum Test Aeneas
In einer praktischen Forschungsanwendung analysierte das Team damit eine der berühmtesten römischen Inschriften: die Aufzeichnung der heiligen Aufführung des Augustus. Die genaue Datierung dieser Inschrift, die von Augustus dem Großen in der ersten Person verfasst wurde, ist unter Historikern umstritten.
Aeneas
Anstatt ein festes Datum anzugeben, wurde eine detaillierte Wahrscheinlichkeitsverteilung erstellt. Die Ergebnisse zeigen zwei deutliche Spitzen: eine kleinere Spitze zwischen 10-1 v. Chr. und eine größere Spitze mit höherer Wahrscheinlichkeit zwischen 10-20 n. Chr. Dieses quantitative Ergebnis spiegelt die beiden in der Wissenschaft vorherrschenden Datierungshypothesen treffend wider.
Aeneas
Die Vorhersagen beruhen auf subtilen sprachlichen Merkmalen und historischen Markierungen im Text, wie offiziellen Titeln und Denkmälern. Durch die Umwandlung des Datierungsproblems in eine probabilistische Schätzung auf der Grundlage linguistischer und kontextueller Daten bietet das Modell einen neuen quantitativen Ansatz zur Lösung ungelöster historischer Debatten.
Historische Forschung zur Förderung der Zusammenarbeit zwischen Mensch und Computer
In einer groß angelegten Kooperationsstudie zwischen Historikern und KI wurden 23 Experten für Inschriftenforschung eingeladen, das Aeneas
um einen Stapel Text zu verarbeiten.
Die Ergebnisse der Evaluierung zeigen, dass bei der Einordnung von Historikern Aeneas
Die Effizienz und Genauigkeit der Studie wurde erheblich verbessert, wenn die zur Verfügung gestellten Kontextinformationen (z. B. ähnliche Texte) in Verbindung mit den Vorhersagen verwendet wurden. Einer der an der Studie beteiligten Historiker erklärte anonym: "Aeneas
Der gefundene ähnliche Text hat meine Sicht auf diese Inschrift völlig verändert. Die darin enthaltenen Details waren entscheidend für die Restaurierung und Datierung des Textes".
Durch die Kombination von Expertenwissen und maschinellem Lernen kann die Aeneas
versucht, sich in die bestehenden Arbeitsabläufe von Historikern zu integrieren und bietet neue Möglichkeiten, die Vergangenheit der Menschheit auf eine interpretierbare, kollaborative Weise zu erschließen.