Recentemente, o Google DeepMind publicou um artigo na revista Nature, lançando um novo produto chamado Aeneas
um modelo de inteligência artificial projetado para transformar a maneira como os historiadores estudam inscrições antigas. A ferramenta pode ajudar os pesquisadores a interpretar, atribuir e reparar melhor os textos antigos que estão em mau estado.
A escrita era praticamente onipresente na Roma antiga, encontrada em tudo, desde monumentos imperiais até objetos do cotidiano. Abrangendo tudo, desde grafites políticos a poemas de amor, transações comerciais e até mesmo convites de aniversário, essas inscrições fornecem aos historiadores modernos uma rica janela para a vida cotidiana no mundo romano. No entanto, a maioria das cerca de 1.500 novas inscrições descobertas a cada ano sofreu com a devastação do tempo, das intempéries ou de danos humanos. Sem informações contextuais, a restauração, a datação e a proveniência são tarefas quase impossíveis.
Tradicionalmente, os historiadores se baseiam em sua experiência pessoal e em recursos profissionais para encontrar "textos semelhantes", ou seja, outras inscrições com semelhanças em termos de redação, sintaxe ou procedência. Aeneas
surgiu para acelerar drasticamente esse processo demorado e trabalhoso. Ele pode processar milhares de inscrições em latim em segundos, recuperando semelhanças textuais e contextuais profundamente correlacionadas para apoiar os historiadores em seu trabalho interpretativo.
Aeneas
O desenvolvimento do Google DeepMind é liderado pelo Google DeepMind e pela Universidade de Nottingham, em colaboração com pesquisadores da Universidade de Warwick, da Universidade de Oxford e da Universidade de Economia e Negócios de Atenas. O projeto não se limita ao latim; sua modelagem também pode ser aplicada a outras línguas, escritas e mídias antigas, como papiros e moedas, com o potencial de se conectar a uma gama mais ampla de evidências históricas. Para promover a pesquisa acadêmica, a equipe tem sido predictingthepast.com
O site oferece um Aeneas
uma versão interativa do mesmo, e o código e o conjunto de dados são de código aberto.
Competências essenciais de Aeneas
Aeneas
Batizado com o nome dos heróis da mitologia greco-romana, ele se baseia no uso anterior de inscrições gregas antigas para restaurar, datar e localizar o Ithaca
em cima da base do modelo. No entanto Aeneas
Indo um pouco mais além, seu objetivo é ajudar os historiadores a contextualizar, dar significado a fragmentos isolados e, por fim, reunir uma compreensão mais completa da história antiga.
Suas principais competências incluem:
- Pesquisa de texto semelhantePor meio de uma tecnologia chamada Embeddings.
Aeneas
As informações textuais e contextuais (por exemplo, idioma, local de origem, data) de cada inscrição são codificadas em uma "impressão digital histórica" exclusiva. Dessa forma, é possível identificar conexões profundas entre o vasto número de inscrições em latim, ajudando os historiadores a colocar inscrições individuais em um contexto histórico mais amplo. - Processamento de entrada multimodal::
Aeneas
é o primeiro modelo capaz de usar entradas multimodais (ou seja, texto e imagens) para determinar a origem geográfica das inscrições. Esse recurso leva suas análises além das limitações somente de texto. - Reparo de lacuna de comprimento desconhecidoEm face de um texto severamente danificado com um número desconhecido de caracteres ausentes.
Aeneas
Pela primeira vez, foi possível realizar uma restauração eficaz. Isso o torna uma ferramenta mais flexível e poderosa para lidar com materiais em condições ruins de conservação. - Desempenho líder no setorO que significa que o uso de um software de gerenciamento de texto é muito importante: tanto no reparo de textos danificados quanto na previsão de quando e onde eles foram escritos.
Aeneas
Ambos estabeleceram novos padrões tecnológicos.
Princípio de operação e desempenho
Aeneas
é uma rede neural generativa multimodal. A equipe de pesquisa primeiro integrou os três principais bancos de dados de inscrições (EDR, EDH e EDCS-ELT) para criar um conjunto de dados legível por máquina (LED) com mais de 176.000 inscrições em latim.
O modelo é baseado no Transformador de decodificadores para processar a entrada textual e uma rede especializada para restauração e datação de caracteres. Para a atribuição geográfica, o modelo analisa tanto o texto quanto a imagem da inscrição.
Em termos de desempenho. Aeneas
O desempenho é excelente. As "impressões digitais históricas" geradas por ele são muito mais claras do que as de outros modelos de megalíngua latina de uso geral ao agrupar inscrições cronologicamente.
Ao corrigir lacunas de até 10 caracteres, o Aeneas
das 20 principais palavras candidatas com uma precisão de 731 TP3T; mesmo na tarefa desafiadora de comprimentos de intervalo desconhecidos, a precisão é mantida em 581 TP3T. Com o uso de dados visuais, o modelo consegue atribuir inscrições a uma das 62 províncias romanas antigas com uma precisão de 721 TP3T e manter o erro de datação do texto em menos de 13 anos.
Fornecer novas perspectivas para o debate histórico
Para testar Aeneas
Em uma aplicação prática de pesquisa, a equipe o utilizou para analisar uma das inscrições mais famosas de Roma: o Registro do Desempenho Sagrado de Augusto. Escrita na primeira pessoa por Augusto, o Grande, a data exata dessa inscrição tem sido um ponto de debate entre os historiadores.
Aeneas
Em vez de fornecer uma data fixa, foi gerada uma distribuição de probabilidade detalhada. Os resultados mostram dois picos distintos: um pico menor entre 10-1 a.C. e um pico maior e de maior confiança entre 10-20 d.C. Esse resultado quantitativo reflete adequadamente as duas hipóteses de datação dominantes no meio acadêmico.
Aeneas
As previsões são baseadas em características linguísticas sutis e marcadores históricos no texto, como títulos oficiais e monumentos. Ao transformar o problema de datação em uma estimativa probabilística baseada em dados linguísticos e contextuais, o modelo oferece uma nova abordagem quantitativa para resolver debates históricos não resolvidos.
Pesquisa histórica para promover a colaboração entre humanos e computadores
Em um estudo colaborativo de larga escala entre historiadores e IA, 23 especialistas em pesquisa de inscrições foram convidados a usar o Aeneas
para processar um lote de texto.
Os resultados da avaliação indicam que, quando os historiadores colocam Aeneas
A eficiência e a precisão do estudo foram significativamente aprimoradas quando as informações contextuais fornecidas (por exemplo, texto semelhante) foram usadas em conjunto com suas previsões. Um dos historiadores envolvidos no estudo declarou anonimamente: "Aeneas
O texto semelhante encontrado mudou completamente minha visão sobre essa inscrição. Os detalhes que ele registrou foram decisivos para a restauração e a datação do texto."
Ao combinar conhecimento especializado com aprendizado de máquina, o Aeneas
está tentando se integrar ao fluxo de trabalho existente dos historiadores, oferecendo novas possibilidades de conexão com o passado da humanidade de uma forma interpretável e colaborativa.