Avanços Tecnológicos nas Línguas Indígenas Apurinã (Aruak) e Sakurabiat (Tupi)

 

Avanços Tecnológicos nas Línguas Indígenas Apurinã (Aruak) e Sakurabiat (Tupi)

Palestra aberta ao público

Data e hora: 31 de março de 2025, às 15h

Local: Auditório do Programa de Pós-Graduação em Letras – PPGL/UFPA

Organização: Grupo de Estudos sobre Línguas Indígenas (www.gelcia.com.br)

Patrocínio: Projeto EDGES «Entangling Indigenouns Knowledges in Universities»

Contato: gelcia@ufpa.br

Este é o resultado das ideias e informações compartilhadas em oficinas organizadas durante março de 2025, possibilitadas pela colaboração entre pesquisadores da Universidade de Helsinque e da Universidade Federal do Pará (UFPA), além de um estágio concedido pelo projeto EDGES «Entangling Indigenous Knowledges in Universities».

Contexto

Os avanços tecnológicos para qualquer língua exigem o reconhecimento do trabalho documental e de pesquisa, aplicando-o à tecnologia linguística e à dimensão digital. No caso do Apurinã e do Sakïrabiat, estamos reconhecendo e reutilizando os resultados de trabalhos originalmente publicados no início do milênio por renomados pesquisadores da UFPA e do Museu Goeldi, em Belém do Pará.

A introdução do Apurinã e do Sakïrabiat à tecnologia linguística começou em 2019. Em 2020, durante a pandemia, foram iniciadas descrições digitais dessas línguas na infraestrutura de tecnologia linguística do Sámi na Universidade Ártica da Noruega, em Tromso. Para facilitar esse processo, foi desenvolvido um teclado extensivo para a escrita do Apurinã, incluindo letras não encontradas no teclado brasileiro, como Ỹ, Ũ, Ẽ, entre outras. Além disso, para tornar a língua mais visível, foi criado um conjunto de dados do Apurinã para colaboração internacional em morfossintaxe no projeto «Universal Dependencies».

Ambas as línguas apresentam desafios próprios para a tecnologia linguística. Embora analisadores morfossintáticos tenham sido desenvolvidos para atender às necessidades de pesquisadores linguísticos, esses mesmos analisadores, com delimitadores normativos, podem ser usados na construção de verificadores ortográficos para as línguas. O trabalho com essas duas línguas também impulsionou o desenvolvimento de cursos presenciais e remotos, nos quais a reutilização de materiais de pesquisa e arquivísticos tem ampliado o potencial de atuação com esses idiomas.

Passaram-se mais de cinco anos, e muitas novidades só se consolidaram neste mês de março de 2025. Com o progresso alcançado no Apurinã e no Sakïrabiat, em breve poderemos facilitar o trabalho com muitas outras línguas indígenas da Amazônia. Prevemos o engajamento de estudantes nessa colaboração interdisciplinar entre pesquisa em línguas indígenas, humanidades digitais e ciência da computação, o que ajudará na integração dos saberes indígenas na educação e promoverá a liderança indígena na pesquisa, no ensino e na presença no mundo digital.

Technological advancements in Apurinã and SakurabiatUniversidade de Helsinque

Public talk at Universidade Federal do Pará, March 31st, 2025

Local: Auditório do Programa de Pós-Graduação em Letras

Data and Time: March 31

Organized by: Grupo de Estudos sobre Línguas Indígenas da Amazônia (GELCIA) – www.gelcia.com.br 

Sponsored by EDGES Consortium «Entangling Indigenous Knowledges in Universities».

Contact: gelcia@ufpa.br 

 

This is a culmination of ideas and information forwarded in workshops organized during March of 2025 and made possible through collaboration between individuals at the University of Helsinki and the Federal University of Pará State and a secondment granted by EDGES «Entangling Indigenous Knowledges in Universities».

 

Background 

 

Technological advancements for any language require the acknowledgement of documentational and research work and applying it to language technology and the digital dimension. In the case of Apurinã and Sakïrabiat, we are recognizing and reusing the results of work originally published in the beginning of the millennium by well-known scholars from the UFPA and the Museu Goeldi in Belém do Pará.

 

The introduction of Apurinã and Sakïrabiat to language technology was begun in 2019. In 2020, during the pandemic, digital descriptions were begun for the languages in the Sámi language technology infrastructure at the Norwegian Arctic Univeristy in Tromsoe. To facilitate this, an extensive keyboard was begun for writing the Apurinã language, with letters not found in on the Brazilian keyboard such as Ỹ, Ũ, Ẽ, etc. And to make a visible presentation of the language, an Apurinã data set was begun for international collaboration in morpho-syntax in the «Universal Dependencies» project.

 

Both languages have presented challenges of their own for language technology. While morphosyntactic analyzers have been developed for both languages to address the needs of language researchers, these same analyzers with normative delimiters can be used in the construction of spellcheckers for the languages. Work with the two languages has also provided impetus for the development of remote and local courses where reuse of all research and archival materials is seen to enhance the potential of work with these languages.

 

Over five years have passed, and there are many new developments that have only fallen into place during this month of March, 2025. With the progress shown for Apurinã and Sakïrabiat, we will soon be able to facilitate many more indigenous languages of the Amazon. We foresee the engagement of students in this interdisciplinary collaboration between indigenous language research, digital humanities and computer science, which will help in the integration of indigenous knowledge into education and promote indigenous leadership in research, education and presence in the digital age.

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *