App baseado em inteligência artificial traduz a Língua de Sinais
Mais de 2,5 milhões de brasileiros possuem surdez profunda e utilizam tanto a Língua Brasileira de Sinais (Libras) como a Língua Portuguesa de Sinais (LGP) como forma de comunicação, segundo o Instituto Brasileiro de Geografia e Estatística (IBGE). Conforme o órgão, este número corresponde a 5% da população brasileira.
Para promover a inclusão e interação dessas pessoas com espaços e outras experiências, é possível recorrer a recursos tecnológicos com este potencial no contexto em que vivemos. Assim, a escala e complexidade do desafio chamaram a atenção da Lenovo, que firmou parceria com o Centro de Estudos e Sistemas Avançados do Recife (CESAR) e financiou um projeto de pesquisa e desenvolvimento de cerca de cinco anos, com um investimento superior a 4 milhões de dólares.
As organizações desenvolveram e patentearam uma tecnologia de IA capaz de identificar e contextualizar visualmente gestos visuais, que funciona a partir de um banco de dados de inúmeros vídeos em Libras. A iniciativa é dada como pioneira, mas tem potencial para ser desenvolvida mundo afora, traduzindo a linguagem de sinais de outros países.
Em entrevista para a Forbes, o diretor de pesquisa e desenvolvimento da Lenovo Brasil, Hildebrando Lima, comemora o impacto da tecnologia lembrando da dificuldade de muitos em entender sinais – tanto por falta de prática ou pela falta de acesso a materiais didáticos e instrutores. Lima ainda diz que, quando completamente desenvolvido, o aplicativo poderá quebrar as barreiras da acessibilidade.
A ferramenta de tradução funciona por meio de bate-papo ao vivo que permite que o deficiente auditivo assine a câmera de um dispositivo, traduzida instantaneamente via algoritmo para um texto em português e enviada para um destinatário do outro lado.
A IA e seu banco de dados acompanham o foco em distinguir os movimentos das mãos, os contornos e, principalmente, os pontos de articulação digitais dos ossos do sinalizador. Ao processar esses movimentos com precisão, o algoritmo identifica estruturas de frases e as converte em texto para o português.
Baseado em redes neurais de profunda aprendizagem, a arquitetura do sistema é parecida com a de modelos como o Chat GPT-3 para reconhecer o português e traduzi-lo para Libras, a fim de facilitar a tradução simultânea para a língua de sinais. Para gerar vídeos na língua de sinais, Lenovo e CESAR criaram um avatar virtual.
No entanto, a complexidade do aplicativo exigia que alguns sistemas de inteligência artificial fossem desenvolvidos para automatizar algumas tarefas, tais como a criação do banco de dados para treinamento, isto é, as gravações usadas para treinar os modelos de reconhecimento de sinais, que foi facilitada por sistemas de visão computacional criados pela equipe.
O projeto foi desenvolvido por uma equipe de 80 pessoas, incluindo cinco deficientes auditivos. Já no processo de concepção, validação e teste da ferramenta, foram envolvidos dezenas de pessoas surdas.
Conforme supramencionado, está nos planos da Lenovo estender o uso do sistema para outras linguagens de sinais ao redor do mundo, a partir de um procedimento de patente pendente, que explora semelhanças entre múltiplas linguagens de sinais, para agilizar o processo de aprendizado.
Tem mais dúvidas sobre como registrar marca? A Crimark está aqui para ajudar em todos os processos!