porsinal  
A Google conseguiu que a língua gestual seja reconhecida por máquinas
por porsinal     
0 comentário(s)
Segunda-feira, 26 de Agosto de 2019 às 10:59:51
Um novo algoritmo desenvolvido pela empresa tecnológica permite reconhecer a língua gestual.

Parece um pouco estranho dizer isso, mas a língua gestual é um dos grandes desafios que o setor de tecnologia enfrenta. Este método de comunicação, usado principalmente por pessoas surdas, tem muitos obstáculos para ser facilmente implementado em sistemas informáticos.

O principal problema está na enorme variedade de gestos e formas que podemos realizar com as mãos. Para um sistema de visão inteligente, é difícil distinguir entre gestos diferentes feitos por mãos diferentes.

Não apenas isso, mas em muitas ocasiões as mãos cruzam-se e emcobrem-se para realizar certos gestos e nesse momento, a maioria dos sistemas perde a posição dos dedos e a forma da palma da mão. Para detectar os gestos da língua gestual, é necessária uma percepção clara do que as mãos estão a fazer.

Google revela o segredo da língua gestual

Agora, o laboratório de Inteligência Artificial do Google diz que conseguiu criar um sistema capaz de identificar gestos em língua gestual em tempo real. Foi implementado no MediaPipe, uma estrutura de código aberto que permite a criação de "canais" através dos quais se podem processar dados de diferentes modalidades, como áudio ou vídeo.

Este projeto usa Inteligência Artificial (IA) para detectar a posição das mãos e dos dedos; O interessante é que, para conseguir isso, o sistema cria uma malha tridimensional de pontos, que representa a posição das articulações da mão. O sistema do Google pode então inferir a posição dessas articulações com base em um único quadro (imagem) do vídeo.

É graças a isso que os resultados podem ser analisados em tempo real. A partir daí, é uma questão "simples" de associar as diferentes formas dessas malhas pontuais ao significado que têm para traduzir gestos em tempo real.

O anúncio do Google entra em detalhes sobre como esta IA funciona, mas o importante está no modelo tridimensional. O sistema teve que aprender com base em cerca de 30.000 fotografias de pessoas a falar em língua gestual. Um mapa de profundidade foi usado para obter a posição tridimensional das mãos.

O resultado é otimista. Os engenheiros da Google mostraram que é possível não apenas registar o que uma pessoa está a dizer, mas também algo tão banal quanto jogar ao pedra-papel-tesoura. O algoritmo é capaz de detectar a forma tridimensional das mãos com grande precisão.

O código do algoritmo foi tornado público, para que qualquer investigador o possa usar em outros projetos. Portanto, é muito possível que nos próximos anos possamos ver grandes avanços no reconhecimento dessa língua.

Vídeo

Não existe video associado.

Comentários

Para comentar esta notícia tem de ser um utilizador registado

    Não existem comentários.

Outras Notícias

Não existem mais not�cias.