SEM CATEGORIATECNOLOGIA

Pesquisa em IA alcança tecnologia líder mundial em reconhecimento visual de pessoas

A IA está sendo cada vez mais usada para ajudar operadores humanos a lidar com grandes quantidades de imagens de CFTV e outras fontes de segurança. A identificação pessoal (ReID) é um método no qual uma IA é capaz de reconhecer imagens da mesma pessoa tiradas de câmeras diferentes ou em ocasiões diferentes. Isso ajuda a rastrear suspeitos em uma rede de CFTV que cobre grande espaço público, como uma rede subterrânea. O ReID é um desafio para as máquinas, pois elas precisam considerar e diferenciar a mesma pessoa sob diferentes fontes de luz, poses e mudanças na aparência, como suas roupas.

Em um artigo a ser apresentado na Conferência Internacional sobre Visão Computacional deste ano, em Seul, Coréia do Sul, a conferência de maior prestígio em IA visual, especialistas do Centro de Surrey para Visão, Processamento de Fala e Sinal (CVSSP) detalham como eles desenvolveram um sistema único chamado OSNet que superou muitos sistemas de identificação populares já em uso.

A equipe do CVSSP mostrou que a OSNet é capaz de detalhar informações de várias escalas espaciais para ajudar a fazer uma re-identificação precisa – desde os menores detalhes, como o logotipo de uma camiseta, até outros fatores maiores, como o tipo de casaco usado pelo suspeito.

Incrivelmente, a OSNet precisa apenas de 2,2 milhões de parâmetros, um número muito pequeno no contexto de modelos de redes neurais profundas, para superar muitos de seus concorrentes construídos na popular infraestrutura ResNet50 que usa 24 milhões de parâmetros – sugerindo que a OSNet possa se tornar o padrão em reconhecimento visual tecnologia. Um tamanho tão pequeno de parâmetro significa que o modelo pode ser implantado “no limite”, o que significa que o levantamento computacional pesado pode ser realizado na própria câmera e não em um data center remoto, economizando largura de banda para transmitir grandes quantidades de dados de vídeo a partir de câmeras para os servidores de dados.

Tao Xiang, ilustre professor de visão computacional e aprendizado de máquina no CVSSP, disse: “Com a OSNet, decidimos desenvolver uma ferramenta que pode superar muitas das pessoas que re-identificam problemas que outras instalações enfrentam – mas os resultados excederam em muito nossas expectativas.A precisão do ReID alcançada pela OSNet superou claramente a dos operadores humanos.

“A OSNet não apenas mostra que é capaz de superar suas contrapartes em muitos problemas de re-identificação, mas os resultados são tais que acreditamos que poderia ser usado como uma tecnologia de reconhecimento visual independente por si só”.

O professor Adrian Hilton, diretor do CVSSP, disse: “Esta é uma conquista considerável do professor Xiang e sua equipe para alcançar a tecnologia de re-identificação líder mundial. O trabalho deles na OSNet tem potencial para ser inovador e pode ajudar a moldar o visual campo de reconhecimento nos próximos anos. Este é um ótimo exemplo de IA e percepção de máquina para o benefício da sociedade que fornece tecnologia capacitadora para espaços públicos mais seguros “.