Processamento de imagens é utilizado para viabilizar o desejo de ternos carros autônomos.
Os carros autônomos, uma das maiores apostas entre as novas tecnologias, enfrentam um número ilimitado de cenários criados pela realidade. As decisões a serem tomadas resumem-se a basicamente quatro: acelerar, frear, virar à direita, virar à esquerda. O desafio é qual escolher, em qual ordem, após a leitura de um mundo capaz de oferecer uma infinita gama de acontecimentos.
Pesquisadores da Universidade de Stanford apresentaram uma proposta híbrida de sistema capaz de lidar de forma mais eficiente com o problema. Eles construíram um novo tipo de câmera com inteligência artificial, capaz de classificar e identificar as imagens com mais rapidez e economia. E, melhor: é um sistema com potencial para ser pequeno o suficiente para caber nos próprios sensores, o que não é possível hoje. O estudo foi publicado aqui.
Os autores da pesquisa juntaram dois tipos de computadores em um modelo híbrido óptico e elétrico com foco em processamento de imagens. O sistema é eficiente ao usar a câmera óptica para fazer um pré-processamento da imagem, filtrando os resultados de forma múltipla (o que exigirá um pesado algoritmo matemático, se feito apenas pelo computador). O filtro ocorre de forma natural, à medida que a luz passa pelas lentes da câmera, economizando também a energia necessária ao processamento. Energia que é destinada ao segundo nível do sistema, usado para fazer os cálculos e as tomadas de decisão. O resultado é uma máquina que faz menos cálculos, usa menos memória e energia.
“É um sistema especialmente rápido em sua tomada de decisões, o que é estratégico em tecnologias como os carros autônomos”, comemora Gordon Wetztein, um dos autores do artigo.
Para entender melhor o sistema, é importante conhecer como se dá o processamento de imagens.
A técnica mais básica é chamada de edge detection. A ideia central é que os pixels de um determinado objeto serão relativamente parecidos. Por isso a palavra edge, que remete a borda. Uma vez determinadas todas as bordas dos objetos da imagem, é possível identificá-los.
Em uma rua, o algoritmo de edge detection é capaz de identificar, com alguma facilidade, um carro em movimento. Por sua vez, se o sistema é capaz de registrar e calcular a distância entre as lanternas traseiras, a redução na distância entre elas indica que o veículo está se distanciando, enquanto o aumento informa que ele está mais próximo.
A edge detection tem duas limitações: baixa performance em ambientes com pouca iluminação ou contraste e a exigência de muita informação para a tomada de decisões. O algoritmo é obrigado a “ler” todos a cena apenas para entender o que está acontecendo e, então, agir.
Uma técnica mais avançada é a classificação de imagens. O algoritmo já contém algumas características e padrões dos objetos. Ele já sabe, por exemplo, como deve ser um carro, uma pessoa ou uma placa de sinalização. Ele compara as informações obtidas na câmera com padrões de cores, formas, tamanhos e outros parâmetros, identificando o objeto e tomando as decisões necessárias. Uma placa de pare significa parar.
A classificação de imagens é mais variada e complexa que a edge detection. O uso das camadas de interpretação, propiciado pelas técnicas de Neural Networks, ajuda. Por exemplo, o computador pode perguntar se a imagem traz uma área vermelha, se esta área vermelha tem o formato de um octógono e se está escrito “pare” nesta área. Se as respostas são sim, é provável que seja uma placa de parada obrigatória. O Neural Network permite que cada pergunta esteja em um nó da rede, sendo feita de forma paralela e espalhando-se em milhares de nós.
A realidade, entretanto, é capaz de oferecer muito mais informação que a capacidade dos sistemas atuais. Identificar uma placa já não é fácil, imagine os contextos desafiadores das ruas e avenidas dos grandes centros urbanos e sua multiplicidade de cenários. Os sistemas atuais ainda são grandes, lentos e consomem muita energia.
Portanto sente, aperte os cintos e dirija com cuidado. Ainda demora um pouco até que possa aposentar sua carteira de habilitação.