
Receba novidades como essas diretamente na sua caixa de entrada, clique aqui
O jeito mais fácil de explicar o que é Deep Learning é refazendo o caminho da tecnologia, ramificando as grandes áreas que tratam do aprendizado de máquinas, sendo a primeira delas a Inteligência Artificial. A partir da década de 1990 as pesquisas aplicadas em Inteligência Artificial (termo criado ainda nos anos 1950) ganharam corpo e visibilidade. Havia um desejo do ser humano de ensinar a máquina a replicar ações como falar, mexer um braço, jogar xadrez etc. Você deve lembrar de vários filmes feitos neste período e que retratam estas referências. O impacto na indústria, no entanto, só ocorre a partir dos anos 2000, já no século 21.
De conceito amplamente estudado, a Inteligência Artificial passou a ganhar espaço com a introdução de metodologias de treinamento. Uma destas metodologias é o Machining Learning, uma técnica de aprendizado de máquina – vertente tecnológica dentro da grande área de estudos que é a Inteligência Artificial. O aprendizado de máquina consiste em alimentar o sistema com uma série de informações de entrada, definindo o que você espera na saída. Se há uma laranja na entrada, espera-se a informação “suco de laranja” na saída. Se há uma maçã na entrada, espera-se a informação “suco de maçã” na saída. A máquina é ensinada: portanto, sempre que tiver uma laranja, ela vai entender “suco de laranja”. Assim ela passa a reconhecer padrões. A maça e a laranja nunca são iguais, podendo sofrer alteração de coloração e formato, portanto o sistema realmente precisa aprender o que é uma maçã e uma laranja.
O Machining Learning se sustenta em algoritmos chamados de redes neurais. As Redes Neurais tentam imitar o modelo de sinapse do cérebro humano, buscando recriar de forma simplificada as conexões entre os neurônios. O modelo do neurônio matemático é chamado na literatura de perceptron. Nos neurônios existem um conjunto de entradas que recebem sinais nervosos, ele consegue ponderar e entregar uma determinada intensidade de sinal na saída, passando para outro neurônio, chamamos isso de sinapse. De forma simplificada o perceptron, imita esta capacidade, promovendo ligações entre os demais perceptrons. Um conjunto de neurônios trabalha em parceria e faz o cérebro humano funcionar. Da mesma forma que um conjunto de perceptros faz uma rede neural funcionar.
Nas Redes Neurais, os perceptrons são conectados em camadas. Existe uma linha de entrada de perceptrons e todas as entradas para o sistema estarão conectadas ali. Todos os perceptrons vão ponderar a informação de entrada e entregar uma saída que vai para outra linha que fará o mesmo processo. Imagine que você tem uma imagem de 784 pixels, e esta imagem pode representar um número de 0 a 9, como criar uma rede neural para identificar esta imagem? Uma forma é utilizar uma linha de 784 perceptrons que serão a entrada da rede neural, uma camada de processamento, e uma camada de saída com 10 perceptrons. Neste exemplo a rede convertera um conjunto de 784 dados de entrada em 10 dados de saída, sendo que a saída de todos os perceptrons somados será 1 e o perceptron com maior valor, será o perceptron ativado e sinalizara a resposta.
As diferentes combinações de perceptrons promovem diferentes redes neurais, sendo uma delas o Deep Learning. A aprendizagem profunda, com seu nome esclarece, são redes neurais com grandes quantidades de perceptrons, conjunto que permite a solução de problemas simples a complexos. A técnica de aprendizado você desconhece, mas se forem atribuídas informações ao sistema, espera-se que de alguma forma ele aprenda. E isso depende de informações, imagens, dataset (conjunto de dados) para que ele aprenda qual é a saída.
Nas Redes Neurais do tipo Deep Learning, de aprendizado profundo, em vez de existirem três camadas, podem ter inúmeras camadas de neurônios, se necessário. Na Pollux, uma das aplicações trabalha com 16 camadas, por exemplo. E quanto mais camadas, maior é a possibilidade de abstrair informações e resolver problemas cada vez mais complexos. Existe a camada de entrada, a de saída e “n” camadas para fazer o processo de aprendizagem, que é o “deep”, a rede profunda. Entre os exemplos de aplicação, estão o reconhecimento facial, o reconhecimento de fala, recomendações personalizadas, diagnósticos de saúde.
Portanto, Machine Learning é alimentar o computador ou sistema com um conjunto de informações para que ele aprenda de alguma forma. Já o Deep Learning é a aprendizagem profunda da máquina, utiliza uma metodologia de aprendizagem chamada redes neurais em que você tenta treinar a máquina com o mesmo princípio de funcionamento do cérebro humano.
Um exemplo bem atual de utilização da aprendizagem profunda foi na listagem de proteínas do DNA do coronavírus. O mapeamento do genoma foi tão rápido por causa da Inteligência Artificial. Entrava um pacote de dados e o algoritmo modelava a abstração. Sem esta tecnologia teria demorado muito mais tempo para se fazer o mapeamento.
Entenda os sistemas de aprendizado
Os sistemas de aprendizado são um conjunto de métodos que podem detectar automaticamente padrões nos dados e, em seguida, usa os padrões descobertos para prever dados futuros ou para executar outros tipos de tomada de decisão.
Inteligência artificial: conjunto de tecnologias que fazem com que máquinas percebam, compreendam, aprendam e executem algumas atividades por aprendizado.
Machine Learning: um subconjunto de tecnologias de Inteligência Artificial que usa estatísticas para permitir que as máquinas aprendam com as experiências.
Deep Learning: um subconjunto de Machine Learning que usa Redes Neurais para resolução de problemas mais complexos. Deep Learning ou Aprendizagem Profunda é quando a tecnologia de Inteligência Artificial é utilizada para resolução de problemas complexos. Utiliza Redes Neurais para formação de camadas de abstração, que por meio de treinamento permitem ao equipamento identificar padrões.
Aplicações na Pollux
Na Pollux, a tecnologia Deep Learning é utilizada em projetos que envolvem sistemas de visão, por exemplo. São feitas fotos de um determinado processo, estes dados (imagens) entram no sistema e um operador é que irá dizer qual imagem é “boa” ou “ruim” a partir do entendimento do que é bom ou ruim naquele processo específico daquela indústria, até que um padrão seja criado. O dataset pode ter cerca de 2 mil imagens para cada processo. E com as informações é possível ir ensinando a máquina. Sempre que aparece uma imagem “ruim” na entrada, o sistema vai entregar um “NOK” na saída. Sempre que aparece uma imagem “boa” na entrada, o sistema vai entregar “OK” na saída.
A Rede Neural precisa deste treinamento, precisa desta base de dados classificada para ser treinada. Após o treinamento a rede está pronta para execução e pode ser treinada de novo para outro processo ou para uma alteração no processo. A classificação ocorre com base no dataset.
Se você quer que um determinado defeito seja apontado no processo, este defeito precisa estar dentro daquele conjunto de dados. Assim, o conjunto de dados é validado para uma determinada aplicação. Se uma determinada situação não havia sido prevista no processo, não é possível saber como o sistema vai reagir. Portanto, é muito importante ter a maior homogeneidade de dados possível. Quanto mais você conseguir representar, melhor o sistema vai reagir.
Quando um projeto é desenvolvido pela Pollux, a rede é pré-treinada para o cliente, o que se chama de extrator de características. O sistema é complexo, mas o treinamento é relativamente simples. É trabalhoso, mas a funcionalidade é simples. A Pollux sempre capacita o cliente para que ele faça o treinamento, mas em um projeto de sistema de visão, por exemplo, a Pollux pode acordar que fará o treinamento para dois ou três SKUs e os outros SKUs o cliente se responsabilizará.
Digamos que uma empresa compre um sistema de visão: a Pollux instala o sistema na linha e coloca ele para rodar. Antes que ele esteja operacional, vão sendo coletadas imagens do sistema produtivo que irão abastecer um dataset. Somente quando o dataset for representativo e conseguir exemplificar todo aquele processo é que se encerra a fase de captação de imagens.
Aí um operador, especialista no processo, vai ajudar a classificar todas as imagens: esta é boa, esta é ruim e assim por diante. É um processo manual. Digamos que sejam 2 mil imagens de cada defeito para classificar. Quanto mais rico o dataset, mais preciso ele será. Depois de ter o dataset adequado, basta clicar no botão treinar. Dependendo do número de imagens e da complexidade do problema, o treinamento pode levar de 20 minutos ou mais. E neste processo a rede vai atualizando as informações para os neurônios. Quando finaliza, acontece a etapa de validação.
O sistema passa a rodar de verdade para ver se está acurado. Se não tiver, é preciso voltar no dataset e incluir mais imagens. O índice de acuracidade é acordado com o cliente, dependendo de cada projeto ou necessidade, mas é um nível muito mais alto do que o olho humano tem capacidade. E o sistema, tem a vantagem de manter sempre o mesmo padrão. Se surge um defeito novo ou um processo é modificado, ou há um novo SKU, ou a embalagem vai mudar, aí é preciso treinar o sistema novamente.
Deep Learning não substitui a visão convencional. São aplicações para resolver problemas diferentes. A visão convencional continua sendo uma excelente tecnologia para alguns tipos de aplicações. Especialmente em identificar padrões com parâmetros muito claros. Quando estes parâmetros não são assim tão claros, o Deep Learning é a melhor opção.
Um exemplo é a solda. Existem muitas variáveis que influenciam na solda e mudam suas características. A solda pode estar toda conforme, porém não é igual a solda anterior. Não há um parâmetro exato. Um outro exemplo é o fechamento da parte de trás de um pacote de biscoito. Para o sistema de visão convencional faltam métricas para dizer o que é bom e o que é ruim. Se fugir um pouquinho do padrão, ele já tem dificuldade.
O Deep Learning vai pegar todas as imagens ruins e tentar encontrar similaridades, como o cérebro humano faz. E assim lida com variações de padrão. Um sistema não é melhor que o outro, eles são complementares e resolvem problemas diferentes. O projeto é que irá dizer o que é melhor para cada solução: sistema de visão convencional ou Deep Learning.
Entenda a diferença:
Sobre a Pollux
Fundada há 24 anos, a Pollux é uma multinacional brasileira com mais de mil projetos de tecnologia industrial implementados por toda a América. Nosso propósito é tornar a indústria 4.0 uma realidade para nossos clientes por meio de soluções completas e turnkey que integram linhas de montagem, robótica, sistemas de visão, inteligência artificial, software e veículos autônomos. Conduzimos a transformação digital nas fábricas, tornando-as mais produtivas, eficientes e inteligentes, favorecendo a competitividade em um cenário global cada vez mais acirrado.
Receba novidades como essas diretamente na sua caixa de entrada, clique aqui
Receba novidades como essas diretamente na sua caixa de entrada, clique aqui