O termo “inteligência artificial”, quando usado no cotidiano, vem carregado de uma série de significados e tem uma aura de fantasia atrelada a si. Por conta disso, antes de mais nada, acho importante esclarecermos o que, afinal de contas, é uma inteligência artificial (IA).
Começamos, então, com a primeira desilusão do leitor mais inocente, que é: existe mais de uma forma de se definir IA, então temos aqui uma discussão por si só um pouco longa. É difícil falar sobre qualquer um desses conceitos sem mencionar Alan Turing que, depois de ajudar os aliados a decifrar os códigos nazistas na segunda guerra mundial, fez uma pergunta que acabaria por mudar o mundo e influenciar muito a forma como olhamos para o termo IA. A tal pergunta foi “Can machines think?” (As máquinas conseguem pensar?), publicada por Turing em seu artigo “COMPUTING MACHINERY AND INTELLIGENCE ” (1950 – https://redirect.cs.umbc.edu/courses/471/papers/turing.pdf).
A pergunta sobre a capacidade de pensamento de máquinas levanta muitas dúvidas sobre o que significa “máquina” e o que significa “pensar”. Para evitar essas ambiguidades, a pergunta é reformulada no artigo nos termos de um jogo.
No jogo em questão, Turing formula pela primeira vez seu famoso “Teste de Turing” – mesmo que o próprio Turing não o chamasse de “Teste de Turing” em seu artigo, mas sim de “Imitation Game” (Jogo da imitação). Esse teste tem como objetivo “enganar” um humano, que não deve ser capaz de reconhecer se está falando com uma máquina ou com outro humano por meio de texto. Para mais detalhes recomendo fortemente a leitura do artigo orginal ou um dos muitos resumos em vídeo explicando a forma como o teste funciona (uma recomendação seria The Turing Test – Computerphile).
Em um texto com uma visão mais moderna sobre IA, apropriadamente nomeado “Artificial Intelligence: A Modern Approach” (Inteligência Artificial: Uma Abordagem Moderna), de Stuart Russel e Peter Norvig (última edição de 2022), os autores definem IA como o estudo de agentes que recebem impulsos de seu meio e performam ações [baseadas nos impulsos].
Os dois autores ainda dividem o campo da IA em 4 tipos de abordagem diferentes:
- Pensar de forma humana: Imitar pensamento baseado na mente humana
- Pensar de forma racional: Imitar pensamento baseado em considerações lógicas
- Agir de forma humana: Agir de uma maneira que imite o comportamento humano
- Agir racionalmente: Agir de forma a atingir um certo objetivo
Ainda uma outra definição seria a do professor do MIT de IA e Ciência da Computação, Patrick Winston, que declara que IA são algoritmos limitados por condições, expostos a representações que são compatíveis com modelos de loops que ligam pensamento, percepção e ação.
Um resumo da área para leigos pode ainda ser encontrado no artigo “WHAT IS ARTIFICIAL INTELLIGENCE”, por John McCarthy, 2007, da universidade de Stanford https://www-formal.stanford.edu/jmc/whatisai.pdf.
O campo da IA pode ainda ser dividido em 4 categorias, baseadas no tipo e na complexidade das tarefas que devem ser executadas.
- Máquinas reativas: IAs capazes de perceber e reagir ao mundo à sua frente conforme realizam tarefas de escopo limitado. Um exemplo clássico seria o Deep Blue, um super computador dos anos 90 feito para jogar xadrez e que, notavelmente, ganhou do grão-mestre Gary Kasparov. Esse computador tomava todas as decisões baseado no estado do tabuleiro e nas regras do xadrez. Por outro lado, ele não aprendia com os movimentos do jogo para tentar melhorar suas jogadas baseado nos movimentos do oponente.
- Memória limitada: IAs capazes de armazenar informações e previsões passadas para usar como referência para previsões futuras. Esse tipo de sistema olha para o que aconteceu no passado para tentar prever as melhores opções para seus próximos passos. Nesse tipo de IA, um time constantemente atualiza os bancos de dados e a treina baseado nos novos dados. Conforme novos dados entram o modelo se atualiza automaticamente. O ciclo de treino é, de modo geral, da seguinte forma:

- Teoria da mente: IAs capazes de tomar decisões baseadas na sua percepção de como outros se sentem e tomam suas próprias decisões. (somente teórico no momento)
- Autoconsciência: IAs capazes de operar com um nível humano de consciência e compreensão da própria existência. (somente teórico no momento)
Existe ainda uma outra forma comum de se classificar IAs, baseada em suas capacidades e escopo.
O primeiro tipo seria o Narrow AI ou Weak AI, que opera dentro de um contexto limitado, como recomendações de vídeos do YouTube, Siri, Alexa, Filtro de E-mails, etc.
O outro tipo seria o Strong AI ou IA Geral, que é o tipo que vemos em robôs de filmes, que podem fazer um pouco de tudo, não sendo limitados a um escopo específico.
Ainda mais uma distinção particularmente importante de se fazer é do método utilizado para se chegar aos resultados preditivos dos modelos. Muitas vezes se usa precipitadamente, na mídia em geral, os termos deep learning e machine learning como sinônimos. Por conta disso é conveniente definirmos de forma um pouco mais precisa a que cada um dos termos se refere.
Machine learning é um algoritmo no qual um computador é alimentado com dados e usa métodos estatísticos para melhorar progressivamente uma tarefa, sem necessariamente, mas também podendo, ser programado especificamente para a tarefa.
Machine learning consiste então tanto dos chamados “aprendizado supervisionado” e “aprendizado não supervisionado”. Essa distinção é importante, por isso vamos fazer uma pequena digressão para esclarecer o significado dos termos (os modelos que estamos descrevendo aqui tem como objetivo prever coisas, então temos dados entrando e resultados saindo):
- Os modelos supervisionados são os que têm os dados de treino classificados. Em um sistema que diferencia fotos de cães e fotos de gatos, os dados de treino seriam as fotos, que devem ser classificadas previamente. Então o modelo tenta dizer se a foto é de um cão ou gato e dizemos para o modelo se ele acertou ou errou de acordo com a classificação anterior feita por humanos.
- Em um sistema não supervisionado não sabemos exatamente qual é o padrão que buscamos e temos dados não categorizados. Um exemplo seria a previsão de comportamento de clientes, no qual não sabemos de antemão os padrões que buscamos. Os dados então tentam ser agrupados pela IA de alguma forma, buscando ela mesmo os padrões. Fica claro então que esse tipo de treinamento acaba sendo mais difícil.
Voltando para o tema machine learning versus deep learning, podemos falar, finalmente, sobre o segundo tema.
Deep learning é um tipo de machine learning com algumas particularidades interessantes. Nesse modelo, os dados passam por uma arquitetura de rede neural, inspirada por processos biológicos. Vamos analisar essa frase de forma mais detalhada.
Uma rede neural é uma forma de processar dados inspirada no cérebro humano. Esse método usa nós (ou neurônios) interconectados para tomar decisões.
Vamos tomar como exemplo o jogo do Google Chrome de quando o navegador não tem conexão com a internet.
O jogo consiste em um dinossauro que corre para a direita da tela tendo que pular ou agachar para passar obstáculos. Uma rede neural poderia abordar a situação com três entradas e duas saídas, como representado no diagrama a seguir:

Cada um dos círculos representa um nó da rede. Dado um conjunto de entradas, os nós, ou neurônios, se ativam (verde) de acordo com alguma regra desenvolvida no treinamento da IA.

Deep learning são simplesmente as redes neurais com 3 ou mais camadas de neurônios, contando com as entradas e saídas.
Mais dois vídeos sobre IA e a história:
1) https://www.youtube.com/watch?v=IgF3OX8nT0w&ab_channel=Veritasium
2) https://www.youtube.com/watch?v=GVsUOuSjvcg&t=1048s&ab_channel=Veritasium