por Alexandre Ashade*
Do reconhecimento de voz à previsão do clima, o machine learning (ML) tem demonstrado habilidades que antes eram consideradas exclusivamente humanas. Contudo, o que muitos não percebem é que ele não é uma entidade única e monolítica. Na verdade, é uma tapeçaria rica e variada, tecida com diferentes abordagens e técnicas. Entender essas formas de aprendizado é fundamental para aplicá-las corretamente.
Por que as formas de aprendizado são importantes?
Quando falamos em aprendizado de máquina, falamos em treinar modelos. Imagine treinar um cachorro: se você quer que ele sente, dá um comando específico e talvez um petisco como recompensa. O processo de treinamento de um modelo de ML é análogo, mas ao invés de ensinar truques a um animal, ensinamos padrões a um algoritmo. A maneira como instruímos o modelo varia – e é por isso que entender a natureza do problema e a forma de aprendizado apropriada é crucial.
Formas de aprendizado em ML
1. Aprendizado supervisionado: é a forma mais comum. Aqui, fornecemos ao algoritmo um conjunto de dados com as respostas corretas. Em termos simples, mostramos a ele que “esta é a entrada, e esta é a saída esperada”. O objetivo é aprender um mapeamento geral entre as entradas e saídas. Exemplos incluem previsão de preços de casas ou reconhecimento de escrita à mão.
2. Aprendizado não-supervisionado: aqui, o algoritmo é alimentado com dados sem respostas corretas. O objetivo é encontrar padrões ou estruturas nos dados, como agrupar consumidores com comportamentos similares. Uma técnica popular é o “clustering” ou agrupamento.
3. Aprendizado por reforço: similar a treinar um animal com recompensas e punições. O algoritmo faz ações no ambiente e recebe recompensas ou penalidades com base na qualidade da ação. Um exemplo famoso é o DeepMind’s AlphaGo, que aprendeu a jogar Go e superou campeões mundiais.
A seguir, iremos detalhar os três tipos de aprendizado:
Aprendizado supervisionado
O aprendizado supervisionado é uma das abordagens mais fundamentais e amplamente utilizadas em ML. Em sua essência, o aprendizado supervisionado é um processo em que um algoritmo é “treinado” em um conjunto de dados que contém pares de entrada e saída.
O objetivo é que, após o treinamento, o algoritmo seja capaz de prever a saída correta para novas entradas com base no que aprendeu.
Como funciona
Imagine um álbum de fotos de pets e, em cada foto, você sabe se é um cão ou um gato. Se você mostrar essas fotos para um amigo (junto com as respectivas etiquetas) repetidamente, após um tempo, seu amigo será capaz de identificar corretamente novas fotos de cães e gatos que ele nunca viu antes. No aprendizado supervisionado, o ‘amigo’ é o modelo de ML, e as ‘fotos’ são os dados de treinamento. A informação “é cão” ou “é gato” é passada ao modelo para que ele aprenda, por tentativa e erro, como fazer a diferenciação.
Modelos populares no aprendizado supervisionado:
1. Regressão linear: é um dos algoritmos mais simples, utilizado principalmente para prever valores contínuos.
Ele tenta encontrar a melhor linha reta que se ajusta aos dados. Um exemplo é a predição do preço de casas com base em características como área, número de quartos, entre outros.
2. Máquinas de vetores de suporte (SVMs): são utilizadas tanto para classificação quanto para regressão. Elas funcionam encontrando o hiperplano que melhor divide um conjunto de dados em classes. Um exemplo é a classificação de e-mails como spam ou não spam com base no conteúdo.
3. Árvores de decisão: elas dividem o conjunto de dados em subconjuntos com base em perguntas feitas sobre as características. Isso é feito de forma recursiva, resultando em uma “árvore” de decisões. Por exemplo, decidir se uma pessoa jogará tênis ou não, com base em características como o clima, umidade e vento. Outra aplicação seria a avaliação de risco de crédito. Um banco utilizaria uma árvore de decisão para determinar se aprova um empréstimo com base em fatores como renda, pontuação de crédito e histórico de emprego, orientando as decisões de empréstimo de forma eficaz.
4. Redes neurais convolucionais (CNNs): são projetadas especificamente para processar dados com uma estrutura semelhante a uma grade, como uma imagem. São especialmente potentes para tarefas de visão computacional, como classificação e detecção de imagens. Por exemplo, servem para identificar objetos em imagens, como discernir se uma imagem contém um gato ou um cachorro.
5. Redes neurais recorrentes (RNNs): são redes neurais que são particularmente adequadas para processar sequências de dados, como séries temporais ou sequências de texto, devido à sua natureza “recorrente” que permite que elas tenham memória. Uma das aplicações é a tradução automática, onde uma sequência de palavras em um idioma é traduzida para uma sequência em outro idioma.
6. Transformers: embora baseados em mecanismos de atenção, revolucionaram o campo de processamento de linguagem natural (NLP). Eles podem capturar dependências de longo alcance em sequências de texto e são a base para modelos populares como BERT e GPT. Por exemplo, estes modelos são utilizados por ChatBots, onde um robô é questionado sobre um trecho de texto e precisa fornecer uma resposta relevante.
Por que é tão popular?
A popularidade do aprendizado supervisionado pode ser atribuída a sua interpretabilidade e previsibilidade. Quando treinamos um modelo com dados rotulados, temos uma métrica clara de quão bem (ou mal) ele está performando, com base no quão bem ele prevê as saídas para as entradas conhecidas. Isso fornece uma abordagem sistemática e geralmente bem-sucedida para resolver uma ampla variedade de problemas complexos em áreas como finanças, medicina e comércio eletrônico.
O aprendizado supervisionado, com seus diversos modelos e aplicações, é uma ferramenta poderosa em ML. Ele serve como base para muitos sistemas avançados e complexos, permitindo que máquinas façam previsões e tomem decisões com base em dados passados. À medida que avançamos para um mundo cada vez mais orientado por dados, o domínio desses conceitos e técnicas será cada vez mais valioso.
Aprendizado não-supervisionado
O aprendizado não-supervisionado é uma abordagem de ML na qual os modelos são treinados usando um conjunto de dados sem rótulos. Em vez de aprender a partir de um feedback direto, como seria o caso do aprendizado supervisionado, esses modelos identificam padrões e estruturas nos dados por conta própria. Pode-se imaginar o aprendizado não-supervisionado como um processo de auto-descoberta, onde o algoritmo tenta entender e aprender a estrutura subjacente dos dados sem qualquer instrução explícita.
Exemplos de modelos de aprendizado não-supervisionado
1. K-means clustering: um dos algoritmos de agrupamento mais populares. Participa de um conjunto de pontos de dados em “K” grupos, onde cada ponto pertence ao grupo com a média mais próxima.
2. Análise de componentes principais (PCA): técnica de redução de dimensionalidade. Ela transforma os dados originais em um novo espaço coordenado, preservando a maior variância dos dados.
3. Autoencoders (deep learning): são redes neurais utilizadas para compressão e descompressão de dados. Eles aprendem a codificar entradas em uma representação comprimida e depois a decodificar essa representação de volta à entrada original.
4. Generative Adversarial Networks (GANs) (deep learning): consistem em duas redes neurais, o gerador e o discriminador, treinadas juntas. O gerador tenta criar amostras que parecem autênticas, enquanto o discriminador tenta distinguir entre amostras reais e falsas.
5. Hierarchical clustering: este algoritmo cria um dendrograma, ou árvore de agrupamento, agrupando dados com base em suas semelhanças.
O aprendizado não-supervisionado fornece uma lente poderosa através da qual podemos compreender dados não rotulados, descobrir estruturas ocultas e extrair insights valiosos.
Seja através de técnicas tradicionais ou de deep learning, esses métodos são fundamentais na caixa de ferramentas de qualquer cientista de dados.
Aprendizado por reforço
O aprendizado por reforço (AR) é uma sofisticada subespecialidade de ML, inspirada nas profundezas das ciências cognitivas, onde os algoritmos são engendrados para operar através da metodologia de tentativa e erro, otimizando suas ações com base em recompensas sucessivas ou punições. Em essência, este paradigma é inspirado na forma como os seres vivos aprendem a tomar decisões otimizadas em ambientes incertos e dinâmicos, fundamentado em princípios de teoria de controle e teoria da decisão.
Neste cenário, o aprendiz – ou agente – interage com seu entorno, denominado ambiente, e aprende uma política ótima, isto é, uma sequência estratégica de ações, para maximizar algum tipo de recompensa cumulativa ao longo do tempo. Esta recompensa é fornecida pelo ambiente e serve como um feedback, uma métrica intrínseca que direciona o agente para o comportamento desejado.
Modelos de destaque em aprendizado por reforço
1. Q-Learning: técnica pioneira que emprega uma função de valor, designada Q-função, para estimar o retorno esperado de executar determinadas ações em certos estados. A política ótima é derivada maximizando esta função.
2. Métodos de política gradiente (Policy gradient methods): ao contrário de métodos que buscam aproximar a função de valor, os métodos de gradientes de política operam diretamente no espaço de políticas, otimizando a política em questão através do gradiente ascendente.
3. Deep Q-Network (DQN) – Um enfoque de deep learning: combina a robustez do Q-Learning com a capacidade representacional das redes neurais profundas. Ao aproximar a Q-função com uma rede neural, o DQN pode lidar com espaços de estados vastos e contínuos, comuns em muitas tarefas complexas.
O aprendizado por reforço, com suas intrincadas ramificações, desvenda oportunidades inovadoras no campo da inteligência artificial. Desde simples tarefas de otimização até a modelagem de comportamentos complexos em simuladores sofisticados, o AR tem potencial para redefinir o horizonte de possibilidades em ML.
Conhecer os tipos de aprendizado em ML é como ter diferentes ferramentas em uma caixa de ferramentas. Cada tipo, seja supervisionado, não-supervisionado ou reforçado, tem suas próprias forças e situações onde se destaca. Ao entender cada um, podemos escolher a melhor ferramenta para o trabalho, tornando nossos projetos mais eficientes e precisos. Em resumo, conhecer os diferentes tipos de aprendizado nos ajuda a resolver problemas de maneira mais inteligente e adaptada.
* Alexandre Ashade é Chief Technology and Innovation Officer da IntellTech.