Posts Como começar a estudar Machine Learning
Post
Cancel

Como começar a estudar Machine Learning

Você está interessado em temas como Machine Learning, Deep Learning e Inteligência Artificial, até tomou a decisão de estudar sobre o assunto, mas não sabe ao certo por onde começar? Bom, neste artigo quero te ajudar a dar seus primeiros passos rumo a este tema tão almejado na atualidade!

Antes de mais nada eu sugiro fortemente que você saiba aonde quer aplicar as técnicas de Machine Learning! Digo isso, pois existem muitas áreas onde estas técnicas podem ser aplicadas (business, jogos, Visão Computacional, Segurança da Informação, etc). Sabendo onde você quer aplicar, você já direciona melhor os seus estudos!

Neste artigo, vou sugerir um caminho simples para estudo que pode ser definido em 5 passos:

  1. Entendendo o que é Machine Learning;

  2. Iniciando o estudo de Algoritmos e Programação e Estatística;

  3. Estudando Modelagem;

  4. Resolvendo problemas reais e melhoria contínua.

O que é Machine Learning?

“Machine Learning é uma ramificação da Inteligência Artificial que tem por objetivo desenvolver aplicações que são capazes de aprender padrões extraídos de conjuntos de dados e melhorar a sua acurácia com o tempo, sem que seja programada para tal.” IBM.

Podemos dizer, de uma forma simples, que Machine Learning foca no desenvolvimento de programas computacionais que são capazes de tomar decisões baseando-se no conjunto de dados previamente conhecido.

Extraindo informações de dados utilizando Estatística e Algoritmos

Já sabemos que, para que uma aplicação seja capaz de aprender, ela deve ter um conjunto de dados à sua disposição para que seja possível extrair informações e identificar padrões. Mas como estes padrões são identificados e analisados? É aí que entram a Estatística e a Programação!

Quando temos um enorme conjunto de dados (imagine uma tabela gigantesca, com muitas linhas e muitas colunas), não conseguimos tirar muitas conclusões apenas olhando para ela: Precisamos da Estatística Descritiva para que sejamos capazes de extrair as principais informações sobre estes dados.

Através da Estatística Descritiva conseguimos extrair informações como Média, Moda, Variância, Desvio Padrão, além disso, podemos também fazer a Visualização de Dados através de Histogramas de Frequências e Gráficos de Dispersão que nos ajudam a entender como os dados se distribuem e como algumas informações podem estar relacionadas entre si.

A Estatística Descritiva é ótima para quando precisamos explorar e conhecer os dados amostrais. Porém, quando precisamos responder algumas perguntas e testar algumas hipóteses sobre a população, a Estatística Inferencial entra na jogada!

A Estatística Inferencial torma possível tirar conclusões acerca do todo (população) através da análise de uma parte (amostra). Assim, quando analisamos uma amostra estamos buscando tirar conclusões acerca de um todo, exemplos:

  • 40% das mulheres em uma amostra gostam de jogos mobile, será que 40% das mulheres de toda a população brasileira gostam de jogos mobile?

  • 90% dos homens entrevistados gostam de futebol, será que 90% dos homens de toda a população brasileira gostam de futebol?

Para fazer conclusões acerca de uma população, tendo conhecimento somente do comportamento da amostra podemos utilizar os Testes de Hipóteses, que envolvem conceitos de Probabilidade.

Linguagens de Programação

Quanto às Linguagens de Programação atualmente existem duas grandes favoritas no mercado: Python e R. Mas isso não siginifica que você tenha que se limitar, existem também opções como Julia, Matlab, Scala, C++ e uma que vem ganhando cada vez mais destaque, que é a Go lang!

Se você está dando seus primeiros passos em programação, recomendo começar com Python!

Realizando Previsões através da Modelagem

Depois que você explora, analisa e testa suas hipóteses sobre os dados é a hora de começar a fazer previsões! É hora de tentar prever o comportamento das variáveis e pra isso você precisa definir um modelo a ser utilizado e vai precisar treiná-lo!

Existem diferentes modelos que podem ser aplicados de acordo com os dados disponíveis e com o tipo de previsão que se quer realizar. Veja o diagrama abaixo para saber quais os principais modelos você precisa entender para começar sua jornada em Machine Learning:

Você pode começar entendendo os modelos de Regressão, e se você quiser já temos um artigo prático sobre Regressão Linear Simples com Python em nosso blog para você dar seus primeiros passos!

Depois disso é muito interessante estudar os métodos de Agrupamento de Dados. Com esta técnica você divide os dados em subconjuntos, sendo que os dados dentro de cada subconjunto são muito similares e dados de subconjuntos diferentes são tão diferentes quanto as distâncias entre os grupos.

Por fim, estude as técnicas de Classificação. Com as técnicas de classificação você se torna capaz de prever a classe de um dado pontual. Um exemplo simpes: Um competidor que possui 50 vitórias e 35 derrotas é classificado como Ouro, Prata ou Bronze na liga atual?

Apresentando soluções para problemas reais

Se você continuou lendo até aqui, você é guerreiro! Rsrsrs.

Agora que você já praticou e tem o mínimo de conhecimento sobre os assuntos que falamos até agora, é hora de mostrar ao mundo o seu valor:

  • Desenvolva pequenos projetos e compartilhe com a comunidade;

  • Escreva alguns Notebooks no Kaggle;

  • Participe de competições (O Kaggle é um ótimo site para isso também!);

  • Ajude as pessoas na comunidade tirando dúvidas;

  • Aplique para vagas de emprego e mostre tudo que você já desenvolveu!

Conclusão

E aí, gostou do artigo? Você pode trocar uma ideia com a gente no nosso grupo do Telegram sempre que precisar de uma mão ou quiser companhia para seus estudos! Siga também a nossa página no Instagram, temos memes e tentamos ser educativos às vezes! Rsrsrs.

This post is licensed under CC BY 4.0 by the author.