Skip to content

Projeto end-to-end através do livro Hands-on Machine Learning

O livro Hands-on Machine Learning with Scikit-Learn, Keras & TensorFlow da editora O'Reilly está sempre sendo citado como um dos melhores livros para aprender os conceitos de Machine Learning (ML) e ser introduzido as principais bibliotecas da área.

Não se trata de um livro básico para iniciantes, visto que o próprio livro na seção de pré-requisitos assume do leitor uma familiaridade com Python, principalmente as bibliotecas NumPy, pandas e Matplotlib. Além de um conhecimento básico de alguns conceitos de cálculo, álgebra linear, probabilidade e estatística.

O que chama a atenção no livro é a maneira com que é organizado e a objetividade em tratar dos assuntos. Ele é dividido em duas partes, sendo que a primeira se trata dos fundamentos de ML, onde são apresentados os principais algoritmos e outros conceitos importantes, como cross-validation e ajustes de hiperparâmetros. Já a segunda parte, aborda redes neurais e Deep Learning, mostrando diferentes arquiteturas e formas de treinamento. Outro ponto interessante que vale mencionar é o repositório no GitHub que possui todos os códigos que são apresentados ao longo do livro.

Fazendo jus ao título Hands-on, logo no segundo capítulo, após apresentar uma visão geral de ML e até mesmo antes de ir mais a fundo nos principais conceitos e algoritmos, o livro já apresenta um projeto end-to-end para você ter uma noção bem prática do que pode ser feito com ML, quais passos tomar e principalmente como fazer. De forma fictícia, o livro imagina um cenário em que você é um cientista de dados recém contratado em uma companhia de mercado imobiliário e o seu objetivo é usar dados do census do estado da California nos Estados Unidos para construir um modelo de predição do preço do aluguel. A partir desse contexto são seguidos os seguintes passos:

  1. Visão geral do problema;
  2. Obter os dados;
  3. Descoberta e visualização dos dados para ter insights;
  4. Preparar os dados para os algoritmos de ML;
  5. Selecionar e treinar o modelo;
  6. Ajuste fino do modelo;
  7. Apresentar a solução;
  8. Deploy, monitorar e mater o sistema.

Todos esses passos são apresentados de uma forma bem didática e clara, e nessa abordagem de aprendizagem top to bottom, a leitura do livro e principalmente desse capítulo é muito recomendada.