Terceira Etapa: Dados e Engenharia de Atributos
Mais de 70 receitas práticas de engenharia de recursos em Python, um guia completo que abrange pré-processamento de dados, criação, transformação e otimização de recursos.
Python Feature Engineering Cookbook: Uma Visão Detalhada
Visão Geral
O Python Feature Engineering Cookbook é um livro técnico profissional publicado pela Packt Publishing, que oferece mais de 70 receitas práticas para criar, projetar e transformar características (features) para a construção de modelos de aprendizado de máquina. O repositório de código do livro está hospedado no GitHub, fornecendo código prático completo para os alunos.
Sobre a Autora
Soledad Galli é uma cientista de dados chefe experiente, com mais de 10 anos de experiência em instituições acadêmicas de classe mundial e empresas renomadas. Ela pesquisou, desenvolveu e colocou em produção modelos de aprendizado de máquina para sinistros de seguros, avaliação de risco de crédito e prevenção de fraudes. Soledad recebeu o prêmio Data Science Leader Award em 2018 e foi nomeada uma das vozes na área de ciência de dados e análise do LinkedIn em 2019.
Principais Características do Conteúdo
Habilidades Essenciais Abrangidas
Este livro abrange as seguintes características empolgantes:
- Simplificar pipelines de engenharia de características: Simplifique o processo de engenharia de características usando pacotes Python poderosos.
- Tratamento de valores ausentes: Domine as técnicas para imputar valores ausentes.
- Codificação de variáveis categóricas: Codifique variáveis categóricas usando diversas técnicas.
- Extração de características de texto: Extraia insights de texto de forma rápida e eficiente.
- Desenvolvimento de características de séries temporais: Desenvolva características a partir de dados de transações e séries temporais.
- Combinação de características: Derive novas características combinando variáveis existentes.
- Transformação de variáveis: Aprenda a transformar, discretizar e escalar variáveis.
- Criação de características de tempo: Crie variáveis informativas a partir de datas e horas.
Arquitetura Técnica
# Estrutura de código de exemplo
def get_first_cabin(row):
try:
return row.split()[0]
except:
return np.nan
Requisitos Técnicos
Requisitos de Software
Capítulo | Software Necessário | Requisitos do Sistema Operacional |
---|---|---|
1-11 | Python 3.5+, Anaconda Distribution, IDE (preferência pessoal) | Windows, Mac OS X, Linux (qualquer versão) |
Pré-requisitos de Aprendizagem
Este livro é adequado para profissionais de aprendizado de máquina, engenheiros de IA, cientistas de dados e engenheiros de PNL (Processamento de Linguagem Natural) e aprendizado por reforço que desejam otimizar e enriquecer seus modelos de aprendizado de máquina com as melhores características. Conhecimento em aprendizado de máquina e programação Python será útil para compreender os conceitos abordados neste livro.
Organização do Conteúdo
Estrutura dos Capítulos
Todo o código está organizado em pastas, totalizando 11 capítulos, dispostos em uma ordem natural, do básico ao avançado. Cada capítulo oferece receitas práticas detalhadas para ajudar o leitor a dominar gradualmente todos os aspectos da engenharia de características.
Orientação Prática
O livro adota o formato de "Cookbook" (Livro de Receitas), onde cada receita é um caso prático completo, incluindo:
- Descrição do problema
- Solução
- Implementação do código
- Explicação dos resultados
Valor de Aprendizagem
Praticidade
A engenharia de características é inestimável para o desenvolvimento e enriquecimento de modelos de aprendizado de máquina. Neste livro, você usará as melhores ferramentas Python para simplificar o processo de engenharia de características, dominar técnicas de engenharia de características e simplificar e melhorar a qualidade do código.
Pronto para Produção
Este livro não apenas fornece conhecimento teórico, mas, mais importante, oferece habilidades práticas e código que podem ser aplicados diretamente em ambientes de produção, ajudando os leitores a construir pipelines de engenharia de características de ponta a ponta.
Recursos Adicionais
Materiais Suplementares
Um arquivo PDF contendo imagens coloridas de capturas de tela/diagramas do livro também é fornecido para aprimorar a experiência de aprendizado.
Atualizações de Versão
Este projeto possui várias versões:
- Primeira Edição (Original)
- Segunda Edição (Aprimorada)
- Terceira Edição (Mais Recente)
Cada versão possui seu respectivo repositório de código no GitHub, sendo continuamente atualizada e mantida.
Resumo
O Python Feature Engineering Cookbook é um livro técnico extremamente prático que, através de mais de 70 receitas práticas, apresenta sistematicamente todos os aspectos da engenharia de características em Python. Tanto iniciantes quanto cientistas de dados experientes podem obter valiosa experiência prática e aprimoramento de habilidades com ele.