A engenharia de dados cresceu rapidamente na última década, deixando muitos engenheiros de software, cientistas de dados e analistas em busca de uma visão abrangente dessa prática. Com este livro prático, você aprenderá como planejar e construir sistemas para atender às necessidades da sua organização e clientes, avaliando as melhores tecnologias disponíveis através da estrutura do ciclo de vida da engenharia de dados.
Os autores Joe Reis e Matt Housley guiam você pelo ciclo de vida da engenharia de dados e mostram como unir uma variedade de tecnologias de nuvem para atender às necessidades dos consumidores de dados downstream.. Você entenderá como aplicar os conceitos de geração, ingestão, orquestração, transformação, armazenamento e governança de dados que são críticos em qualquer ambiente de dados, independentemente da tecnologia subjacente.
Este livro irá ajudá-lo:
Obtenha uma visão geral concisa de todo o cenário de engenharia de dados
Avaliar problemas de engenharia de dados usando um framework end-to-end de melhores práticas
Corte o hype do marketing ao escolher tecnologias de dados, arquitetura e processos
Use o ciclo de vida da engenharia de dados para projetar e construir uma arquitetura robusta
Incorpore a governança e a segurança de dados ao longo do ciclo de vida da engenharia de dados
Sobre o autor
Joe Reis é um nerd de dados com mentalidade de negócios que trabalha na indústria de dados há 20 anos, com responsabilidades que vão desde modelagem estatística, previsão, aprendizado de máquina, engenharia de dados, arquitetura de dados e quase tudo mais entre esses.. Joe é o CEO e cofundador da Ternary Data, uma empresa de consultoria em engenharia e arquitetura de dados com sede em Salt Lake City, Utah. Além disso, ele é voluntário em vários grupos de tecnologia e leciona na Universidade de Utah.. Nas horas vagas, Joe gosta de escalar, produzir música eletrônica e levar seus filhos em aventuras malucas.
Matt Housley é um consultor de engenharia de dados e especialista em nuvem. Após alguma experiência inicial de programação com Logo, Basic e assembly 6502, ele concluiu um doutorado em matemática na Universidade de Utah.. Matt então começou a trabalhar em ciência de dados, eventualmente especializando-se em engenharia de dados baseada em nuvem.. Ele cofundou a Ternary Data com Joe Reis, onde aproveita sua experiência de ensino para treinar futuros engenheiros de dados e aconselhar equipes sobre arquitetura de dados robusta.. Matt e Joe também pontificam sobre tudo relacionado a dados no The Monday Morning Data Chat.