Para muitos pesquisadores, Python é uma ferramenta de primeira classe principalmente por causa de suas bibliotecas para armazenar, manipular e obter insights de dados.. Existem vários recursos para peças individuais desta pilha de ciência de dados, mas somente com o Python Data Science Handbook você obtém todos eles — IPython, NumPy, Pandas, Matplotlib, Scikit-Learn e outras ferramentas relacionadas.
Cientistas e analistas de dados que trabalham e estão familiarizados com leitura e escrita de código Python acharão esta referência de mesa abrangente ideal para lidar com questões do dia a dia.: manipulando, transformando e limpando dados; visualizando diferentes tipos de dados; e usando dados para construir modelos estatísticos ou de aprendizado de máquina. Muito simplesmente, esta é a referência indispensável para computação científica em Python.
Com este manual, você aprenderá como usar:
IPython e Jupyter: fornecer ambientes computacionais para cientistas de dados usando Python
NumPy: inclui o ndarray para armazenamento e manipulação eficientes de arrays de dados densos em Python
pandas: apresenta o DataFrame para armazenamento e manipulação eficientes de dados rotulados/colunares em Python
Matplotlib: inclui capacidades para uma gama flexível de visualizações de dados em Python
Scikit-Learn: para implementações Python eficientes e limpas dos algoritmos de aprendizado de máquina mais importantes e estabelecidos
Sobre o autor
Jake VanderPlas é um usuário e desenvolvedor de longa data da pilha científica Python. Atualmente, trabalha como diretor de pesquisa interdisciplinar na Universidade de Washington, conduz sua própria pesquisa em astronomia e dedica tempo a aconselhar e consultar cientistas locais de uma ampla gama de áreas.