
Introdução a Data Science
Description
Alles über E-Books | Antworten auf Fragen rund um E-Books, Kopierschutz und Dateiformate finden Sie in unserem Info- & Hilfebereich.
Neste livro, Tatiana Escovedo e Adriano Koshiyama focam no processo e nas técnicas relacionadas aos algoritmos preditivos mais comumente utilizados, mas mostrando também a importância da etapa de preparação dos dados brutos, limpeza e análise. Você vai aprender como utilizar Data Science para resolver problemas e agregar valor ao negócio, aprendendo com os dados. O trajeto inicia com uma introdução a conceitos de Estatística e Álgebra Linear, passando para o tema Pré-processamento de dados, uma etapa importantíssima para o entendimento do problema e preparação dos dados para a aplicação dos algoritmos de Machine Learning, chegando aos modelos de Classificação, Regressão, Associação e Agrupamento. Todos os conceitos teóricos apresentados serão complementados com exemplos práticos na linguagem R.
More details
Persons
Adriano Koshiyama é Doutorando em Ciência da Computação desde 2016 pela University College London. Passou por diversas empresas (Sieve\B2W Digital, Goldman Sachs International etc.) sempre trabalhando como Engenheiro de Machine Learning. Seus principais tópicos de pesquisa estão relacionados a Ciência de Dados, machine learning, métodos estatísticos, otimização e finanças.
Content
1.1 Banco de dados ou bando de dados?
1.2 Aplicações de Data Science
1.3 Dados x informação x conhecimento
1.4 Esquema básico de um projeto de Data Science
2 Introdução a R
2.1 Comandos básicos
2.2 Criando estruturas de dados dentro do R
2.3 Trabalhando com data frames
3 Conceitos básicos de estatística e álgebra linear
3.1 A matemática do Data Science
3.2 Conceitos básicos de Estatística
3.3 Conceitos básicos de Álgebra Linear
4 Pré-processamento de dados
4.1 Importação de dados
4.2 Análise exploratória
4.3 Preparação e limpeza
5 Modelos de Classificação
5.1 Problemas de Classificação
5.2 Algoritmos
6 Práticas de Classificação
6.1 Árvores de Classificação
6.2 KNN
6.3 Naïve Bayes (Bayes Ingênuo)
6.4 Support Vector Machine (SVM)
7 Modelos de Regressão
7.1 Problemas de Regressão
7.2 Algoritmos
8 Práticas de Regressão
8.1 Regressão Linear, Árvore de Regressão e KNN para Regressão
8.2 Regressão Logística
9 Modelos de Associação e Agrupamento
9.1 Problemas de Associação
9.2 Problemas de Agrupamento
10 Práticas de Associação e Agrupamento
10.1 Apriori
10.2 K-means
11 Conclusão
11.1 Sugestão de template básico para projeto de Ciência de Dados
11.2 Exemplo de um projeto completo usando o template
11.3 E agora?
System requirements
File format: ePUB
Copy protection: Adobe-DRM (Digital Rights Management)
System requirements:
- Computer (Windows; MacOS X; Linux): Install the free reader Adobe Digital Editions prior to download (see eBook Help).
- Tablet/smartphone (Android; iOS): Install the free app Adobe Digital Editions or the app PocketBook before downloading (see eBook Help).
- E-reader: Bookeen, Kobo, Pocketbook, Sony, Tolino and many more (not Kindle).
The file format ePub works well for novels and non-fiction books – i.e., „flowing” text without complex layout. On an e-reader or smartphone, line and page breaks automatically adjust to fit the small displays.
This eBook uses Adobe-DRM, a „hard” copy protection. If the necessary requirements are not met, unfortunately you will not be able to open the eBook. You will therefore need to prepare your reading hardware before downloading.
Please note: We strongly recommend that you authorise using your personal Adobe ID after installation of any reading software.
For more information, see our ebook Help page.