Análise de Dados Ambientais com R
Apresentação
I Introdução
1
Motivação
1.1
Análise de dados meteorológicos
1.2
Ciência de dados
1.3
Etapas para abordagem de um problema
1.4
Programação computacional
1.5
R
1.6
Por que o R?
1.7
Pacotes da comunidade do R
1.8
R não é perfeito!
1.9
Para saber mais sobre o R
II Configuração do Sistema
2
Pré-requisitos
2.1
Instalação do R e RStudio
2.1.1
Instalando o R
2.2
Instalação de Pacotes
2.2.1
Da internet
2.2.2
Atualização de pacotes
2.3
Pacotes necessários e dependências
2.4
RStudio no Ubuntu
2.5
Git e Github
2.5.1
Instalação do
git
III Interação
3
Interface do Usuário
3.1
R no modo interativo
3.1.1
Expressões em sequência
3.1.2
Navegação entre as expressões já avaliadas
3.1.3
Comentários
3.1.4
Auto preenchimento de funções
3.1.5
Primeiro
script
3.2
R no modo de processamento em lote
3.2.1
Linux
3.2.2
Windows
4
RStudio
4.1
Visão geral do RStudio
4.2
Git no RStudio
IV Fundamentos do R
5
Operações básicas
5.1
Convenção
5.2
Calculadora
5.2.1
Aritmética básica
5.2.2
Cálculos problemáticos
5.2.3
Dados faltantes
5.2.4
Funções matemáticas
5.3
Variáveis
5.3.1
Removendo variáveis
5.4
Erros comuns
5.5
Boas práticas para códigos de boa qualidade
5.5.1
Nomes de variáveis
5.6
Exercícios
6
Tipos básicos de dados
6.1
Vetores e tipos de dados
6.1.1
Construindo vetores
6.1.2
Números
6.1.3
Caractere
6.1.4
Lógico
6.2
Testes sobre tipos de dados
6.3
Conversão entre tipos de dados
6.4
Outros tipos de dados derivados
6.4.1
Fator
6.4.2
Datas e horários
7
Manipulação de Vetores
7.1
Propriedades
7.1.1
Nomeando vetores
7.2
Atributos
7.3
Operações com vetores
7.3.1
Comparações
7.3.2
Funções
any
e
all
7.4
Sequências
7.4.1
Sequências de números inteiros
7.4.2
Sequências de números reais
7.4.3
Repetições
7.5
Indexação de vetores
7.5.1
Indexação por vetores numéricos
7.5.2
Indexação por nomes
7.5.3
Indexação por vetores lógicos
7.6
Substituição de elementos de um vetor
7.7
Lidando com dados faltantes
7.7.1
Identificação e remoção de
NA
s
7.7.2
Indexação com
NA
s
7.7.3
Efeito de
NAs
em funções
7.8
Dados Nulos (
NULL
)
7.9
Dados duplicados
7.10
Dados ordenados
7.11
Funções móveis úteis
7.12
Identificação de eventos discretos
7.13
Frequência de ocorrência de dados discretos
7.14
Exercícios
8
Estrutura de dados
8.1
Lista
8.1.1
Criação
8.1.2
Exemplo de lista com dados de estações meteorológicas
8.1.3
Indexação
8.1.4
Conversão de lista para vetor e vice-versa.
8.1.5
Conversão de
list
para
data.frame
8.2
Data Frames
(Quadro de Dados)
8.2.1
Criação
8.2.2
Atributos de um
dataframe
8.2.3
Formas de acesso à variáveis
8.2.4
Indexação, seleção e substituição
8.2.5
Combinando
dataframes
8.2.6
Teste e Coerção
9
Entrada e saída de dados
9.1
Pré-requisitos
9.2
Diretório de trabalho
9.3
Boas práticas para importação e exportação de dados
9.4
Arquivos texto
9.4.1
rio
9.4.2
Arquivos texto não estruturados
9.5
Arquivos binários
9.5.1
Formatos binários nativos do R
9.5.2
NetCDF (Network Common Data Form)
9.6
Arquivos Excel
9.6.1
Como usar
9.6.2
Escrita de arquivos excel no formato
.xls
9.6.3
Escrita de arquivos excel no formato
.xlsx
9.6.4
Estrutura de dados não tabulares
9.7
Para saber mais
9.8
Exercícios
V Ferramentas modernas do R
10
Processamento de dados
10.1
Pré-requisitos
10.1.1
Dados
10.2
tibble
: um
quadro de dados
aperfeiçoado
10.2.1
Funcionalidades do
tibble
10.3
Restruturação de dados retangulares
10.3.1
Dados arrumados
10.3.2
Formatos de dados mais comuns
10.3.3
Funções adicionais do
tidyr
10.3.4
Exercícios
10.4
Manipulação de dados
10.4.1
Códigos como fluxogramas
10.4.2
Seleção de variáveis
10.4.3
Seleção de observações
10.4.4
Reordenando dados
10.4.5
Criando e renomeando variáveis
10.4.6
Agregando observações
10.4.7
Agrupando observações
10.4.8
Combinação de dados
10.5
Exercícios
11
Visualização de dados
11.1
Pré-requisitos
11.1.1
Pacotes
11.1.2
Dados
11.2
Sistemas Gráficos
11.3
Pacotes Gráficos
11.3.1
graphics
11.3.2
grid
11.3.3
lattice
11.3.4
ggplot2
11.3.5
Terminologia: funções de alto e baixo nível
11.4
Funções gráficas básicas
11.4.1
Diferentes entradas de dados na
plot()
11.5
Parâmetros gráficos
11.5.1
Símbolos e linhas
11.5.2
Cores
11.5.3
Características de texto
11.5.4
Plotando vários gráficos em uma mesma página
11.5.5
Gráfico com 2 eixos
11.5.6
Adicionando legenda
11.6
ggplot2
11.6.1
Exemplo de aplicação
11.6.2
Dados
11.6.3
Gráfico do tempo de Santa Maria-RS em 2020
11.6.4
Histograma e colunas
11.6.5
Imagem 2D
11.6.6
Facetas
12
Referências
Appendix
A
Matriz
A.1
Criação de matrizes
A.1.1
Função
matrix()
A.2
Nomes das linhas e colunas de uma matriz
A.3
Indexação de matrizes
A.4
Número de linhas e colunas de uma matriz
A.5
Adição de linhas e colunas a uma matriz
A.6
Matriz transposta e diagonal
A.7
Conversão de matriz para vetor
A.8
Operações adicionais com matrizes
A.8.1
Função
dim()
A.9
Atribuição por indexação
A.10
Operações matriciais
A.10.1
Multiplicação matricial
A.10.2
Adição matricial
A.10.3
Produto escalar
A.10.4
Determinante
A.10.5
Solução de sistemas lineares
A.10.6
Produto cartesiano
A.11
Arranjo
A.11.1
Criação
A.11.2
Indexação
B
Funções nativas do R para importar e exportar dados
B.1
Amostras pequenas de dados
B.1.1
scan()
B.1.2
readline()
B.1.3
Impressão na tela
B.1.4
textConnection()
B.2
Exportando e recuperando objetos do R no formato textual
B.2.1
dput()
,
dget
,
dump
e
source
.
B.3
Dados de pacotes do R
B.4
Leitura de arquivos texto com funções da base do R
B.4.1
Dados hidrometeorológicos brasileiros
B.4.2
Arquivos formatados com largura fixa
C
R Markdown
C.1
Como usar o
R Markdown
C.1.1
Opções do
chunk
C.1.2
Saídas dos
chunks
C.1.3
Códigos R dentro de linhas
C.2
Markdown
C.2.1
Cabeçalhos
C.2.2
Parágrafos
C.2.3
Listas
C.2.4
Linhas horizontais
C.2.5
Citações diretas
C.2.6
Tabelas
C.2.7
Ênfase de texto
C.2.8
Hyperlinks
C.2.9
Figuras
C.2.10
Expressões matemáticas
C.3
Aparência
C.4
Referências para aprender mais sobre o R Markdown
Publicado com bookdown
Análise de Dados Ambientais com R
Apêndice B
Funções nativas do R para importar e exportar dados