ATUALIZADA EM 11/07/2019

 

 

____________________________________________________________________________________________________________________________________________________

 

Programa

Cronograma 

 

Horário de Atendimento:

            (Professor) Segundas-feiras, sala 210 - IMECC : 13h00 às 14h00

            OBS: Não haverá atendimento fora desse horário

 

 

Slides das Aulas

Introdução (atualizados em 12/03/2019, slide 44), (atualizados em 17/03/2019, slides 30, 42),

(atualizados em 19/03/2019, slides 58, 60)      

Revisão de álgebra matricial (disponibilizados em 17/03/2019)

Distribuição Normal multivariada (atualizados em 15/04/2019, slide 17)

 Modelos de regressão linear múltipla: parte 1  (atualizados em 17/04/2019, slides 8, 15, 31 e 32)

Modelos de regressão linear múltipla: parte 2 (atualizados em 20/04/2019, slides 7 e 22)

Modelos de regressão linear múltipla: parte 3 (atualizados em 17/04/2019, slide 14, atualizados em 19/04/2019, slides 32, 34, 35, 36, 42)

       Verificação da qualidade de ajuste do modelo

Parte 1 (disponibilizados em 02/05/2019)

Parte 2 (disponibilizados em 06/05/2019)

Parte 3 (disponibilizados em 12/05/2019)

       Seleção e comparação de modelos (atualizados em 29/05/2019, modificações no exemplo 9; atualizados em 03/06/2019, slides 70 e 71)

Transformações de variáveis e outros métodos de estimação (disponibilizados 28/05/2019

Análise de Multicolinariedade (disponibilizados em 29/05/2019, atualizados em 03/06/2019, slides 9 e 11, atualizados em 06/06/2019, slides 26, 28 e 29)

Estimação por mínimos quadrados ponderados e generalizados (atualizados em 11/06/2019)

Medidas de influência e alavancagem (disponibilizados em 03/06/2019)

Introdução aos modelos de regressão não lineares (atualizados em 12/06/2019)

 

 

Listas

     Lista 0 (revisão de inferência)

     Lista 1

       Lista 2 (disponibilizada em 14/04/2019)

      Lista 3 (atualizada em 12/05/2019, questão 8)

      Lista 4 (atualizada em 29/05/2019, inserção da Questão 10)

      

Conjuntos de dados

    Braga1998.txt (carga e VO2 no limiar anaeróbio) - colunas: 1- etiologia cardíaca ; 2 - carga ; 3 - consumo de oxigênio (VO2)

    Braga1998PCR.txt - colunas: 1- etiologia cardíaca ; 2 - carga ; 3 - consumo de oxigênio (VO2)

    Consumo (dados sobre consumo de combustível) - colunas: :1 - sigla do estado, 2 - taxa do combustível (em USD), 3 - porcentagem de motoristas licenciados, 4 - renda per capita (em USD), 5 - ajuda federal às 1 estradas do estado (em mil USD) , 6 -consumo per capita de combustível (em galões por ano) (as outras seis seguem a mesma estrutura).

   Singer&Andrade1997.txt  (eficácia de escova de dentes) - colunas: 1 - indivíduo ; 2 - sexo ; 3 - IPB pré-escovação, escova Hugger ; 4 - IPB pós-escovação, escova Hugger; 5 - IPB pré-escovação, escova tradicional , 6 - IPB pós-escovação tradicional.

 censo.txt (censo do IBGE de 2000) - colunas: 1 - estado ; 2 - anos de escolaridade ; 3 - renda média.

 imoveis.txt - colunas: 1 - imposto do imóvel (em 100 USD), 2 - área do terreno (em 1000 pés quadrados), 3 -  área construída (em 1000 pés quadrados), 4 - idade da residência (em anos) e 5 - preço de venda do imóvel (em 1000 USD) 

Sef1999REG (descrição no próprio arquivo, usar a planilha dados 2 ou Sef1999Reg) (atualizados em 06/06/2019)

 Turbina (dados do Exemplo 6: turbinas; coluna 1 - tipo de turbina; coluna 2 - tempo de vida)

  store.dat (dados do Exemplo 7: número de clientes) - colunas : 1 - número de clientes ; 2 - número de domicílios ; 3 - renda; 4 - idade ; 5 - distância ao cliente ; 6 - distância à loja

 risco carros.prn (dados do Exemplo 10) - colunas : 1 - risco,; 2 -  base da roda (dimensão, em polegadas); 3 - comprimento do carro (em polegadas); 4 - largura do carro (em polegadas); 5 - altura do carro (em polegadas); 6 - peso do freio (em onças); 7- tamanho do motor (em polegadas); 8 - diâmetro do carro (em polegadas); 9 - ``stroke'' (arranque); 10 - taxa de compressão (performance); 11 - cavalo-vapor (potência); 12 -  pico-rpm (potência); 13 -  consumo urbano (milhas por galão); 14 - consumo estrada (milhas por galão).

  Nobre&Singer.txt (eficácia da escova de dentes, estudo longitudinal) - colunas: 1 - tipo de escova; 2 - sessão;  3 - IPB pré ; 4- IPB pós ; 5 - indivíduo

re3.dat (colunas: (i) estado (nome do estado), (ii) pop (população estimada em julho de 1975), (iii) percap (renda percapita em 1974 em USD), (iv) analf (proporção de analfabetos em 1970), (v) expvida (expectativa de vida em anos 1969-70), (vi) crime (taxa de criminalidade por 100000 habitantes 1976), (vii) estud (porcentagem
de estudantes que concluem o segundo grau 1970), (viii) ndias (número de dias do ano com temperatura abaixo de zero grau Celsus na cidade mais importante do estado) e (ix) area (área do estado em milhas quadradas))

coelhos.dat: colunas: 1 - idade do animal (em dias), 2 - peso da lente do olho seco

 salary.dat (descrição dos dados - veja a Lista IV)

 

Programas

      Exemplo introdutório:  estudo entre renda e escolaridade (link

      Exemplo 0: altura e peso de homens e mulheres (link) (atualizados em 12/10/2019) 

Colocação de curvas normais ao longo da reta regressão (link)

Exemplo 1 (consumo e carga): Ajuste do modelo de regressão linear simples (desconsiderando etiologia) (link) (atualizados em 03/06/2019)

Geração de Gráficos da Normal Bivariada (link) (disponibilizado em 20/03/2019)

Exemplo 4: consumo de combustível (link) (atualizados em 03/06/2019)

Exemplo 3: produção de milho (link) (heterocedasticidade e mínimos quadrados ponderados) (atualizados em 03/06/2019)

Exemplo 2: estudo da eficácia das escovas (link) (atualizados em 03/06/2019)

       Teste para a Hipótese Linear Gera e outras Funções auxiliares (MQG) e  (atualizado em 12/06/2019)

       Exemplo 1: carga e VO2 no limiar anaeróbio (modelo de regressão linear múltipla) (atualizados em 18/06/2019)

       Exemplo 5: medidas de absorbância (atualizados em 03/06/2019)

        Funções para a verificação da qualidade de ajuste do modelo:

diag_norm, envel_norm (disponibilizado em 02/05/2019)

 diag2_norm (disponibilizado em 02/05/2019)   

        Função para a calcular e graficar medidas de influência e alavancagem:

anainflu_norm (disponibilizado em 10/06/2019)

      Simulação de resíduos (disponibilizado em 02/05/2019)

     Exemplo 6: potência das turbinas de aviões (disponibilizado em 12/05/2019)

      Exemplo 7: perfil de clientes de uma vídeo locadora (disponibilizado em 12/05/2019)

     Exemplo 0 : altura e peso de homens e mulheres (disponibilizado em 28/05/2019) 

    Problemas com o uso das medidas R2 e R2 Exemplo de Anscombe (1973) - (link) (disponibilizado em 12/05/2019)

    Arquivos auxiliares - estatísticas de comparação de modelos (link) (disponibilizado em 20/05/2019)

    Seleção e comparação de modelos - (link) (disponibilizado em 20/05/2019)

    Exemplo 9:  dados sobre automóveis (atualizados em  29/05/2019)

   Transformações de variáveis e outros métodos de estimação  (disponibilizado em  28/05/2019)

    Exemplo 10 (multicolinearidade): risco de assegurar carros (disponibilizado em 29/05/2019)

   Exemplo 11: comparação dos tipos de escovas (estudo longitudinal - mínimos quadrados generalizados) (atualizados em 11/06/2019)

   Exemplos de modelos não lineares (figuras) (disponibilizado em 05/06/2019)

    Modelos não lineares (para a função nls) (disponibilizado em 05/06/2019)

   Análise dos dados da fadiga de materiais (atualizados em 12/06/2019)

 

 

Notas

 

Trabalho (questões e entrega - atualizado em 06/06/2019, instruções e normas, modelo de relatório).

OBS:

1. Para as questões de análise de dados, a escolha dos modelos é livre, dentro da classe de modelos vistas no curso.

2. Para as questões sobre simulação, os códigos devem ser apresentados (não contam para o número total de páginas)

 

Seminários

Lista de tópicos e equipes (link) (atualizada em 03/04/2019)

Lista de equipes e datas de apresentação (link) (cada equipe terá 25 minutos de apresentação com 5 min para perguntas/discussões) (disponibilizada em 14/04/2019)

Mais informações sobre os seminários (link)

Critérios de avaliação (link)

Apresentações e programas

Modelos Lineares Generalizados

Modelos de regressão para dados binários

Modelos de regressão parada dados de contagem

Modelos de regressão para variáveis positivas

Modelos de regressão não-paramétricos

 

 

Links/Material adicional

        Apostila introdutória ao R (link)

        R studio (link)

        Wikibook sobre o ajuste do modelos de regressão lineares (link)

        Cursos ministrados pelo Prof. Caio Azevedo: Probabilidade I (link), Probabilidade II (link) e Inferência (link)

         Cursos sobre modelos de regressão não lineares (link)  

        Livro "Modelos de regressão com apoio computacional" (link)

 Colocação de curvas normais ao longo da reta de regressão (link)

Um resumo sobre seleção de modelos (link)

Pacote glmnet do R, para execução do LASSO (e outros procedimentos para seleção de covariáveis (link)

 

      

 

Tabelas

            Distribuição normal padrão

            Distribuição t de Student

            Distribuição Qui-quadrado

            Distribuição F de Snedecor (parte 1 parte 2)