ATUALIZADA EM 10/12/2018

MI 634 Análise de Dados Longitudinais 

AVISOS

 

A SEÇÃO "NOTAS" FOI ATUALIZADA

 

_______________________________________________________________________________________________________________________________

 

Programa

Cronograma

Horário de Atendimento:

            Segundas-feiras : 13h00 às 14h00 (veja o Programa da disciplina)

 

Slides das Aulas

    Introdução à análise de dados longitudinais

    Análise descritiva de dados longitudinais

Parte 1

Parte 2

Parte 3

  Revisão de álgebra matricial

  Distribuição normal multivariada (disponibilizados em 14/08/2018) 

 MANOVA (disponibilizados em 23/08/2018)

Modelo linear multivariado marginal

Parte 1: dados de bilirrubina (atualizados em 03/09/2018)

      Parte 2 : dados de Potthoff and Roy (disponibilizados em 10/09/2018)

      Parte 3: dados do pH bucal (disponibilizados em 10/09/2018)

Revisão sobre análise de resíduos  (disponibilizados em 10/09/2018)

Modelos lineares mistos (pacote do R sugerido: lme)

Parte 1 (disponibilizados em 10/09/2018)

Parte 2 (disponibilizados em 18/09/2018)

Parte 3 (disponibilizados em 18/09/2018)

Parte 4 (disponibilizados em 18/09/2018)

 

Modelos lineares generalizados mistos (pacote do R sugerido: glmmADMB)

Parte 1: Poisson  (atualizados em 18/10/2018)

Parte 2: Bernoulli  (disponibilizados 18/10/2018)

 

Inferência Bayesiana (programas sugeridos: WinBUGS, OpenBUGS, JAGS, STAN, e os respectivos pacotes em R - R2WinBUGS, R2OpenBUGS, rjags/jags, rstan)

Introdução e algoritmos MCMC  (disponibilizados em 25/10/2018)

Análise de dados (atualizados em 31/10/2018)

Gráficos de convergência: dados de concentração de Bilirrubina -  modelo gama misto  (link)

Gráficos de convergência: dados de ataques epíléticos - modelo Poisson misto (link)

Gráficos de convergência: dados de Potthof and Roy - modelo normal misto (link)

Gráficos de convergência: dados da condição respiratória - modelo Bernoulli misto (link)

       

Modelos não lineares mistos (em breve)  (pacote do R sugerido: nlme) (disponibilizados em 04/11/2018)

Teoria e análise de dados (frequentista e bayesiano) (atualizados em 07/11/2018)

Gráficos de convergência: dados de indometacina - modelo normal misto (link)

Gráficos de convergência: dados de indometacina - modelo gama misto (link)

 

Aspectos de teoria assintótica para modelos (lineares) mistos (link) (disponibilizados em 12/11/2018)

 

 


Listas

Lista I

Lista II (disponibilizada em 23/08/2018),

Questão adicional 1. Adicionalmente, analise os conjuntos de dados disponíveis no site bem como aqueles que foram e estão sendo apresentados ao longo do curso através de modelos marginais multivariados apropriados (com exceção daqueles conjuntos de dados que já o foram)

Questão adicional 2. Analise os conjuntos de dados, analisados em sala de aula, bem como aqueles constantes nas listas de exercícios, utilizando modelos mais apropriados (ainda que tais modelos não tenham sido apresentados em sala de aula). Você pode ajustar os modelos tanto sob o paradigma frequentista quanto bayesiano

Lista III (disponibilizada em 09/10/2018)

Lista IV (diponibilizada em 18/10/2018)

Lista V (diponibilizada em 04/11/2018)

 


Programas

  Análise descritiva para dados longitudinais: Exemplo 1 (bilirrubina), Exemplo 2 (Potthoff and Roy), Exemplo 3 (pH da placa dentária)

  MANOVA: MANOVA Potthoff and Roy, Funções MANOVA (disponibilizadas em 23/08/2018)

   Modelo linear multivariado (marginal): dados da bilirrubina (atualizados em 03/09/2018)  

   Modelo linear multivariado (marginal): dados de Potthoff and Roy (disponibilizados em 10/09/2018)

   Modelo linear multivariado (marginal): dados do pH bucal (disponibilizados em 10/09/2018)

   Simulação dos resíduos (disponibilizados em 10/09/2018)

   Comandos gerais para a função "gls" do pacote "nlme" (disponibilizados em 10/09/2018)

    Modelo linear misto

            Parte 1 (Bilirrubina) (atualizados em 18/09/2018)

            Parte 2 (Potthoff and Roy) (disponibilizados em 18/09/2018)

            Parte 3 (dados de Ph da placa) (disponibilizados em 18/09/2018 )

   **** Diagnóstico para modelos lineares mistos: Função desenvolvida por Singer, Rocha e Nobre cuja versão original está disponível em: (link) (disponibilizados em 18/09/2018 )

            Versão ligeiramente modificada: (link) (disponibilizados em 18/09/2018 )

Modelo linear generalizado misto

    Parte 1 (Poisson):

        Análise descritiva (disponibilizado em 09/10/2018)

        Análise inferencial (atualizado em 18/10/2018)

        Estudo de simulação sobre resíduos (disponibilizado em 16/10/2018)

        Envelope para o modelo de Poisson (disponibilizado em 09/10/2018)

 

   Parte 2 (Bernoulli):

      Análise descritiva (disponibilizado em 18/10/2018)

      Análise inferencial (disponibilizado em 18/10/2018)

      Estudo de simulação sobre resíduos (disponibilizado em 18/10/2018)

      Envelope para o modelo de Bernoulli (disponibilizado em 18/10/2018)

 

 Inferência Bayesiana:

    

Análise dos dados de concentração de Bilirrubina: modelo gama misto (análise dos dados,função OpenBUGS) (disponibilizados em 25/10/2018)

Análise dos dados de ataques epíléticos : modelo Poisson misto (análise dos dados,função OpenBUGS) (disponibilizados em 25/10/2018)

Análise dos dados de Potthof and Roy : modelo normal misto (análise dos dados,função OpenBUGS) (atualizados em 31/10/2018 )

Análise dos dados da condição respiratória : modelo Bernoulli misto (análise dos dados,função OpenBUGS) (disponibilizados em 25/10/2018)

 

  Modelos não lineares mistos         

Análise descritiva (disponibilizados em 04/11/2018)         

Gráficos de modelos não lineares (disponibilizados em 04/11/2018)

Gráficos sobre valores iniciais para os processo de estimação (disponibilizados em 04/11/2018)       

Análise inferencial (os bancos de dados "Indometh" e "Soybean" acompanham o pacote "nlme" e ficam disponíveis quando este é carregado)                

Funções com os preditores não lineares (disponibilizados em 04/11/2018)                

Programas para as análises (disponibilizados em 04/11/2018)   

 Frequentista (dados de indometacina e de crescimento de espécies de soja) (atualizados em 07/11/2018)

Bayesiano (modelo normal misto - dados de indometacina) - arquivo OpenBugs, programa para a análise

 Bayesiano (modelo gama  misto - dados de indometacina) - arquivo OpenBugs, programa para a análise         

 Envelope (frequentista): Modelo M1 (disponibilizados em 04/11/2018)                

Envelope (frequentista): Modelo M2 (disponibilizados em 04/11/2018)               

 Envelope (frequentista): Modelo M3 (disponibilizados em 04/11/2018)

Simulação relativa à gráficos de envelopes (link): (disponibilizados em 05/11/2018)

    

 


Conjuntos de dados

    Bilirrubina

    Potthoff and Roy: disponível no R, através do pacote "mice", sob o nome de "potthoffroy"

    pHplaca

    Macchione.xls

    Ataques : descrição: indivíduo, período (1:antes do tratamento, 2:1o período após o tratamento, 3:2o período após o tratamento, 4:3o período após o tratamento), número de semanas em cada período, número de ataques em cada período e tratamento (0:placebo, 1:progabide).

    Respiratorio: descrição: paciente, tratamento (0:droga ativa, 1:placebo), sexo (0:feminino, 1:masculino), idade (em anos), nível base (0:ausência, 1:presença) e condição do paciente nas visitas (0:boa, 1:ruim).

   Ratosgee : animal, grupo, quantidade de células brancas, quantidade de células vermelhas e número de colônias de células cancerosas. 

   health care utilization data : C1-Identificação da família; C2- identificação do invidíduo; C3- sexo (1- masculino, 2 feminino); C4- status da doença crônica (0- sem doneça crônica, 1 - para uma doença crônica e assim por diante); C5-Nível educacional(1 – menos que ensino médio, 2 ensino médio, 3 nível superior, 4 pos-graduação); C6-idade em 1985; C7-C12- número de visitas ao médico de 1985 to 1990


Seminários

 

Instruções adicionais (link

Artigos escolhidos :

Jose Alejandro - Models for Longitudinal Data: A Generalized Estimating Equation Approach  (link) - apresentação: dia 21/11/2018, das 11h00 as 12h00

Amanda Merian -  Negative binomial mixed models for analyzing microbiome count data (link) - apresentação: dia 21/11/2018, das 10h00 as 11h00. 


Notas

Notas (prova 1, prova 2, prova substitutiva, trabalho, seminário)

  


Trabalho

Questões selecionadas (link)

Data de entrega: até dia 28/11/2018, as 10h10 (sala 210 do IMECC ou na sala de aula, de preferência, nesta última)

 


Links

Dissertação sobre métodos de diagnóstico em modelos lineares mistos: Nobre (2004)

Tese sobre análise de dados longitudinais para a Teoria da Resposta ao Item (contas relativas à derivadas de matrizes): Tavares (2001)

 Livro sobre Modelos Lineares Generalizados do Prof. Gilberto Paula (link)

 Aproximação, pela distribuição F, das estatísticas usadas na metodologia MANOVA (link)     

Mais sobre o ajuste de modelos lineares normais multivariados no R (incluindo a função "linearHypothesis") (link)

 Mais sobre verificação da normalidade multivariada (pacote MVN)       

Artigo original sobre a distribuição T2 de Hotelling (link)

Artigo original sobre a distribuição Wishart (link)

Referências sobre a estatística Lambda de Wilks (link, vejam os artigos no final da página)

Paper original sobre a estatística Traço de Pillai (link)

Referências sobre a estatística Traço de Lawley-Hotelling  (link1,link2,link3)

Referências sobre a estatística raiz máxima de Roy (link)

Curso de análise de dados longitudinais, Prof. Júlio Singer (link) (vejam os conjuntos de dados disponíveis em link)

(Versão preliminar) Análise de dados longitudinais (Singer, Nobre, Rocha) (link)

 

Artigos sobre decomposição de Cholesky para análise de dados longitudinais

Joint mean-covariance models with applications to longitudinal data: unconstrained parameterisation (link)

Bayesian analysis of covariance matrices and dynamic models for longitudinal data (link)

Cholesky Decompositions and Estimation of A Covariance Matrix: Orthogonality of Variance–Correlation Parameters (link)

Dynamic Conditionally Linear Mixed Models for Longitudinal Data (link)

Simultaneous modelling of the Cholesky decomposition of several covariance matrices (link)

Covariance matrix selection and estimation via penalised normal likelihood (link)

Cholesky decompositions and estimation of a covariance matrix: orthogonality of variance–correlation parameters (link)

Modeling covariance matrices via partial autocorrelations (link)

 

Modelagem da estrutura de dependência (matriz de covariâncias/correlações)

Joint mean-covariance models with applications to longitudinal data: unconstrained parameterisation (link)

Proc MIXED SAS (link)

 

Artigo sobre modelagem (data-driven/direcionadas pelos dados/problema) de dados longitudinais

 Regression models for pretest/posttest data in blocks  (link)

 

Pacotes e funções do R

 Pacote nlme (função gls: modelo linear multivariado (marginal))   (link)

Pacote nlme ( função lme: modelo linear misto) (link)

Pacote lme4 (função glmer: modelo linear generalizado misto) (link)

Pacote blme (ajuste de modelos lineares mistos) (manual)

Pacote brinla (ajuste de modelos lineares e lineares generalizados mistos usando o INLA) (manual, livro, página)

Pacote MCMCglmm (ajuste de modelos lineares generalizados mistos via algoritmos MCM) (manual, artigo)

Pacote brms: ajusta diversos tipos de modelos, incluindo modelos hierárquicos/mistos lineares e lineares generalizados via STAN (artigo, manual)

Pacote bild: análise de modelos de regressão para dados binários longitudinal sob a ótica frequentista  (manual, artigo)

jmcm: An R Package for Joint Mean-Covariance Modeling of Longitudinal Data (link)

glmmADMB: pacote para o ajuste de modelos lineares generalizados mistos e extensões (introdução/instalação, exemplos, manual). Instalação (melhor caminho):

install.packages("R2admb")

install.packages("glmmADMB", repos=c("http://glmmadmb.r-forge.r-project.org/repos", getOption("repos")), type="source")

jmcm: An R Package

nlme: ajusta modelos lineares e não lineares Gaussianos (manual,apresentação)

 

Mais temas

 

Estimação via algoritmo EM em modelos lineares mistos (link)

Cálculo da matriz de variâncias e covariâncias do estimadores obtidos via algoritmo EM (e similares, CEM, SEM,
       SAEM etc) (link)

Teste de hipótese para inclusão de efeitos aletatórios via estatísticas U (link, link)

Teoria assintótica em modelos mistos (link)

Sobre a construção de verossimilhanças (link)

Estimação em modelos não lineares de efeitos mistos Gaussianos

- Lindstrom, M. J. and  Bates, D. M. (1990). Nonlinear Mixed Effects Models for Repeated Measures Data, Biometrics, 46, 3. (link)

Estatísticas de comparação de modelos (Bayesianas) obtidas através de amostras MCMC

- Vilca, F., Azevedo, C. L. N., Balakrishnan, N.  (2017). Bayesian inference for sinh-normal/independent nonlinear regression models, Journal of Applied Statistics,44, 11. (link)

Determinaçao de pontos de corte para testar hipóteses do ponto de vista Bayesiano na TRI

- Azevedo, C. L. N., Bolfaine, H., Andrade, D. F. (2011). Bayesian inference for a skew-normal IRT model under the centred parameterization, CSDA, 55, 1.  (link)

Normalidade asintótica das distribuições a posteriori em modelos lineares generalizados mistos (link)

Apresentação do Prof. Júlio Singer, SINAPE 2018 (link)