Força-tarefa COVID-19 Unicamp

Predição de Novos Casos e Óbitos por Município

Problema: A habilidade de predição de cenários futuros a curto prazo é essencial para a tomada de decisão baseada em evidência. Com a utilização de modelos, por exemplo, do tipo SIR, é possível utilizarmos as informações disponíveis até o momento para prevermos o número de casos e óbitos no futuro imediato. Deseja-se disponibilizar um dashboard que apresente estas informações para os gestores de saúde.

Para esta a execução desta proposta, é necessário o acesso aos dados estratificados por município e estado. Idealmente, os dados seriam compostos das seguintes informações:

  • Data;
  • Cidade;
  • Estado;
  • Número de novos casos (para aquela data);
  • Número de novos óbitos;
  • Número de novas recuperações;

A Plataforma IVIS do Ministério da Saúde encontra-se fora do ar, requerendo uma ação conjunta com secretarias de saúde e/ou acompanhamento ostensivo de publicações na mídia. Tais informações devem estar estruturadas e disponíveis em infra-estrutura que permita o acesso programático aos mesmos.

O repositório de dados disponibilizado pela Universidade Johns Hopkins possui tais informações para o nível nacional.

Status: Em execução

Necessidade: Especialistas em modelagem

2 curtidas

Tenho acesso fácil aos colegas da UnB que acabam de publicar este estudo:


Imagino que a segunda autora tenha acesso aos dados do Ministério. Verei o que consigo. Considere-me no time.

Benilton, existe um repositório no GitHub supostamente alimentado por dados/estado que busca do IVIS mas também da Fiocruz. Pode ser útil: https://github.com/liibre/coronabr

Bom dia!
Há uma base de dados disponível e atualizada em: https://data.brasil.io/dataset/covid19/_meta/list.html

Aqui quem escreve é Vitor Vieira Vasconcelos, professor da UFABC. Estou à disposição para colaborar nos estudos. Como sugestão de método, eu acho interessante os métodos de predição espaço-temporal como dos pacotes spTimer e CARBayesST na liguagem R. Como critério de contágio, acho interessante usar não apenas a vizinhança de contiguidade espacial dos municípios, mas também as ligações de linhas aéreas e de ônibus entre as cidades, bem como as redes de cidades propostas pelo IBGE.

1 curtida

Estou tentando fazer uma atividade de modelagem para Campinas/Brasil com os (poucos) estudantes que sobraram na disciplina de Laboratório Avançado do Curso de Física. Encontrei vários códigos para simulação no Github e uma página excelente que o Rodolfo (IC) me passou ontem à noite: https://medium.com/data-for-science/epidemic-modeling-101-or-why-your-covid19-exponential-fits-are-wrong-97aa50c55f8
Com uma equipe profissional dá para ir bem mais adiante. Por exemplo, seria possível modelarmos o efeito do “confinamento vertical” proposto pelo excelentíssimo mas até agora sem teste nenhum. Não deve ser muito complicado modelar jovens na rua e velhos em casas sozinhos ou com contato com jovens e combinações entre os dois.

Outra sugestão: Fazer apresentações sobre SIR, SEIR e correlatos para ajudar os mortais a digerirem as predições do grupo do Imperial College e outros. Eu buscaria fazer uma para profissionais que conhecem cálculo e uma simplificada para leigos. Gente muito desqualificada está atacando ferozmente o Átila Iamarino que fez uma live apresentando os resultados. Ele mesmo é biólogo e tem limitações ao falar do modelo.

Além dos sites já mencionados, existe uma base de dados atualizada diariamente aqui:

Estão disponíveis o número de novos casos por dia por estado e por município. Por estado também tem o número de óbitos por dia. As fontes (diversas) estão detalhadas lá.

Número de novas recuperações não vi em nenhum lugar, acredito que seja difícil obter. Uma possibilidade é estimar baseado no tempo médio de infecção.

Wesley Cota organizou dados por cidade, estão aqui:

Seu site

parece bem completo.

Não pude incluir na outra postagem. Parece que minha reputação por aqui não anda muito boa…

Outra fonte de dados que pode ser útil:
https://ciis.fmrp.usp.br/covid19/

Talvez a apresentação do Kraenkel seja útil:

1 curtida

Eu assisti. Legal, mas não entra em detalhe algum dos modelos. Fica parecendo mágica para o público. Divulgação científica é um assunto complicado.

Situação Atual (31/março/2020 11:15am)

  • Disponibilizei um repositório público no Github contendo:
    1. Código básico em R de importação, manipulação e visualização de dados
    2. Arquivo CSV, para aqueles que não usam R, com os dados obtidos via Brasil IO

Sugestões de código, implementações, etc, podem ser depositadas no github com pull request ou mesmo por comunicações diretas por meio deste fórum.

@Vitor , coloquei um começo de código no github… Você não já quer dar uma olhada no que é possível a partir do que está disponível por lá? Num trabalho a várias mãos, podemos avançar mais rapidamente.

@asaa, ótima a possibilidade de apoio com o pessoal da UnB. Vamos lá! Deixei também um CSV no github, já lembrando que você não usa R. Minha intenção é de atualizar o arquivo diariamente. Será que é interessante também indexar o arquivo por data?

@rmiranda, estou usando o coronabr… Ele baixa os dados diretamente do Brasil IO sugerido pelo @Vitor e adiciona um monte de outras coisas também, mas que ainda não estou utilizando.

@tessler, acho que essas duas iniciativas são de grande valor (a de modelagem e de comunicação científica dos resultados). Como podemos coordenar ações? Será que já podemos utilizar a oportunidade de ter você com os alunos de Laboratório Avançado para darmos um passo à frente?

2 curtidas

Vamos por partes:

  1. Eu sou provavelmente o mais pedestre por aqui em modelagem de epidemias. Estou mega orgulhoso por ter entendido as bases so SIR (suficiente para discutir com estudantes de graduação). Entendo que tem odelos bem mais sofisticadoso como mencionado pelo @Vitor e vou tentar entende-los também. Eu gostaria de ± reproduzir o estudo do Imperial College para o Brasil e se possível incluir os cenários propostos pelo excrementíssimo. Parece que ele tem falado sem apresentar modelos ou simulações (provavelmente porque os milicos e medíocres que o cercam não conseguem). Para isso vocês estão mais bem equipados intelectualmente do que eu mas corro atrás.
  2. Não conheço quase nada de R (assunto das minhas filhas estatísticas). Se o código puder ser em Python agradeço. Acho que os demais não-estatísticos também.
  3. O grupo de alunos ficou reduzido a 2, talvez 3. Resto do pessoal vai trancar. São tão pedestres quanto eu mas espero que estejam mais a vontade brevemente. Podem ajudar no que for preciso.
  4. As iniciativas de divulgação precisam começar em paralelo. Idealmente um especialista falando em língua acessível como funciona um modelo de epidemia. Como podemos prever o que vai acontecer e com que limitações. A imprensa está só falando em crescimento exponencial…

Por exemplo, acabo de ser informado que salões de beleza, cabeleireiros e barbeiros foram autorizados a funcionar em Campinas (Porto Alegre também). Que consequência isso pode ter sobre a disseminação do vírus?

@tessler, claro que Python tá valendo!!! Deixei o CSV lá no repositório pra casos assim!

Pensando sobre a coisa dos salões, pensando num grafo, isso teria uma probabilidade de um contato adicional com alguma probabilidade (que não sei estimar no momento)… No caso dos modelos SIR, penso num aumento das taxas de transição entre os compartimentos (mas aí a gente volta pro seu ponto inicial).

Leandro, curiosamente, essas mesmas exceções também foram permitidas na Espanha, cujas restrições foram muito mais severas que o resto da Europa. Eu não entendi muito bem o motivo, disseram que eram questões higiênicas. Mas certamente não é uma “jaboticaba”.

O modelo do Imperial College é “simples”. O impacto das diversão “ações” correspondem basicamente a alterações nos parâmetros do modelo SIR (ou seus descendentes). Estimar esses parâmetros é a grande dificuldade. Basicamente você precisa de muitos dados, e isso eles têm. O trabalho do pessoal de Brasilia que está ai em cima tem mais detalhes sobre isso.

Deixo abaixo duas referências que talvez já sejam conhecidas, mas ambas valem a pena.

https://www.nationalgeographic.com/history/2020/03/how-cities-flattened-curve-1918-spanish-flu-pandemic-coronavirus/

Outra referência útil:

No início da epidemia a sua dinâmica é dominada pelo crescimento exponencial - um contagia dois e cada um contagia dois e assim por diante. O modelo SIR tem dois parâmetros para determinar e duas condições de contorno. Mesmo o modelo SIR, se o I<<S inicialmente, dI/dt = beta I, isto é, exponencial inicialmente. E esta informação, por exemplo no estado de SP em 31/mar tem beta=17% por dia, aproximadamente.
E o fator gamma de recuperação pode se o inverso do tempo de incubação. Assim, digamos 12 dias, e gamma=1/12. Fazendo um código porco (já passou da meia noite), a curva de infectados é a seguinte:

image

Isto é, haveria um pico de 17% da população infectada em torno de 110 dias.
Assumi a fração da população inicial infectada de 10^{-5}. Seria uma curva bem achatada. O modelo SIR não contempla mortos, mas seria fácil incluir nas equações, mas teria que se estimar mais um parâmetro.

1 curtida