Força-tarefa COVID-19 Unicamp

Predição de Novos Casos e Óbitos por Município

@acaseri, tô deixando os dados (atualizados diariamente) no repositório do github. Sinta-se à vontade pra mandar uns pull requests e vamos seguindo com isso de maneira “federada”. Nos próximos dias, devemos receber uma série de resultados que estão empacados na espera e os números podem mudar significativamente. Logo espero poder compartilhar um dashboard também.

@GRezende, acho que para as suas duas perguntas, a gente deve começar a ser capaz de coletar evidências nas próximas semanas, com os testes rápidos que já foram despachados para o Sudeste (acho que coisa de 200 mil). Entretanto, não acho que, na situação em que o mundo se encontra, estes serão recursos “perenes” para o período da pandemia… Mas penso que estes testes rápidos ajudarão a calibrar o problema das subnotificações.

@asaa, achei legal a linha de pensamento. Mas acho que os testes rápidos possuem uma taxa de falso negativos que não é desprezível… Você consegue ter uma idéia de o que seria a “maior taxa aceitável para falso negativos” que esta idéia suportaria? Vou checar algumas informações com o pessoal da área clínica.

1 curtida

@ Benilton_Carvalho Numa primeira análise mais simples, a “eficiência” do teste não muda muita coisa, i.e., os resultados finais nos dois algoritmos vão depender da mesma forma dessa “eficiência”, supondo “eficiência” como a prob. de acerto. Agora, se esta prob. é diferente nos casos positivos e negativos, a situação fica mais complicada, teria que pensar mais a respeito.

Este tipo de análise é empregada por laboratórios em testes de HIV.

Ótimo, obrigado! :+1:

Boa noite,

Eu escrevi um outro pacote em R para importar os dados no endereço https://github.com/Freguglia/datacovidbr. Tem menos dependências do que o coronabr e é mais simples porque o objetivo é apenas importar os dados, sem as funcionalidades de gerar gráficos, etc. Tem algumas diferenças no pré-processamento também.

Não consigo contribuir com a modelagem, mas deixo a alternativa disponível e posso adicionar mais conteúdo que possa ajudar conforme for necessário, tanto de novas fontes como pré-processamento.

Oi Victor, estamos olhando seu código e ele está muito interessante. Desde o início da epidemia estamos fazendo uma curadoria de diferentes fontes dos dados e atualizando diariamente. Um dos nossos objetivos iniciais era avaliar a qualidade da reportagem dos dados. Os dados podem ser encontrados aqui: https://github.com/pdpcosta/COVID-19_Brazil
Fiquei curiosa que você está conseguindo fazer o download de planilhas CSV direto do Ministério da Saúde, é isso mesmo? Como você descobriu o caminho? Não conseguimos encontrar com facilidade.

@asaa, fui levantar umas métricas dos testes rápidos que tanto se fala (que são de IgG/IgM)… a taxa de falso negativo pode chegar a 75%; já as de falso positivo, 15%. Talvez, no RT-PCR seja possível.

@VictorFreguglia, excelente! Vou dar uma olhada no seu pacote: a redução de dependência é bem importante nessa fase.

Os dados estão no FioGripe: http://info.gripe.fiocruz.br/

1 curtida

Pessoal, só indicando mais uma base de dados: https://covid19graficos.github.io/relatorio/

É nosso ex-aluno e está postando diariamente no Grupo da Unicamp no Facebook. Já chamei ele para contribuir por aqui tb.

@pdpcosta É isso mesmo! Eu precisei monitorar o tráfego de rede pra ver quais endereços eram acessados quando o usuário clica no botão de Download. Aí deu pra descobrir que, pelo menos no momento, os dados ficam no endereço https://covid.saude.gov.br/assets/files/COVID19_{dt}.csv, onde {dt} é a data no formato, por exemplo 20200402 para o dia de ontem.

Eu ainda não consegui estimar em qual horário eles inserem os dados pro novo dia ou se isso é automático, então pelo menos nas primeiras horas do dia pode ser que ainda não tenha o arquivo do dia anterior.

@Benilton_Carvalho muito obrigada. Eu vou dar uma olhada nos dados este final de semana

Fantástico @VictorFreguglia, acabei de testar e realmente funciona. Observamos que os dados do MS estão defasados de um dia de algumas secretarias estaduais, mas ainda sim é ótimo ter acesso aos dados oficiais novamente. Só queria entender porque eles não disponibilizam isso abertamente como estavam fazendo até 18/03.Vamos conversando sobre maneiras de interagir ou quem sabe unirmos os esforços.

Olá @christian.perone estamos atrás destes dados também. Um aluno conseguiu os dados epidemiológicos em PDF e estamos trabalhando na tabulação. Assim que terminarmos, estará disponível aqui: https://github.com/pdpcosta/COVID-19_Brazil

1 curtida

Valeu, @VictorFreguglia! Mudei a dependência do repositório!

@VictorFreguglia será que você consegue repetir o processo para descobrir o caminho do Portal G1? Acabei de ver que o Ministério da Saúde agora tem o botão de Download do CSV na própria página também. Mas este portal do G1 aparentemente tem o dado compilado dos municípios. https://especiais.g1.globo.com/bemestar/coronavirus/mapa-coronavirus/?_ga=2.146359859.608239959.1585989548-08bd7eae-26af-6bf1-7295-16bf5e0c57df#/

@pdpcosta Os dados são compilados por município, mas não coincidem com os do portal Brasil.io. Os links são esse para os dados do Brasil e esse para os dados mundiais. Estão em JSON, mas se precisar de ajuda pra importar esse formato no R, é só abrir uma issue no seu repositório que já deixei com Watch e ajudo por lá :slight_smile:

Oi @VictorFreguglia, obrigada pela pronta resposta. Vou dar uma olhada. Qual é a sua leitura sobre a qualidade dos dados do Brasil.io?
Abraço e bom início de semana!

Para quem tiver interesse, estou atualizando análises neste website, atualizei o forecast de óbitos utilizando os dados liberados hoje (Apr 7).

Olá pessoal sou mestre em ciência de dados e atuo na área, tenho experiência em mineração de dados não estruturados e análise e modelagem de redes complexas. Estou à disposição no que precisarem. Como sugestão para o pessoal que deseja modelar a epidemia em forma de rede, tentem testar outras estruturas de redes. Acredito que essa curva de contágio em forma de distribuição normal não reflete muito a realidade dessas doenças. Vou compartilhar abaixo um gráfico de uma simulação que fiz em uma disciplina relacionada com diferentes tipos de redes.

Abraços

Caros, escrevi um código simples em Python que faz algumas análises no contexto de um modelo SIR simples a partir dos dados divulgados pelo Ministério da Saúde. Já vem rodando há algumas semanas, aparentemente sem bugs. Os “relatórios”, assim como todas as informações pertinentes estão aqui:
http://vigo.ime.unicamp.br/COVID/

1 curtida