O Nextstrain é um projeto open-source destinado ao monitoramento de patógenos por meio de dados genômicos. Sua plataforma possui um banco de dados de genomas virais, um pipeline de bioinformática para análise filodinâmica e uma ferramenta para visualização interativa.
Juntos, eles apresentam uma visão em tempo real da evolução e disseminação de uma variedade de patógenos virais de grande importância para a saúde pública. Assim, o site Nextstrain tem o objetivo de ajudar em estudos epidemiológicos e respostas a surtos, o site possui um repositório atualizado de dados públicos e ferramentas analíticas.
Ferramentas
Uma das características do Nextstrain é a disponibilização de um conjunto de ferramentas para análises de bioinformática e visualização de dados. Ele possui dois módulos: "Augur" e "Auspice".
O módulo Augur consiste em uma série de ferramentas de bioinformática modulares unix-like. Já o Auspice é um programa usado para visualização web, como também, apresentar e interagir com dados filogenéticos e filogeográficos.
O uso do módulo Augur permite a criação de “receitas” para diferentes tipos de patógenos e análises, bem como o uso de ferramentas ou scripts externos para o enriquecimento de funcionalidade.
A documentação completa pode ser obtida em Nextstrain: analysis and visualization of pathogen sequence data. Os tutoriais também estão disponíveis na plataforma.
Arquitetura
A arquitetura do conjunto de ferramentas disponibilizadas pelo Nextstrain permitem:
- Executar e analisar sequências - incluindo subamostragem, alinhamento, inferência em árvore, etc. Isso é possível pela execução de uma série de comandos disponíveis no módulo Augur em etapas distintas.
- Substituição de módulos ou séries de módulos por outras ferramentas de análise (por exemplo, BEAST).
- Interpretação dos dados independente da análise usada no módulo Auspice.
- Compartilhamento dos resultados apresentados no site com colaboradores ou outros cientistas por meio do nextstrain.org.
Relatório sobre o vírus SARS-CoV-2
O Nextstrain disponibiliza relatórios semanais das análises genômicas atualizadas sobre o SARS-CoV-2. No último foi possível analisar o movimento e as formas de contaminação do vírus em todos os continentes. No total, o banco de dados do Nextstrain possui sequências isoladas de quarenta e oito países em seis continentes.
É possível observar que há uma escassez de dados de referentes a países localizados no hemisfério sul. Quando voltamos nossas observações para a América do Sul, ainda não existe um padrão de transmissão claro para que possamos extrair conclusões sobre esse tema.
Caso você tenha interesse em explorar os dados usados pelo Nextstrain, acesse o link: Genomic epidemiology of novel coronavirus.
Referência
James Hadfield, Colin Megill, Sidney M Bell, John Huddleston, Barney Potter, Charlton Callender, Pavel Sagulenko, Trevor Bedford, Richard A Neher, Nextstrain: real-time tracking of pathogen evolution, Bioinformatics, Volume 34, Issue 23, 01 December 2018, Pages 4121–4123, https://doi.org/10.1093/bioinformatics/bty407