Informazione

Trasmissibilità della variante virale: dati empirici o forma della proteina spike?

Trasmissibilità della variante virale: dati empirici o forma della proteina spike?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Beh, prima non sono nel campo della biologia o delle scienze mediche. Da questi giorni stiamo aspettando che gli scienziati ci dicano se la variante indiana di SARS Cov 2 è più trasmissibile del virus originale, quindi mi vengono in mente queste due domande:

  1. Gli scienziati confermano l'aumento della trasmissibilità sulla base di dati empirici?
  2. Gli scienziati possono sapere quanto sia trasmissibile la variante in base a quanto bene la proteina spike si lega ai recettori della cellula, ad esempio effettuando una simulazione della forma piegata 3D della punta basata sul suo codice nel genoma?

Generalmente basato su (1). Per citare il sito web:

Le varianti che destano maggiore preoccupazione possono:

  • diffondersi più rapidamente,
  • eludere l'immunità naturale o correlata al vaccino,
  • causare malattie più gravi,
  • eludere il rilevamento dai test disponibili, o
  • rispondono meno al trattamento.

Se guardi le caratteristiche che dicono di cercare nelle varianti, quella che menzionano per prima è "diffondere più rapidamente" - l'unico modo per dirlo è guardare la genetica e la frequenza con cui la variante si presenta in relazione a un punto temporale precedente. Il punto 2 può essere visto solo con i test: le persone che hanno avuto un'infezione vengono infettate di nuovo? Punto elenco 3 - guarda la gravità della malattia nei pazienti.

Sono sicuro che ormai avrai capito la direzione; la sorveglianza è la risposta: tutti i dati empirici.

(2) può o non può aiutare, tutto ciò che fa è dirti la potenziale affinità per un recettore, che è solo una parte della trasmissibilità. In effetti, in genere è necessario attendere l'emergere di una variante (non ha senso inseguire ciascuna di esse; ogni infezione avrà una qualche forma di variante in alcuni dei virioni prodotti - esistono come quasispecie), prima che avvenga la modellazione. Inoltre, la modellazione è in realtà un metodo piuttosto scarso per capire se il virus si legherà a un recettore. Dai un'occhiata a questo documento e vedi che molti della famiglia Mustelid hanno una scarsa rilegatura per modellazione, ma in realtà vengono infettati facilmente da SARS-CoV-2.

Molti altri fattori entrano nella trasmissione virale, come il titolo virale nel paziente, il numero di particelle virali rilasciate in ogni goccia/aerosol, la sopravvivenza delle particelle nell'aria/goccia/aerosol ecc.

Ecco un bel documento del PNAS che copre le caratteristiche biologiche della trasmissibilità sulla base di un'analisi statistica/modellistica. Sebbene questo non riguardi specificamente SARS-CoV-2, copre una serie di funzionalità che vengono esaminate per una maggiore trasmissione dei virus in generale.


Trasmissibilità della variante virale: dati empirici o forma della proteina spike? - Biologia

Dopo mesi di trasmissione da uomo a uomo sono emersi lignaggi divergenti di SARS-CoV-2.

La nomenclatura è dibattuta, ma i nomi del lignaggio PANGO sono: B.1.1.7, B.1.351 e P.1.

Questi lignaggi mostrano una serie di cambiamenti di aminoacidi, specialmente nella proteina S.

B.1.1.7, B.1.351 e P.1 possono essere più trasmissibili, il loro effetto sulla gravità della malattia è incerto.

Alcune mutazioni in B.1.351 e P.1 possono influenzare il legame dell'anticorpo o l'efficienza del vaccino.


Introduzione

Il 31 dicembre 2019, l'Ufficio nazionale cinese dell'Organizzazione mondiale della sanità (OMS) è stato informato di casi di polmonite ad eziologia sconosciuta rilevati nella città di Wuhan, provincia di Hubei1,2. Entro l'11 e il 12 gennaio 2020, le autorità cinesi hanno identificato un nuovo RNA con involucro a singolo filamento e senso positivo Betacoronavirus, con genoma di 30.000 nucleotidi di lunghezza, appartenente al Coronaviridae famiglia, correlata al coronavirus della sindrome respiratoria acuta grave (SARS-CoV) che ha causato un'epidemia globale nel 2002-2004 3 . Inizialmente chiamato nCoV-2019 (nuovo Coronavirus 2019), il virus è probabilmente emerso da diversi eventi di ricombinazione in pipistrelli e pangolini 4 , ed è stato successivamente introdotto nella popolazione umana attraverso trasmissioni zoonotiche 1,5 è stato successivamente ribattezzato SARS-CoV-2 e riconosciuto come agente eziologico della malattia da coronavirus 2019 (COVID-19) 6 . Indagini epidemiologiche e analisi filogenetiche hanno prontamente confermato la trasmissione da uomo a uomo di SARS-CoV-2 per via aerea 3,7. A seguito della sua diffusione mondiale, l'OMS ha dichiarato l'epidemia un'emergenza di sanità pubblica di interesse internazionale il 30 gennaio 2020 e una pandemia l'11 marzo 2020. A partire dal 16 dicembre 2020, la SARS-CoV-2 si è diffusa. in 216 paesi con quasi 74 milioni di casi confermati e oltre 1,6 milioni di decessi 8 .


Risultati e discussione

Panoramica epidemiologica dell'epidemia italiana di SARS-CoV-2

L'Italia è stato uno dei primi e più colpiti Paesi al mondo. Al 31 ottobre 2020, il Ministero della Salute italiano e il Dipartimento della Protezione Civile hanno segnalato 1,38 milioni di casi totali di SARS-CoV-2 e 49.261 decessi 9 . I primi casi importati confermati risalgono al 30 gennaio 2020 quando due turisti di Wuhan, in Cina, sono risultati positivi al SARS-CoV-2 a Roma (Fig.  1a ). Il 17 febbraio 2020, il governo italiano ha confermato il primo caso acquisito localmente in una piccola città del Nord Italia (Codogno, regione Lombardia) 10 . Tre giorni dopo, nella città di Padova, è stata segnalata la prima morte correlata al COVID-19 in Italia, un maschio di 78 anni. Poiché l'epidemia si è rapidamente diffusa in tutto il Paese, rendendo l'Italia uno dei principali hotspot SARS-CoV-2 11, il governo italiano ha dichiarato un'emergenza sanitaria pubblica di importanza nazionale, consentendo l'introduzione di misure restrittive per limitare i nuovi contagi 12. Nel tentativo di appiattire la curva epidemica, le misure di blocco della Fase I sono state introdotte per la prima volta il 7 marzo 2020 in 11 comuni del Nord Italia, dove si era verificata la maggior parte dei casi, ed estese entro l'11 marzo a tutto il Paese (Fig. .  1a ). Descritto come il più grande blocco nella storia dell'Europa 13 , la mobilità dei cittadini è stata limitata, tranne che per motivi di lavoro o di salute ben fondati. All'aperto era sempre richiesto un mandato di maschera universale. Sono state inoltre sospese a livello nazionale le scuole, le attività universitarie, gli eventi pubblici/culturali e le competizioni sportive, nonché le attività commerciali non essenziali. Le frontiere con altri stati sono state chiuse e all'interno del paese il trasporto pubblico è stato limitato o interrotto.

un Cronologia degli eventi chiave a seguito dei primi casi confermati di infezione da SARS-CoV-2 in Italia. B Curva epidemica che mostra la progressione dei numeri giornalieri di infezioni virali segnalati in Italia dall'inizio dell'epidemia a marzo (nero) e i cambiamenti Rif stime nello stesso periodo (verde), con fasi di lockdown indicate in basso. C Mappa dei casi cumulativi di SARS-CoV-2 per 100.000 abitanti in Italia fino a ottobre 2020.

Con la diminuzione del numero di contagi virali giornalieri, le misure di sanità pubblica sono state progressivamente allentate attraverso una Fase II (4 maggio), che ha consentito le visite ai familiari che vivono nella stessa regione e il riavvio di alcune attività commerciali, e una Fase III (15 giugno ), che ha consentito la riapertura delle attività commerciali e la ripresa dei viaggi all'interno del paese, ma ha lasciato in vigore mandati di mascheramento e divieti di riunioni su larga scala. Un significativo rallentamento del numero di infezioni dall'inizio di maggio 2020 (Fig.  1b ) ha convalidato l'efficacia delle restrizioni di Fase I.

Dopo un periodo di recessione epidemica apparentemente stabile, con pochissimi nuovi casi rilevati tra giugno e agosto, una nuova ondata epidemica ha colpito il paese, determinando un'incidenza maggiore rispetto a prima. Sovrapposizione della curva epidemica segnalata e stime dinamiche del numero effettivo di riproduzione, Rif, durante i tre periodi principali (prima ondata, recesso, seconda ondata) dell'epidemia italiana, ha rivelato un andamento interessante (Fig.  1b ). Rif fornisce una misura del numero medio di infezioni secondarie causate da una singola persona infetta: un'epidemia in crescita è tipicamente caratterizzata da Rif >𠂑, mentre Rif <𠂑 indica nessuna crescita. Come previsto, Rif i valori sono stati stimati essere Ϣ all'inizio della diffusione esponenziale di SARS-CoV-2 in Italia e sono rapidamente scesi a valori ρ dopo l'inizio delle misure di blocco della Fase I. Eppure, tra la fine di giugno e la fine di agosto, attraverso i blocchi di Fase II e III, Rif i valori hanno mostrato un comportamento oscillante, con picchi progressivamente più elevati (ϡ), nonostante il numero costantemente basso di nuove infezioni rilevate. Con l'aumento dei contagi e dei ricoveri a settembre, Rif temporaneamente diminuito vicino a 1, per aumentare nuovamente entro la metà di ottobre, poco prima dell'inizio della nuova crescita esponenziale dei casi infetti, attualmente in corso. Infatti, entro il 31 ottobre, tutte le regioni italiane, seppur con tassi diversi, sono state colpite dall'epidemia (Fig.  1c ). Il rapido aumento dei pazienti COVID-19 che richiedono il ricovero durante i primi mesi del 2020, nonché Rif oscillazioni durante il periodo di recessione epidemica, suggeriscono che il virus stava circolando in modo criptico tra i cluster di trasmissione non rilevati. Durante questo periodo, c'erano probabilmente migliaia di infezioni lievi o asintomatiche tra serbatoi non rilevati (nascosti) che precedevano ogni fase di crescita esponenziale di ogni ondata epidemica 14,15. In effetti, in molti altri paesi europei (ad esempio, Regno Unito, Francia e Germania, tra gli altri, è stata osservata una drammatica ripresa nei casi dopo aver allentato rigorosi interventi di salute pubblica (ad esempio, ordini di casa) che hanno temporaneamente ridotto la diffusione dell'epidemia.

Ricostruzione filogenetica dell'epidemia italiana di SARS-CoV-2

Per approfondire, abbiamo accoppiato i dati epidemiologici con l'analisi filodinamica di 714 sequenze virali attualmente disponibili da pazienti italiani, campionate tra il 30 gennaio e il 1 ottobre 2020 (vedi Metodi). La dinamica della popolazione virale è stata valutata utilizzando stime coalescenti non parametriche della dimensione effettiva della popolazione (no) nel tempo (una misura della diversità virale che rappresenta il numero di diversi genomi che contribuiscono alla generazione successiva), data una raccolta di storie evolutive plausibili di massima verosimiglianza (ML) dedotte dai dati di sequenza virale. Sebbene modelli distinti potrebbero essere osservati in no stime, tutte le ricostruzioni concordano su un aumento di no fino alla fine di marzo 2020, in linea con l'aumento del numero di casi segnalati (Figura supplementareਁ). Il modello best-fit (cioè, la raccolta di alberi con la più alta probabilità, log l > �,120) descrive anche un declino costante e no fino a ottobre (Fig. supplementareਁ, modello A), che potrebbe riflettere l'impatto delle misure di blocco sulla popolazione virale. Come no è correlato alla diversità genetica virale, questo modello può indicare che, nonostante il rapido aumento dei casi alla fine dell'estate, la popolazione virale ha mantenuto una diversità inferiore rispetto ai primi mesi dell'epidemia. Ciò è coerente con una riduzione delle importazioni virali, probabilmente derivante da interventi di salute pubblica globale come i divieti di viaggio. Due modelli alternativi dedotti da alberi simili nel valore di verosimiglianza al modello best-fit, mostrano una tendenza al ribasso simile seguita da un pronunciato aumento di no tra settembre e ottobre (schema B), o un aumento più lento ma costante di no tra aprile e ottobre (schema C). Entrambe le ricostruzioni sono in accordo con un aumento del virus no, corrispondente a un aumento esponenziale delle infezioni da SARS-CoV-2 durante la seconda ondata epidemica. Insieme, con le oscillazioni dedotte di Rif valori successivi alla prima ondata epidemica, le analisi suggeriscono la persistenza di complesse dinamiche di trasmissione durante il periodo di recessione epidemica, coinvolgendo individui asintomatici o lievemente colpiti non rilevati. Anche considerando il no valori dedotti da alberi ML con minore verosimiglianza, si arriva ad una conclusione analoga—riduzione complessiva di no dopo aprile, ma ripetute fluttuazioni durante la recessione e la seconda ondata epidemica (Figura supplementareਁ, curve nere).

Il confronto longitudinale dei modelli di diffusione di SARS-CoV-2 nel tempo tra le diverse regioni italiane mostra che la fase pre-lockdown è stata caratterizzata da una crescita esponenziale del numero di casi e decessi COVID-19 confermati giornalmente, con la più alta incidenza nel Nordovest, seguita da una significativa diminuzione in tutte le regioni a seguito delle misure di blocco (Figura supplementareਂ). Entro la fine di agosto 2020, i dati epidemiologici mostrano anche una trasmissione aumentata e sostenuta nelle regioni meridionali e insulari, probabilmente guidata dalla diffusione interregionale attraverso piccoli cluster familiari/sociali. Queste regioni sono la principale destinazione turistica per gli italiani e la maggior parte delle restrizioni ai viaggi internazionali erano ancora in vigore durante la Fase III 16 . La proporzione dei lignaggi e la distribuzione specifica per regione in diverse parti del paese sono indicative di diversi eventi fondatori indipendenti (Fig.  2b). Ad esempio, la linea A, predominante in Sicilia, è stata rilevata in catene di trasmissione epidemiologicamente collegate che sembrano essere correlate a immigrati arrivati ​​dal Nord Africa durante la tarda Fase III 17 . È interessante notare che il numero di lignaggi circolanti è cambiato nel tempo (Figura complementareਃ). Il ceppo sub B.2 è stato il primo identificato a gennaio, segnando l'introduzione primaria di casi importati dalla Cina (mostrato in Fig.  2 ). Tra febbraio e aprile, ulteriori sottolignaggi, come.

un Frequenza dei ceppi e sub ceppi di SARS-CoV-2 nelle macroregioni italiane. B Distribuzione del ceppo e del ceppo più diffuso in tutto il paese.

B.1, B.1.1 e B.1.5 sono emersi nell'Italia settentrionale e centrale, epicentro della prima ondata epidemica, riflettendo probabilmente le successive importazioni 18 . All'inizio del blocco di Fase II a maggio, che ha seguito una drammatica diminuzione dei casi, solo B.1. e B.1.1 sono stati rilevati i sub-lignaggi. Durante il periodo di recessione epidemica tra giugno e luglio, più sottolinee hanno nuovamente co-circolato. Tuttavia, la successiva seconda ondata è stata dominata da B.1.1 (settembre) e B.1. (Ottobre) (Supplemento Fig.ਃ). Poiché le misure di Fase II e III hanno consentito rispettivamente i viaggi intra e poi interregionali, mentre i confini nazionali sono rimasti per lo più chiusi (tranne che con i paesi europei che fanno parte dell'accordo di Shengen), è plausibile che nella prima ondata epidemica sia risultata eterogeneità dagli eventi iniziali dei fondatori associati ai viaggi internazionali e poi propagati attraverso la mobilità all'interno dello stato durante la recessione epidemica. Tali inferenze basate sulla sequenza, tuttavia, dovrebbero essere interpretate con cautela a causa del bias di campionamento intrinseco nei genomi a lunghezza intera SARS-CoV-2 attualmente disponibili da pazienti italiani, che potrebbe influenzare i risultati e limitare la loro generalizzabilità 18 .

Nel nostro set di dati di sequenza, solo la Lombardia (Nordovest, regione più colpita finora), ha fornito un numero robusto di genomi virali (n =�), che a sua volta corrisponde approssimativamente a un genoma disponibile ogni 450 casi positivi. L'Abruzzo nel Centro Italia è la seconda regione più rappresentata in termini di genomi disponibili (n =�), mentre molte altre regioni, tra cui Liguria (Nordovest), Umbria (Centro) e Calabria (Sud) non sono rappresentate in modo esaustivo (Fig.  3a ), influenzando così la nostra capacità di caratterizzare in -approfondita epidemiologia molecolare SARS-CoV-2 a livello regionale.

un Mappa dell'Italia che mostra il numero di sequenze del genoma SARS-CoV-2 per regione. La dimensione dei cerchi indica il numero di nuovi genomi disponibili dall'inizio dell'epidemia in Italia. B Albero di massima verosimiglianza risolta nel tempo di 1421 sequenze SARS-CoV-2 di cui 714 dall'Italia (cerchi rossi). C Diagramma di corda dei numeri stimati dei flussi migratori tra le aree geografiche. D Frequenza delle origini geografiche stimate per i cluster di trasmissione identificati che coinvolgono l'Italia e hanno origine nei mesi da gennaio a ottobre del 2020. e Frequenza delle sequenze italiane (campionate da gennaio a ottobre) classificate come non cluster (grigio) o appartenenti a cluster di origine italiana (bianco) o non italiane (nero).

Tuttavia, i modelli evolutivi del virus dedotti dalla filogenesi sono utili per corroborare i dati epidemiologici, testare ipotesi riguardanti i fattori che guidano le dinamiche epidemiche e valutare interventi di salute pubblica come gli ordini di soggiorno a casa. A tal fine, abbiamo scalato nel tempo i migliori alberi da 100 ML di tutti i genomi completi SARS-CoV-2 disponibili da pazienti italiani e dedotto la posizione più probabile di ciascun nodo interno (sequenza ancestrale) negli alberi (vedi Metodi per i dettagli ). Le topologie complessive degli alberi dedotti erano molto simili e la regressione lineare delle distanze genetiche dalla radice alla punta rispetto alle date di campionamento indicava un segnale temporale sufficiente nei dati di sequenza (Figura complementare਄). Sebbene il tasso evolutivo di SARS-CoV-2 in Italia sia stato leggermente inferiore (1.44 ×𠤐 � sostituzioni nucleotidiche/sito/anno) rispetto ai valori ottenuti per l'epidemia mondiale 19,20 , il più recente antenato comune (TMRCA ) delle sequenze italiane disponibili, comprese tra il 2 gennaio e il 26 gennaio (media 14 gennaio) 2020, coerentemente con la data del primo caso confermato (30 gennaio). Allo stesso modo, il nodo radice (origine) di un albero ML su scala temporale che include sia l'italiano (n =�) e sequenze di riferimento mondiali (n =�) è stato collocato in Cina (99,8% di probabilità), con un TMRCA risalente all'inizio di dicembre 2019, in accordo con i dati epidemiologici disponibili 21,22, convalidando ulteriormente la nostra inferenza sulla filogenesi. L'albero (Fig.  3b ) mostra coerentemente la maggior parte delle sequenze italiane intervallate da ceppi virali raccolti in altri paesi. Questo modello, come quello osservato altrove 23 , conferma che l'emergere di ceppi di SARS-CoV-2 durante la prima ondata epidemica è stato principalmente favorito dall'esposizione ai viaggi durante la fase pre-blocco, piuttosto che dalla diffusione interregionale. Secondo la stima dei flussi migratori, abbiamo ulteriormente esaminato il potenziale ruolo italiano come esportatore di SARS-CoV-2.Il numero di transizioni di stato da e verso l'Italia (Fig.  3c ) dipende fortemente dal numero e dalla natura delle sequenze incluse da altre località. Indipendentemente dal dataset, e in linea con le informazioni epidemiologiche, la maggior parte delle fonti geografiche delle introduzioni sono attribuite all'Europa (Fig.  3c ). Sono stati identificati cluster di trasmissione putativi ben supportati (valori bootstrap 㺐%) all'interno della filogenesi sulla base di una soglia di distanza genetica predefinita in grado di rilevare sequenze epidemiologicamente collegate (vedi Metodi). I cluster contenenti almeno una sequenza italiana sono stati considerati di interesse per la stima delle origini temporali e spaziali della trasmissione. Le origini temporali di ciascun cluster sono state derivate dall'età stimata dall'orologio dell'MRCA di tutte le sequenze appartenenti al cluster. Le origini spaziali sono state dedotte utilizzando la ricostruzione dello stato ancestrale della probabilità congiunta, dato il paese noto di campionamento dei nodi punta (sequenze campionate) all'interno dell'albero. Come previsto, il numero di cluster (ben supportati) formati nel corso dell'epidemia è stato ampiamente influenzato dal numero di campioni contemporanei (Fig.  3d), limitando le conclusioni sulla velocità di formazione dei cluster nel tempo. Le origini geografiche stimate di ciascun cluster riflettevano la distribuzione dei campioni tra le sequenze di riferimento, in gran parte limitate all'Europa e al Nord America. Tuttavia, dopo aprile, i cluster di trasmissione potevano essere ricondotti solo all'Italia, suggerendo una trasmissione altamente localizzata a seguito dell'attuazione delle misure di blocco della Fase I. Ogni sequenza italiana è stata quindi classificata come non cluster (cioè nessun cluster con nessun'altra sequenza con bootstrap 㺐%), o appartenente a un cluster locale (tutto italiano). Le sequenze italiane all'interno di cluster ben supportati che includevano e provenivano da ceppi non italiani sono state classificate come appartenenti a cluster “outside”. Infine, ogni cluster ben supportato per il quale un singolo paese non poteva essere assegnato con una probabilità del 㺐% come quello all'origine di quel cluster, è stato anche considerato un cluster esterno (sebbene sconosciuto nell'origine). Ciò ha rivelato modelli distinti tra gennaio, febbraio–luglio e agosto (Fig.  3e ). Tutte le sequenze italiane ottenute a gennaio appartenevano a cluster di origine straniera, dimostrando l'influenza delle introduzioni esterne prima che venissero messi in atto i lockdown. La frazione predominante è stata rapidamente sostituita da sequenze appartenenti a cluster di origine locale e sequenze non cluster, il che suggerisce un potenziale sottocampionamento. Il mese di settembre, quando la seconda ondata epidemica era in aumento, dominavano largamente le sequenze di origine locale, senza sequenze di origine straniera. La frazione di sequenze campionate in agosto (75%) era al di fuori dell'intervallo di confidenza del 95% (

50%) per la frazione nei mesi rimanenti, sottolineando il significativo contributo della trasmissione locale sulle sequenze campionate a settembre. Tuttavia, il profilo mutazionale specifico delle sequenze italiane (Fig.  4a ), relativo al riferimento Wuhan ( <"type":"entrez-nucleotide","attrs":<"text":"NC_045512"," term_id":"1798174254","term_text":"NC_045512">> NC_045512), ha anche fornito alcune prove di ceppi importati di recente durante il blocco di Fase III, quando i divieti di viaggio iniziarono ad essere allentati. In particolare, il 97,34% (n =�) delle sequenze disponibili portavano la mutazione che codifica per il cambiamento di aminoacidi D614G (coordinata genomica: 23403UN > G) nella proteina Spike di SARS-CoV-2, mentre il restante 2,66% (n =�) hanno mostrato la sequenza nucleotidica che codifica per il wild type D614. La mutazione D614G è stata associata a una maggiore infettività e trasmissibilità senza effetti sugli esiti della gravità della malattia 24� , sebbene alcuni di questi risultati siano stati recentemente messi in discussione 27 . La frequenza del polimorfismo D614G tra le regioni italiane nel tempo (Fig.  4b ) mostra che G614 è diventato rapidamente dominante durante la prima ondata epidemica, ed è rimasto l'unico rilevato nelle sequenze disponibili durante le prime due fasi di lockdown. Successivamente, le varianti D614 sono riemerse a seguito dell'allentamento delle misure di Fase III in Sicilia (Italia insulare), probabilmente a causa delle catene di trasmissione epidemiologicamente legate al flusso migratorio dal Nord Africa 17 , uno scenario rafforzato dalla linea A di SARS-CoV-2 prevalenza in quella regione (Fig.  2b ).

un Mappe varianti delle mutazioni più comuni mappate contro i genomi SARS-CoV-2. Mutazioni più comuni definite come mutazioni presenti in 㺐% dei genomi in quel gruppo (linee nere). Be Variazione della frequenza della mutazione D614G nella proteina Spike nelle regioni italiane durante le fasi epidemiche. Le regioni italiane sono colorate in base alla mutazione dominante D614G. Il colore bianco rappresenta i dati genomici mancanti di diverse regioni italiane durante le fasi epidemiche.

Simulazione del modello stocastico ad agenti dell'epidemia italiana

I risultati dell'analisi dei cluster indicano trasmissioni locali mantenute promosse da catene di trasmissione relativamente piccole durante i mesi di segnalazioni di casi bassi e fino all'inizio della seconda ondata. Questa osservazione suggerisce che la ripresa dell'epidemia è stata associata a un allentamento delle misure di blocco che ha portato a un aumento della trasmissione locale, piuttosto che a un gran numero di reintroduzioni di virus nel paese. Tale scenario è supportato anche da indagini che mostrano una significativa riduzione del numero di turisti stranieri (circa �,9%), ma un aumento, seppur contenuto (1,1%), del turismo interno durante la stagione estiva dopo le restrizioni sui i viaggi sono stati rilassati 16 . Per esplorare se l'aumento della mobilità potrebbe spiegare la seconda ondata di casi in Italia, abbiamo effettuato simulazioni epidemiche stocastiche basate su agenti. I dati sulla mobilità su tre diverse modalità di trasporto (a piedi, pubblico e veicolo personale), derivati ​​dai rapporti sulle tendenze di Apple Mobility, sono stati utilizzati come proxy per il numero di individui con cui un individuo infetto entra in contatto, che è stato consentito di variare nel corso tempo (vedi Metodi). Poiché anche il numero di ricoveri è diminuito drasticamente (e è rimasto basso) in seguito al primo aumento dei casi, è stato testato anche il ruolo dell'allontanamento degli individui infetti dalla popolazione tramite il ricovero, consentendo di rendere proporzionale la probabilità che un individuo infetto esca dalla simulazione ai tassi di ospedalizzazione standardizzati (anche variabili nel tempo). Il numero simulato di infezioni attive nel tempo utilizzando i soli dati di mobilità, i soli dati di ospedalizzazione e combinati sono stati quindi confrontati con i dati empirici dei casi. Mentre tutti e tre i modelli hanno prodotto un tasso simile di nuove infezioni durante la prima ondata epidemica (Figura complementareਅ), il tasso di rimozione variabile nel tempo basato sui tassi di ospedalizzazione (senza dati sulla mobilità) ha prodotto una continua crescita esponenziale delle infezioni (Fig.   5a ). Come nei dati empirici, il numero variabile di contatti basato sulla mobilità ha prodotto due onde distinte, che erano le più simili alla curva epidemica (Fig.  5b). Il modello che incorporava sia i tassi di mobilità che di ospedalizzazione ha prodotto una prima ondata di entità troppo grande e una seconda ondata di origine troppo precoce rispetto al modello precedente (Fig.  5c). Il modello che incorpora i soli dati di mobilità ha prodotto l'errore assoluto medio più basso (Fig.  5d ), producendo una prima ondata di tempi e magnitudo simili e una seconda ondata ritardata, più vicina ai dati epidemiologici empirici (Fig.  1b ).

un La probabilità di rimozione di un individuo infetto era proporzionale al tasso empirico di ospedalizzazione nella simulazione dei casi infetti attivi nell'arco di un anno (blu). B Il numero di individui con cui un individuo infetto entra in contatto è stato proporzionale al numero empiricamente determinato di individui che utilizzano la deambulazione, nonché i mezzi di trasporto pubblici e personali, come mezzo primario di mobilità nella simulazione di casi infetti attivi nell'arco di un anno ( blu). C I tassi di ospedalizzazione (come in A) e i dati sulla mobilità (come in B) sono stati combinati nella simulazione dei casi infetti attivi nell'arco di un anno (blu). In unC, l'arancione rappresenta il numero di infezioni osservate empiricamente. D L'errore assoluto è stato calcolato per ogni punto temporale delle osservazioni raccolte tra le infezioni simulate utilizzando solo i tassi di ospedalizzazione (rosso), solo i dati di mobilità (blu) e la combinazione (viola). L'errore assoluto medio è stato calcolato come errore medio su 1000 simulazioni. La simulazione presupponeva un'unica introduzione esterna.

Sebbene i risultati indichino che i dati sulla mobilità potrebbero riprodurre modelli di ondate epidemiche in Italia, non possiamo escludere ulteriori fattori, che potrebbero aver giocato un ruolo nel ritardare la seconda ondata epidemica, non completamente catturati dalle nostre simulazioni, come il mantenimento delle misure di restrizione, diversi “types& #x0201d di mobilità tra prima e seconda ondata, o temperature più elevate in estate 28,29 .

Accoppiando l'analisi filodinamica dei dati genetici virali ed epidemiologici, mostriamo come l'interazione tra l'intervento di sanità pubblica e le mutevoli dinamiche di trasmissione di SARS-CoV-2 in Italia possa spiegare l'oscillazione tra tempi di recessione epidemica relativamente stabile e drammatiche risorgenze, come è attualmente essere osservato. Questo modello di “rubberbanding” o “snapping back” dopo la revoca delle restrizioni per la salute pubblica è stato, purtroppo, seguito da molti altri paesi europei. Nel complesso, mostriamo il ruolo critico svolto dai piccoli cluster di trasmissione, che agiscono come "serbatoi nascosti" durante la recessione epidemica a seguito di misure di blocco aggressive, nel mantenere la circolazione a basso livello di SARS-CoV-2 in Italia, che alla fine ha seminato una nuova ondata epidemica . Nonostante l'accordo coerente tra le diverse analisi dei dati basate sulla filogenesi virale e sull'epidemiologia, tuttavia, è necessario riconoscere i limiti del nostro lavoro. La disponibilità di un elevato numero di sequenze virali, raccolte in un arco di tempo esteso e sufficientemente rappresentative dell'epidemia in corso, è fondamentale per una tempestiva sorveglianza genomica, e per la valutazione e pianificazione di strategie di controllo efficaci ed opportune. Il numero di genomi completi italiani di SARS-CoV-2 attualmente depositati in banche dati pubbliche rappresenta una frazione molto piccola (0,05%) del numero documentato di casi confermati in Italia e il bias di campionamento tra regioni diversamente colpite dall'epidemia limita ulteriormente la generalizzabilità del risultati. Inoltre, la nostra definizione di cluster di trasmissione putativi (vedi Metodi) non richiede il campionamento e l'inclusione di tutti i ceppi coinvolti in una catena di trasmissione, sebbene consenta il rilevamento di cladi monofiletici che probabilmente comprendono sequenze collegate epidemiologicamente attraverso una catena di trasmissione, sebbene non direttamente. Tuttavia, le osservazioni epidemiologiche, corroborate da analisi filodinamiche basate sulle sequenze disponibili, hanno mostrato un quadro coerente. La prima ondata epidemica in Italia sembra essere stata in gran parte collegata a introduzioni esterne che hanno portato a grandi cluster di trasmissione, in concomitanza con un elevato numero di infezioni. La successiva implementazione di una strategia di blocco nazionale in tre fasi ha notevolmente mitigato il numero di infezioni e ricoveri durante l'estate 2020. Tuttavia, una volta aumentata la mobilità e diminuito il distanziamento sociale a causa del progressivo allentamento delle misure di blocco, è stato osservato un improvviso picco di casi infettivi, seguito prontamente da nuovi ricoveri. Il nostro modello matematico basato su agenti ricapitola questo fenomeno, supportando ulteriormente l'ipotesi che i piccoli cluster osservati durante l'estate agissero, essenzialmente, come "serbatoi nascosti" che probabilmente si sono fusi in seguito all'aumento della mobilità e alla riduzione delle misure di distanziamento sociale. Ciò a sua volta ha fornito la “spark” per l'improvviso aumento delle infezioni osservato alla fine dell'estate, che ha portato alla successiva seconda ondata di crescita esponenziale. In altre parole, i driver della dinamica di trasmissione di SARS-CoV-2 si sono spostati da alti livelli di trasmissione comunitaria, probabilmente coinvolgendo eventi di super diffusione di massa, all'inizio dell'epidemia italiana, al sostegno da parte di piccoli gruppi familiari/sociali più tardi nell'epidemia. Sfortunatamente, questo suggerisce anche che nessuna quantità di interventi a livello comunitario può essere sufficiente per frenare l'epidemia finché le persone non aderiscono a misure a livello individuale come l'uso della mascherina, l'igiene delle mani e il distanziamento sociale. È probabile che le nuove misure di lockdown forniscano solo un sollievo temporaneo, come è già avvenuto nei primi mesi dell'epidemia in Italia e in molti altri Paesi. In effetti, è attualmente in corso un importante dibattito sulla distribuzione dei vaccini, date le restrizioni finanziarie e logistiche che impongono una distribuzione a fasi molto lunga, basata su politiche di priorità. In questo contesto, i nostri risultati suggeriscono che i serbatoi di trasmissione nascosti potrebbero continuare a sostenere epidemie locali fino alla fine del 2021, poiché l'introduzione del vaccino richiederà probabilmente mesi prima di raggiungere la necessaria soglia di immunità di gregge. In definitiva, la nostra capacità di frenare con successo l'attuale pandemia può essere collegata alla nostra capacità di determinare il numero e la struttura di tali serbatoi all'interno del contesto sociale e comportamentale di luoghi specifici.


Il repository Zenodo https://doi.org/0.5281/zenodo.4593885 include il codice per riprodurre tutte le figure e i risultati presentati qui.

Chan, K. K., Tan, T. J. C., Narayanan, K. K. e Procko, E. Un recettore esca ingegnerizzato per SARS-CoV-2 si lega ampiamente alle varianti di sequenza della proteina S. Sci. avv. 7, eabf1738 (2021).

Starr, T.N. et al. La scansione mutazionale profonda del dominio di legame del recettore SARS-CoV-2 rivela vincoli sul ripiegamento e sul legame ACE2. Cellula 182, 1295–1310.e20 (2020).

Gu, H. et al. Adattamento di SARS-CoV-2 nei topi BALB/c per testare l'efficacia del vaccino. Scienza 369, 1603–1607 (2020).

Peacock, T. P., Goldhill, D. H., Zhou, J., Baillon, L. & Frise, R. Il sito di scissione della furina della proteina spike SARS-CoV-2 è un determinante chiave per la trasmissione a causa della replicazione potenziata nelle cellule delle vie aeree. Prestampa su https://doi.org/10.1101/2020.09.30.318311 (2020).

Bal, A. et al. Lo screening delle delezioni H69 e V70 nella proteina spike SARS-CoV-2 con un test di diagnosi RT-PCR rivela una bassa prevalenza a Lione, in Francia. Prestampa su https://doi.org/10.1101/2020.11.10.20228528 (2020).

Il consorzio COVID-19 Genomics UK (COG-UK). Una rete di sorveglianza genomica SARS-CoV-2 su scala nazionale integrata. Il microbio della lancetta 1, E99–E100 (2020).

Pybus, O. G. & Rambaut, A. Analisi evolutiva della dinamica delle malattie infettive virali. Naz. Rev. Geneti. 10, 540–550 (2009).

Volz, E. M., Koelle, K. & Bedford, T. Filodinamica virale. Calcolo PLoS. Biol. 9, e1002947 (2013).

Hodcroft, E.B. et al. Emersione e diffusione di una variante SARS-CoV-2 in Europa nell'estate del 2020. Prestampa su https://doi.org/10.1101/2020.10.25.20219063 (2020).

Bi, Q. et al. Epidemiologia e trasmissione di COVID-19 in 391 casi e 1286 dei loro stretti contatti a Shenzhen, in Cina: uno studio di coorte retrospettivo. Lancetta infetta. Dis. 20, 911–919 (2020).

Mishra, S. et al. Un modello COVID-19 per le autorità locali del Regno Unito. Prestampa su https://doi.org/10.1101/2020.11.24.20236661 (2020).

Kemp, S. et al. Emergenza ricorrente e trasmissione di una delezione di picco SARS-CoV-2 ΔH69/V70. Prestampa su https://doi.org/10.1101/2020.12.14.422555 (2020).

du Plessis, L. et al. Istituzione e dinamica del lignaggio dell'epidemia di SARS-CoV-2 nel Regno Unito. Scienza 371, 708–712 (2021).

REACT Study Investigators et al. Rinascita di SARS-CoV-2 in Inghilterra: rilevamento mediante sorveglianza dell'antigene di comunità. Prestampa su https://doi.org/10.1101/2020.09.11.20192492 (2020).

Riley, S. et al. REACT-1 round 9 interim report: trend al ribasso di SARS-CoV-2 in Inghilterra nel febbraio 2021 ma ancora ad alta prevalenza. Prestampa su https://doi.org/10.1101/2021.02.18.21251973 (2021).

Leung, K., Shum, M. H., Leung, G. M., Lam, T. T. & Wu, J. T. Valutazione precoce della trasmissibilità dei ceppi mutanti N501Y di SARS-CoV-2 nel Regno Unito, da ottobre a novembre 2020. Sorveglianza dell'euro. 26, 2002106 (2021).

Davies, N.G. et al. Trasmissibilità stimata e impatto del lignaggio SARS-CoV-2 B.1.1.7 in Inghilterra. Prestampa su https://doi.org/10.1101/2020.12.24.20248822 (2020).

Tegally, H. et al. Emersione di una variante SARS-CoV-2 preoccupante per le mutazioni nella glicoproteina spike. Natura https://doi.org/10.1038/s41586-021-03402-9 (2021).

Sabino, E. C. et al. Ricomparsa di COVID-19 a Manaus, in Brasile, nonostante l'elevata sieroprevalenza. Lancetta 397, 452–455 (2021).


L'infettività relativa della nuova variante britannica di SARS-CoV-2

L'apparente rapida crescita in Inghilterra di una nuova variante del virus SARS-CoV-2 che causa COVID-19 ha portato a terribili avvertimenti da parte di coloro che consigliano il governo del Regno Unito. I loro consigli suggerivano solo che la nuova variante fosse più trasmissibile (più infettiva), non che fosse più virulenta (causa malattie più gravi). Tuttavia, ha portato ad azioni rapide (molti direbbero di panico) prima da parte del governo del Regno Unito e poi da parte dei governi di molti altri paesi. Il governo del Regno Unito ha imposto ulteriori restrizioni alla libertà delle persone di mescolarsi e di spostarsi, mentre altri paesi hanno vietato i viaggiatori dal Regno Unito. Molti milioni di persone nel Regno Unito hanno dovuto cancellare i loro piani per le vacanze di Natale con un preavviso molto breve, oltre ad avere le loro libertà ulteriormente ridotte da allora in poi. In questo articolo esamino fino a che punto il consiglio che ha portato a queste azioni dannose del governo fosse giustificato.

Il nuovo ceppo, B.1.1.7, e la sua diffusione nel Regno Unito

L'agenzia governativa britannica Public Health England (PHE) chiamò la nuova variante VUI-202012/01, e ora VUC-202012/01, ma farò riferimento ad essa con il nome scientifico dato alla sua stirpe, B.1.1.7 (Rambaut et al.)[1], o semplicemente come “la nuova variante”. Il lignaggio coinvolge 8 cambiamenti di aminoacidi (6 mutazioni e 2 delezioni)[2] nel gene per l'importante proteina spike, insieme a 9 cambiamenti di aminoacidi[3] nei geni per altre proteine. Il lignaggio è stato talvolta indicato solo con il nome della mutazione più nota che possiede, N501Y, ma è da evitare poiché ci sono altre varianti che hanno anche questa mutazione.

Rambaut et al. ho questo da dire sul nuovo lignaggio:

Il lignaggio B.1.1.7 porta un numero maggiore del solito di cambiamenti genetici del virus. L'accumulo di 14 sostituzioni di amminoacidi specifici del lignaggio prima del suo rilevamento è, ad oggi, senza precedenti nei dati genomici globali del virus per la pandemia di COVID-19.

Identificano anche tre delle mutazioni in particolare (incluso N501Y) come sospettate di avere potenziali effetti biologici.

B.1.1.7 è stato rilevato per la prima volta in SARS-CoV-2 sequenziato da un campione raccolto nel sud-est dell'Inghilterra il 20 settembre 2020, da quando il cluster di casi è cresciuto rapidamente e si è diffuso in altre località. Il Regno Unito sequenzia molti più genomi SARS-CoV-2 di qualsiasi altra nazione e più del resto d'Europa messo insieme, quindi il fatto che B.1.17 sia stato rilevato per la prima volta nel Regno Unito non implica necessariamente che abbia avuto origine lì. Il lignaggio è stato rilevato anche in molti altri paesi e potrebbe ora essere diffuso.

La crescita del lignaggio B.1.1.7 nel Regno Unito può essere monitorata nei dati di sequenziamento caricati su GISAID. Ho utilizzato la struttura di elaborazione del COVID-CG[4] per selezionare le sequenze di ogni giorno con tutte e otto le mutazioni del gene spike B1.1.7.[5] Poiché i dati giornalieri erano rumorosi e poche sequenze erano datate dopo il 12 dicembre 2020, ho preso le medie mobili di 7 giorni, centrate fino al 9 dicembre. La Figura 1 mostra la proporzione risultante di tutte le sequenze del Regno Unito rappresentate dal lignaggio B.1.1.7 dalla sua prima comparsa. Va notato che la proporzione di sequenze non B.1.1.7 rappresentata dalle aree in cui B.1.1.7 è cresciuta per la prima volta in rilievo potrebbe essere aumentata nel tempo, con conseguente crescita mostrata che sovrastima la velocità con cui è cresciuta nelle singole aree o nel Regno Unito nel suo insieme.

Figura 1. La proporzione di tutti i genomi SARS-CoV-2 sequenziati nel Regno Unito costituita dal lignaggio B.1.1.7

Il tasso di crescita più elevato di B.1.1.7

Un rapporto PHE pubblicato il 21 dicembre 2020[6] presenta prove epidemiologiche sul tasso di crescita di B.1.1.7 rispetto ai lignaggi non B.1.1.7. Utilizzando un marcatore proxy per B.1.1.7[7] sono stati in grado di utilizzare i dati di una parte significativa del programma di test del Regno Unito ‘pillar 2’. Ciò ha fornito un set di dati molto più ampio di quello dei genomi SARS-CoV-2 sequenziati e ha consentito la stratificazione dei dati settimanali per ciascuna delle 42 aree NHS “STP”. La Figura 2 riproduce la Figura 1 del documento PHE, che mostra il vantaggio moltiplicativo nei tassi di crescita settimanali dei casi B.1.1.7 (il rapporto tra settimane B.1.1.7 e settimane non B.1.1.7 T+1 casi divisi per settimana T casi). L'asse x è per il proxy B.1.1.7, test del gene S negativo. La settimana indicata è la settimana base, quindi i punti gialli riflettono i rapporti tra i casi della settimana 49 (settimana che termina il 5 dicembre) e i casi della settimana 48.

Figura 2. Analisi dei dati empirici del vantaggio moltiplicativo nei tassi di crescita settimanali. Ogni punto rappresenta il rapporto dei tassi di crescita settimanali tra B.1.17 [VOC] e non-B.1.1.7 per un'area e una settimana STP del NHS England, in base ai dati del pilastro 2 mostrati nella Figura S1 del rapporto PHE. Colori e forme differenziano le settimane di calendario. I numeri sopra 1 mostrano un vantaggio moltiplicativo. La linea blu rappresenta il valore medio per una particolare frequenza e le linee grigie l'inviluppo del 95%. La dispersione alle basse frequenze riflette in gran parte il rumore statistico dovuto a conteggi bassi.

Quando la nuova variante rappresenta una piccola percentuale dei casi totali (sotto

25%, diciamo), il proxy utilizzato è meno soddisfacente e c'è anche molta dispersione. Tuttavia, il vantaggio moltiplicativo medio (rapporto) basato su proxy della variante nella crescita settimanale è notevolmente indipendente dalla sua prevalenza relativa. Ciò supporta la metodologia di PHE, sebbene i dati della settimana 48 suggeriscano che il vantaggio moltiplicativo potrebbe diminuire una volta che la variante costituisce più di

25% dei casi totali. PHE calcola da questi dati un vantaggio moltiplicativo medio nella crescita settimanale di 1,51 per B.1.1.7. Assumendo un intervallo di generazione fisso di 6,5 giorni, lo convertono in un numero di riproduzione (Rt) vantaggio moltiplicativo di 1,47 per B.1.1.7 rispetto ad altre varianti,.

PHE ha anche stimato l'effetto di B.1.1.7 su Rt utilizzando dati genomici (sequenziamento) per le stesse aree e settimane. Hanno stimato un effetto additivo su Rt di 0,57 o 0,74 quando l'effetto poteva variare tra le aree. PHE ha anche stimato l'effetto su Rt utilizzando i dati proxy del gene S del test PCR, aggiustati per la specificità (che è scarsa quando la proporzione negativa del gene S è bassa). Le loro stime dell'effetto additivo su Rt utilizzando quei dati erano 0,52, o 0,60 quando l'effetto poteva variare tra le aree. Utilizzando un modello di regressione bayesiana, la loro stima dell'effetto era 0,56. Tuttavia, poiché ci si aspetterebbe che qualsiasi differenza biologica nell'infettività provochi un effetto moltiplicativo su Rt, e Rt era variabile durante il periodo di analisi, un effetto additivo stimato su Rt è meno utile e anche suscettibile di essere meno accurato di una stima moltiplicativa. Inoltre, tutte queste stime implicano modelli statistici più complicati, ulteriori ipotesi e stime di altre variabili. Preferisco quindi il loro vantaggio moltiplicativo stimato di 1,51 (per la crescita settimanale, prima della conversione in Rt scala), che è direttamente derivato dai dati sottostanti. Ciò equivale a un vantaggio del tasso di crescita giornaliero logaritmico di 0,059.

Altre prove riguardanti la crescita più rapida di B.1.1.7

Il 18 dicembre 2020 si è tenuta una riunione del comitato NERVTAG[8] – che consiglia il governo sulla minaccia rappresentata dai virus respiratori nuovi ed emergenti – sulla nuova variante. un tasso di crescita del 71% superiore alle altre varianti nessuno dei documenti presi in considerazione dalla commissione conteneva una stima del genere. Dal verbale di una successiva riunione del 21 dicembre 2020[10] risulta che questa era una delle numerose stime non documentate del professor Neil Ferguson dell'Imperial College, membro della NERVTAG. Una stima di regressione alternativa che apparentemente ha presentato indicava che il lignaggio B.1.1.7 aveva a Rt 0,39 in più rispetto ai lignaggi non varianti da inizio novembre a inizio dicembre. Questa è presumibilmente una stima dell'effetto additivo ed è notevolmente inferiore alle stime di PHE che utilizzano più o meno lo stesso metodo. Altre due stime dichiarate nei verbali provenienti dal professor Ferguson sembrano entrambe in realtà versioni leggermente errate della stima PHE di un moltiplicativo Rt vantaggio di 1.47 per B.1.1.7.

I verbali di un'ulteriore riunione della NERVTAG del 21 dicembre menzionano anche una stima della London School of Hygiene and Tropical Medicine che B.1.1.7 era del 56% più trasmissibile (un vantaggio moltiplicativo di 1,56 in Rt valore). Questa stima è documentata in una prestampa (Davies et al. [11]). Gli autori utilizzano un metodo bayesiano soggettivo per adattare un modello altamente complesso con molti parametri probabilistici, alcuni fissi e altri stimati. Questo è un metodo tutt'altro che robusto e molto probabilmente intrinsecamente distorto per stimare la velocità di trasmissione relativa. Inoltre, sembrano utilizzare dati meno informativi, suddivisi geograficamente solo per le 7 regioni del SSN, non (come utilizzato da PHE) per le 42 aree STP del SSN. L'uso di dati meno informativi implica che, anche se avessero impiegato un metodo robusto, ci si aspetterebbe che le loro stime siano intrinsecamente meno affidabili della stima PHE. Gli intervalli di incertezza delle loro stime, che includono un intervallo di confidenza superiore al 99% compreso tra 1,49x e 1,57x per la regione del sud-est[12], sembrano essere piuttosto irrealisticamente ristretti, date le sostanziali incertezze esistenti. Ciò getta ulteriori dubbi sul realismo delle loro stime.

Infine, l'incontro NERVTAG del 21 dicembre ha preso in considerazione anche una stima filogenetica dell'Università di Edimburgo (Andrew Rambaut) basata su sequenze genetiche di Kent e Londra, che Rt era 1,57 o 1,72 a seconda della finestra temporale utilizzata. Poiché nessun comparativo Rt la stima per le varianti non B.1.1.7 è riportata nel verbale di riunione, non è possibile dedurne una stima della relativa velocità di trasmissione della nuova variante.

Concludo che l'altra evidenza considerata da NERVTAG è meno robusta e meno utile della stima PHE di un vantaggio moltiplicativo nella crescita settimanale di 1,51.

Perché non è necessario che la crescita più rapida di B.1.1.7 sia dovuta a un aumento trasmissibilità

Mentre l'evidenza che il lignaggio B.1.1.7 è cresciuto più velocemente di altri lignaggi in Inghilterra nei due mesi circa fino all'inizio/metà dicembre sembra robusto, non si possono dedurre le proprietà biologiche di un virus solo da dati epidemiologici limitati. L'apparente rapida diffusione di questa nuova variante potrebbe essere dovuta agli effetti del fondatore e agli eventi di super-diffusore piuttosto che, o in aggiunta, a una maggiore trasmissibilità (maggiore infettività).

È istruttivo a questo proposito considerare altre due linee/varianti che hanno avuto anch'esse un periodo di crescita eccezionalmente rapida e, in un caso, sono diventate totalmente dominanti nella maggior parte dei paesi.

Il clade G: mutazione del gene spike D614G

La mutazione D614G è emersa all'inizio dell'epidemia, emergendo in Europa a febbraio, e la variante G614 si è indubbiamente diffusa più velocemente nella maggior parte delle località rispetto alla D614. In moltissimi paesi, aree e città è passato da rappresentare una minoranza di infezioni ad essere la variante dominante nel giro di un mese o giù di lì. Da luglio 2020 ha rappresentato l'approssimarsi del 100% delle nuove infezioni nella maggior parte dei paesi e in tutti i continenti.

Alla luce del fatto che D614G diventa e rimane così dominante, non sorprende che un articolo di agosto (Korber et al.[13]) ha sostenuto che la mutazione D614G aumenta la trasmissibilità, citando diversi elementi di prova:

  • la coerenza dell'aumento [della frequenza di G614] tra le regioni geografiche.
  • la forma D614 non è persistita in molte località in cui la forma G614 è stata introdotta nelle epidemie D614 ben consolidate in corso, come ci si aspetterebbe se le due forme avessero la stessa probabilità di propagarsi.
  • l'aumento della frequenza del G614 spesso è continuato anche dopo che gli ordini nazionali di soggiorno a casa [blocchi] erano in atto, quando era probabile che la reseeding seriale da parte dei viaggiatori fosse ridotta in modo significativo.

In aggiunta a ciò prove epidemiologiche, tGli autori hanno anche notato che l'aumento della trasmissibilità di G614 era coerente con altri studi che suggerivano associazioni con una maggiore infettività in vitro[14] [15] , e con la loro scoperta di un'associazione con cariche virali più elevate in vivo. Inoltre, un altro articolo (Li, Q et al[16]) ha riportato una maggiore antigenicità per G614.

La maggior parte degli argomenti di Korber sono anche abbastanza applicabili alle prove che suggeriscono che B.1.1.7 potrebbe essere più trasmissibile. Tuttavia, un articolo più recente su Nature (van Dorp et al.[17]) non ha trovato "nessuna prova per lignaggi significativamente più trasmissibili di SARS-CoV-2 a causa di mutazioni ricorrenti" 8221, incluso D614G (B.1.1.7 aveva non è stato identificato entro la fine del periodo di studio). Ciò dimostra che, anche dopo che un nuovo ceppo è diventato dominante, le conclusioni sulla sua relativa trasmissibilità tratte da prove epidemiologiche e biologiche indirette possono rivelarsi errate.

La variante 20A.EU1: mutazione spike A222V

La variante 20A.EU1, che coinvolge la mutazione del gene spike A222V, è emersa in Spagna all'inizio dell'estate 2020. Si è rapidamente diffusa in altri paesi europei, dove in genere è cresciuta più velocemente delle varianti non-20A.EU1. La Figura 3 traccia il tasso di crescita giornaliero logaritmico delle sequenze con la mutazione A222V nel Regno Unito, rispetto a quelle senza di essa, nei due mesi fino a metà settembre. In quel periodo il rapporto tra le nuove sequenze A222V e non-A222V è cresciuto da meno di 0,02 a 0,67. Il tasso di crescita giornaliero logaritmico medio è stato di 0,061 - un vantaggio moltiplicativo settimanale di 1,53 - sostanzialmente senza tendenza. Tale vantaggio moltiplicativo è effettivamente identico alla stima 1,51 di PHE per B.1.1.7 utilizzando i dati da metà ottobre a metà dicembre.

Figura 3. Il tasso di crescita giornaliero logaritmico della media mobile a 7 giorni delle nuove sequenze con la mutazione A222V nel Regno Unito, rispetto a quelle senza di essa, nei due mesi fino al 12 settembre 2020.

Tuttavia, in autunno la frequenza relativa delle nuove sequenze A222V ha smesso di aumentare in un certo numero di paesi, senza – come ha fatto D614G – raggiungere una dominanza totale e continua (Figura 4). Nel Regno Unito la variante A20.EU1 ha raggiunto circa il 70% di tutte le nuove sequenze entro la fine di ottobre, ma da allora è diminuita in termini di frequenza relativa, come ha fatto anche in Belgio, Germania e Svizzera.

Figura 4. La proporzione durante il 2020 di nuove sequenze SARS-CoV-2 settimanali in dieci paesi europei che hanno la mutazione A222V (il che implica che sono la variante A20.EU1)

Nonostante la rapida crescita della variante 20A.EU1 in molti paesi europei durante l'estate e/o l'autunno, un documento prestampato del novembre 2020 su 20A.EU1 concludeva: “Non troviamo prove di una maggiore trasmissibilità di questa variante, ma dimostriamo invece come l'aumento dell'incidenza in Spagna, la ripresa dei viaggi in Europa e la mancanza di screening e contenimento efficaci possono spiegare il successo della variante.[18]

Sovrastima dell'effetto su Rt di possibile maggiore trasmissibilità

Supponendo che il tasso di crescita più elevato fino ad oggi del lignaggio B.1.1.7 fosse dovuto a una maggiore trasmissibilità, che effetto avrebbe questo sull'attuale numero di riproduzione, Rt? Dipenderà da cosa Rt è e sull'intervallo di generazione medio e sulla sua distribuzione di probabilità. Più lungo è l'intervallo di generazione, maggiore è Rt necessaria per produrre un determinato tasso di crescita. Nella pubblicazione PHE del 21 dicembre, la loro stima del vantaggio moltiplicativo nel tasso di crescita settimanale (di 1,51) viene convertita in un vantaggio moltiplicativo in Rt di 1,47 assumendo un intervallo di generazione fisso di 6,5 giorni: 1,47 = 1,51^(6,5/7).

Tuttavia, la formula di conversione di PHE’ non è giustificata, per due motivi:

  • l'intervallo di generazione non è fisso e
  • stime recenti dell'intervallo di generazione medio sono ben al di sotto di 6,5 giorni.

La maggior parte delle stime dell'intervallo di generazione (il periodo da una persona che viene infettata a loro che infetta un'altra persona) sono in realtà stime dell'intervallo seriale (il periodo dall'insorgenza dei sintomi in una persona all'insorgenza dei sintomi in una persona che infettano), poiché il tempo di infezione non è osservabile. L'intervallo di generazione può essere validamente stimato combinando stime probabilistiche dell'intervallo seriale e del periodo di incubazione (dall'infezione all'insorgenza dei sintomi). Tuttavia, trattare semplicemente una stima probabilistica di intervallo seriale come rappresentante della distribuzione dell'intervallo di generazione, come avviene tipicamente, è insoddisfacente.

PHE non fornisce alcuna fonte per la loro ipotesi di un intervallo di generazione di 6,5 giorni, ma potrebbero seguire il team dell'Imperial College, che ha utilizzato (in Flaxman et al.[19]) un intervallo di generazione con una media di 6,5 giorni, affermando che è stato stimato da Bi et al.[20]. Infatti Bi et al. ha stimato l'intervallo seriale, non l'intervallo di generazione, e ha adattato una distribuzione di probabilità gamma con una media di 6,3 giorni. Tuttavia, i loro dati includevano casi in cui l'individuo infettante non si isolava dagli altri fino a molto tempo dopo l'insorgenza dei sintomi. Bi et al. ha scoperto che se l'individuo infetto è stato isolato meno di tre giorni dopo l'insorgenza dei sintomi, cosa che normalmente avviene nel Regno Unito ora, l'intervallo seriale medio era di soli 3,6 giorni.

Knight e Mishra (2020)[21] mostrano che, per evitare di sovrastimare l'intervallo seriale, è necessario adattarlo a una distribuzione di probabilità che, a differenza della distribuzione gamma utilizzata da Bi et al., permetta valori negativi (che si osservano in un percentuale non trascurabile di casi). Considerano un certo numero di stime esaminate in un articolo di revisione del periodo di incubazione e dell'intervallo seriale, selezionando l'unica stima dell'intervallo seriale basata su una distribuzione di probabilità negativa che ha una dimensione del campione ampia (quasi dieci volte quella in Bi et al.) e la stima del periodo di incubazione basata sul campione più grande. La stima dell'intervallo di generazione risultante ha una media di 3,99 giorni e una deviazione standard di 2,96 giorni.[22]

Davis et al. affermano che il loro complesso modello bayesiano, che stimava un vantaggio moltiplicativo di 1,56 in Rt valore usando un intervallo di generazione abbastanza lungo, si adattava meno bene quando usavano un intervallo più breve. Tuttavia, sembra probabile che il motivo principale per cui ottengono uno scarso adattamento alla crescita relativa della nuova variante durante il blocco con un intervallo di generazione più breve è che il loro modello sovrastima notevolmente l'effetto del blocco di novembre. [23]

Utilizzando la distribuzione stimata di Knight e Mishra per l'intervallo di generazione e la formula di conversione corretta,[24] la stima PHE del vantaggio moltiplicativo del lignaggio B.1.1.7 nel tasso di crescita settimanale di 1,51 corrisponde a un vantaggio moltiplicativo in Rt di 1,25.[25] Questo è solo circa la metà del vantaggio moltiplicativo di 1,47 stimato da PHE.[26] Ciò implica che sarebbero necessarie misure meno estese e severe per prevenire la crescita esponenziale delle infezioni data l'emergere di B.1.1.7 rispetto a quanto implicato dalla stima PHE di un vantaggio moltiplicativo di 1,47 in Rt, anche se il vantaggio moltiplicativo osservato nel tasso di crescita settimanale di B.1.1.7 a metà dicembre è interamente causato dalla sua maggiore trasmissibilità.

La nuova variante sudafricana

Un nuovo lignaggio SARS-CoV-2 che coinvolge anche una mutazione del gene spike N501Y e una serie di altre mutazioni (diverse da quelle in B.1.1.7) è emersa di recente in Sud Africa, come descritto da Tegally et al.[ 27], che lo chiamano 501Y.V2. Dicono che i dati genomici, che mostrano il rapido spostamento di altri lignaggi, suggeriscono che questo lignaggio possa essere associato a una maggiore trasmissibilità. Tuttavia, le prove limitate finora disponibili sono insufficienti per giustificare i commenti allarmistici del ministro della salute del governo britannico, secondo cui "Questa nuova variante è molto preoccupante perché è ancora più trasmissibile e sembra essere mutata ulteriormente rispetto alla nuova variante scoperta nel Regno Unito”.[28] Come ha affermato un professore di virologia molecolare presso l'Università di Nottingham, la mutazione coinvolta è stata vista in precedenza, non abbiamo idea se abbia un impatto sulla trasmissibilità del virus e dovremmo evitare di farci prendere dal panico a questo punto.[29]

Conclusioni

Gli esempi del clade G e 20A.EU1 illustrano che prove epidemiologiche apparentemente forti di un tasso di crescita più elevato di una nuova variante per un periodo considerevole, anche quando porta a una dominanza apparentemente permanente, e nonostante siano accompagnate da prove che suggeriscono che la variante è associata a carica virale più elevata, non consente una conclusione valida che la variante abbia una trasmissibilità maggiore rispetto alle varianti esistenti. Tali prove possono suggerire una maggiore trasmissibilità, ma non la dimostrano in modo affidabile.

Nonostante ciò, il comitato NERVTAG ha concluso con moderata fiducia il 18 dicembre che la nuova variante “dimostra un sostanziale aumento della trasmissibilità rispetto ad altre varianti” e nella riunione del 21 dicembre è andato oltre ed ha espresso grande fiducia che “B.1.1. 7 può diffondersi più velocemente di altre varianti del virus SARS-CoV-2 attualmente in circolazione nel Regno Unito”. Pur ammettendo che la causa sottostante di una diffusione più rapida non fosse chiara, i fattori causali suggeriti riguardavano esclusivamente una maggiore trasmissibilità. Non sorprende, dato che le fiduciose conclusioni della NERVTAG non sono giustificate dai fatti, che un certo numero di esperti nel Regno Unito e in altri paesi le abbiano contestate[30] o abbiano espresso opinioni contrarie[31] [32] [33] Non sorprende che i media mainstream stiano riportando, in modo errato, che B.1.1.7 ha dimostrato di possedere una trasmissibilità sostanzialmente maggiore.

Ho sostenuto che la stima di PHE di un vantaggio moltiplicativo di crescita settimanale di 1,51 per B.1.1.7 è, per diverse ragioni, più robusta e accurata rispetto alle altre stime disponibili. Ho mostrato che, anche se la maggiore crescita fino ad oggi di B.1.1.7 fosse dovuta interamente ad una maggiore trasmissibilità, essa corrisponderebbe ad un vantaggio moltiplicativo in Rt di solo 1,25, metà del vantaggio calcolato da PHE utilizzando una formula di conversione inappropriata.

Non ci sono prove fino ad oggi che B.1.1.7 sia più virulento dei ceppi esistenti, né che sarà resistente ai vaccini che sono stati sviluppati. L'opinione degli esperti sembra essere che nessuno di questi è probabile che sia il caso.[34]

Questi risultati implicano che B.1.1.7 non sembra attualmente rappresentare un serio aumento della minaccia rappresentata da SARS-CoV-2, anche nel peggiore dei casi che il suo tasso di crescita più elevato osservato sia interamente dovuto all'aumento della trasmissibilità. Nel migliore dei casi, il suo tasso di crescita più elevato non risulterà in alcun modo derivare da una maggiore trasmissibilità, come ora sembra essere il caso del clade G e della variante 20A.EU1.

Di conseguenza, è difficile vedere che l'imposizione di misure drastiche per rallentare la trasmissione, riducendo ulteriormente l'attività economica, l'attività sociale e la libertà dei popoli, sia giustificata dall'evidenza attuale riguardante l'emergente linea B.1.1.7.

Tuttavia, la disponibilità di ulteriori prove potrebbe rafforzare o indebolire la tesi secondo cui l'emergere di B.1.1.7 rappresenta uno sviluppo serio. È importante che le autorità del Regno Unito inizino a rilasciare, su base giornaliera e a livello di autorità locale o più fine, tutti i dati disponibili sui casi del nuovo ceppo, come indicato dal proxy ‘S gene negative’ e da qualsiasi altro metodo . Attualmente stanno mantenendo queste informazioni non pubbliche, il che rende impossibile per i ricercatori indipendenti valutare correttamente in modo tempestivo e, se necessario, contestare, quali potrebbero essere conclusioni errate. Inoltre, è altamente auspicabile che nessun rapporto o studio relativo a SARS-CoV-2 o COVID-19 venga considerato in seguito dal governo o dai suoi consulenti a meno che non sia accompagnato da un collegamento in cui siano disponibili tutti i dati utilizzati.

Nicholas Lewis 29 dicembre 2020

[1] Rambaut, A et al: Caratterizzazione genomica preliminare di un lignaggio SARS-CoV-2 emergente nel Regno Unito definito da una nuova serie di mutazioni spike. COVID-19 Genomics Consortium UK, rete ARTIC 19 dicembre 2020. https://virological.org/t/preliminary-genomic-characterisation-of-an-emergent-sars-cov-2-lineage-in-the-uk-defined -da-un-novel-set-of-spike-mutations/563

[2] Mutazioni N501Y, A570D, P681H, T716I, S982A e D1118H più delezioni HV69-70 e Y144

[3] Mutazioni T1001I, A1708D e I2230T più delezione di SGF3675-3677 nel gene ORF1ab Mutazioni R52I e Y73C più codone Q27stop nel gene Orf8 D3L e S235F nel gene N. Esistono anche 6 mutazioni sinonime (non modificanti gli aminoacidi): 5 in ORF1ab (C913T, C5986T, C14676T, C15279T, C16176T) e 1 nel gene M (T26801C).

[5] Solo il numero totale di sequenze di ogni giorno con ciascuna mutazione è disponibile tramite COVID-CG, ma il numero di ciascuna delle otto mutazioni spike che compaiono ogni giorno (R >0.999, eccetto 0.991 per la delezione HV69-70, che a volte si verifica in altri ceppi), il che implica che hanno una co-occorrenza estremamente elevata. Ho preso il numero minimo ogni giorno per le otto mutazioni spike come conteggio per le sequenze B.1.1.7. L'integrazione di dati sulle mutazioni non-spike sembra non necessario la corrispondenza di tutte le mutazioni B.1.1.7 con tutte le mutazioni ORF1ab B.1.1.7 è quasi perfetta a parte A1708D, che sembra assente in circa l'1% dei casi in cui tutti gli altri 11 picchi e Sono presenti mutazioni di ORF1ab.

[7] Risultato del test TaqPath PCR per il gene S negativo, N e ORF1ab positivo.

[8] NERVTAG: gruppo consultivo sulle minacce dei virus respiratori nuovi ed emergenti

[11] Davies, NG et al: stimata trasmissibilità e gravità della nuova variante SARS-CoV-2 di preoccupazione 202012/01 in Inghilterra. Center for Mathematical Modeling of Infectious Diseases, London School of Hygiene and Tropical Medicine, aggiornato il 23 dicembre 2020. https://cmmid.github.io/topics/covid19/reports/uk-novel-variant/2020_12_23_Transmissibility_and_severity_of_VOC_202012_01_in_England.pdf

[12] Figura 1A di Davies et al, pannello più a destra.

[13] Korber, B. et al. Monitoraggio dei cambiamenti nel picco di SARS-CoV-2: prova che D614G aumenta l'infettività del virus COVID-19. Cella 182, 812.e19–827.e19 (2020). https://doi.org/10.1016/j.cell.2020.06.043, 20 agosto 2020

[14] Zhang, L. et al. La mutazione D614G nella proteina spike SARS-CoV-2 riduce lo spargimento di S1 ​​e aumenta l'infettività. Prestampa su https://doi.org/10.1101/2020.06.12.148726, 12 giugno 2020

[15] Yurkovetskiy, L. et al. Analisi strutturale e funzionale della variante della proteina spike D614G SARSCoV-2. Cell 183, 739.e8–751.e8 https://doi.org/10.1016/j.cell.2020.09.032, ottobre 2020

[16] Li, Q. et al. L'impatto delle mutazioni nel picco di SARS-CoV-2 sull'infettività e sull'antigenicità virali. Cell 182, 1284.e9–1294.e https://doi.org/10.1016/j.cell.2020.07.012, settembre 2020

[17] van Dorp, L et al., Nessuna evidenza di una maggiore trasmissibilità da mutazioni ricorrenti in SARS-CoV-2. Natura, novembre 2020. https://doi.org/10.1038/s41467-020-19818-2

[18]Hodcroft, BH et al: comparsa e diffusione di una variante SARS-CoV-2 in Europa nell'estate del 2020. medRxiv 27 novembre 2020 https://doi.org/10.1101/2020.10.25.20219063

[19] Flaxman, S., Mishra, S., Gandy, A. et al. Stima degli effetti degli interventi non farmaceutici su COVID-19 in Europa. Natura 584, 257–261 (2020). https://doi.org/10.1038/s41586-020-2405-7

[20] Bi, Q. et al. Epidemiologia e trasmissione di COVID-19 a Shenzhen in Cina: analisi di 391 casi e 1.286 dei loro stretti contatti. medRxiv (2020) https://doi.org/10.1101/2020.03.03.20028423

[21] Knight, J. e Mishra, S.: Stima del numero di riproduzione effettivo utilizzando il tempo di generazione rispetto all'intervallo seriale, con applicazione a COVID-19 nella Greater Toronto Area, Canada. Modellazione delle malattie infettive 5 (2020) 889e896, novembre 2020. https://doi.org/10.1016/j.idm.200.10.009

[22] Knight e Mishra adattano la loro stima dell'intervallo di generazione utilizzando una distribuzione gamma. A differenza dell'intervallo seriale, l'intervallo di generazione non può essere negativo, quindi qui è adatta una distribuzione gamma.

[23] Dicono che lo scarso adattamento con un intervallo di generazione più breve era dovuto al fatto che prevedeva che il nuovo ceppo avrebbe dovuto diminuire in frequenza relativa durante il blocco di novembre. Mentre scrivono: “Quando RT < 1 per entrambe le varianti, un tempo di generazione più breve è uno svantaggio selettivo, perché le infezioni con questa variante diminuiscono più velocemente rispetto a una variante con la stessa RT ma trasmettendo su una scala temporale più lunga.” Tuttavia, questo è vero solo se RT era inferiore a 1 durante il blocco, mentre la loro Fig. 1E mostra che, in realtà, RT è rimasto pari o leggermente superiore a 1 durante il blocco. Ciò è coerente con i dati sulla mobilità in Davies et al. Fig.1C, che mostrano poca differenza tra l'immediato prima dell'inizio e la fine del lockdown. Una tuta RT di 1 implica che le infezioni con la variante più trasmissibile aumenteranno in frequenza relativa, come avvenuto, non diminuiranno. Inoltre, la complessità del loro modello significa che lo scarso adattamento potrebbe essere parzialmente o totalmente dovuto ad altre cause, come un lungo intervallo di generazione che compensa la stima errata di un altro parametro, o al modo peculiare in cui hanno rappresentato un intervallo di generazione accorciato.

[24] Wallinga, J., & Lipsitch, M. (2007). Come gli intervalli di generazione modellano la relazione tra tassi di crescita e numeri riproduttivi. Atti della Royal Society B: Scienze biologiche, 274 (1609), 599-604. https://doi.org/10.1098/rspb.2006.3754 Usando la loro equazione 2.9 in combinazione con la funzione di generazione del momento di distribuzione gamma.

[25] La stima del vantaggio moltiplicativo presuppone che Rt per gli altri ceppi è 1.0 il vantaggio moltiplicativo dedotto è una funzione lentamente decrescente di Rt per gli altri ceppi.

[26] Lo stesso è approssimativamente vero per tutto l'intervallo di confidenza al 95% di PHE’ di per Rt rapporto di 1,34–1,59, che convertito nello stesso modo corrisponde a an Rt gamma di rapporti di 1,19–1,30.


Numero 29: lancio del vaccino negli Stati Uniti: una corsa contro le varianti virali

I tassi di vaccinazione COVID-19 negli Stati Uniti continuano ad aumentare, con quasi tre milioni di americani che ricevono il vaccino ogni giorno. Al 29 marzo, il 37% della popolazione statunitense di età superiore ai 18 anni ha ricevuto almeno una dose di vaccino, secondo i dati dei Centri statunitensi per il controllo e la prevenzione delle malattie (CDC).

Ma il lancio di vaccini altamente efficaci sta avvenendo in mezzo a un aumento dei casi di COVID-19 nel paese, alimentato in gran parte dalla variante B.1.1.7 più trasmissibile che è stata identificata per la prima volta come la causa dei casi in aumento nel Regno Unito. Il regista Rochelle Walensky per avvertire di "sventura imminente" all'inizio di questa settimana.

Per mettere tutto questo in prospettiva, l'editore HVP Kristen Jill Abboud ha recentemente parlato con Eric Topol, vicepresidente esecutivo di Scripps Research e direttore e fondatore dello Scripps Research Translational Institute. Topol ha raccontato l'epidemiologia e la scienza della pandemia di COVID-19 e gli sforzi per controllarla sul suo account Twitter (@EricTopol) e recentemente è stato coautore di un commento in Natura sulla necessità di vaccini COVID-19 a prova di variante.

Di seguito viene visualizzata una versione modificata della conversazione.

Come pensi che stiano andando gli Stati Uniti oggi con la loro risposta al COVID?

L'aumento del vaccino è stato fantastico negli ultimi tempi. Abbiamo avuto tre giorni di somministrazione di oltre 3,3 milioni di dosi di vaccino al giorno, il che è sorprendente. Ovviamente, sarebbe stato meglio se avessimo potuto farlo dall'inizio, quindi avremmo contenuto tutto e avremmo usato le nostre migliori munizioni contro le varianti. Ma mentre tutto sta andando molto bene con le vaccinazioni, non possiamo fare abbastanza, abbastanza velocemente, per costruire davvero un muro di difesa contro questo virus.

Stiamo assistendo all'aumento dei casi in molte parti del paese. Il Michigan sembra davvero cupo in termini di casi in aumento, e ora l'intero nord-est degli Stati Uniti non sta andando bene. Questi sono tutti alimentati dalla variante del Regno Unito. Sebbene New York e New Jersey possano avere alcuni casi della variante New York, questa non è una variante superspreader. La variante del Regno Unito è la più preoccupante perché si diffonde così facilmente e quindi supererà le altre varianti che conosciamo oggi. La variante B.1.1.7 alla fine sarà responsabile di tutte le infezioni negli Stati Uniti, quindi questa è la nostra grande preoccupazione. Alla fine, prevarremo, ma prima potremo somministrare più vaccini, questo ci aiuterà a ribaltare la situazione.

L'altro vantaggio che abbiamo è che circa 100 milioni di persone negli Stati Uniti hanno avuto il COVID e molti di loro sono le stesse persone che non riceveranno un vaccino e non indosseranno maschere. Questi individui, che probabilmente hanno un certo livello di immunità naturale, non vengono presi in considerazione in molti calcoli su quando potremmo iniziare a vedere un contenimento molto forte del virus, cosa che non abbiamo mai avuto in questo paese dall'inizio del pandemia.

Che dire della variante B.1.351 identificata per la prima volta in Sud Africa? Questo rappresenta una minaccia per i nostri attuali vaccini?

Questa è la peggiore di tutte le varianti che conosciamo oggi se si guarda a come può eludere le risposte immunitarie in modo tale che i vaccini potrebbero perdere efficacia. Ma gli studi sui vaccini Johnson & Johnson e Novavax in Sud Africa mostrano che quei vaccini hanno preservato l'efficacia contro la variante B.1.351. Non hanno funzionato così bene in Sud Africa come hanno fatto in altri posti, ma era abbastanza vicino. E tutti i in vitro studi di laboratorio suggeriscono che i vaccini a mRNA dovrebbero funzionare molto bene contro quella variante.

In futuro potrebbe esserci una variante che combina le peggiori caratteristiche delle varianti B.1.1.7 e B.1.351, ma non l'abbiamo ancora visto. Potrebbe essere lì che siamo diretti.

Prevedi che saranno necessari colpi di richiamo per migliorare l'efficacia dei vaccini esistenti contro queste o future varianti di SARS-CoV-2?

È molto probabile che potremmo passare diversi anni senza la necessità di booster per i vaccini COVID-19 esistenti. SARS-CoV-1, che è il virus più strettamente correlato, è circolato nel 2003 e 17 anni dopo ci sono persone che hanno ancora ottimi anticorpi e cellule T contro questo virus. La preparazione dei booster che sono in corso ora da Moderna e da altre aziende è più a scopo precauzionale. La domanda è davvero se possiamo sviluppare un vaccino pan-coronavirus, che è la via più interessante per ottenere una protezione pluriennale contro il virus ed è assolutamente fattibile.

Prevedi che SARS-CoV-2 diventi endemico?

Non è chiaro solo il tempo lo dirà. Dipende da ciò che accade a livello globale. Il virus sta ancora imperversando in molti luoghi - i tassi di infezione sono in forte ascesa - ed è una storia globale. Se non teniamo le braccia avvolte attorno al virus, si evolverà. Le tendenze che stiamo vedendo in questo momento a livello globale non sono favorevoli, ma se guardi a ciò che sta accadendo in Israele, è una storia diversa. In Israele, hanno praticamente schiacciato questo virus. Ma la domanda è: il mondo può imitare ciò che è successo in un paese di nove milioni di persone con confini naturali e campagne di vaccinazione aggressive? Ci sono altri 7,6 miliardi di persone là fuori che dobbiamo proteggere.

Cosa pensi che dovrebbero fare di più gli Stati Uniti per garantire che i vaccini COVID-19 siano disponibili a livello globale?

Ho promosso che dovremmo spedire tutti i nostri vaccini in eccesso perché abbiamo un eccesso: 300 milioni di dosi del vaccino AstraZeneca, 100 milioni o più del vaccino di J&J e 100 milioni in più del vaccino di Novavax. Abbiamo 500 o 600 milioni di dosi di vaccino che non useremo mai. Abbiamo abbastanza vaccino per tutti nel paese e non riusciremo a convincere tutti a prenderlo. Solo con i vaccini Moderna e Pfizer, ne abbiamo abbastanza per la popolazione degli Stati Uniti.

Non capisco davvero il ritardo nel rilascio di queste dosi di vaccino. In questo momento, vuoi provare a far arrivare il vaccino ai paesi che ne hanno un disperato bisogno e non mancano di quelli. Ci sono molte zone calde che potremmo aiutare. Non ci sono buone scuse che ho sentito per non rilasciare quei vaccini. Questo non è un problema nazionale, è un problema globale e planetario. Più aiutiamo gli altri paesi, più aiutiamo anche noi stessi.

Cosa sappiamo ora della capacità dei vaccini COVID autorizzati di prevenire la diffusione virale, oltre a prevenire le malattie?

I dati su questo sono molto incoraggianti: sembra che la diffusione virale sia davvero ben inibita. I dati migliori che abbiamo sono per entrambi i vaccini Moderna e Pfizer, è più sconosciuto per gli altri vaccini.

In che modo è stata utilizzata l'intelligenza artificiale (AI) per comprendere o affrontare questa pandemia?

L'intelligenza artificiale è stata nel complesso una delusione in questa pandemia: non ha avuto l'impatto che mi sarebbe piaciuto vedere, il che probabilmente riflette il fatto che siamo ancora abbastanza presto nella storia dell'intelligenza artificiale. Ha contribuito all'accelerazione di un farmaco COVID, baricitinib, che ha ottenuto l'autorizzazione all'uso di emergenza in combinazione con remdesivir. L'intelligenza artificiale è stata anche utilizzata per prevedere chi si ammalerà di COVID, chi trarrà i maggiori benefici dalla vaccinazione, ecc., Ma non ho visto nulla che sia stato un contributo davvero importante. Ma ciò non significa che l'IA non contribuirà di più in futuro. L'intelligenza artificiale, se usata correttamente, sarebbe il modo per prevedere una pandemia. Individuare una pandemia prima ancora che accada è, per me, ciò che stiamo aspettando con l'intelligenza artificiale. E possiamo arrivarci.

Intervista di Kristen Jill Abboud


COVID-19 e SARS-CoV-2. Modellare il presente, guardando al futuro

Da dicembre 2019 la sindrome respiratoria acuta grave Coronavirus 2 (SARS-CoV-2) ha prodotto un focolaio di malattia polmonare che è presto diventata una pandemia globale, nota come COronaVIrus Disease-19 (COVID-19). Il nuovo coronavirus condivide circa l'82% del suo genoma con quello che ha prodotto l'epidemia del 2003 (SARS CoV-1). Entrambi i coronavirus condividono anche lo stesso recettore cellulare, che è l'enzima di conversione dell'angiotensina 2 (ACE2). Nonostante queste somiglianze, il nuovo coronavirus si è espanso più ampiamente, più velocemente e più letale rispetto al precedente. Molti ricercatori di tutte le discipline hanno utilizzato diversi strumenti di modellazione per analizzare l'impatto di questa pandemia su scala globale e locale. Ciò include un'ampia gamma di approcci - deterministici, basati sui dati, stocastici, basati su agenti e le loro combinazioni - per prevedere la progressione dell'epidemia nonché gli effetti degli interventi non farmaceutici per arrestare o mitigare il suo impatto sul mondo popolazione.Le complessità fisiche della società moderna devono essere catturate da questi modelli. Ciò include i molti modi di contatti sociali – reti di contatti sociali (multiplex), sistemi di trasporto (multistrato), metapopolazioni, ecc. – che possono fungere da struttura per la propagazione del virus. Ma la modellizzazione non solo svolge un ruolo fondamentale nell'analisi e previsione delle variabili epidemiologiche, ma svolge anche un ruolo importante nell'aiutare a trovare cure per la malattia e nel prevenire il contagio attraverso nuovi vaccini. La necessità di rispondere in modo rapido ed efficace alle domande: i farmaci esistenti potrebbero funzionare contro la SARS CoV-2? e si possono sviluppare in tempo nuovi vaccini? richiede l'uso di modelli fisici di proteine, interazioni proteina-inibitori, screening virtuale di farmaci contro bersagli virali, previsione dell'immunogenicità di piccoli peptidi, modelli di vaccinomica e progettazione di vaccini, solo per citarne alcuni. Qui, esaminiamo queste tre principali aree di ricerca modellistica contro SARS CoV-2 e COVID-19: (1) epidemiologia (2) riproposizione di farmaci e (3) progettazione di vaccini. Pertanto, compiliamo la letteratura esistente più pertinente sulle strategie di modellazione contro il virus per aiutare i modellisti a navigare in questa letteratura in rapida crescita. Teniamo anche d'occhio le future epidemie, dove i modellisti possono trovare le strategie più rilevanti utilizzate in una situazione di emergenza come quella attuale per aiutare a combattere future pandemie.


Riferimenti

Bull, J. J. & Lauring, A. S. Teoria ed empirismo nell'evoluzione della virulenza. PLOS Pathog. 10, e1004387 (2014). Questa recensione fornisce informazioni su come la teoria della virulenza potrebbe essere unita ai dati empirici e su ciò che è necessario per comprendere meglio la relazione tra virulenza e trasmissibilità.

McMahon, D.P. et al. Elevata virulenza di un genotipo virale emergente come causa della perdita delle api. Proc. Biol. Sci. 283, 20160811 (2016).

Power, R. A., Parkhill, J. & de Oliveira, T. Studi sull'associazione del genoma microbico: lezioni dal GWAS umano. Naz. Rev. Geneti 18, 41–50 (2017).

Ansari, M.A. et al. L'analisi da genoma a genoma evidenzia l'effetto del sistema immunitario innato e adattativo umano sul virus dell'epatite C. Naz. Genet. 49, 666 (2017).

Yang, J. et al. Rilevamento parallelo imparziale di agenti patogeni virali in campioni clinici mediante l'uso di un approccio metagenomico. J.Clin. Microbiolo. 49, 3463–3469 (2011).

Shi, M. et al. Ridefinizione della virosfera degli invertebrati. Natura 540, 539–543 (2016).

Shi, M. et al. La storia evolutiva dei virus a RNA dei vertebrati. Natura 556, 197–202 (2018).

Stern, A. et al. Il percorso evolutivo verso la virulenza di un virus a RNA. Cellula 169, 35–46 (2017). Questo studio è un potente esempio dell'approccio analitico qui delineato. Gli autori usano la filogenetica e lo studio sperimentale per descrivere i percorsi evolutivi attraverso i quali i ceppi di OPV diventano patogeni e propongono un quadro per la progettazione del vaccino.

Rossi, S.L., Ebel, G.D., Shan, C., Shi, P.-Y. & Vasilakis, N. Il virus Zika è mutato causando gravi epidemie? Tendenze Microbiolo. https://doi.org/10.1016/j.tim.2018.05.007 (2018).

Alizon, S. & Lion, S. Cooperazione parassitaria all'interno dell'ospite ed evoluzione della virulenza. Proc. Biol. Sci. 278, 3738–3747 (2011).

Kerr, P.J. et al. Virus del mixoma e leporipoxvirus: un paradigma evolutivo. virus 7, 1029–1061 (2015).

Ebihara, H. et al. Determinanti molecolari della virulenza del virus Ebola nei topi. PLOS Pathog. 2, e73 (2006).

Jimenez-Guardeño, J. M. et al. Il motivo di legame PDZ della proteina dell'involucro del coronavirus della sindrome respiratoria acuta grave è un determinante della patogenesi virale. PLOS Pathog. 10, e1004320 (2014).

Kataoka, C. et al. Il ruolo del residuo amminoacidico VP1 145 dell'enterovirus 71 nell'idoneità e nella patogenesi virale in un modello di scimmia cynomolgus. PLOS Pathog. 11, e1005033 (2015).

Song, H., Santi, N., Evensen, O. & Vakharia, V. N. Determinanti molecolari della virulenza del virus della necrosi pancreatica infettiva e dell'adattamento della coltura cellulare. J. Virol. 79, 10289–10299 (2005).

Uraki, R. et al. Determinanti della virulenza del virus dell'influenza pandemica A(H1N1)2009 in un modello murino. J. Virol. 87, 2226–2233 (2013).

Liu, J. et al. Gli isolati di campo di ingegneria inversa del virus del mixoma dimostrano che alcune interruzioni del gene o perdita di funzione non spiegano i cambiamenti di virulenza osservati nel campo. J. Virol. 91, e01289-17 (2017).

Oh, D. Y. & Hurt, A. C. Utilizzo di furetti come modello animale per studiare l'efficacia antivirale dell'influenza. Davanti. Microbiolo. 7, 80 (2016).

Dudas, G. et al. I genomi dei virus rivelano i fattori che hanno diffuso e sostenuto l'epidemia di Ebola. Natura 544, 309–315 (2017).

Faria, N.R. et al. Stabilimento epidemico e trasmissione criptica del virus Zika in Brasile e nelle Americhe. Natura 546, 406–410 (2017).

Holmes, E. C., Dudas, G., Rambaut, A. & Andersen, K. G. L'evoluzione del virus Ebola: approfondimenti dall'epidemia 2013-2016. Natura 358, 193–200 (2016).

Hadfield, J. et al. Nextstrain: monitoraggio in tempo reale dell'evoluzione dei patogeni. Bioinformatica https://doi.org/10.1093/bioinformatics/bty407 (2018).

Lässig, M. & Łuksza, M. Possiamo leggere il futuro da un albero? eLife 3, e05060 (2014).

Neher, R. A., Russell, C. A. & Shraiman, B. I. Predire l'evoluzione dalla forma degli alberi genealogici. eLife 3, e03568 (2014).

Longdon, B. et al. Le cause e le conseguenze dei cambiamenti nella virulenza a seguito dei cambiamenti dell'ospite patogeno. PLOS Pathog. 11, e1004728 (2015). Questo studio combina la trasmissione sperimentale tra specie e la filogenetica per rivelare la natura dell'evoluzione della virulenza in un virus della Drosophila. I risultati mostrano che i livelli di virulenza erano prevedibili dalla filogenesi dell'ospite.

Walter, S. et al. Modelli di infezione differenziali e recenti origini evolutive degli epacivirus equini negli asini. J. Virol. 91, e01711–e01716 (2016).

Leroy, E. M. et al. I pipistrelli della frutta come serbatoi del virus Ebola. Natura 438, 575–566 (2005).

Allocati, N. et al. Trasmissione della malattia dell'uomo pipistrello: patogeni zoonotici dai serbatoi della fauna selvatica alle popolazioni umane. Morte cellulare Dis. 2, 16048 (2016).

Truyen, U., Evermann, J. F., Vieler, E. & Parrish, C. R. L'evoluzione del parvovirus canino ha comportato la perdita e il guadagno della gamma di ospiti felini. Virologia 215, 186–189 (1996).

Allison, A.B. et al. L'evoluzione del parvovirus ospite-specifico in natura è ricapitolata dall'adattamento in vitro a diverse specie di carnivori. PLOS Pathog. 10, e1004475 (2014).

Geoghegan, J. L., Senior, A. M., Di Giallonardo, F. & Holmes, E. C. Fattori virologici che aumentano la trasmissibilità dei virus umani emergenti. Proc. Natl Acad. Sci. Stati Uniti d'America 113, 4170–4175 (2016).

Anderson, R. M. & May, R. M. Coevoluzione di ospiti e parassiti. Parassitologia 85, 411–426 (1982).

Bull, J.J. Virulence. Evoluzione 48, 1423–1437 (1994).

Ebert, D. in Evoluzione in salute e malattia (a cura di Stearns, S. C.) 161-172 (Oxford Univ. Press, Oxford, 1999).

Ebert, D. & Bull, J. J. Sfidare il modello di compromesso per l'evoluzione della virulenza: la gestione della virulenza è fattibile? Tendenze Microbiolo. 11, 15–20 (2003).

Ewald, P.W. Evoluzione delle malattie infettive. (Oxford Univ. Press, Oxford, 1994).

Leggi, A. F. L'evoluzione della virulenza. Tendenze Microbiolo. 2, 73–76 (1994).

Furio, V. et al. Relazione tra fitness all'interno dell'ospite e virulenza nel virus della stomatite vescicolare: correlazione con disaccoppiamento parziale. J. Virol. 86, 12228–12236 (2012).

Lion, S. & Metz, J. A. J. Oltre la massimizzazione R0: sull'evoluzione dei patogeni e le dimensioni ambientali. Tendenze Eco. Evol. 33, 458–473 (2018). Questo articolo sostiene che le attuali formulazioni di R 0 sono troppo semplicistici per comprendere l'evoluzione dei patogeni e che è necessario un approccio più complesso e multidimensionale.

Fraser, C., Hollingsworth, T. D., Chapman, R., de Wolf, F. & Hanage, W. P. Variazione della carica virale del punto di regolazione dell'HIV-1: analisi epidemiologica e ipotesi evolutiva. Proc. Natl Acad. Sci. Stati Uniti d'America 104, 17441–17446 (2007).

Alizon, S., Hurford, A., Mideo, N. & Van Baalen, M. L'evoluzione della virulenza e l'ipotesi del trade-off: storia, stato attuale delle cose e futuro. J. Evol. Biol. 22, 245–259 (2009). Questo articolo fornisce una panoramica della teoria secondo cui esiste un compromesso tra virulenza e trasmissibilità, evidenziando le aree in cui la teoria è stata contestata ed estesa negli ultimi 20 anni.

Alizon, S. e Michalakis, Y. Evoluzione adattiva della virulenza: il buon vecchio approccio basato sul fitness. Tendenze Eco. Evol. 30, 248–254 (2015).

Lipsitch, M. & Moxon, E. R. Virulenza e trasmissibilità dei patogeni: qual è la relazione? Tendenze Microbiol. 5, 31–37 (1997).

Novella, I. S., Elena, S. F., Moya, A., Domingo, E. & Holland, J. J. La dimensione dei colli di bottiglia genetici che portano alla perdita di fitness del virus è determinata dall'idoneità iniziale media della popolazione. J. Virol. 69, 2869–2872 (1995).

Betancourt, M., Escriu, F., Fraile, A. & García-Arenal, F. Evoluzione della virulenza di un virus vegetale generalista in un sistema ospite eterogeneo. Evol. Appl. 6, 875–890 (2013).

Di Giallonardo, F. & Holmes, E. C. Biocontrollo del virus: grandi esperimenti nell'emergenza e nell'evoluzione delle malattie. Tendenze Microbiolo. 23, 83–90 (2015).

Willemsen, A., Zwart, M. P. & Elena, S. F. L'elevata virulenza non impedisce necessariamente l'adattamento virale a un nuovo ospite: un caso di studio che utilizza un virus a RNA vegetale. BMC Evol. Biol 17, 25 (2017).

De Roode, J.C. et al. Virulenza e capacità competitiva nelle infezioni da malaria geneticamente diverse. Proc. Natl Acad. Sci. Stati Uniti d'America 102, 7624–7628 (2005).

Levin, B. R. & Bull, J. J. Evoluzione miope e virulenza dei microrganismi patogeni. Tendenze Microbiolo. 2, 76–81 (1994).

Lloyd-Smith, J. O. et al. Dinamiche epidemiche all'interfaccia uomo-animale. Scienza 326, 1362–1367 (2009).

Bergstrom, C. T., McElhany, P. & Real, L. A. Colli di bottiglia della trasmissione come determinanti della virulenza nei patogeni in rapida evoluzione. Proc. Natl Acad. Sci. Stati Uniti d'America 96, 5095–5100 (1999).

Bolker, B. M., Nanda, A. & Shah, D. Virulenza transitoria di patogeni emergenti. J.R. Soc. Interfaccia 7, 811–822 (2010).

Brown, S. P., Cornforth, D. M. & Mideo, N. Evoluzione della virulenza nei patogeni opportunisti: generalismo, plasticità e controllo. Tendenze Microbiol. 20, 336–342 (2012).

Dolan, P. T., Whitfield, Z. J. e Andino, R. Mappatura del potenziale evolutivo dei virus a RNA. Microbo ospite cellulare 23, 435–446 (2018). Questo articolo discute quali aspetti dell'evoluzione del virus potrebbero essere prevedibili, inclusa la virulenza, e come questo può essere testato e sottolinea l'importanza dell'evoluzione parallela come indicatore di adattamento.

Sackman, A.M. et al. Evoluzione parallela guidata dalla mutazione durante l'adattamento virale. Mol. Biol. Evol. 34, 3243–3253 (2017).

Stewart, C.-B., Schilling, J. W. e Wilson, A. C. Evoluzione convergente delle sequenze di lisozima? Natura 332, 788 (1988).

Frickel, J., Feulner, P. G. D., Karakoc, E. & Becks, L. I cambiamenti nelle dimensioni della popolazione e i modelli di selezione guidano l'evoluzione parallela in un sistema host-virus. Naz. Comune 9, 1706 (2018).

Brault, A.C. et al. Una singola mutazione virale del Nilo occidentale selezionata positivamente conferisce una maggiore virogenesi aviaria nei corvi americani. Naz. Genet. 39, 1162–1166 (2007). Questo studio dimostra che la selezione positiva su una singola sostituzione amminoacidica all'interno del genoma di WNV era responsabile dell'aumento della virulenza nel corvo americano.

Longdon, B. et al. Gli spostamenti dell'ospite provocano cambiamenti genetici paralleli quando i virus si evolvono in specie strettamente correlate. PLOS Pathog. 14, e1006951 (2018).

Weaver, S. et al. Datamonkey 2.0: una moderna applicazione web per caratterizzare processi selettivi e altri processi evolutivi. Mol. Biol. Evol. 35, 773–777 (2018).

Kryazhimskiy, S. & Plotkin, J. B. La genetica della popolazione di dN/dS. PLOS Genet. 4, e1000304 (2008).

Pybus, O.G. et al. Prove filogenetiche per il carico di mutazioni deleterie nei virus a RNA e il loro contributo all'evoluzione virale. Mol. Biol. Evol. 24, 845–852 (2007).

Bhatt, S., Holmes, E. C. e Pybus, O. G. Il tasso genomico di adattamento molecolare del virus dell'influenza umana A. Mol. Biol. Evol. 28, 2443–2451 (2011).

Geoghegan, J. L., Senior, A. M. & Holmes, E. C. Colli di bottiglia della popolazione di agenti patogeni e paesaggi adattivi: superare le barriere all'emergenza della malattia. Proc. Biol. Sci. 283, 1837 (2016).

Morley, V. J. & Turner, P. E. La dinamica dell'evoluzione molecolare nelle popolazioni di virus a RNA dipende da un cambiamento ambientale improvviso o graduale. Evoluzione 71, 872–883 (2017).

Taubenberger, J.K. et al. Caratterizzazione dei geni della polimerasi del virus dell'influenza del 1918. Natura 437, 889–893 (2005).

Sawyer, S. L., Emerman, M. & Malik, H. S. Antica evoluzione adattativa dell'enzima antivirale di modifica del DNA dei primati APOBEC3G. PLOS Biol. 2, e275 (2004).

Sawyer, S. L., Wu, L. I., Emerman, M. & Malik, H. S. La selezione positiva del primate TRIM5alpha identifica un dominio di restrizione retrovirale specifico per specie critica. Proc. Natl Acad. Sci. Stati Uniti d'America 102, 2832–2837 (2005).

Bedhomme, S., Hillung, J. & Elena, S. F. Virus emergenti: perché non sono tuttofare? Curr. opinare. Virolo. 10, 1–6 (2015).

Urbanowicz, R.A. et al. Adattamento umano del virus Ebola durante l'epidemia dell'Africa occidentale. Cellula 167, 1079–1087 (2016).

Simon-Loriere, E. & Holmes, E. C. Perché i virus a RNA si ricombinano? Naz. Rev. Microbiol. 9, 617–626 (2011).

Di Giallonardo, F. et al. Dinamica spaziale fluida del virus del Nilo occidentale negli Stati Uniti: rapida diffusione in un ambiente ospite permissivo. J. Virol. 90, 862–872 (2016).

LaDeau, S. L., Kilpatrick, A. M. & Marra, P. P. Emergenza del virus del Nilo occidentale e declino su larga scala delle popolazioni di uccelli nordamericani. Natura 447, 710–713 (2007).

Kilpatrick, A. M. Globalizzazione, uso del suolo e invasione del virus del Nilo occidentale. Scienza 334, 323–327 (2011).

Guan, Y. et al. Influenza H5N1: una minaccia pandemica proteiforme. Proc. Natl Acad. Sci. Stati Uniti d'America 101, 8156–8161 (2004).

Webby, R. J. & Webster, R. G. Siamo pronti per l'influenza pandemica? Scienza 302, 1519–1522 (2003).

Lam, T.T.-Y. et al. Diffusione, divergenza e insediamento dei virus influenzali H7N9 in Cina. Natura 522, 102–105 (2015).

Yang, L. et al. Genesi e diffusione di virus aviari H7N9 altamente patogeni recentemente emersi nella Cina continentale. J. Virol. 91, e01277–e01217 (2017).

Qi, W. et al. Emersione e adattamento di un nuovo virus dell'influenza H7N9 altamente patogeno negli uccelli e nell'uomo da un antenato a bassa patogenicità infettante per l'uomo del 2013. J. Virol. 92, e00921–17 (2018).

Lipsitch, M. et al. Fattori virali nella valutazione del rischio di pandemia influenzale. eLife 5, e18491 (2016).

Baigent, S. J. & McCauley, J. W. Influenza di tipo A nell'uomo, nei mammiferi e negli uccelli: determinanti della virulenza del virus, trasmissione dell'ospite e interspecie. Biosaggi 25, 657–671 (2003).

Horimoto, T. & Kawaoka, Y. Influenza: lezioni dalle pandemie passate, avvertimenti da incidenti attuali. Naz. Rev. Microbiol. 3, 591–600 (2005).

Monne, I. et al. Emersione di un virus dell'influenza aviaria altamente patogeno da un progenitore a bassa patogenicità. J. Virol. 88, 4375–4388 (2014).

Russell, C.A. et al. Il potenziale per l'evoluzione del virus dell'influenza A/H5N1 trasmissibile per goccioline respiratorie in un mammifero ospite. Scienza 336, 1541–1547 (2012).

Hatta, M., Gao, P., Halfmann, P. e Kawaoka, Y. Base molecolare per l'elevata virulenza dei virus dell'influenza A H5N1 di Hong Kong. Scienza 293, 1840–1842 (2001).

Pearce, M.B. et al. Maggiore virulenza dei virus dell'influenza aviaria A H5N1 altamente patogeni del clade 2.3.2.1 nei furetti. Virologia 502, 114–122 (2017).

Nogales, A., Martinez-Sobrido, L., Topham, D. J. & DeDiego, M. L. NS1 proteine ​​aminoacidi cambia D189N e V194I influenzano le risposte all'interferone, la termosensibilità e la virulenza dei virus dell'influenza umana H3N2 circolanti. J.Virol. 91, e01930–16 (2017).

Jackson, D., Hossain, M. J., Hickman, D., Perez, D. R. & Lamb, R. A. Un nuovo determinante della virulenza del virus dell'influenza: i quattro residui C-terminali della proteina NS1 modulano la patogenicità. Proc. Natl Acad. Sci. Stati Uniti d'America 105, 4381–4386 (2008).

Kash, J.C. et al. Analisi genomica dell'aumento delle risposte immunitarie e di morte cellulare dell'ospite indotte dal virus dell'influenza del 1918. Natura 443, 578–581 (2006). Questo articolo presenta uno studio completo sulla virulenza del virus dell'influenza del 1918 in un modello murino, rivelando l'importanza delle interazioni virus-ospite che coinvolgono un ampio set di geni virali interagenti.

Bae, J.-Y. et al. Un singolo amminoacido nella proteina acida della polimerasi determina la patogenicità dei virus dell'influenza B. J. Virol. 92, e00259–e00218 (2018).

Fenner, F. Controllo biologico come esemplificato dall'eradicazione del vaiolo e dalla mixomatosi. Proc. R. Soc. B. 218, 259–285 (1983).

Fenner, F. & Marshall, I. D. Un confronto della virulenza per i conigli europei (Oryctolagus cuniculus) di ceppi di virus mixoma recuperati sul campo in Australia, Europa e America. J. Hyg. 55, 149–191 (1957).

Fenner, F. & Ratcliffe, F.N. mixomatosi (Cambridge Univ. Press, Cambridge, 1965).

Kerr, P.J. et al. Storia evolutiva e attenuazione del virus del mixoma in due continenti. PLOS Pathog. 8, e1002950 (2012). Questo articolo presenta la prima analisi filogenomica su larga scala di MYXV e mostra che, nonostante l'evoluzione parallela a livello fenotipico (cioè di grado di virulenza), diverse mutazioni virali erano responsabili dell'evoluzione della virulenza sia in Australia che in Europa.

Kerr, P.J. et al. L'evoluzione su scala genomica del virus mixoma (MYXV) rivela l'adattamento ospite-patogeno e la rapida diffusione geografica. J. Virol. 87, 12900–12915 (2013).

Elena, S. F., Carrasco, P., Daròs, J. A. e Sanjuán, R. Meccanismi di robustezza genetica nei virus a RNA. EMBO Rep. 7, 168–173 (2006).

Gandon, S., Mackinnon, M.J., Nee, S. & Read, A.F. Vaccini imperfetti e l'evoluzione della virulenza del patogeno. Natura 414, 751–756 (2001).

Smith, T. Vaccini imperfetti e modelli imperfetti. Tendenze Eco. Evol. 17, 154–156 (2002).

Leggi, A.F. et al. La vaccinazione imperfetta può aumentare la trasmissione di agenti patogeni altamente virulenti. PLOS Biol. 13, e1002198 (2015). Questo documento presenta una chiara dimostrazione che la vaccinazione imperfetta era responsabile di una maggiore virulenza nel caso dell'MDV dei polli e considera le implicazioni evolutive della vaccinazione imperfetta in generale.

Kamil, J.P. et al. vLIP, un omologo della lipasi virale, è un fattore di virulenza del virus della malattia di Marek. J. Virol. 79, 6984–6996 (2005).

Trimpert, J. et al. Un'analisi filogenomica del virus della malattia di Marek rivela percorsi indipendenti verso la virulenza in Eurasia e Nord America. Evol. Appl. 10, 1091–1101 (2017).

Mackinnon, M. J. & Read, A. F. Immunity promuove l'evoluzione della virulenza in un modello di malaria. PLOS Biol. 2, e230 (2004).

Carre, N. et al. Il tasso di progressione verso l'AIDS è cambiato negli ultimi anni? Aids 11, 1611–1618 (1997).

Fraser, C. et al. Virulenza e patogenesi dell'infezione da HIV-1: una prospettiva evolutiva. Scienza 343, 1243727 (2014). Questo studio chiave sull'evoluzione della virulenza dell'HIV si concentra sui fattori che determinano l'SPVL e mostra l'importanza dei tratti genetici del virus nel plasmare l'SPVL e quindi la gravità della malattia.

Galai, N. et al. Andamento temporale della conta iniziale delle cellule CD4 dopo la sieroconversione del virus dell'immunodeficienza umana in Italia, 1985-1992. Lo studio italiano di sieroconversione da virus dell'immunodeficienza umana. Sono. J. Epidemiol. 143, 278–282 (1996).

Herbeck, J.T. et al. La virulenza dell'HIV sta cambiando? Una meta-analisi delle tendenze nei marcatori prognostici della progressione e della trasmissione della malattia da HIV. Aids 26, 193–205 (2012).

Vanhems, P., Lambert, J., Guerra, M., Hirschel, B. & Allard, R. Associazione tra il tasso di diminuzione delle cellule CD4 + T e l'anno della sieroconversione del virus dell'immunodeficienza umana (HIV) di tipo 1 tra le persone arruolate nello studio di coorte svizzero sull'HIV. J. Infettare. Dis. 180, 1803–1808 (1999).

Arien, K.K., Vanham, G. & Arts, E.J.L'HIV-1 si sta evolvendo in una forma meno virulenta negli esseri umani? Naz. Rev. Microbiol. 5, 141–151 (2007).

Claiborne, D.T. et al. L'idoneità replicativa dell'HIV-1 trasmesso guida l'attivazione immunitaria acuta, il carico provirale nelle cellule CD4 + T di memoria e la progressione della malattia. Proc. Natl Acad. Sci. Stati Uniti d'America 112, E1480–E1489 (2015).

Miura, T. et al. Ridotta capacità di replicazione dei virus acuti/precoci nelle persone che diventano controllori dell'HIV. J. Virol. 84, 7581–7591 (2010).

Blanquart, F. et al. La variazione genetica virale rappresenta un terzo della variabilità della carica virale predefinita dell'HIV-1 in Europa. PLOS Biol. 15, e2001855 (2017).

Fellay, J. et al. Variazione genetica comune e controllo dell'HIV-1 nell'uomo. PLOS Genet. 5, e1000791 (2009).

Alizon, S. et al. L'approccio filogenetico rivela che il genotipo del virus determina in gran parte la carica virale predefinita dell'HIV. PLOS Pathog. 6, e1001123 (2010).

Blanquart, F. et al. Un compromesso evolutivo trasmissione-virulenza spiega l'attenuazione dell'HIV-1 in Uganda. eLife 5, e20492 (2016).

Sofonea, M. T., Aldakak, L., Boullosa, L. F. V. V. e Alizon, S. Il virus Ebola può evolversi per essere meno virulento negli esseri umani? J. Evol. Biol. 31, 382–392 (2018).

Diehl, W.E. et al. La glicoproteina del virus Ebola con maggiore infettività ha dominato l'epidemia del 2013-2016. Cellula 167, 1088–1098 (2016). Questo studio utilizza una combinazione di filogenetica e studio sperimentale per dimostrare l'importanza della sostituzione di A82V nella glicoproteina EBOV per l'infettività virale e suggerisce che A82V ha aumentato la virulenza del virus.

Ng, M. et al. Il recettore del filovirus NPC1 contribuisce ai modelli specie-specifici di suscettibilità all'ebolavirus nei pipistrelli. eLife 4, e11785 (2015).

Marzi, A. et al. Le mutazioni recentemente identificate nel genoma del virus Ebola-Makona non alterano la patogenicità nei modelli animali. Rappresentante cellulare 23, 1806–1816 (2018).

Chan, J. F., Choi, G. K., Yip, C. C., Cheng, V. C. e Yuen, K. Y. Febbre di Zika e sindrome congenita di Zika: una malattia arbovirale emergente inaspettata. J. Infettare. 72, 507–524 (2016).

Cao-Lormeau, V. M. et al. Focolaio di sindrome di Guillain-Barré associato all'infezione da virus Zika nella Polinesia francese: uno studio caso-controllo. Lancetta 387, 1531–1539 (2016).

Fauci, A.S. & Morens, D.M. Zika virus nelle Americhe: un'altra minaccia di arbovirus. N. inglese J. Med. 374, 601–604 (2016).

Simonin, Y., van Riel, D., Van de Perre, P., Rockx, B. & Salinas, S. Differenziale virulenza tra i lignaggi asiatici e africani del virus Zika. PLOS Negl. Troppo. Dis. 11, e0005821 (2017).

Grubaugh, N. D., Faria, N. R., Andersen, K. G. e Pybus, O. G. Approfondimenti genomici sull'emergenza e la diffusione del virus Zika. Cellula 172, 1160–1162 (2018).

Liu, Y. et al. Miglioramento evolutivo dell'infettività del virus Zika nelle zanzare Aedes aegypti. Natura 545, 482–486 (2017). I risultati di questo studio suggeriscono che una mutazione nella proteina NS1 in ZIKV associata al recente focolaio nelle Americhe causa un aumento dell'infettività in Aedes aegypti zanzare, aumentando a sua volta il potenziale epidemico.

Yuan, L. et al. Una singola mutazione nella proteina prM del virus Zika contribuisce alla microcefalia fetale. Scienza 358, 933–936 (2017).

Rosenfeld, A. B., Doobin, D. J., Warren, A. L., Racaniello, V. R. e amp Vallee, R. B. Replicazione di isolati di virus Zika precoci e recenti durante lo sviluppo del cervello di topo. Proc. Natl Acad. Sci. Stati Uniti d'America 114, 12273–12278 (2017).

Firth, C. & Lipkin, W. I. La genomica dei patogeni emergenti. Annu. Rev. Genom. Ronzio. Genet. 14, 281–300 (2013).

Gardy, J. L. & Loman, N. J. Verso un sistema di sorveglianza globale dei patogeni informato sulla genomica, in tempo reale. Naz. Rev. Genet. 19, 9–20 (2018).

Shi, M., Zhang, Y.-Z. & Holmes, E. C. Meta-trascrittomica e biologia evolutiva dei virus a RNA. Ris. virus 243, 83–90 (2018).

Geoghegan, J. L. & Holmes, E. C. Predire l'emergenza del virus in mezzo al rumore evolutivo. Apri Biol. 7, 170189 (2017).

Lighten, J. & van Oosterhout, C. Il biocontrollo della carpa comune in Australia comporta rischi per la biosicurezza. Naz. Eco. Evol. 1, 87 (2017).

Marshall, J. et al. Biocontrollo della carpa invasiva: i rischi abbondano. Scienza 359, 877 (2018).

McColl, K. A., Sheppard, A. W. & Barwick, M. Biocontrollo sicuro ed efficace della carpa comune. Naz. Eco. Evol. 1, 134 (2017).

McColl, K. A., Sunarto, A. & Holmes, E. C. Cyprinid herpesvirus 3 e il suo futuro evolutivo come agente di controllo biologico per le carpe in Australia. Virolo. J. 13, 206 (2016).

Andre, J. B. & Hochberg, M. E. Evoluzione della virulenza nelle malattie infettive emergenti. Evoluzione 59, 1406–1412 (2005).

Chahroudi, A., Bosinger, S. E., Vanderford, T. H., Paiardini, M. & Silvestri, G. Natural SIV host: Show AIDS the door. Scienza 335, 1188–1193 (2012).

Silvestri, G., Paiardini, M., Pandrea, I., Lederman, M. M. e Sodora, D. L. Comprendere la natura benigna dell'infezione da SIV negli ospiti naturali. J.Clin. Investire. 117, 3148–3154 (2007).

Keele, B.F. et al. Aumento della mortalità e immunopatologia simile all'AIDS negli scimpanzé selvatici infettati da SIVcpz. Natura 460, 515–519 (2009). I risultati di questo studio suggeriscono che il virus dell'immunodeficienza delle scimmie negli scimpanzé, che è l'antenato dell'HIV, aumenta la mortalità in questi animali, sebbene con una malattia meno evidente che nell'uomo.

Crawford, P.C. et al. Trasmissione del virus dell'influenza equina ai cani. Scienza 310, 482–485 (2005).

Parrish, C. R., Murcia, P. R. e Holmes, E. C. Serbatoi di virus dell'influenza e ospiti intermedi: cani, cavalli e nuove possibilità per l'esposizione al virus dell'influenza degli esseri umani. J. Virol. 89, 2990–2994 (2015).

Feng, K.H. et al. Virus dell'influenza equina e canina I virus H3N8 mostrano differenze biologiche minime nonostante la divergenza filogenetica. J. Virol. 89, 6860–6873 (2015).

Bourhy, H., Dautry-Varsat, A., Hotez, P. J. & Salomon, J. Rabies, ancora trascurato dopo 125 anni di vaccinazione. PLOS Negl Trop. Dis. 4, e839 (2010).

Garver, K. A., Batts, W. N. e Kurath, G. Confronti di virulenza dei genogruppi U e M del virus della necrosi ematopoietica infettiva nello slamon rosso e nella trota iridea. J. Acquat. Anim. Salute 18, 232–243 (2006).

Penaranda, M. M., Purcell, M. K. e Kurath, G. I meccanismi di virulenza differenziale del virus della necrosi ematopoietica infettiva nella trota iridea (Oncorhynchus mykiss) includono l'ingresso dell'ospite e la cinetica di replicazione del virus. gen. J. Virol. 90, 2172–2182 (2009).

Kerr, P.J. et al. L'evoluzione del virus mixoma: la caratterizzazione genomica e fenotipica degli isolati dalla Gran Bretagna rivela molteplici percorsi evolutivi di successo distinti da quelli australiani. PLOS Pathog. 13, e1006252 (2017).

Kerr, P.J. et al. Il prossimo passo nella corsa agli armamenti in corso tra il virus del mixoma e i conigli selvatici in Australia è un nuovo fenotipo della malattia. Proc. Natl Acad. Sci. Stati Uniti d'America 114, 9397–9402 (2017).

Jiao, P. et al. Una sostituzione di un singolo aminoacido nella proteina NS1 modifica la patogenicità dei virus dell'influenza aviaria H5N1 nei topi. J. Virol. 82, 1146–1154 (2008).

Cotter, C. R., Jin, H. e Chen, Z. Un singolo amminoacido nella regione del gambo della proteina HA del virus dell'influenza H1N1pdm influenza la fusione virale, la stabilità e l'infettività. PLOS Pathog. 10, e1003831 (2014).

Gromowski, G. D., Firestone, C. Y. e Whitehead, S. S. Determinanti genetici del ceppo vaccinale del virus dell'encefalite giapponese SA14-14-2 che regolano l'attenuazione della virulenza nei topi. J. Virol. 89, 6328–6337 (2015).

Lui, W. et al. Effetto di una delezione di 88 aminoacidi in nsp2 del virus della sindrome riproduttiva e respiratoria dei suini sulla replicazione del virus e sulle risposte delle citochine in vitro. Arco. Virolo. 163, 1489–1501 (2018).

Yu, X. et al. Il residuo glutammico in posizione 402 nel C-terminale della nucleoproteina del virus della malattia di Newcastle è fondamentale per il virus. Sci. Rappresentante. 7, 17471 (2017).

Panzarina, V. et al. Il basso tasso evolutivo del virus della necrosi pancreatica infettiva (IPNV) in Italia è associato a una ridotta virulenza nelle trote. Virus Evol. 4, vey019 (2018).

Dietzschold, B. et al. Caratterizzazione di un determinante antigenico della glicoproteina correlato alla patogenicità del virus della rabbia. Proc. Natl Acad. Sci. Stati Uniti d'America 80, 70–74 (1983).

Blanie, S., Mortier, J., Delverdier, M., Bertagnoli, S. e Camus-Bouclainville, C. M148R e M149R sono due fattori di virulenza per la patogenesi del virus mixoma nel coniglio europeo. Veterinario. Ris. 40, 11 (2009).

Bauer, P.H. et al. Analisi genetica e strutturale di un determinante di virulenza in polyomavirus VP1. J. Virol. 69, 7925–7931 (1995).

Balinsky, C.A. et al. Il gene simile al kelch del virus Sheepox SPPV-019 influenza la virulenza del virus. J. Virol. 81, 11392–11401 (2007).


Materiali e metodi

Stima dei livelli di espressione genica

Set di dati di sequenziamento dell'RNA utilizzati in questo studio

I livelli di espressione dei geni delle cellule Vero e degli ORF SARS-CoV-2 sono stati stimati dai dati di sequenziamento dell'RNA basati su nanoball delle cellule Vero infettate da SARS-CoV-2 BetaCoV/Corea/KCDC03/2020 (Kim et al. 2020). I livelli di espressione di MERS-CoV ORF sono stati stimati dai dati di sequenziamento dell'RNA di cellule epiteliali di adenocarcinoma polmonare umano (Calu-3) raccolte 6 ore dopo l'infezione da MERS-CoV HCoV-EMC/2012 (Zhang et al. 2020). I livelli di espressione di Virus dell'influenza A Gli ORF sono stati stimati dai dati di sequenziamento dell'RNA dell'epitelio polmonare umano primario (NHBE) infetto dal sottotipo H1N1 Virus dell'influenza A A/Porto Rico/8/1934 (Blanco-Melo et al. 2020). I livelli di espressione genica degli ORF del virus Ebola sono stati stimati dai dati di sequenziamento dell'RNA di cellule epatiche umane (Huh7) infettate dall'isolato Makona del virus Ebola (Albarino et al. 2018). I livelli di espressione di HERV ORF sono stati stimati dai dati di sequenziamento dell'RNA per le cellule mononucleate del sangue periferico umano di sei individui sani (Tokuyama et al. 2018).

Genomi di riferimento

Livelli di espressione in SARS-CoV-2 e MERS-CoV

Il livello di mRNA di un ORF di coronavirus non può essere stimato dall'abbondanza di letture mappate nei dati di sequenziamento dell'RNA a causa della natura annidata del genoma e dei sottogenomi (Kim et al. 2020). Tuttavia, tali sottogenomi nidificati sono stati prodotti dalla sintesi discontinua di RNA a filamento negativo (cioè, fusione leader-corpo), pertanto, l'abbondanza di un sottogenoma può essere stimata dal numero di letture della giunzione leader-corpo (fig. 2B ). Il motivo è brevemente descritto come segue. Esistono due tipi di sequenze di regolazione della trascrizione (TRS): TRS-L è a valle della sequenza leader e i TRS del corpo (TRS-B) sono a monte delle singole ORF. Durante la sintesi dell'RNA a filamento negativo, il TRS-B a filamento negativo può ibridarsi con il TRS-L nell'RNA genomico a senso positivo e la sintesi continua utilizzando la sequenza leader come stampo, risultando in un leader-to -giunzione del corpo. Per ogni sottogenoma, viene tradotto solo l'ORF più a monte (5′-) (quando non è presa in considerazione la scansione leaky dei codoni di inizio). Pertanto, il livello di mRNA di un ORF in un sottogenoma può essere dedotto dal numero di letture contenenti leader. ORF1ab viene tradotto dall'RNA genomico. Pertanto, sebbene non vi sia alcuna giunzione leader-corpo, le letture contenenti leader possono ancora essere utilizzate per stimare il suo livello di mRNA.

Le letture del sequenziamento dell'RNA delle linee cellulari infette da coronavirus sono state allineate ai riferimenti con STAR 2.7.3a (Dobin et al. 2013) utilizzando i parametri come segue: --outFilterTypeBySJout --outFilterMultimapNmax 20 --align SJoverhangMin 8 --outSJfilterOverhangMin 12 12 12 12 --outSJfilterCountUniqueMin 1 1 1 1 --outSJfilterCount TotalMin 1 1 1 1 --outSJfilterDistToOtherSJmin 0 0 0 0 --outFilterMismatchNmax 999 --outFilterMismatchNover ReadLmax 0.04 --scoreGapNoncan -4 --scoreGapATAC -4 --BchimClipATAC Entro chimScoreJunction NonGTAG 0 --alignSJstitchMismatchNmax -1 -1 -1 -1 --alignIntronMin 20 --alignIntronMax 1000000 --alignMates GapMax 1000000.

Il TRS-L di SARS-CoV-2 è il 70°�° nucleotidi nel suo genoma e quello di MERS-CoV è il 62°�° nucleotidi. Pertanto, sono state contate solo le letture con il sito di giunzione 5′ situato tra il 55° e l'85° nucleotidi del genoma SARS-Cov-2 (o tra il 45° e l'80° nucleotidi del genoma MERS-CoV) poiché rappresentavano i sottogenomi generati da fusioni canoniche leader-corpo. Una lettura di giunzione leader-corpo è stata assegnata al sottogenoma secondo la sequenza ORF immediatamente a valle del suo sito di giunzione 3′ una lettura di giunzione leader-corpo verrà scartata se il suo sito di giunzione 3′ è oltre 50 nucleotidi a monte del codone di inizio di qualsiasi ORF. Il livello di mRNA di ORF1ab è stato calcolato dal numero di letture contenenti leader allineate all'RNA del genoma senza interruzioni. ORF10 in SARS-CoV-2 è stato escluso in questo studio perché non ha un TRS-B, né è stato rilevato il suo sottogenoma (Kim et al. 2020). Zhang et al. (2020) hanno fornito tre set di dati RNA-seq replicati per cellule Calu-3 infettate da MERS-CoV. Considerando che i ranghi del livello di mRNA tra gli ORF erano coerenti nei tre replicati, in questo studio è stato utilizzato il replicato n.

Livelli di espressione in Virus dell'influenza A e il virus Ebola

Il livello di espressione di un ORF è stato stimato dall'abbondanza di letture di sequenziamento mappate ad esso. I dati di sequenziamento dell'RNA sono stati allineati ai riferimenti corrispondenti con STAR utilizzando parametri predefiniti. Il livello di espressione di un ORF è stato fornito da RSEM (Li e Dewey 2011). Vale la pena notare che il Virus dell'influenza A sottotipo H1N1 ceppo utilizzato per stimare il livello di espressione (A/Porto Rico/8/1934) non è direttamente correlato alle varianti del virus utilizzate per stimare il tasso evolutivo, i virus della pandemia del 2009. Tuttavia, abbiamo ipotizzato che i livelli di espressione relativa di ORF improbabile cambiassero drasticamente tra Variante del virus dell'influenza As come un equilibrio stechiometrico tra le proteine ​​virali deve essere ampiamente mantenuto per garantire il corretto confezionamento della particella virale. Albarino et al. (2018) hanno fornito tre set di dati RNA-seq in diversi momenti dopo che le cellule Huh7 sono state infettate da virus Ebola, il livello di espressione medio in tre momenti è stato utilizzato per ogni ORF.

Livelli di espressione in virus vaccinico e citomegalovirus umano

I livelli di espressione di virus vaccinico Gli ORF sono stati recuperati dai dati dell'array di piastrellatura del genoma di virus vaccinico-cellule HeLa infettate (Assarsson et al. 2008) la maggior parte degli ORF virali aveva iniziato la trascrizione a 4 ore dopo l'infezione e, pertanto, i livelli di espressione in questo momento sono stati utilizzati per ulteriori analisi. I livelli di espressione degli ORF del citomegalovirus umano sono stati recuperati da uno studio precedente che ha eseguito esperimenti di sequenziamento dell'RNA su cellule staminali ematopoietiche CD34+ infettate da citomegalovirus umano (Cheng et al. 2017). In questo studio sono stati utilizzati i dati di sequenziamento dell'RNA delle cellule raccolte 2 giorni dopo l'infezione, quando gli ORF virali sono stati trascritti più attivamente.

Livelli di espressione nel virus parainfluenzale umano di tipo 3, virus respiratorio sinciziale umano, virus del morbillo e virus della parotite

Il livello di espressione di un ORF è stato ricavato dalle densità di banda dai gel di elettroforesi stimate in studi precedenti (Cattaneo et al. 1987 De et al. 1990 Barik 1992 Takeuchi et al. 1993 Pagán et al. 2012).

La stima dei livelli di espressione per le ORF sovrapposte

Alcuni ORF virali si sovrappongono tra loro e le loro proteine ​​codificate vengono tradotte con vari meccanismi come la scansione che perde, il frameshifting ribosomiale e l'editing dell'RNA. Sono stati considerati tre scenari quando abbiamo stimato il livello di espressione di ORF sovrapposti. Innanzitutto, gli ORF sovrapposti condividono lo stesso codone di inizio (ad es. ORF1a/ORF1ab nella SARS-CoV-2). In secondo luogo, gli ORF sovrapposti vengono tradotti in frame diversi a causa della scansione che perde (ad es. ORF3a/ORF3b nella SARS-CoV-2). In entrambi gli scenari, abbiamo assegnato il livello di mRNA stimato all'ORF più lungo (ad es. ORF1ab o ORF3a) per semplicità anche il tasso evolutivo è stato stimato da questo ORF. Nel terzo scenario, ad esempio P/V/C nel virus del morbillo e nel virus della parainfluenza umana di tipo 3, ci sono ORF sovrapposte che condividono lo stesso codone di inizio (P e V) e ORF sovrapposte in diversi frame di traduzione (C e P). ) nella stessa regione genomica abbiamo diviso il livello totale di mRNA stimato in ORF individuali in base all'abbondanza di proteine ​​relativa riportata (ViralZone, https://viralzone.expasy.org/857, recuperato il 18 giugno 2020).

Livelli di espressione dei geni scimmia e umani

I dati di sequenziamento dell'RNA delle cellule Vero infette da SARS-CoV-2 sono stati allineati al genoma di C. sabaeus con STAR utilizzando i parametri di default. Allo stesso modo, i dati di sequenziamento dell'RNA per le cellule mononucleate del sangue periferico umano sono stati allineati al genoma umano con STAR utilizzando parametri predefiniti. Ogni lettura è stata assegnata al suo gene allineato sotto il parametro --quantMode TranscriptomeSAM. Considerando che possono esistere più isoforme di splicing per un gene, è stata stimata l'abbondanza di ciascuna isoforma e l'abbondanza totale di tutte le isoforme di un gene è stata utilizzata come livello di espressione.

Livelli di espressione di HERV ORF

I dati di sequenziamento dell'RNA per le cellule mononucleate del sangue periferico umano sono stati allineati al genoma umano con STAR utilizzando i parametri come segue: --outSAMtype BAM SortedByCoordinate --outFilterMultimapNmax 30. Il file di annotazione degli HERV ORF è stato scaricato da gEVE il 5 agosto 2020 ( database di elementi virali endogeni basati sul genoma, http://geve.med.u-tokai.ac.jp) (Nakagawa e Takahashi 2016). Notato che alcuni HERV ORF sono stati annotati come più regioni troncate. Per ciascuna regione ORF o ORF annotata, il livello di espressione è stato definito come il rapporto tra il numero di letture allineate, stimato con Telescope 1.0.3 (Bendall et al. 2019) con i parametri predefiniti, e la lunghezza della regione ORF o ORF . Poiché le regioni annotate della stessa ORF HERV possono avere diversi livelli di espressione stimati, abbiamo utilizzato il livello di espressione medio di tutte le regioni ORF annotate espresse della stessa ORF per rappresentare il livello di espressione di questa ORF.

Livelli proteici in SARS-CoV-2

L'abbondanza di proteine ​​codificate dal genoma SARS-CoV-2 è stata stimata dal numero di corrispondenze dello spettro peptidico (PSM) di una proteina, normalizzato dal numero dei suoi peptidi teorici. Il numero di PSM è stato recuperato da una precedente analisi proteomica su cellule Vero infette da SARS-CoV-2 utilizzando la spettrometria di massa tandem (Davidson et al. 2020). I peptidi teorici delle proteine ​​digerite dalla tripsina sono stati generati in silico utilizzando lo script Python interno, in cui il numero massimo di arginina o lisina mancanti durante la digestione è stato fissato a 2. È stato contato solo il peptide con una lunghezza compresa tra 7 e 140 amminoacidi . Le abbondanze proteiche stimate dei nove ORF di SARS-CoV-2 erano altamente correlate con le corrispondenti abbondanze di mRNA (r =0.99, P =6 ×� 𢄧 , Tavola di correlazione di Pearson 1 ).

Stima dei tassi di evoluzione delle proteine

Recupero della sequenza genomica delle varianti virali

Sequenze genomiche complete di varianti di SARS-CoV-2 e Virus dell'influenza A sono stati scaricati da GISAID (Global Initiative on Sharing All Influenza Data, https://www.gisaid.org/) (Shu e McCauley 2017) quelli di MERS-CoV, virus Ebola, virus morbillo, virus della parotite, virus della parainfluenza umana di tipo 3 , virus respiratorio sinciziale umano, virus vaccinico, e il citomegalovirus umano sono stati scaricati da NCBI Virus (https://www.ncbi.nlm.nih.gov/labs/virus/vssi/) (Hatcher et al. 2017). In particolare, per SARS-CoV-2, il 12 maggio 2020 sono state scaricate 13.556 sequenze genomiche ad alta copertura. Sequenze genomiche isolate da pipistrello, pangolino, tigre o visone e quelle con oltre 50 basi non determinate durante il sequenziamento (etichettate come Ns nella sequenza del genoma) sono state filtrate e le 7.310 sequenze rimanenti sono state utilizzate per l'analisi a valle. Per MERS-CoV, sono state filtrate le sequenze genomiche con oltre 200 discrepanze di nucleotidi rispetto al genoma di riferimento e le 518 sequenze genomiche rimanenti (da ospiti umani e animali) sono state utilizzate per l'analisi a valle. Per il virus Ebola, sono state scaricate 287 sequenze genomiche raccolte in Sierra Leone e Guinea durante l'epidemia dell'Africa occidentale del 2013�. Per Virus dell'influenza A sottotipo H1N1, 1.839 sequenze genomiche raccolte durante la pandemia del 2009 sono state scaricate. Per il virus del morbillo e il virus della parotite, sono state scaricate rispettivamente 209 e 284 sequenze genomiche. Per il virus della parainfluenza umana di tipo 3, sono state scaricate un totale di 353 sequenze complete del genoma. Per il virus respiratorio sinciziale umano, sono state scaricate 1.006 sequenze genomiche complete del sottogruppo A. Per virus vaccinico, sono state scaricate un totale di 103 sequenze complete del genoma. Due delle sequenze ( <"type":"entrez-nucleotide","attrs":<"text":"NC_006998","term_id":"66275797","term_text":"NC_006998">> NC_006998 e <" type":"entrez-nucleotide","attrs":<"text":"AY243312","term_id":"29692106","term_text":"AY243312">> AY243312) erano identici tra loro e abbiamo mantenuto solo il genoma di riferimento <"type":"entrez-nucleotide","attrs":<"text":"NC_006998","term_id":"66275797","term_text":"NC_006998">> NC_006998 per ulteriori analisi. Inoltre, due delle varianti del virus ( <"type":"entrez-nucleotide","attrs":<"text":"MG012795","term_id":"1320878772","term_text":"MG012795">> MG012795 e <"type":"entrez-nucleotide","attrs":<"text":"MG012796","term_id":"1320879051","term_text":"MG012796">> MG012796) che hanno mostrato un esterno eccezionalmente lungo rami nell'albero filogenetico sono stati esclusi per ulteriori analisi. Di conseguenza, sono state utilizzate un totale di 100 sequenze rimanenti per la stima del tasso di evoluzione della proteina in virus vaccinico. Per il citomegalovirus umano, sono state scaricate un totale di 299 sequenze complete del genoma.

Stima del tasso di evoluzione delle proteine ​​nei virus

Il tasso di evoluzione delle proteine ​​di dieci specie di virus esaminate in questo studio è stato dedotto dalla differenza media a coppie tra le varianti. Nello specifico, per ciascuna specie virale, la sequenza di riferimento di ogni ORF è stata allineata con i genomi delle singole varianti virali mediante ago EMBOSS (Rice et al. 2000). Le sequenze allineate (senza interruzioni) sono state tradotte in silico in sequenze proteiche. Il numero di diversi amminoacidi è stato contato per ogni coppia di varianti e la media è stata stimata da tutte le possibili coppie di varianti, che è stata ulteriormente normalizzata dalla lunghezza della sequenza peptidica.

Stima del tasso di evoluzione delle proteine ​​per SARS-CoV-2 prima del trasferimento zoonotico

Il tasso di sequenza della proteina SARS-CoV-2 durante l'evoluzione negli ospiti animali è stato stimato dal Dn/DS rapporto tra SARS-CoV-2 e tre coronavirus correlati isolati da pipistrelli o pangolini. Le sequenze di SARS-CoV-2 (Wu et al. 2020), RaTG13 (GenBank: <"type":"entrez-nucleotide","attrs":<"text":"MN996532.1","term_id": "1802633852","term_text":"MN996532.1">> MN996532.1) isolato da pipistrelli nello Yunnan (Zhou et al. 2020), GD-1 (GISAID: EPI_ISL_410721) isolato da pangolini nel Guangdong (Xiao et al. 2020) e GX-P5E (GISAID: EPI_ISL_410541) isolati dai pangolini nel Guangxi (Lam et al. 2020) sono stati allineati da MUSCLE (Edgar 2004) l'albero filogenetico è stato costruito utilizzando il metodo di unione dei vicini in MEGA X (Kumar et al . 2018) con la massima verosimiglianza composita come modello di sostituzione. Un coronavirus (bat-SL-CoVZC45, GenBank: <"type":"entrez-nucleotide","attrs":<"text":"MG772933.1","term_id":"1369125417","term_text":" MG772933.1">> MG772933.1) isolato da Zhejiang (Hu et al. 2018) è stato utilizzato per radicare l'albero filogenetico. Gli ORF omologhi tra SARS-CoV-2, RaTG13, GD-1 e GX-P5E sono stati allineati da MUSCLE. La media Dn, DS, e Dn/DS rapporto sull'albero filogenetico sono stati stimati per ogni ORF da codeml in PAML (Yang 2007) sotto i parametri modello = 0, NSsites = 0, fix_omega = 0 e clock = 0.

Stima delle specie incrociate Dn/DS Rapporto in tre gruppi di specie/sottospecie di virus

Stima del tasso evolutivo delle proteine ​​codificate dal genoma nucleare dei primati

Abbiamo stimato il tasso evolutivo delle proteine ​​codificate nel genoma delle cellule Vero dalla divergenza proteica tra C. sabaeus e M. mulatti. Per ogni gene, le frazioni di amminoacidi identici nell'allineamento di sequenza tra le due specie, “C. sabaeus % ID” e “M. mulatta % ID,” sono stati recuperati da Ensembl (versione 99). La coppia di geni omologhi è stata filtrata se le due frazioni differiscono di più del 5%. È stata stimata la media delle due fazioni e la sua differenza dal 100% è stata utilizzata per dedurre il tasso di evoluzione delle proteine. Il tasso evolutivo delle proteine ​​umane è stato similmente stimato come la frazione media di amminoacidi identici nell'allineamento di sequenza tra l'essere umano e lo scimpanzé, “H. sapiens % ID” e “P. trogloditi % ID.”

Stima del tasso evolutivo per HERV ORFs

Le sequenze proteiche del retrovirus endogeno nell'uomo e negli scimpanzé sono state scaricate da gEVE. Una coppia di retrovirus endogeni ortologhi umani e scimpanzé per una regione ORF annotata è stata identificata seguendo tre criteri: 1) La coppia ortologa presenta i migliori risultati BLAST reciproci sintenici 2) l'identità della sequenza allineata era maggiore dell'85% e 3) il numero di gli amminoacidi allineati non erano inferiori all'85% della lunghezza totale della proteina in entrambe le regioni annotate. Il tasso evolutivo di ciascuna regione ORF annotata è stato stimato dalla divergenza proteica tra umano e scimpanzé, definita come il numero di vari amminoacidi diviso per la lunghezza media della proteina della coppia ortologa. Simile alla stima dei livelli di espressione, abbiamo utilizzato il tasso evolutivo medio di tutte le regioni ORF annotate per rappresentare il tasso evolutivo dell'ORF quando più regioni sono annotate per lo stesso ORF.


Guarda il video: Variante Mu, Andrea Crisanti: Ha un indice di trasmissione più basso della variante Delta,.. (Agosto 2022).