procedure Cliniche
Sia il VHX e BPD prove sono state condotte dall’Shoklo Malaria Unità di Ricerca in cliniche lungo la Thailandia–Myanmar confine nel nord-ovest della Thailandia, una zona con bassa stagione malaria transmission18,19. Tra le popolazioni di pazienti figurano lavoratori migranti e sfollati di etnia Burman e karen 38. Durante il periodo in cui sono stati condotti questi studi, il trattamento primachine radical cure non era di routine.
In entrambi gli studi, gli episodi ricorrenti sono stati rilevati attivamente alle visite programmate mediante microscopia (il limite inferiore di rilevazione è di circa 50 parassiti per \(\upmu{\mathrm{{L}}}\)). I pazienti sono stati incoraggiati a venire alle cliniche tra le visite programmate in caso di malessere e quindi alcune recidive sono state rilevate passivamente (meno del 5%). Tutte le recidive sono state trattate, indipendentemente dai sintomi.
Approvazione etica
Lo studio BPD è stato approvato sia dal Mahidol University Faculty of Tropical Medicine Ethics Committee (MUTM 2011-043, TMEC 11-008) che dal Oxford Tropical Research Ethics Committee (OXTREC 17-11) ed è stato registrato presso ClinicalTrials.gov (NCT01640574). Lo studio VHX ha ricevuto l’approvazione etica dal Mahidol University Faculty of Tropical Medicine Ethics Committee (MUTM 2010-006) e dal Oxford Tropical Research Ethics Committee (OXTREC 04-10) ed è stato registrato presso ClinicalTrials.gov (NCT01074905).
Vivax History trial (VHX)
Questo studio randomizzato controllato è stato condotto tra maggio 2010 e ottobre 2012. In totale, 644 pazienti di età superiore a 6 mesi e del peso di 7 kg con microscopia confermato che non complicata da P. vivax mono-specie di infezione (P. vivax solo) sono stati randomizzati a ricevere artesunate (2 mg/kg al giorno per 5 giorni), clorochina (25 mg di base per kg diviso per 3 giorni: 10, 10, e 5 mg/kg), o clorochina plus primachina (0,5 mg di base per kg al giorno per 14 giorni).
I pazienti con deficit di G6PD (come determinato dal test a punti fluorescenti) sono stati randomizzati solo ai gruppi in monoterapia con artesunato e clorochina. I soggetti sono stati seguiti quotidianamente per il trattamento farmacologico supervisionato. Il follow-up è continuato settimanalmente per 8 settimane e poi ogni 4 settimane per un totale di 1 anno. I pazienti con microscopia hanno confermato che le infezioni da P. vivax sono state ritirate con lo stesso farmaco in studio come nell’assegnazione originale. I pazienti nei gruppi di monoterapia con artesunato o clorochina che hanno avuto più di 9 recidive sono stati sottoposti a trattamento curativo radicale con il regime standard di primachina (0,5 mg base per kg al giorno per 14 giorni).
Migliori Primachina Dose di prova (BPD)
Tra il febbraio 2012 e il luglio 2014, 680 pazienti di età superiore a 6 mesi sono stati arruolati in quattro trial controllato randomizzato contemporaneamente confronto tra due regimi di primachina (0,5 mg/kg al giorno per 14 giorni o 1 mg/kg al giorno per 7 giorni in combinazione con uno dei due di sangue-fase i trattamenti: clorochina (25 mg base per kg) o diidroartemisinina-piperachina (diidroartemisinina 7 e piperachina 55 mg/kg). Tutte le dosi sono state controllate.
I criteri di inclusione ed esclusione per questo studio erano gli stessi dello studio VHX, ad eccezione dei seguenti: i pazienti sono stati esclusi se erano carenti di G6PD dal test a punti fluorescenti, avevano un ematocrito inferiore al 25% o avevano ricevuto una trasfusione di sangue entro 3 mesi.
Le visite di follow-up si sono verificate nelle settimane 2 e 4 e poi ogni 4 settimane per un totale di un anno. Qualsiasi P ricorrente. le infezioni da vivax rilevate mediante microscopia (stessi criteri del VHX) sono state trattate con un regime standard di clorochina (25 mg base per kg per 3 giorni) e primachina (0,5 mg base per kg al giorno per 14 giorni).
Genotipizzazione di microsatelliti
Il sangue intero per un esame emocromocitometrico completo è stato raccolto mediante venipuntura in una provetta EDTA da 2 mL. Il sangue intero rimanente è stato congelato a -80 ° C. P. il DNA genomico vivax è stato estratto da 1 mL di sangue venoso utilizzando un sistema di estrazione automatica del DNA QIAsymphony SP (Qiagen, Germania) e QIAsymphony DSP DNA mini kit (Qiagen, Germania) secondo le istruzioni del produttore. Al fine di confrontare i modelli genotipici di infezioni primarie e recidive, abbiamo genotipizzato inizialmente utilizzando tre loci microsatelliti polimorfici che hanno fornito un’amplificazione molto pulita: nessun picco di balbuzie e affidabilità dell’amplificazione PCR alle basse densità di parassiti solitamente presenti nelle infezioni ricorrenti. Questi loci core erano PV.3.27, PV.3.502, e PV.ms8. Per tutti i frammenti12,39 è stato adottato un approccio seminestato alla PCR. Tutte le reazioni di amplificazione sono state eseguite in un volume totale di 10 µL e in presenza di 10 mmol/L Tris-HCl (pH 8,3), 50 mmol/L KCl, 250 nmol/L di ciascun primer oligonucleotidico, 2,5 mmol/L MgCl2, 125 µmol/L di ciascuno dei quattro trifosfati desossinucleosidici e 0,4 U di Takara polimerasi (TaKaRa BIO). Le reazioni primarie di amplificazione sono state avviate con 2 µL del DNA genomico del modello preparato dai campioni di sangue e 1 µL del prodotto di queste reazioni è stato utilizzato per avviare le reazioni secondarie di amplificazione. I parametri di ciclo per PCR erano i seguenti: denaturazione iniziale per 5 min a 95 °C preceduta ricottura eseguita per 30 s a 52 °C, estensione eseguita per 30 s a 72 °C, e denaturazione eseguita per 30 s a 94 °C. Dopo una fase finale di ricottura è stata eseguita, seguita da 2 min di estensione, la reazione è stata interrotta. I prodotti PCR sono stati conservati a 4 °C fino all’analisi.
I genotipi di parassiti nei campioni ricorrenti sono stati confrontati con quelli nei campioni di iscrizione e alle coppie di campioni è stata assegnata una classificazione grezza basata su IBS, definita come correlata basata su IBS di maggioranza, se due o tre loci tipizzati mostravano evidenza di IBS e diversa basata su maggioranza non IBS, altrimenti. Le chiamate eteroalleliche avevano prove di IBS se includevano una chiamata identica a un’altra nel confronto. Se i campioni accoppiati sono stati classificati come correlati in base alla maggioranza IBS, o se uno o più dei loci iniziali non sono riusciti ad amplificare, sei marcatori microsatelliti aggiuntivi (non core) sono stati genotipizzati (PV.1.501, PV. ms1, PV.ms5, PV.ms6, PV.ms7 e PV. ms16). Per ogni microsatellite, i dettagli inclusi il motivo, il cromosoma e la posizione sono forniti nella tabella supplementare 3. I conteggi degli episodi suddivisi in base al numero di marcatori aggiuntivi digitati correttamente sono forniti nella Tabella supplementare 4. Per vedere se ulteriori marcatori bias ricaduta inferenza, abbiamo partizionato la probabilità di recidiva inferita nei dati genetici nulli per il numero di marcatori utilizzati per stimare la probabilità di recidiva. Ulteriori marcatori non pregiudicano l’inferenza della recidiva: la probabilità di recidiva diminuisce dal precedente con uno a tre marcatori, stabilizzandosi intorno allo 0,25 successivamente (Fig. 5).
Per la chiamata allele sui microsatelliti, le lunghezze dei prodotti PCR sono state misurate rispetto agli standard di dimensione interna (Genescan 500 LIZ) su un analizzatore genetico ABI 3100 (PE Applied Biosystems), utilizzando GENESCAN e GENOTYPER software (Applied Biosystems) per misurare le lunghezze degli alleli e quantificare le altezze di picco. Alleli multipli sono stati chiamati quando c’erano più picchi per locus e dove picchi minori erano \(> 33 \%\) dell’altezza dell’allele predominante. Abbiamo incluso campioni di controllo negativi (DNA umano o nessun modello) in ogni esecuzione di amplificazione. Un sottoinsieme dei campioni (n = 10) è stato analizzato in triplice copia per confermare la coerenza dei risultati ottenuti. Tutte le coppie di primer sono state testate per la specificità utilizzando il DNA genomico di P. falciparum o umani.
Time-to-event model of vivax malaria recurrence
Per le infezioni ricorrenti da P. vivax negli studi VHX e BPD, abbiamo sviluppato e confrontato due modelli di miscela a effetti misti bayesiani che descrivono i dati time-to-event condizionati al farmaco di trattamento somministrato. Il primo modello (modello 1) ha assunto il 100% di efficacia della primachina ad alte dosi con la sola reinfezione possibile dopo la cura radicale. Il secondo modello (modello 2) ha permesso la recidiva e la ricrudescenza a seguito di primachina ad alte dosi. Un elenco completo delle ipotesi relative a entrambi i modelli è disponibile nella tabella supplementare 5. Il modello 1 fungeva da modello base per valutare la robustezza. Il modello 2 è stato utilizzato come modello finale e tutte le stime riportate sono derivate da esso. La notazione è stata scelta in modo da essere coerente con la notazione matematica per il modello genetico (vedi sotto). Si noti che nella notazione del modello che segue \(n\) è un indice, mentre sopra è usato per indicare i conteggi. Per ogni individuo indicizzato dal pedice \(n\in 1..N\), registriamo gli intervalli di tempo (in giorni) tra i successivi episodi di P. vivax (l’episodio di iscrizione è indicato come episodio 0). L’ultimo intervallo di tempo è censurato alla fine del follow-up. I modelli non assumono alcun pregiudizio di selezione dalla perdita al follow-up. Per il \({n}{{\mathrm{{th}}}}\) i singoli, i dati riguardanti il periodo di intervallo \(t\) (il tempo tra un episodio di \(t-1\) e l’episodio di \(t\)) è della forma \({{\boldsymbol{x}}}_{n}^{(t)}\) = {\({D}_{n}^{t},{Z}_{n}^{t},{C}_{n}^{t},{S}_{n}\)}, dove \({D}_{n}^{t}\in \{{\rm{COME}},{\rm{CQ}},{\rm{PMQ}}+\}\) è la combinazione di farmaci utilizzati per trattare l’episodio di \(t-1\) (IN: artesunate in monoterapia; CQ: chloroquine in monoterapia; PMQ\({}^{+}\): primachina più sangue stadio di trattamento), \({Z}_{n}^{t}\) è l’intervallo di tempo in giorni, \({C}_{n}^{t}\in \{0,1\}\) indica se l’intervallo è stato censurato, dove 1 corrisponde a un diritto censurato osservazione (cioè di follow-up si è conclusa prima della prossima ricorrenza è stata osservata) e 0 corrisponde ad un osservate infezioni ricorrenti, e \({S}_{n}\) indica lo studio in cui il paziente è stato reclutato (1: VHX, 2: BPD). In generale, let \({{\boldsymbol {x}}}_{n}\) = {\({{\boldsymbol {x}}}_{n}^{(0)},\ldots ,{{\boldsymbol{x}}}_{n}^{(T)}\)} denota tutti i dati time-to-event disponibili per l’individuo \({n} {{\mathrm{{th}}}}\). Poche recidive (otto) si sono verificate nelle prime 8 settimane per i pazienti randomizzati ai bracci diidroartemisinina-piperachina dello studio BPD, quindi abbiamo modellato il periodo post-profilattico della piperachina come identico a quello della clorochina (cioè PMQ\({}^{+}\) comprende sia la clorochina che la diidroartemisinina-piperachina come trattamenti allo stadio del sangue). In realtà, i profili di eliminazione e le attività intrinseche sono leggermente diversi, con piperachina che fornisce una soppressione dello stadio asessuale leggermente più lunga rispetto alla clorochina.
In entrambi i modelli, il time-to-recurrence è modellato come una miscela di quattro distribuzioni, con pesi della miscela a seconda del trattamento dell’episodio precedente. Le distribuzioni della miscela corrispondono ai diversi stati di ricorrenza. Le quattro miscele sono: reinfezione, data da una distribuzione esponenziale; recidiva precoce (periodica), data da una distribuzione di Weibull con parametri farmaco-dipendenti dal trattamento; recidiva tardiva (a tasso costante), data da una distribuzione esponenziale; recrudescenza, data da una distribuzione esponenziale. Il modello 2 specifica diverse proporzioni di miscelazione per il componente di reinfezione nei gruppi non primachine e primachine, \({p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CQ}}}\) e \({p}_{n}^{{\rm{PMQ+}}}\), rispettivamente. La proporzione di miscelazione tra recidiva precoce/periodica e recidiva tardiva/costante all’interno della componente recidiva è la stessa nei gruppi primachina e non primachina.
La probabilità per il modello 2 è data come
dove \({p}_{n}^{(\cdot )}\in (0,1)\) è l’individuo e la droga specifica miscela di probabilità di reinfezione (abbiamo impostato la prima riflette la nostra convinzione che \({p}_{n}^{{\rm{COME}}}={p}_{n}^{{\rm{CQ}}}\ < \ {p}_{n}^{{\rm{PMQ+}}}\) e \({c}^{(\cdot )}\in (0,1)\) è il miscela annidata farmaco-specifica probabilità di ricrudescenza.
La probabilità per il modello 1 è la stessa tranne che \({p}_{n}^{{\rm{PMQ+}}}=1\) (possibile solo reinfezione). \({\mathcal {E}} (\cdot)\) indica la distribuzione esponenziale. In entrambi i modelli, \({\lambda} _{{S}_{n}}\) è il tasso di reinfezione specifico dello studio. La relazione tra \({\lambda} _{1}\) e \({\lambda} _{2}\) è parametrizzata come \({\lambda} _{2}=\delta {\lambda} _{1}\) dove i priori sono specificati per \({\lambda} _{1}\) e \(\delta\). \ (\delta\) ha specificato la diminuzione della trasmissione tra i periodi di studio VHX e BPD. \({\lambda} _ {{\rm {RC}}}\) è il tasso di ricrudescenza (assunto indipendente dal farmaco). \({c}^{{D}_{n}^{t}}\) è una proporzione di miscelazione annidata farmaco-dipendente tra ricrudescenza e recidiva. Il tempo di ricaduta è di per sé una distribuzione della miscela in cui \ (q\) è la proporzione di miscelazione doppiamente nidificata tra recidive precoci (primo componente) e tardive (secondo componente). Questa è una proporzione fissa in tutti gli individui. Le ricadute tardive / a tasso costante sono parametrizzate dalla costante di velocità \(\gamma\). La recidiva precoce, che si presume essere di Weibull distribuito, che indichiamo con \({\mathcal{W}}(\cdot ,\cdot )\), con tossicodipendenti parametri di scala \({\mu }_{{D}_{n}^{t}}\) e la forma parametri \({k}_{{D}_{n}^{t}}\) per cui con \({\mu }_{{\rm{CQ}}}={\mu }_{{\rm{PMQ+}}}\) e \({k}_{{\rm{CQ}}}={k}_{{\rm{PMQ+}}}\).
La probabilità marginale individuale di reinfezione è data da \({p}_{n}^{{D}_{n}^{t}}\); la probabilità marginale individuale di ricrudescenza è data da \(\left{c}^{{D}_{n}^{t}}\); la probabilità marginale individuale di recidiva è data da \(\left\left\).
Abbiamo utilizzato distribuzioni informative precedenti (Tabella supplementare 1) per garantire l’identificabilità dei componenti della miscela. Il contenuto informativo nei dati, oltre a quello specificato nel precedente, è stato esaminato visivamente utilizzando grafici precedenti a posteriori. La trama prior-to-posterior per il modello 2 è mostrato in Fig supplementare. 6. L’identificabilità dei parametri è stata determinata mediante simulazione. Cinquanta set di dati sintetici sono stati tratti da ciascuno dei processi di generazione dei dati definiti dai modelli 1 e 2 e da una versione modificata del modello 2 che incorporava la reinfezione stagionale. La componente stagionale è stata stimata dalla distribuzione empirica della settimana di iscrizione negli studi BPD e VHX. I modelli sono stati quindi adattati a questi set di dati simulati e i parametri stimati sono stati confrontati con i parametri di verità di simulazione. Fig.supplementare 7 mostra i tassi di errore PMQ+ stimati (utilizzando il modello 2) rispetto ai tassi di errore reali per i dati generati nel modello 2 (adattamento del modello ben specificato) e per i dati generati nella versione stagionale del modello 2 (adattamento del modello specificato in modo errato), rispettivamente. La reinfezione stagionale provoca una leggera sopravvalutazione del tasso di fallimento. Il controllo del modello posteriore è stato effettuato simulando 500 set di dati sintetici time-to-event sotto la distribuzione predittiva posteriore dell’adattamento del modello finale. Il numero di recidive per persona-anno per ciascun braccio di trattamento è stato scelto come statistica riassuntiva utilizzata per calcolare i valori p predittivi posteriori (Fig. 7).
I modelli stan producono (i) distribuzioni posteriori Monte Carlo per tutti i parametri del modello; (ii) stime posteriori degli stati di ricorrenza per ogni intervallo di tempo \({{\boldsymbol{x}}}_{n}^{(t)}\); (iii) stime di verosimiglianza del registro di ogni estrazione posteriore. Per ogni modello, abbiamo eseguito otto catene con \(1{0}^{5}\) iterazioni, assottigliamento per 400 iterazioni e scartamento della metà per il burn-in. La convergenza delle catene MCMC è stata valutata utilizzando traceplots che valutano la miscelazione e l’accordo delle otto catene indipendenti. Tutte queste analisi possono essere replicate con il repository github online.
Frequenze alleliche e cardinalità effettiva
Per ogni microsatellite genotipizzato, le frequenze alleliche sono state stimate utilizzando tutti i dati genetici disponibili dagli episodi di iscrizione (137 VHX, 79 BPD) e un modello multinomiale-Dirichlet (Fig. 8). Per ogni marcatore la cardinalità effettiva \({n}^ {*}\), definita come il numero di alleli che forniscono la stessa probabilità di identità per caso date frequenze di allele equifrequenti, è stata stimata come uno sulla somma delle frequenze di allele quadrate40. Dalle cardinalità effettive possiamo calcolare il numero di ipotetici SNP biallelici che i nove microsatelliti equivalgono a come segue:
dove \(m\) è l’indice su \(M=9\) microsatelliti e il logaritmo è in base \({n}_{{\rm{SNP}}}^{* }\), la media ipotizzata efficace cardinalità di un ipotetico SNP. Questo è 2 per un SNP ideale e circa 1,5 per un SNP40 realistico.
Modello genetico
Il modello genetico produce la probabilità che un P ricorrente. vivax episodio in un dato individuo è una recrudescenza, di recidiva, o reinfezione rispetto a osservato in precedenza episodi, tre ingressi: (1) prima della probabilità che l’episodio è una recrudescenza, di recidiva, o reinfezione (in questo lavoro si basano sul tempo all’evento di dati); (2) un set di popolazione a livello di frequenza allele stime; (3) disponibili dati genetici per l’osservati episodi per l’individuo, ciascuna con un massimo di nove polyallelic marcatori microsatellite. Per propagare l’incertezza in (1) e (2), disegniamo 100 campioni Monte Carlo dal modello time-to-event e dalle distribuzioni di Dirichlet posteriori su frequenze alleliche per ciascun marcatore. Il modello genetico non cattura l’incertezza dovuta alla variazione del numero di marcatori genotipizzati in quanto è computazionalmente proibitivo farlo al momento. Tuttavia, il modello genetico non interpreta eccessivamente i dati limitati: quando i marcatori genotipizzati sono pochi, restituisce semplicemente stime vicine alle precedenti. Il resto di questa sezione fornisce una descrizione informale del modello. Una descrizione dettagliata con un elenco di ipotesi e la specifica matematica completa è nei metodi supplementari.
Per un dato individuo, i parassiti all’interno e tra le infezioni sono considerati estranei, fratelli o cloni in relazione l’uno con l’altro (estranei si riferisce a tutti i parassiti la cui discendenza condivisa risale oltre una singola zanzara). L’insieme delle relazioni tra parassiti può essere rappresentato da un grafico completamente connesso. Ogni vertice rappresenta un genotipo aploide, e ogni bordo tra i genotipi è etichettato come un fratello o un estraneo quando i genotipi sono contenuti all’interno della stessa infezione, o come un clone, un fratello o un estraneo quando i genotipi provengono da infezioni diverse. Per le infezioni complesse, il numero di vertici è impostato uguale al COI, che è definito come il numero massimo di alleli per marcatore osservato.
Il modello presuppone che le ricadute possano verificarsi per tutte le relazioni inter-parassitarie tra infezioni (estranei, fratelli e cloni), mentre le reinfezioni si verificano solo come estranei e le recrudescenze solo come cloni. I passaggi chiave nel modello sono i seguenti. In primo luogo, calcoliamo la probabilità dei dati genetici dato un grafico relazione etichettato. In secondo luogo, calcoliamo la probabilità del grafico proposto dato che l’episodio ricorrente è una recrudescenza, una ricaduta e una reinfezione. Terzo, sommiamo tutti i possibili grafici. L’insieme di grafici etichettati include tutti i modi possibili per sfasare i dati microsatellitici (cioè attribuire alleli ai genotipi aploidi nelle infezioni complesse) e tutte le relazioni vitali tra genotipi aploidi. Ad esempio, se il genotipo A è un clone di B e B è un clone di C, l’unica relazione valida tra A e C è clonale.
Il concetto di parentela (probabilità di IBD) caratteristiche nel primo passo. Tuttavia, il modello non stima la parentela. Invece, stima la probabilità di osservare i dati forniti IBD moltiplicati per la probabilità di IBD condizionata da una relazione specificata (ad esempio 0.5 per i fratelli in una popolazione outbred). Questo calcolo fa uso di frequenze alleliche (gli alleli comuni condivisi possono essere identici ma non necessariamente a causa della discesa, mentre gli alleli rari condivisi sono più probabili IBD). Abbiamo poi somma delle due possibili IBD scenari (alleli sono IBD o non) per ottenere la probabilità che i dati osservati condizionato la relazione specificata,
Questo viene calcolato per tutte le relazioni a coppie nel grafico delle relazioni (vedere Metodi supplementari per i dettagli completi).
La complessità computazionale del modello genetico lo limita all’analisi congiunta di tre episodi (due recidive) per paziente (nei nostri dati questo è il caso di 158 pazienti). Per ogni individuo con più di due recidive (54 pazienti), abbiamo stimato le probabilità a coppie di stati di recidiva tra gli episodi (usando il modello sopra) e costruito una matrice di adiacenza. Le probabilità di recidiva sono state quindi definite come proporzionali alla probabilità massima stimata di recidiva rispetto a tutti gli episodi precedenti e a quelle di recrudescenza rispetto all’episodio direttamente precedente. La probabilità di reinfezione è il complemento della probabilità di recidiva più ricrudescenza. Queste probabilità sono state poi ri-ponderate per sommare a 1.
Simulazione genetica
Abbiamo usato la simulazione per esplorare i requisiti dei marker per l’inferenza dello stato ricorrente. Come descritto sopra, i dati su marcatori microsatellitici indipendenti da 3 a 12 sono stati simulati per infezioni accoppiate (un episodio primario seguito da una singola ricorrenza) in tre scenari: la ricorrenza contiene un genotipo di parassita aploide che è un fratello, un estraneo o un clone di un genotipo di parassita aploide nell’infezione primaria. I dati simulati sono stati analizzati assumendo un precedente uniforme sugli stati di recidiva (cioè recrudescenza, reinfezione e recidiva hanno ciascuna probabilità pregresse di un terzo). Per ciascuno degli scenari stranger, sibling e clonali, abbiamo simulato i dati per un’infezione iniziale e ricorrente con i rispettivi COIS 1 & 1, 2 & 1, e 1 & 2, con e senza errore; e rispettivi COIs 3 & 1, senza errore. Per illustrare il comportamento del modello quando applicato a dati errati, i dati con errore sono stati simulati utilizzando una probabilità di errore estremamente elevata per-locus (0.2 contro errore realistico\(<\ 0.01\)41). Quando il COIs superava uno, il fratello, lo straniero o il clone era tra i genotipi aploidi estranei estranei (un grafico di relazione con al massimo un singolo bordo non estraneo). Per un dato insieme di COI, questo tipo di grafico produce dati molto diversi ed è quindi il più difficile da analizzare. Per gli episodi non errati con COIs in 1 o 2, abbiamo esplorato le cardinalità di 13 e 4 (la media e il minimo, rispettivamente, del nostro pannello di nove microsatelliti). Per i dati errati e per gli episodi con COIs di 3 & 1 abbiamo usato solo cardinalità pari a 13. I risultati di un sottoinsieme illustrativo delle simulazioni genetiche sono presentati in Fig. 5 e Fichi supplementari. 3 e 4. Tutte le simulazioni genetiche possono essere replicate dal repository github online, vedere la cartella Simulation_Study.
Classificazione degli episodi ricorrenti
La stima del tasso di scoperta di falsi fallimenti del modello genetico e Fig. 4 entrambi richiedono la specificazione dei confini di classificazione. Abbiamo scelto arbitrariamente l’intervallo come zona di incertezza. Ogni ricorrenza è classificato come una reinfezione o un errore in cui il fallimento è una ricaduta o una recrudescenza: se la somma di alto credibile intervalli di ricaduta plus recrudescenza è inferiore a 0,3, la ricorrenza è classificato come una reinfezione; se la somma della bassa credibile intervalli di ricaduta plus recrudescenza supera 0.7, la ricorrenza è classificato come un fallimento; in caso contrario la classificazione è considerata incerta. Poiché non vi era evidenza trascurabile di recrudescenza, tutti i fallimenti sono essenzialmente ricadute.
Reporting Summary
Ulteriori informazioni sul design della ricerca sono disponibili nel Reporting Summary di Nature Research collegato a questo articolo.