Løse årsaken til tilbakevendende Plasmodium vivax malaria probabilistically

Kliniske prosedyrer

både vhx og BPD studiene ble utført Av Shoklo Malaria Research Unit i klinikker langs Thailand–Myanmar grensen i nordvestlige Thailand, et område med lav sesong malaria overføring18,19. Pasientpopulasjonene inkluderer arbeidsinnvandrere og fordrevne Personer Fra Burman og Karen ethnicity38. I løpet av tiden disse studiene ble utført, var primaquine radical cure behandling ikke rutinemessig.

i begge studiene ble gjentatte episoder detektert aktivt ved planlagte besøk ved mikroskopi (nedre grense for deteksjon er omtrent 50 parasitter per \(\upmu{\mathrm{{l}}}\)). Pasientene ble oppfordret til å komme til klinikkene mellom planlagte besøk når de var uvel, og så ble det oppdaget noen tilbakefall passivt (mindre enn 5%). Alle tilbakefall ble behandlet, uavhengig av symptomer.

Etisk godkjenning

BPD-studien ble godkjent av Både Mahidol University Faculty Of Tropical Medicine Ethics Committee (MUTM 2011-043, TMEC 11-008) Og Oxford Tropical Research Ethics Committee (OXTREC 17-11) og ble registrert ved ClinicalTrials.gov (NCT01640574). VHX-studien ble gitt etisk godkjenning av Mahidol University Faculty Of Tropical Medicine Ethics Committee (MUTM 2010-006) og Oxford Tropical Research Ethics Committee (OXTREC 04-10) og ble registrert på ClinicalTrials.gov (NCT01074905).

Vivax History trial (VHX)

denne randomiserte kontrollerte studien ble gjennomført Mellom Mai 2010 og oktober 2012. Totalt 644 pasienter eldre enn 6 måneder og som veier mer enn 7 kg med mikroskopi bekreftet ukomplisert P. vivax monoart infeksjon (kun p. vivax) ble randomisert til å motta artesunat (2 mg/kg per dag i 5 dager), klorokin (25 mg base per kg fordelt over 3 dager: 10, 10 og 5 mg/kg), eller klorokin pluss primaquin (0,5 mg base per kg per dag i 14 dager).

g6pd-mangelfulle pasienter (som bestemt ved fluorescerende spottest) ble randomisert kun til artesunat-og klorokin-monoterapigruppene. Forsøkspersoner ble fulgt daglig for overvåket legemiddelbehandling. Oppfølgingen fortsatte ukentlig i 8 uker og deretter hver 4. uke i totalt 1 år. Pasienter med mikroskopibekreftede p. vivax-infeksjoner ble trukket tilbake med samme studielegemiddel som ved den opprinnelige tildelingen. Pasienter i artesunat-eller klorokin-monoterapigruppene som opplevde mer enn 9 tilbakefall, fikk radikal kurativ behandling med standard primaquin-regimet (0,5 mg base per kg per dag i 14 dager).

Beste Primaquin Dosestudie (BPD)

mellom februar 2012 og juli 2014 ble 680 pasienter eldre enn 6 måneder inkludert i en fire-veis randomisert kontrollert studie som samtidig sammenlignet to regimer med primaquin (0,5 mg/kg per dag i 14 dager eller 1 mg/kg per dag i 7 dager) kombinert med en av to blodtrinnsbehandlinger: klorokin (25 mg base per kg) eller dihydroartemisinin-piperakin (dihydroartemisinin 7 og piperakin 55 mg / kg). Alle doser ble overvåket.

inklusjons-og eksklusjonskriteriene for denne studien var de samme som FOR vhx-studien, med unntak av følgende: pasienter ble ekskludert dersom DE var G6PD-mangel ved fluorescerende spottest, hadde hematokrit mindre enn 25%, eller hadde fått blodtransfusjon innen 3 måneder.

Oppfølgingsbesøk skjedde i uke 2 og 4, og deretter hver 4. uke i totalt ett år. Enhver tilbakevendende P. vivax-infeksjoner oppdaget ved mikroskopi (samme kriterier SOM FOR VHX) ble behandlet med et standardregime av klorokin (25 mg base per kg over 3 dager) og primaquin (0,5 mg base per kg per dag i 14 dager).

Mikrosatellitt genotyping

Fullblod for fullstendig blodtelling ble samlet ved venepunksjon i ET 2 mL EDTA-rør. Det gjenværende fullblodet ble frosset ved -80 °C. P. vivax genomisk DNA ble ekstrahert fra 1 mL venøst blod ved hjelp Av et automatisert dna-ekstraksjonssystem QIAsymphony SP (Qiagen, Tyskland) og QIAsymphony DSP DNA MINI kit (Qiagen, Tyskland) i henhold til produsentens instruksjoner. For å sammenligne de genotypiske mønstrene av primære infeksjoner og tilbakefall, genotyperte vi først ved å bruke tre polymorfe mikrosatellittlokier som ga meget ren forsterkning: ingen stammetopper og pålitelighet AV PCR-forsterkning ved de lave parasittdensitetene som vanligvis finnes i tilbakevendende infeksjoner. Disse kjerne loci var PV.3,27, PV.3.502, OG PV.ms8. En seminested PCR tilnærming ble vedtatt for alle fragmenter12, 39. Alle amplifiseringsreaksjoner ble utført i et totalvolum på 10 µ og i nærvær av 10 mmol/L Tris-HCl (pH 8,3), 50 mmol/L KCl, 250 nmol / L av hver oligonukleotidprimer, 2,5 mmol / L MgCl2, 125 µ / L av hver av de fire Deoksynukleosidtrifosfater og 0,4 E TaKaRa polymerase (TaKaRa BIO). Primære amplifiseringsreaksjoner ble initiert med 2 µ av mal genomisk DNA fremstilt fra blodprøvene, og 1 µ av produktet av disse reaksjonene ble brukt til å initiere sekundære amplifiseringsreaksjoner. Sykkelparametrene for PCR var som følger: initial denaturering i 5 min ved 95 °c forutgående gløding utført i 30 s ved 52 °C, forlengelse utført i 30 s ved 72 °C, og denaturering utført i 30 s ved 94@ c. etter at et endelig glødingstrinn ble utført, etterfulgt av 2 min forlengelse, ble reaksjonen stoppet. PCR-produkter ble lagret hos 4 °C til analyse.

genotypene av parasitter i tilbakevendende prøver ble sammenlignet med de i registreringsprøver, og prøvepar ble tildelt en grov klassifisering basert PÅ IBS, definert som relatert basert på flertall IBS, hvis to eller tre av tre loci-typede viste tegn PÅ IBS, og forskjellig basert på flertall ikke IBS, ellers. Heteroalleliske samtaler hadde bevis PÅ IBS hvis de inkluderte en samtale som var identisk med en annen over sammenligningen. Hvis de parede prøvene ble klassifisert som relatert basert på flertallet IBS, eller hvis en eller flere av de første loci ikke klarte å forsterke, ble seks ekstra (ikke-kjerne) mikrosatellittmarkører genotypet (PV.1.501, PV. ms1, PV. ms5, PV. ms6, PV. ms7, og PV.ms16). for hver mikrosatellitt, detaljer inkludert motiv, kromosom, og posisjon er gitt I Supplerende Tabell 3. Antall episoder partisjonert med antall ekstra markører skrevet vellykket er gitt I Supplerende Tabell 4. For å se om flere markører bias relapse inferens, partisjonerte vi sannsynligheten for tilbakefall utledet i null genetiske data ved antall markører som brukes til å estimere sannsynligheten for tilbakefall. Ytterligere markører forstyrrer ikke tilbakefallsinferens: sannsynligheten for tilbakefall reduseres fra prioren med en til tre markører, og stabiliseres deretter rundt 0,25 (Supplerende Fig. 5).

for allel som påkalte mikrosatellittene, ble lengden PÅ PCR-produktene målt i forhold til interne størrelsesstandarder (Genescan 500 LIZ) på EN ABI 3100 Genetisk analysator (PE Applied Biosystems), ved HJELP AV GENESCAN og GENOTYPER software (Applied Biosystems) for å måle allel lengder og å kvantifisere topphøyder. Flere alleler ble kalt når det var flere topper per locus og hvor mindre topper var \(> 33 \%\) av høyden av den overordnede allelen. Vi inkluderte negative kontrollprøver (humant DNA eller ingen mal) i hver amplifiseringsrunde. En undergruppe av prøvene (n = 10) ble analysert i tre eksemplarer for å bekrefte konsistensen av de oppnådde resultatene. Alle par primere ble testet for spesifisitet ved hjelp av genomisk DNA fra P. falciparum eller mennesker.

Time-to-event modell av vivax malaria residiv

for residiverende p. vivax-infeksjoner i vhx-og BPD-studiene utviklet og sammenlignet vi To Bayesianske mixed-effects-blandingsmodeller som beskriver time-to-event data som er betinget av det administrerte behandlingsdroget. Den første modellen (modell 1) antok 100% effekt av høydose primaquin med kun reinfeksjon mulig etter radikal kur. Den andre modellen (modell 2) tillot tilbakefall og tilbakefall etter høydose primaquin. En fullstendig liste over forutsetninger knyttet til begge modellene finnes I Supplerende Tabell 5. Modell 1 fungerte som en basismodell for å vurdere robusthet. Modell 2 ble brukt som den endelige modellen, og alle rapporterte estimater er avledet fra den. Notasjon ble valgt for å være i samsvar med den matematiske notasjonen for den genetiske modellen (se nedenfor). Merk at i modellnotasjonen som følger \(n\) er en indeks, mens over den brukes til å betegne teller. For hver enkelt indeksert av subscript \(n \ i 1..N\), registrerer vi tidsintervallene (i dager) mellom påfølgende p. vivax-episoder(innmeldingsepisoden er betegnet episode 0). Det siste tidsintervallet er riktig sensurert på slutten av oppfølgingen. Modellene antar ingen utvalgsskjevhet fra tap til oppfølging. For individet er data om tidsintervallet \(t\) (tiden mellom episode\ (t-1\) og episode\ (t\)) av formen\ ({{\boldsymbol {x}}}_{n}^{(t)}\) = {\({d}_{n}^{t}, {Z}_{n}^{t}, {C}_{n}^{t}, {S}_{n}\)}, hvor\ ({d}_{n}^{t} \i\ {{\rm{as}}, {\rm{cq}}, {\rm {pmq}}+\}\) er legemiddelkombinasjonen som brukes til å behandle episode\(t-1\) (som: artesunat monoterapi; cq: klorokin monoterapi; pmq\({}^{+}\): primaquin pluss blodtrinnsbehandling), \({Z}_{n}^{t}\) er tidsintervallet i dager, \({c}_{n}^{t}\i \{0,1\}\) angir om intervallet ble sensurert der 1 tilsvarer en rett sensurert observasjon (dvs.oppfølging avsluttet før neste tilbakefall ble observert) og 0 tilsvarer en observert tilbakevendende infeksjon, og \({s}_{n}\) betegner studien der pasienten ble rekruttert (1: VHX, 2: bpd). Generelt, la \({{\boldsymbol{x}}} _ {n}\) = {\({{\boldsymbol{x}}}_{n}^{(0)},\ldots, {{\boldsymbol{x}}}_{n}^{(t)}\)} betegne alle tilgjengelige tid-til-hendelse data for\({n} {{\mathrm{{th}}}}\) individ. Få tilbakefall (åtte) forekom i løpet av de første 8 ukene for pasienter randomisert til dihydroartemisinin-piperakingruppene I bpd-studien, så vi modellerte den postprofylaktiske perioden av piperakin som identisk med den for klorokin (dvs. PMQ).\({}^{+}\) inkluderer både klorokin og dihydroartemisinin-piperakin som blod-stadium behandlinger). I virkeligheten, eliminering profiler og iboende aktiviteter er litt annerledes, med piperakin gi litt lengre aseksuell stadium undertrykkelse enn klorokin.

i begge modellene er tid til tilbakefall modellert som en blanding av fire fordelinger, med blandingsvekter avhengig av behandlingen av forrige episode. Blandingsfordelingene samsvarer med de forskjellige gjentakelsestilstandene. De fire blandingene er: reinfeksjon, gitt ved en eksponentiell fordeling; tidlig (periodisk) tilbakefall, gitt Ved En weibull-distribusjon med medikamentavhengige parametere; sent (konstant rate) tilbakefall, gitt ved en eksponentiell fordeling; rekrudescens, gitt ved en eksponentiell fordeling. Modell 2 spesifiserer forskjellige blandingsforhold for reinfeksjonskomponenten i ikke-primaquin-og primaquin-gruppene, \({p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CQ}}}\) og \({p}_{n}^{{\rm{PMQ+}}}\), henholdsvis. Blandingsandelen mellom tidlig/periodisk og sent / konstant tilbakefall innenfor relapsekomponenten er den samme på tvers av primaquin-og ikke-primaquin-grupper.

sannsynligheten for modell 2 er gitt som

$${Z} _ {n}^{t} \ sim \; det er ikke noe problem.}_{{S}_{n}})\left(1-{p}_{n}^{{D}_{n}^{t}}\right)\Big\{\left(1-{c}^{{D}_{n}^{t}}\right)\big(q{\mathcal{W}}({\ mu _{{D} _ {n}^{t}}, {k} _ {{d} _ {n}^{t}}) \ \ + (1-q) {\mathcal{E}} (\gamma) \ stor) + {c}^{d}_{n}^{t}} {\mathcal{e}}({\lambda } _{{\rm{RC}}}) \ Stor\},$$
(1)

hvor \({p}_{n}^{(\cdot )}\in (0,1)\) er den individuelle og stoffspesifikke blandingssannsynligheten for reinfeksjon (vi setter prioren for å reflektere vår tro på at \({p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CQ}}\ < \ {p}_{n}^{{\rm{PMQ+}}\)) og \({c}^{(\cdot)} \in (0,1)\) er nestet stoffspesifikk blanding sannsynlighet for rekrudescens.

sannsynligheten for modell 1 er den samme bortsett fra at \({p} _ {n}^{{\rm{PMQ+}}}=1\) (bare reinfeksjon mulig). \({\mathcal{e}} (\cdot )\) angir eksponentiell fordeling. I begge modellene er \({\lambda }_{{s} _ {n}}\) studiespesifikk reinfeksjonsrate. Forholdet mellom \({\lambda } _ {1}\) og \({\lambda } _ {2}\) er parametrisert som \({\lambda } _ {2}= \ delta {\lambda } _ {1}\) hvor priorer er spesifisert for \({\lambda }_{1}\) og \(\delta\). \(\delta\) spesifiserte reduksjonen i overføring mellom VHX og BPD studieperioder. \({\lambda }_{{\rm{RC}}}\) er recrudescence rate (antatt narkotika uavhengig). \({c}^{{d}_{n}^{t}}\) er en narkotikaavhengig nestet blandingsandel mellom rekrudescens og tilbakefall. Tiden til tilbakefall er i seg selv en blandingsfordeling hvor \(q\) er dobbelt nestet blandingsforhold mellom tidlig (første komponent) og sen (andre komponent) tilbakefall. Dette er en fast andel på tvers av alle individer. Sen / konstant-rate relapses er parameterisert av hastigheten konstant \(\gamma\). De tidlige relapsene antas Å være Weibull distribuert, betegnet \({\mathcal{W}}(\cdot ,\cdot )\), med stoffavhengige skalaparametere \({\mu }_{{D}_{n}^{t}}\) og formparametere \({k}_{{d}_{n}^{t}}\) hvorved med \({\mu }_{{\rm{CQ}}}={\mu }_{{\rm{PMQ+ dette er en av de beste måtene å gjøre det på.

den individuelle marginale sannsynligheten for reinfeksjon er gitt av \({p} _ {n}^{{d} _ {n}^{t}}\); den individuelle marginale sannsynligheten for tilbakefall er gitt av \(\left{c}^{{d}_{n}^{t}}\); den individuelle marginale sannsynligheten for tilbakefall er gitt av \(\left\left\).

vi brukte informative tidligere distribusjoner (Supplerende Tabell 1) for å sikre identifisering av blandingskomponentene. Informasjonsinnholdet i dataene, utover det som er angitt i det foregående, ble undersøkt visuelt ved hjelp av tidligere til bakre tomter. Den før-til-posterior tomten for modell 2 er vist I Supplerende Fig. 6. Identifisering av parametere ble bestemt ved simulering. Femti syntetiske datasett ble trukket fra hver av datagenereringsprosessene definert av modell 1 og 2 og en modifisert versjon av modell 2 som innlemmet sesongmessig reinfeksjon. Sesongkomponenten ble estimert ut fra den empiriske fordelingen av uke for innmelding i bpd-og VHX-studiene. Modellene ble deretter tilpasset disse simulerte datasettene og estimerte parametere ble sammenlignet med simulerings-sannhetsparametere. Supplerende Fig. 7 viser estimerte PMQ + feilrater (ved bruk av modell 2) versus de sanne feilratene for data generert under modell 2 (velspesifisert modelltilpasning), og for data generert under sesongversjonen av modell 2 (feilspesifisert modelltilpasning), henholdsvis. Sesongmessig reinfeksjon resulterer i liten overvurdering av feilfrekvensen. Posterior modellkontroll ble gjort ved å simulere 500 syntetiske time-to-event datasett under posterior prediktiv fordeling av den endelige modellen passform. Antall tilbakefall per personår for hver behandlingsarm ble valgt som summarisk statistikk brukt til å beregne posterior prediktiv p-verdier (Supplerende Fig. 7).

stan-modellene utdata (i) Monte Carlo posterior fordelinger for alle modellparametere; (ii) posterior estimater av tilbakefall stater for hvert tidsintervall \({{\boldsymbol{x}}}_{n}^{(t)}\); (iii) logg sannsynlighet estimater av hver posterior trekning. For hver modell kjørte vi åtte kjeder med \(1{0}^{5}\) iterasjoner, tynning per 400 iterasjoner og kaste halvparten for innbrenning. Konvergens AV MCMC kjeder ble vurdert ved hjelp traceplots vurdere blanding og avtale av de åtte uavhengige kjeder. Alle disse analysene kan replikeres med online github repository.

allelfrekvenser og effektiv kardinalitet

for hver mikrosatellittgenotypet ble allelfrekvenser estimert ved hjelp av alle tilgjengelige genetiske data fra innmeldingsepisodene (137 VHX, 79 BPD) og en multinomial Dirichlet-modell (Supplerende Fig. 8). For hver markør ble den effektive kardinaliteten \ ({n}^ {*}\), definert som antall alleler som gir samme sannsynlighet for identitet ved en tilfeldighet gitt likeverdige allelfrekvenser, estimert som en over summen av allelfrekvensene squared40. Fra de effektive kardinaliteter kan vi beregne antall hypotetiske bialleliske Snper som de ni mikrosatellittene tilsvarer som følger:

$${\rm{Hypotetisk}}\ {\rm{SNP}}\ {\rm{count}}= \ sum _{m = 1}^{m}{\mathrm{log}}_{{n} _ {{\rm{SNP}}}^{* }}({n_{m}^{* }),$$
(2)

hvor \(m\) er indeksen over\ (m = 9\) mikrosatellitter og logaritmen er base \({n}_{{\rm{SNP}}}^{* }\), den antatte gjennomsnittlige effektive kardinaliteten til en hypotetisk SNP. Dette er 2 FOR en ideell SNP og ca 1,5 for en realistisk SNP40.

Genetisk modell

den genetiske modellen gir sannsynligheten For at en tilbakevendende P. vivax-episode i et gitt individ er en rekrudescens, tilbakefall eller reinfeksjon med hensyn til tidligere observerte episoder, gitt tre innganger: (1) tidligere sannsynligheter for at episoden er en rekrudescens, tilbakefall eller reinfeksjon (i dette arbeidet er de basert på time-to-event data); (2) et sett av populasjonsnivå allelfrekvensestimater; (3) tilgjengelige genetiske data for de observerte episodene for det gitte individet hver med maksimalt ni polyalleliske mikrosatellittmarkører. For å spre usikkerhet i (1) og (2) tegner vi 100 Monte Carlo-prøver fra time-to-event-modellen og fra de bakre Dirichlet-fordelingene over allelfrekvenser for hver markør. Den genetiske modellen fanger ikke usikkerhet på grunn av variasjon i antall genotypiske markører, da det er beregningsmessig uoverkommelig å gjøre det i dag. Ikke desto mindre tolker den genetiske modellen ikke begrensede data: når genotypiske markører er få, returnerer det bare estimater nær det tidligere. Resten av denne delen gir en uformell beskrivelse av modellen. En detaljert beskrivelse med en liste over forutsetninger og full matematisk spesifikasjon er I Tilleggsmetodene.

for et gitt individ anses parasitter innenfor og på tvers av infeksjoner å være enten fremmede, søsken eller kloner i forhold til hverandre (fremmede refererer til alle parasitter hvis felles forfedre går utover en enkelt mygg). Settet av interparasittforhold kan representeres av en fullt tilkoblet graf. Hvert toppunkt representerer en haploid genotype, og hver kant mellom genotyper er merket som et søsken eller en fremmed når genotypene er inneholdt i samme infeksjon, eller som en klone, et søsken eller en fremmed når genotypene er fra forskjellige infeksjoner. For komplekse infeksjoner er antall hjørner satt lik COI, som er definert som maksimalt antall alleler per markør observert.

modellen antar at tilbakefall kan forekomme for alle interparasittforhold på tvers av infeksjoner (fremmede, søsken og kloner), mens reinfeksjoner bare forekommer som fremmede, og tilbakefall bare som kloner. De viktigste trinnene i modellen er som følger. Først beregner vi sannsynligheten for de genetiske dataene gitt en merket forholdsgraf. For det andre beregner vi sannsynligheten for den foreslåtte grafen gitt at den tilbakevendende episoden er en gjentakelse, et tilbakefall og en reinfeksjon. For det tredje summerer vi over alle mulige grafer. Settet med merkede grafer inkluderer alle mulige måter å fase mikrosatellittdataene (dvs.tilordne alleler til haploide genotyper i komplekse infeksjoner) samt alle levedyktige forhold mellom haploide genotyper. For eksempel, hvis genotype A er en klon Av B og B er en klon Av C, er det eneste levedyktige forholdet Mellom A og C klonal.

begrepet slektskap (sannsynlighet FOR IBD) har i første trinn. Modellen estimerer imidlertid ikke slektskap. I stedet estimerer den sannsynligheten for å observere DATAENE GITT IBD multiplisert med sannsynligheten FOR IBD betinget av et spesifisert forhold (f. eks. 0,5 for søsken i en utavlet befolkning). Denne beregningen gjør bruk av allel frekvenser (felles felles alleler er egnet til å være identiske, men ikke nødvendigvis på grunn av nedstigningen, mens felles sjeldne ALLELER er mer sannsynlig IBD). Vi summerer deretter over de to MULIGE IBD-scenariene (ALLELER ER IBD eller ikke) for å oppnå sannsynligheten for de observerte dataene betinget av det angitte forholdet,

$${\{\rm {data}})=\; {\mathbb {P}} ({\mathbb {data}} \ | \{\rm {IBD}})\ ganger {\mathbb {P}} ({\rm {IBD}}\ | \{\rm {relationship}})\ \ + {\mathbb {P}} ({\rm {data}}\ | \{\rm {ikke} {\rm {ibd}}) \ ganger {\mathbb {p}} ({\rm {ikke}} \{\rm {ibd}} \ | \{\rm {forhold}}).$$

Dette beregnes for alle parvise relasjoner i forholdet grafen (se Supplerende Metoder for detaljer).

beregningskompleksiteten til den genetiske modellen begrenser den til felles analyse av tre episoder (to tilbakefall) per pasient (i våre data er dette tilfellet for 158 pasienter). For hvert individ med mer enn to tilbakefall (54 pasienter), estimerte vi parvis sannsynligheter for tilbakefall mellom episoder (ved hjelp av modellen ovenfor) og konstruerte en adjacency matrix. Sannsynligheten for tilbakefall ble deretter definert som proporsjonal med den maksimale estimerte sannsynligheten for tilbakefall med hensyn til alle foregående episoder, og sannsynligheten for tilbakefall med hensyn til den direkte foregående episoden. Sannsynligheten for reinfeksjon er komplementet til sannsynligheten for tilbakefall pluss rekrudescens. Disse sannsynlighetene ble deretter re-vektet til sum til 1.

Genetisk simulering

vi brukte simulering til å utforske markørkrav for tilbakevendende tilstandsinngripen. Som beskrevet ovenfor ble data på 3 til 12 uavhengige mikrosatellittmarkører simulert for parede infeksjoner (en primær episode etterfulgt av en enkelt gjentakelse) under tre scenarier: gjentakelsen inneholder en haploid parasittgenotype som enten er en søsken, fremmed eller klon av en haploid parasittgenotype i den primære infeksjonen. De simulerte dataene ble analysert forutsatt en uniform tidligere over tilbakefall tilstander (dvs. rekrudescens, reinfeksjon og tilbakefall hver har tidligere sannsynligheter på en tredjedel). For hver av de fremmede, søsken og klonale scenariene simulerte vi data for en innledende og tilbakevendende infeksjon med respektive COIs 1 & 1, 2 & 1, og 1 & 2, med og uten feil; og respektive COIs 3 & 1, uten feil. For å illustrere atferden til modellen når den brukes på feilaktige data, ble data med feil simulert ved hjelp av en ekstremt høy per-locus sannsynlighet for feil (0,2 versus realistisk feil \(<\ 0.01\)41). Når COIs overskredet en, søsken, fremmed, eller klone var blant urelaterte fremmede haploide genotyper (et forhold graf med på det meste en enkelt ikke-fremmed kant). For et gitt Sett Med COIs gir denne typen graf svært varierte data og er dermed den mest utfordrende å analysere. For ikke-feilaktige episoder med COIs i 1 eller 2, utforsket vi kardinaliteter på 13 og 4 (henholdsvis gjennomsnitt og minimum av vårt panel på ni mikrosatellitter). For feilaktige data og for episodene med COIs på 3 & 1 brukte vi kardinalitet lik 13 bare. Resultatene av en illustrerende delmengde av de genetiske simuleringene er presentert I Fig. 5 Og Supplerende Figurer. 3 og 4. Alle de genetiske simuleringene kan replikeres fra online github repository, se mappe Simulation_Study.

Klassifisering av tilbakevendende episoder

estimeringen av oppdagelsesraten for falsk svikt i den genetiske modellen Og Fig. 4 begge krever spesifikasjon av klassifiseringsgrenser. Vi valgte vilkårlig intervallet som usikkerhetssonen. Hvert tilbakefall er enten klassifisert som en reinfeksjon eller en svikt der svikt er enten et tilbakefall eller en gjentakelse: hvis summen av de øvre troverdige intervaller for tilbakefall pluss gjentakelse er mindre enn 0,3, er gjentakelsen klassifisert som en gjenopptakelse; hvis summen av de nedre troverdige intervaller for tilbakefall pluss gjentakelse overstiger 0,7, er gjentakelsen klassifisert som en fiasko; ellers anses klassifiseringen usikker. Siden det var ubetydelig bevis på rekrudescens, er alle feilene i hovedsak tilbakefall.

Rapporteringssammendrag

Ytterligere informasjon om forskningsdesign er tilgjengelig I Nature Research Reporting Summary knyttet til denne artikkelen.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

Previous post Conejo Valley Guide / Conejo Valley Events
Next post Brystforstørrelse