løsning af årsagen til tilbagevendende Plasmodium vivaksa malaria probabilistisk

kliniske procedurer

både VHK–og BPD-forsøgene blev udført af Shoklo Malaria Research Unit i klinikker langs grænsen mellem Thailand og Myanmar i det nordvestlige Thailand, et område med lav sæsonbestemt malariaoverførsel18,19. Patientpopulationerne omfatter vandrende arbejdstagere og fordrevne personer fra Burman og Karen ethnicity38. I løbet af den tid, disse undersøgelser blev udført, var primakin radikal kurbehandling ikke rutinemæssig.

i begge undersøgelser blev tilbagevendende episoder påvist aktivt ved de planlagte besøg ved mikroskopi (den nedre detektionsgrænse er ca.50 parasitter pr. \(\upmu{\mathrm{{L}}}\)). Patienter blev opfordret til at komme til klinikkerne mellem planlagte besøg, når de var utilpas, og derfor blev nogle gentagelser påvist passivt (mindre end 5%). Alle gentagelser blev behandlet, uanset symptomer.

etisk godkendelse

BPD-undersøgelsen blev godkendt af både Mahidol University Fakultet for Tropisk medicin etik udvalg (MUTM 2011-043, TMEC 11-008) og ClinicalTrials.gov (NCT01640574). Undersøgelsen blev givet etisk godkendelse af Mahidol University Faculty of Tropical Medicine Ethics Committee (MUTM 2010-006) og Tropical Research Ethics Committee (OKSREC 04-10) og blev registreret på ClinicalTrials.gov (NCT01074905).

dette randomiserede kontrollerede forsøg blev udført mellem maj 2010 og oktober 2012. I alt blev 644 patienter ældre end 6 måneder og vejer mere end 7 kg med mikroskopi bekræftet ukompliceret infektion med mono-arter (kun P. vivaks) randomiseret til at få artesunat (2 mg/kg pr.dag i 5 dage), chlorokin (25 mg base pr. kg fordelt over 3 dage: 10, 10 og 5 mg/kg) eller chlorokin plus primakin (0,5 mg base pr. kg pr. dag i 14 dage).

G6PD-mangelfulde patienter (som bestemt ved fluorescerende spottest) blev kun randomiseret til artesunat-og chlorokinmonoterapigrupperne. Emner blev fulgt dagligt til overvåget lægemiddelbehandling. Opfølgningen fortsatte ugentligt i 8 uger og derefter hver 4.uge i i alt 1 år. Patienter med mikroskopi bekræftede P. vivaks-infektioner blev genbehandlet med det samme studielægemiddel som i den oprindelige tildeling. Patienter i artesunat-eller chlorokinmonoterapigrupperne, der oplevede mere end 9 gentagelser, fik radikal kurativ behandling med standardprimakinregimet (0,5 mg base pr.kg pr. dag i 14 dage).

bedste Primakin-Dosisstudie (BPD)

mellem februar 2012 og juli 2014 blev 680 patienter ældre end 6 måneder inkluderet i et fire-vejs randomiseret kontrolleret forsøg, der samtidig sammenlignede to regimer med primakin (0,5 mg/kg dagligt i 14 dage eller 1 mg/kg dagligt i 7 dage) kombineret med en af to blodstadiebehandlinger: chlorokin (25 mg base pr.kg) eller dihydroartemisinin-piperakin (dihydroartemisinin 7 og piperakin 55 mg/kg). Alle doser blev overvåget.

inklusions-og eksklusionskriterierne for denne undersøgelse var de samme som for undersøgelsen, bortset fra følgende: patienter blev ekskluderet, hvis de var G6PD-mangelfulde ved fluorescerende spottest, havde en hæmatokrit mindre end 25% eller havde modtaget en blodtransfusion inden for 3 måneder.

opfølgningsbesøg fandt sted i uge 2 og 4 og derefter hver 4.uge i i alt et år. Enhver tilbagevendende P. ved mikroskopi blev der anvendt et standardregime med chlorokin (25 mg base pr.kg over 3 dage) og primakin (0,5 mg base pr. kg pr. dag i 14 dage).

Mikrosatellitgenotypebestemmelse

Fuldblod til fuldstændig blodtælling blev opsamlet ved venepunktur i et 2 mL EDTA-rør. Det resterende fuldblod blev frosset ved -80 KP. genomisk DNA blev ekstraheret fra 1 mL venøst blod ved hjælp af et automatiseret DNA-ekstraktionssystem Chiasymphony SP (Chiagen, Tyskland) og Chiasymphony DSP DNA mini kit (Chiagen, Tyskland) i henhold til producentens anvisninger. For at sammenligne de genotypiske mønstre af primære infektioner og gentagelser genotypede vi oprindeligt ved hjælp af tre polymorfe mikrosatellit loci, der gav meget ren amplifikation: ingen stammetoppe og pålidelighed af PCR-amplifikation ved de lave parasittætheder, der normalt findes i tilbagevendende infektioner. Disse centrale loci var PV.3.27, PV.3.502 og PV.ms8. En seminested PCR-tilgang blev vedtaget for alle fragmenter12,39. Alle amplifikationsreaktioner blev udført i et totalt volumen på 10 liter og i nærvær af 10 mmol/L Tris-HCl (pH 8,3), 50 mmol/L KCl, 250 nmol/L af hver oligonukleotidprimer, 2,5 mmol/L MgCl2, 125 liter/l af hver af de fire TaKaRa-polymerase (TaKaRa BIO). Primære amplifikationsreaktioner blev initieret med 2 liter af det skabelongenomiske DNA fremstillet ud fra blodprøverne, og 1 liter af produktet af disse reaktioner blev anvendt til at initiere de sekundære amplifikationsreaktioner. Cykelparametrene for PCR var som følger: initial denaturering for 5 min ved 95 liter C forud for udglødning udført for 30 s ved 52 liter C, forlængelse udført for 30 s ved 72 liter C, og denaturering udført for 30 s ved 94 liter C. Efter et sidste udglødningstrin blev udført, efterfulgt af 2 minutter forlængelse, reaktionen blev stoppet. PCR-produkter blev opbevaret ved 4 liter C indtil analyse.

genotyperne af parasitter i tilbagevendende prøver blev sammenlignet med dem i tilmeldingsprøver, og prøvepar blev tildelt en rå klassificering baseret på IBS, defineret som relateret baseret på flertal IBS, hvis to eller tre af tre loci-typede viste tegn på IBS og forskellige baseret på flertal ikke IBS, ellers. Heteroalleliske opkald havde bevis for IBS, hvis de inkluderede et opkald, der var identisk med et andet på tværs af sammenligningen. Hvis de parrede prøver blev klassificeret som relaterede baseret på flertallet IBS, eller hvis en eller flere af de oprindelige loci ikke kunne amplificeres, blev seks yderligere (ikke-kerne) mikrosatellitmarkører genotypet (PV.1.501, PV. ms1, PV.ms5, PV.ms6, PV.ms7 og PV.ms16). for hver mikrosatellit er detaljer inklusive motiv, kromosom og position angivet i supplerende tabel 3. Optællinger af episoder opdelt efter antallet af yderligere markører, der er indtastet med succes, findes i supplerende Tabel 4. For at se, om yderligere markører bias tilbagefaldsinferens, delte vi sandsynligheden for tilbagefald udledt i null genetiske data med antallet af markører, der blev brugt til at estimere sandsynligheden for tilbagefald. Yderligere markører bias ikke tilbagefaldsinferens: sandsynligheden for tilbagefald falder fra prior med en til tre markører og stabiliseres derefter omkring 0,25 (supplerende Fig. 5).

for alleler, der kalder på mikrosatellitterne, blev PCR-produkternes længder målt i sammenligning med interne størrelsesstandarder (Genescan 500 LI) på en Abi 3100 genetisk analysator (PE Applied Biosystems) ved hjælp af GENESCAN og GENOTYPEPROGRAM (Applied Biosystems) til måling af allellængder og til kvantificering af spidshøjder. Flere alleler blev kaldt, når der var flere toppe pr locus og hvor mindre toppe var \(> 33 \%\) af højden af den overvejende allel. Vi inkluderede negative kontrolprøver (humant DNA eller ingen skabelon) i hver amplifikationskørsel. En delmængde af prøverne (n = 10) blev analyseret i tre eksemplarer for at bekræfte konsistensen af de opnåede resultater. Alle par primere blev testet for specificitet ved anvendelse af genomisk DNA fra P. falciparum eller mennesker.

Time-to-event-model for gentagelse af malaria

for tilbagevendende infektioner i undersøgelserne udviklede og sammenlignede vi to bayesiske blandingsmodeller med blandede effekter, der beskriver data fra tid til begivenhed betinget af det indgivne behandlingslægemiddel. Den første model (model 1) antog 100% effektivitet af højdosis primakin med kun reinfektion mulig efter radikal kur. Den anden model (model 2) tillod tilbagefald og rekrudescens efter højdosis primakin. En komplet liste over antagelser vedrørende begge modeller findes i supplerende tabel 5. Model 1 fungerede som en basismodel til vurdering af robusthed. Model 2 blev brugt som den endelige model, og alle rapporterede estimater er afledt af den. Notation blev valgt for at være i overensstemmelse med den matematiske notation for den genetiske model (se nedenfor). Bemærk, at i modelnotationen, der følger \(n\), er et indeks, mens det ovenfor bruges til at betegne tællinger. For hver enkelt indekseret af abonnementet \(n \ i 1..N\), registrerer Vi tidsintervallerne (i dage) mellem på hinanden følgende P. vivaks episoder (tilmeldingsepisoden betegnes episode 0). Det sidste tidsinterval er ret censureret i slutningen af opfølgningen. Modellerne antager ingen valgforstyrrelse fra tab til opfølgning. For \({n}{{\mathrm{{th}}}}\) individuelle data vedrørende tidsinterval \(t\) (tiden mellem episode \(t-1\) og episode \(t\)) er af formen \({{\boldsymbol{x}}}_{n}^{(t)}\) = {\({D}_{n}^{t},{Z}_{n}^{t},{C}_{n}^{t},{E}_{n}\)}, hvor \({D}_{n}^{t}\i \{{\rm{SOM}},{\rm{CK}},{\rm{PMQ}}+\}\) er det stof kombination anvendes til behandling af episode \(t-1\) (DA: artesunate monoterapi; CK: chloroquine monoterapi; PMQ\({}^{+}\): ({c}_{n}^{t}\) er tidsintervallet i dage,\ ({c}_{n}^{t} \i\{0,1\}\) angiver, om intervallet blev censureret, hvor 1 svarer til en højre censureret observation (dvs.opfølgning afsluttet før den næste gentagelse blev observeret) og 0 svarer til en observeret tilbagevendende infektion, og\ ({S}_{n}\) angiver den undersøgelse, som patienten blev rekrutteret til (1: VH, 2: BPD). Generelt, lad \({{\boldsymbol {}}}_{n}\) = {\({{\boldsymbol{k}}}_{n}^{(0)},\ldots ,{{\boldsymbol{K}}} _ {n}^{(T)}\)} angiver alle tilgængelige tid-til-begivenhed data for \({n}{{\mathrm{{th}}}}\) person. Få gentagelser (otte) forekom i de første 8 uger for patienter randomiseret til dihydroartemisinin-piperakin-armene i BPD-forsøget, så vi modellerede den post-profylaktiske periode af piperakin som identisk med chlorokin\({}^{+}\) omfatter både chlorokin og dihydroartemisinin-piperakin som blod-fase behandlinger). I virkeligheden, eliminationsprofilerne og de indre aktiviteter er lidt forskellige, med piperakin, der giver lidt længere aseksuel sceneundertrykkelse end klorokin.

i begge modeller modelleres time-to-recidiv som en blanding af fire fordelinger med blandingsvægte afhængigt af behandlingen af den foregående episode. Blandingsfordelingerne svarer til de forskellige tilbagefaldstilstande. De fire blandinger er: reinfektion, givet ved en eksponentiel fordeling; tidligt (periodisk) tilbagefald, givet ved en Vævsfordeling med behandlingsafhængige parametre; sent (konstant-rate) tilbagefald, givet ved en eksponentiel fordeling; recrudescence, givet ved en eksponentiel fordeling. Model 2 angiver forskellige blandingsforhold for geninfektionskomponenten i grupperne ikke-primakin og primakin, \({p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CK}}}\) og \({p}_{n}^{{\rm{PK+}}}\), henholdsvis. Blandingsandelen mellem tidligt/periodisk og sent/konstant-rate tilbagefald inden for tilbagefaldskomponenten er den samme på tværs af primakin-og ikke-primakin-grupper.

sandsynligheden for model 2 er angivet som

$${J} _ {n}^{T} \sim \; {p}_{n}^{{D}_{n}^{t}} {\mathcal{E}} ({\lambda }_{{S}_{n}})\left(1-{p}_{n}^{{D}_{n}^{t}}\right)\Big\{\left(1-{c}^{{D}_{n}^{t}}\right)\big(q{\mathcal{W}}({\mu } _{{D}_{n}^{t}}, {k}_{{d} _ {n}^{t}})\\ + (1-K) {\mathcal{E}} (\gamma) \ big) + {C}^{{D}_{n}^{t}} {\mathcal{E}} ({\lambda } _{{\rm{RC}}}) \ Big\},$$
(1)

hvor \({p}_{n}^{(\cdot )}\in (0,1)\) er den individuelle og lægemiddelspecifikke blandings Sandsynlighed for reinfektion (vi indstiller forud for at afspejle vores tro på, at \({\rm{AS}}}={p}_{n}^{{\rm{as}}}\ < \ {p}_{n}^{{\rm{PMK+}}}\) og \({c}^{(\cdot)} \in (0,1)\) er den indlejret lægemiddelspecifik blanding Sandsynlighed for recrudescence.

sandsynligheden for model 1 er den samme, bortset fra at \({p}_{n}^{{\rm{PMK+}}}=1\) (kun reinfektion mulig). \({\mathcal{E}} (\cdot )\) angiver den eksponentielle fordeling. I begge modeller er \({\lambda }_{{s}_{n}}\) den undersøgelsesspecifikke reinfektionshastighed. Forholdet mellem \({\lambda }_{1}\) og \({\lambda }_{2}\) er parametriseret som \({\lambda }_{2}=\delta {\lambda }_{1}\), Hvor priors er specificeret for \({\lambda }_{1}\) og \(\delta\). \(\delta\) specificerede faldet i transmission mellem undersøgelsesperioderne VHG og BPD. \({\lambda }_{{\rm{RC}}}\) er rekrudescensfrekvensen (antaget lægemiddeluafhængig). \({c}^{{d}_{n}^{t}}\) er en lægemiddelafhængig indlejret blandingsandel mellem rekrudescens og tilbagefald. Tiden til tilbagefald er i sig selv en blandingsfordeling, hvor \(k\) er den dobbelt indlejrede blandingsandel mellem tidlige (første komponent) og sene (anden komponent) tilbagefald. Dette er en fast andel på tværs af alle individer. De sene / konstante tilbagefald parameteriseres af hastighedskonstanten \(\gamma\). De tidlige tilbagefald antages at være distribueret, betegnet \({\mathcal{V}}(\cdot ,\cdot )\), med lægemiddelafhængige skalaparametre \({\mu }_{{d}_{n}^{t}}\) og formparametre \({k}_{{d}_{n}^{t}}\) hvorved med \({\mu }_{{\rm{CK}}}={\mu }_{{\rm{PMK+}}}) og\ ({K}_{{\rm{k}}}={k}_{{\rm{PMK+}}}\).

den individuelle marginale Sandsynlighed for reinfektion er givet af \({p}_{n}^{{d}_{n}^{t}}\); den individuelle marginale Sandsynlighed for recrudescence er givet af \(\left{c}^{{d}_{n}^{t}}\); den individuelle marginale Sandsynlighed for tilbagefald er givet af \(\left\left\).

vi brugte informative tidligere distributioner (supplerende tabel 1) for at sikre identifikation af blandingskomponenterne. Informationsindhold i dataene ud over det, der er specificeret i prior, blev undersøgt visuelt ved hjælp af tidligere til bageste plot. Det forudgående til bageste plot for model 2 er vist i supplerende Fig. 6. Identifikation af parametre blev bestemt ved simulering. Halvtreds syntetiske datasæt blev trukket fra hver af de datagenererende processer defineret af Modeller 1 og 2 og en modificeret version af model 2, som inkorporerede sæsonbestemt reinfektion. Den sæsonbestemte komponent blev estimeret ud fra den empiriske fordeling af uge for tilmelding til BPD-og VHK-undersøgelserne. Modellerne blev derefter tilpasset disse simulerede datasæt, og estimerede parametre blev sammenlignet med simulerings-sandhedsparametre. Supplerende Fig. 7 viser de estimerede fejlfrekvenser (ved hjælp af model 2) i forhold til de sande fejlfrekvenser for data genereret under model 2 (velspecificeret modelpasning) og for data genereret under sæsonversionen af model 2 (mis-specificeret modelpasning). Sæsonbestemt reinfektion resulterer i en lille overvurdering af fejlfrekvensen. Posterior modelkontrol blev udført ved at simulere 500 syntetiske datasæt fra tid til begivenhed under den bageste forudsigelige fordeling af den endelige modelpasning. Personår for hver behandlingsarm blev valgt som sammenfattende statistik, der blev brugt til at beregne posterior forudsigelige p-værdier (supplerende Fig. 7).

stan-modellerne udsender (i) Monte Carlo posterior distributioner for alle modelparametre; (ii) posterior estimater af gentagelsestilstande for hvert tidsinterval \({{\boldsymbol {}}}_{n}^{(t)}\); (iii) log sandsynlighedsestimater for hver posterior lodtrækning. For hver model løb vi otte kæder med \(1{0}^{5}\) iterationer, udtynding pr 400 iterationer og kassere halvdelen for burn-in. Konvergens af MCMC-kæder blev vurderet ved hjælp af traceplots, der vurderede blanding og enighed mellem de otte uafhængige kæder. Alle disse analyser kan replikeres med online github repository.

Allelfrekvenser og effektiv kardinalitet

for hver mikrosatellitgenotype blev allelfrekvenser estimeret ved hjælp af alle tilgængelige genetiske data fra tilmeldingsepisoderne (137 VH, 79 BPD) og en multinomial-Dirichlet-model (supplerende Fig. 8). For hver markør den effektive kardinalitet \({n}^{* }\), defineret som antallet af alleler, der giver den samme sandsynlighed for identitet ved en tilfældighed givet ækvivalente allelfrekvenser, blev estimeret som en over summen af allelfrekvenserne kvadrat40. Fra de effektive kardinaliteter kan vi beregne antallet af hypotetiske bialleliske SNP ‘ er, som de ni mikrosatellitter svarer til som følger:

$${\rm{hypotetisk}}\ {\rm{SNP}}\ {\rm{count}}= \ sum _{m=1}^{m} {\mathrm{log}}_{{n} _ {{\rm{SNP}}}^{* }}({n} _ {m}^{* }),$$
(2)

hvor \(m\) er indekset over\ (M=9\) mikrosatellitter og logaritmen er base \({n}_{{\rm{SNP}}}^{* }\), den antagede gennemsnitlige effektive Kardinalitet af en hypotetisk SNP. Dette er 2 for en ideel SNP og cirka 1,5 for en realistisk SNP40.

genetisk model

den genetiske model udsender sandsynligheden for, at en tilbagevendende P. (1) tidligere sandsynligheder for, at episoden er en rekrudescens, tilbagefald eller reinfektion (i dette arbejde er de baseret på data fra tid til begivenhed); (2) et sæt populationsniveau allelfrekvensestimater; (3) tilgængelige genetiske data for de observerede episoder for det givne individ hver med højst ni polyalleliske mikrosatellitmarkører. For at udbrede usikkerhed i (1) og (2) tegner vi 100 Monte Carlo-prøver fra time-to-event-modellen og fra de bageste Dirichlet-fordelinger over allelfrekvenser for hver markør. Den genetiske model fanger ikke usikkerhed på grund af variation i antallet af genotypemarkører, da det er beregningsmæssigt uoverkommeligt at gøre det på nuværende tidspunkt. Ikke desto mindre fortolker den genetiske model ikke begrænsede data: når genotypede markører er få, returnerer den simpelthen estimater tæt på det foregående. Resten af dette afsnit giver en uformel beskrivelse af modellen. En detaljeret beskrivelse med en liste over antagelser og den fulde matematiske specifikation findes i de supplerende metoder.

for et givet individ anses parasitter inden for og på tværs af infektioner for enten at være fremmede, søskende eller kloner i forhold til hinanden (fremmede henviser til alle parasitter, hvis fælles herkomst går ud over en enkelt myg). Sættet af Inter-parasit relationer kan repræsenteres af en fuldt forbundet graf. Hvert toppunkt repræsenterer en haploid genotype, og hver kant mellem genotyper er mærket som et søskende eller en fremmed, når genotyperne er indeholdt i den samme infektion, eller som en klon, et søskende eller en fremmed, når genotyperne er fra forskellige infektioner. For komplekse infektioner er antallet af hjørner sat lig med COI, som er defineret som det maksimale antal alleler pr.

modellen antager, at tilbagefald kan forekomme for alle Inter-parasit-forhold på tværs af infektioner (fremmede, søskende og kloner), mens reinfektioner kun forekommer som fremmede og recrudescences kun som kloner. De vigtigste trin i modellen er som følger. Først, vi beregner sandsynligheden for de genetiske data, der er givet en mærket forholdsgraf. For det andet beregner vi sandsynligheden for den foreslåede graf, da den tilbagevendende episode er en recrudescence, et tilbagefald og en reinfektion. For det tredje opsummerer vi alle mulige grafer. Sættet med mærkede grafer inkluderer alle mulige måder at fase mikrosatellitdataene på (dvs.tilskrive alleler til haploide genotyper i komplekse infektioner) såvel som alle levedygtige forhold mellem haploide genotyper. For eksempel, hvis genotype A er en klon af B og B er en klon af C, er det eneste levedygtige forhold mellem A og C klonal.

begrebet relatedness (Sandsynlighed for IBD) funktioner i det første trin. Modellen estimerer dog ikke sammenhæng. I stedet estimerer den sandsynligheden for at observere de givne IBD-data ganget med sandsynligheden for IBD betinget af et specificeret forhold (f.eks. 0,5 for søskende i en udavlet population). Denne beregning gør brug af allelfrekvenser (delte almindelige alleler kan være identiske, men ikke nødvendigvis på grund af nedstigning, mens delte sjældne alleler er mere sandsynlige IBD). Vi opsummerer derefter de to mulige IBD-scenarier (alleler er IBD eller ej) for at opnå sandsynligheden for de observerede data betinget af det specificerede forhold,

$${\mathbb{P}}({\rm{data}}\ | \ {\rm{relationship}})= \;{\RM{data}}({\rm{data}}\ | \ {\RM{IBD}})\gange {\mathbb{P}}({\rm{IBD}} ({\RM{IBD}} \ | \{\RM{relationship}})\ \ + {\mathbb{P}} ({\rm{data}} \ | \{\rm{not}} \{\RM{IBD}}) \gange{\mathbb{P}} ({\rm{not}} \{\RM{IBD}} \ | \{\rm {relationship}}).$$

dette beregnes for alle de parvise forhold i forholdsgrafen (se supplerende metoder for alle detaljer).

beregningskompleksiteten af den genetiske model begrænser den til den fælles analyse af tre episoder (to gentagelser) pr. For hvert individ med mere end to gentagelser (54 patienter) estimerede vi parvise sandsynligheder for tilbagefaldstilstande mellem episoder (ved hjælp af ovenstående model) og konstruerede en adjacency matrice. Tilbagefaldssandsynligheder blev derefter defineret som proportional med den maksimale estimerede Sandsynlighed for tilbagefald med hensyn til alle foregående episoder, og sandsynligheden for recrudescence med hensyn til den direkte foregående episode. Sandsynligheden for reinfektion er komplementet til sandsynligheden for tilbagefald plus rekrudescens. Disse sandsynligheder blev derefter vægtet til summen til 1.

genetisk simulering

vi brugte simulering til at udforske markørkrav til tilbagevendende tilstandsinferens. Som beskrevet ovenfor blev data om 3 til 12 uafhængige mikrosatellitmarkører simuleret for parrede infektioner (en primær episode efterfulgt af en enkelt gentagelse) under tre scenarier: gentagelsen indeholder en haploid parasitgenotype, der enten er en søskende, fremmed eller klon af en haploid parasitgenotype i den primære infektion. De simulerede data blev analyseret under forudsætning af en ensartet forudgående over tilbagefaldstilstandene (dvs.rekrudescens, reinfektion og tilbagefald har hver tidligere sandsynligheder på en tredjedel). For hver af de fremmede, søskende og klonale scenarier, vi simulerede data for en indledende og tilbagevendende infektion med respektive Coi ‘er 1 & 1, 2 & 1, og 1 & 2, med og uden fejl; og respektive Coi’ er 3 & 1, uden fejl. For at illustrere modelens opførsel, når den blev anvendt på fejlagtige data, blev data med fejl simuleret ved hjælp af en ekstremt høj per-locus Sandsynlighed for fejl (0,2 versus realistisk fejl \(<\ 0.01\)41). Da COIs overskred en, var søskende, fremmed eller klon blandt ikke-relaterede fremmede haploide genotyper (en forholdsgraf med højst en enkelt ikke-fremmed kant). For et givet sæt Coi ‘ er giver denne type graf meget forskellige data og er således den mest udfordrende at analysere. For ikke-fejlagtige episoder med Coi ‘ er i 1 eller 2 udforskede vi kardinaliteter på 13 og 4 (henholdsvis gennemsnittet og minimumet af vores panel på ni mikrosatellitter). For de fejlagtige data og for episoderne med Coi ‘ er på 3 & 1 brugte vi kardinalitet svarende til 13 kun. Resultaterne af en illustrativ delmængde af de genetiske simuleringer er præsenteret i Fig. 5 og supplerende Fig. 3 og 4. Alle de genetiske simuleringer kan replikeres fra online github repository, se folder Simulation_Study.

klassificering af tilbagevendende episoder

estimeringen af den falske fejlopdagelseshastighed for den genetiske model og Fig. 4 begge kræver specifikation af klassificeringsgrænser. Vi valgte vilkårligt intervallet som usikkerhedsområdet. Hver gentagelse klassificeres enten som en reinfektion eller en fiasko, hvor fiasko enten er et tilbagefald eller en recrudescence: hvis summen af de øvre troværdige intervaller for tilbagefald plus recrudescence er mindre end 0,3, klassificeres gentagelsen som en reinfektion; hvis summen af de lavere troværdige intervaller for tilbagefald plus recrudescence overstiger 0,7, klassificeres gentagelsen som en fiasko; ellers betragtes klassificering som usikker. Da der var ubetydelige tegn på recrudescence, er alle fejl i det væsentlige tilbagefald.

Rapporteringsoversigt

yderligere information om forskningsdesign er tilgængelig i Nature Research Reporting Resume knyttet til denne artikel.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

Previous post Conejo Valley Guide | Conejo Valley Events
Next post brystforstørrelse