klinikai eljárások
mind a VHX, mind a BPD vizsgálatokat a Shoklo malária kutatóegység a Thaiföld–Mianmar határ mentén fekvő klinikákon,Thaiföld északnyugati részén, alacsony szezonális malária átvitelű területen18, 19. A betegpopulációk közé tartoznak a burmai és Kareni etnikumú migráns munkavállalók és lakóhelyüket elhagyni kényszerült személyek38. A vizsgálatok lefolytatásának ideje alatt a primaquine radical cure kezelés nem volt rutinszerű.
mindkét vizsgálatban a visszatérő epizódokat aktívan detektálták a tervezett látogatások során mikroszkóppal (a kimutatás alsó határa körülbelül 50 parazita / \(\upmu{\mathrm{{L}}}\)). A betegeket arra ösztönözték, hogy rosszullét esetén a tervezett látogatások között jöjjenek a klinikákra, így néhány kiújulást passzív módon észleltek (kevesebb, mint 5%). Minden kiújulást kezeltek, a tünetektől függetlenül.
etikai jóváhagyás
a BPD tanulmányt mind a Mahidol Egyetem Trópusi Orvostudományi Karának Etikai Bizottsága (MUTM 2011-043, TMEC 11-008), mind az Oxford trópusi kutatási Etikai Bizottság (OXTREC 17-11) jóváhagyta, és a ClinicalTrials.gov (NCT01640574). A VHX tanulmány etikai jóváhagyást kapott a Mahidol Egyetem Trópusi Orvostudományi Kar etikai Bizottságától (MUTM 2010-006) és az Oxford trópusi kutatási etikai Bizottságtól (OXTREC 04-10), és a ClinicalTrials.gov (NCT01074905).
Vivax History trial (VHX)
ezt a randomizált, kontrollos vizsgálatot 2010 májusa és 2012 októbere között végezték. Összesen 644, 6 hónaposnál idősebb és 7 kg-nál nagyobb testtömegű, mikroszkóppal igazolt, szövődménymentes P. vivax egyfajú fertőzést (csak a P. vivax-ot) randomizáltak artezunát (2 mg/ttkg naponta 5 napig), klorokin (25 mg bázis/ttkg osztva 3 napra: 10, 10 és 5 mg / ttkg) vagy klorokin plusz primakin (0, 5 mg bázis / ttkg naponta 14 napig) kezelésre.
G6PD-hiányos betegeket (fluoreszcens spot teszttel meghatározva) csak az artezunát és klorokin monoterápiás csoportokba randomizáltak. Az alanyokat naponta követték felügyelt gyógyszeres kezelés céljából. A követés hetente folytatódott 8 hétig, majd 4 hetente, összesen 1 évig. A mikroszkópiával igazolt P. vivax fertőzéseket ugyanazzal a vizsgálati gyógyszerrel kezelték, mint az eredeti elosztásban. Az artesunát vagy klorokin monoterápiás csoportokban szenvedő betegek, akik több mint 9 ismétlődést tapasztaltak, radikális gyógyító kezelést kaptak a standard primaquin kezeléssel (0,5 mg bázis / kg / nap 14 napig).
Best Primaquine Dose trial (BPD)
2012 februárja és 2014 júliusa között 680, 6 hónaposnál idősebb beteget vontak be egy négyutas, randomizált, kontrollos vizsgálatba, egyidejűleg két primaquin-kezelési sémát (napi 0,5 mg/ttkg 14 napon keresztül vagy 1 mg/ttkg naponta 7 napon keresztül) kombinálva a két vérfázisú kezelés egyikével: klorokin (25 mg bázis/kg) vagy dihidrartemizinin-piperakin (dihidrartemizinin 7 és piperakin 55 mg / kg). Minden adagot felügyeltek.
a vizsgálat felvételi és kizárási kritériumai ugyanazok voltak, mint a VHX vizsgálatban, kivéve a következőket: a betegeket kizárták, ha fluoreszcens spot teszttel G6PD-hiányosak voltak, hematokrit-értékük kevesebb, mint 25% volt, vagy 3 hónapon belül vérátömlesztést kaptak.
Utóvizsgálatokra a 2.és 4. héten, majd 4 hetente került sor, összesen egy éven keresztül. Bármely visszatérő P. a mikroszkóppal kimutatott vivax fertőzéseket (ugyanazok a kritériumok, mint a VHX esetében) standard klorokinnal (25 mg bázis / kg 3 nap alatt) és primakinnel (0, 5 mg bázis / kg / nap 14 napon keresztül) kezelték.
mikroszatellit genotipizálás
a teljes vérképet 2 mL-es EDTA-csőben vénapunkcióval gyűjtöttük össze. A maradék teljes vért lefagyasztottuk -80 ft-on. a vivax genomi DNS-t 1 mL vénás vérből extraháltuk egy automatizált DNS-extrakciós rendszer segítségével QIAsymphony SP (Qiagen, Németország) és QIAsymphony DSP DNS mini kit (Qiagen, Németország) a gyártó utasításainak megfelelően. Az elsődleges fertőzések és kiújulások genotípusos mintáinak összehasonlítása érdekében kezdetben három polimorf mikroszatellit lókuszt használtunk, amelyek nagyon tiszta amplifikációt biztosítottak: nincsenek dadogási csúcsok, és a PCR amplifikáció megbízhatósága az ismétlődő fertőzésekben általában előforduló alacsony parazitasűrűség mellett. Ezek a központi lókuszok PV voltak.3.27, PV.3.502 és PV.ms8. A seminested PCR megközelítést az összes töredékre alkalmazták12, 39. Az összes amplifikációs reakciót összesen 10 db 60 mmol/L trisz-HCl (pH 8,3), 50 mmol/L KCl, 250 nmol/L oligonukleotid primer, 2,5 mmol/L MgCl2, 125 ml 6 ml dezoxinukleozid-trifoszfát és 0,4 e TaKaRa polimeráz (TaKaRa BIO) jelenlétében végeztük. Az elsődleges amplifikációs reakciókat a vérmintákból előállított sablon genomi DNS 2 6L-jével indítottuk el, a másodlagos amplifikációs reakciók elindításához pedig e reakciók termékéből 1 xnumxl-t használtunk. A PCR ciklusparaméterei a következők voltak: kezdeti denaturálás 5 percig 95 C-nél, megelőzve a 30 másodpercig végzett lágyítást 52 C-nél, a meghosszabbítást 30 másodpercig 72 C-nél, a denaturálást pedig 30 másodpercig 94 C-nél. A PCR-termékeket az elemzésig 4CC-n tároltuk.
a visszatérő mintákban lévő paraziták genotípusait összehasonlítottuk a beiratkozási mintákban szereplőkkel, és a mintapárok nyers osztályozást kaptak az IBS alapján, amelyet a többségi IBS alapján rokonnak határoztak meg, ha a beírt három lókusz közül kettő vagy három IBS-t mutatott, és más a többség alapján nem IBS, egyébként. A heteroallelikus hívásoknak bizonyítékuk volt az IBS-re, ha olyan hívást tartalmaztak, amely azonos volt a másikkal az összehasonlítás során. Ha a párosított mintákat rokonnak minősítették a többségi IBS alapján, vagy ha a kezdeti lókuszok közül egy vagy több nem sikerült amplifikálni, hat további (nem mag) mikroszatellit markereket genotipizáltak (PV.1.501, PV.ms1, PV.ms5, PV.ms6, PV.ms7 és PV. ms16). minden mikroszatellit esetében a motívum, a kromoszóma és a helyzet részleteit a 3. Kiegészítő táblázat tartalmazza. A sikeresen beírt további jelölők számával felosztott epizódok számát A kiegészítő táblázat tartalmazza 4. Annak megállapítására, hogy további markerek torzítják-e a relapszus következtetését, felosztottuk a nullgenetikai adatokban levezetett relapszus valószínűségét a relapszus valószínűségének becsléséhez használt markerek számával. További markerek nem torzítják a relapszus következtetését: a relapszus valószínűsége az előzőhöz képest egy-három markerrel csökken, ezután 0,25 körül stabilizálódik (kiegészítő ábra. 5).
a mikroszatelliteket használó allélok esetében a PCR termékek hosszát a belső méretszabványokkal (Genescan 500 LIZ) összehasonlítva mértük egy ABI 3100 genetikai analizátoron (PE Applied Biosystems), GENESCAN és GENOTYPER szoftver (Applied Biosystems) segítségével az allélhossz mérésére és a csúcsmagasság számszerűsítésére. Több allélt hívtak, amikor lókuszonként több csúcs volt, és ahol kisebb csúcsok voltak \(> 33 \%\) az uralkodó allél magasságából. Negatív kontrollmintákat (emberi DNS vagy nincs sablon) vontunk be minden amplifikációs futtatásba. A minták egy részhalmazát (n = 10) három példányban elemeztük, hogy megerősítsük a kapott eredmények konzisztenciáját. Az összes primerpárt specificitás szempontjából teszteltük a P. falciparum vagy az emberek genomi DNS-ével.
a vivax malária kiújulásának Time-to-event modellje
a visszatérő P. vivax fertőzések esetében a VHX és a BPD vizsgálatokban két Bayes-féle vegyes hatású keverékmodellt fejlesztettünk ki és hasonlítottunk össze, amelyek leírják az eseményig eltelt idő adatait a beadott gyógyszertől függően. Az első modell (1.modell) a nagy dózisú primaquin 100%-os hatékonyságát feltételezte, csak radikális gyógyulás után lehetséges újrafertőzés. A második modell (2.modell) lehetővé tette a relapszust és a recrudescenciát nagy dózisú primakin után. A két modellre vonatkozó feltételezések teljes listája az 5. Kiegészítő táblázatban található. Az 1. modell alapmodellként szolgált a robusztusság felmérésére. A 2. modellt használták végső modellként, és az összes jelentett becslés ebből származik. A jelölést úgy választották meg, hogy összhangban legyen a genetikai modell matematikai jelölésével (lásd alább). Vegye figyelembe, hogy a következő modelljelölésben \(n\) egy index, míg felette a számok jelölésére szolgál. Minden egyes indexelt az index \(n \ in 1..N\), rögzítjük az egymást követő P. vivax epizódok közötti időintervallumokat (napokban) (a beiratkozási epizódot 0. Az utolsó időintervallum helyes Cenzúrázott A nyomon követés végén. A modellek nem feltételeznek szelekciós torzítást a veszteségtől a nyomon követésig. A \({n}{{\mathrm{{th}}}}\) egyedi, vonatkozó adatok időintervallum \(t\) (az idő között epizód \(t-1\) és Epizód \(t\)) a következő formában: \({{\boldsymbol{x}}}_{n}^{(t)}\) = {\({D}_{n}^{t},{Z}_{n}^{t},{C}_{n}^{t},{S}_{n}\)}, ahol \({d}_{n}^{t}\in \{{\rm{as}},{\rm{CQ}},{\rm{PMQ}}+\}\) az epizód kezelésére alkalmazott gyógyszerkombináció \(t-1\) (as: artesunate monoterápia; CQ: klorokin monoterápia; PMQ\({}^{+}\): primaquine plusz vér stádiumú kezelés), \({z}_{n}^{t}\) az az időintervallum napokban, \({c}_{n}^{t}\in \{0,1\}\) azt jelöli, hogy az intervallumot cenzúrázták-e, ahol az 1 megfelel egy jobb cenzúrázott megfigyelésnek (azaz a nyomon követés a következő megismétlődés megfigyelése előtt fejeződött be), a 0 pedig egy megfigyelt visszatérő fertőzésnek felel meg, és \({S}_{n}\) azt a vizsgálatot jelöli, amelybe a beteget felvették (1: VHX, 2: BPD). Általában legyen \ ({{\boldsymbol{x}}} _ {n}\) = {\({{\boldsymbol{x}}} _ {n}^{(0)},\ldots ,{{\boldsymbol{x}}}_{n}^{(T)}\)} jelöli az összes rendelkezésre álló idő-esemény adatot a \({n}{{\mathrm{{th}}}}\) egyén számára. Kevés kiújulás (nyolc) fordult elő az első 8 hétben azoknál a betegeknél, akiket randomizáltak a BPD vizsgálat dihidrartemisinin-piperakin karjaiba, ezért a piperakin profilaktikus utáni periódusát a klorokinéval azonos módon modelleztük (azaz PMQ\({}^{+}\) magában foglalja mind a klorokint, mind a dihidrartemizinin-piperakint vérfázisú kezelésként). A valóságban az eliminációs profilok és a belső tevékenységek kissé eltérnek egymástól, a piperakin valamivel hosszabb aszexuális stádium-szuppressziót biztosít, mint a klorokin.
mindkét modellben az ismétlődésig eltelt időt négy Eloszlás keverékeként modellezik, a keverék súlyával az előző epizód kezelésétől függően. A keverékeloszlások megfelelnek a különböző ismétlődési állapotoknak. A négy keverék a következő: újrafertőzés, amelyet exponenciális eloszlás ad; korai (időszakos) relapszus, amelyet a Weibull Eloszlás a kezelés gyógyszerfüggő paramétereivel; késői (állandó sebességű) relapszus, amelyet egy exponenciális eloszlás ad; rekrudeszcencia, amelyet egy exponenciális eloszlás ad. A 2. modell különböző keverési arányokat határoz meg az újrafertőző komponens számára a nem primaquin és primaquin csoportokban, \({p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CQ}}}\) és \({p}_{n}^{{\rm{PMQ+}}}\) sorrendben. A relapszus komponensen belül a korai/periodikus és késői/állandó sebességű relapszus keverési aránya azonos a primakin és a nem primakin csoportokban.
a 2. modell valószínűsége a következő
ahol \({p}_{n}^{(\cdot )}\in (0,1)\) az újrafertőződés egyéni és gyógyszerspecifikus keveréke (a priort úgy állítottuk be, hogy tükrözze azt a meggyőződésünket, hogy \({p}_{n}^{{\rm{as}}}={p}_{n}^{{\rm{CQ}}}\ < \ {p}_{n}^{{\rm{PMQ+}}}\)) és \({c}^{(\cdot )}\in (0,1)\) az beágyazott gyógyszer-specifikus keverék a rekrudeszcencia valószínűsége.
az 1. modell valószínűsége ugyanaz, kivéve, hogy \({p} _ {n}^{{\rm{PMQ+}}}=1\) (csak újrafertőzés lehetséges). \({\mathcal{E}} (\cdot)\) az exponenciális eloszlást jelöli. Mindkét modellben a \({\lambda }_{{S}_{n}}\) A vizsgálat specifikus újrafertőzési aránya. A \({\lambda }_{1}\) és \({\lambda }_{2}\) közötti kapcsolat paramétere \({\lambda }_{2}=\delta {\lambda }_{1}\), ahol a priorok a \({\lambda }_{1}\) és \(\delta\). \(\delta\) a VHX és a BPD vizsgálati periódusok közötti transzmisszió csökkenését határozta meg. \({\lambda} _{{\RM{RC}}}\) a rekrudeszcencia sebessége (feltételezett gyógyszerfüggetlen). \({c}^{{D} _ {n}^{t}}\) egy gyógyszerfüggő beágyazott keverési arány a rekrudeszcencia és a relapszus között. A relapszus ideje önmagában egy keverékeloszlás, ahol \(q\) A korai (első komponens) és a késői (második komponens) relapszusok kétszeresen beágyazott keverési aránya. Ez egy rögzített arány az összes egyén között. A késői / állandó sebességű relapszusokat a \(\gamma\) sebességi állandó paraméterezi. A korai relapszusok Weibull eloszlásúak, \({\mathcal{W}}(\cdot ,\cdot )\), gyógyszerfüggő skálaparaméterekkel \({\mu }_{{D}_{n}^{t}}\) és alakparaméterekkel \({k}_{{D}_{n}^{t}}\), ahol \({\mu }_{{\rm{CQ}}}={\mu }_{{\rm{PMQ+}}}\) és \({K}_{{\RM{CQ}}}={k}_{{\rm{PMQ+}}}\).
az újrafertőzés egyéni marginális valószínűségét \({p}_{n}^{{D}_{n}^{t}}\) adja meg; a recrudeszcencia egyéni marginális valószínűségét \(\left{c}^{{D}_{n}^{t}}\) adja meg; a visszaesés egyéni marginális valószínűségét \(\left\left\) adja meg.
informatív előzetes eloszlásokat használtunk (1.Kiegészítő táblázat) a keverék összetevőinek azonosíthatóságának biztosítása érdekében. Az adatok információtartalmát a priorban meghatározottakon felül vizuálisan vizsgáltuk a posterior előtti parcellák felhasználásával. A modell előtti-hátsó ábrája 2 a kiegészítő ábrán látható. 6. A paraméterek azonosíthatóságát szimulációval határoztuk meg. Ötven szintetikus adatkészletet vontak le az 1.és 2. modell által meghatározott adatgeneráló folyamatokból, valamint a 2. modell módosított változatából, amely magában foglalta a szezonális újrafertőződést. A szezonális komponenst a BPD és VHX vizsgálatokba való beiratkozás heteinek empirikus megoszlása alapján becsülték meg. A modellek ezután illeszkedtek ezekhez a szimulált adatkészletekhez, és a becsült paramétereket összehasonlították a szimulációs igazság paraméterekkel. Kiegészítő Ábra. A 7. ábra a becsült PMQ+ hibaszázalékokat mutatja (a 2. modell használatával) a 2.modell (jól meghatározott modellillesztés), illetve a 2. modell szezonális változata (rosszul meghatározott modellillesztés) alapján generált adatok valós hibaszázalékaival szemben. A szezonális újrafertőzés a hibaarány enyhe túlbecslését eredményezi. A hátsó modellellenőrzést 500 szintetikus idő-esemény adatkészlet szimulálásával végeztük a végső modell illesztésének hátsó prediktív eloszlása alatt. Az egyes kezelési karokra eső személyenkénti ismétlődések számát választották összefoglaló statisztikák kiszámításához használt posterior prediktív p értékek (kiegészítő ábra. 7).
a stan modellek kimenetet adnak (i) Monte Carlo hátsó eloszlások az összes modellparaméterhez; (ii) az ismétlődési állapotok utólagos becslései minden egyes időintervallumhoz \({{\boldsymbol{x}}}_{n}^{(t)}\); (iii) naplózni az egyes hátsó sorsolások valószínűségi becsléseit. Minden modellnél nyolc láncot futottunk \(1{0}^{5}\) iterációk, ritkítás 400 iterációnként, és a fele eldobása a beégéshez. Az MCMC-láncok konvergenciáját a nyolc független lánc keveredését és egyetértését értékelő nyomelemekkel értékelték. Mindezek az elemzések megismételhetők az online github adattárral.
Allélfrekvenciák és hatékony kardinalitás
minden egyes mikroszatellit genotipizált allélfrekvenciát a beiratkozási epizódokból (137 VHX, 79 BPD) és egy multinomiális-Dirichlet modellből (kiegészítő ábra) származó összes rendelkezésre álló genetikai adat felhasználásával becsülték meg. 8). Minden marker esetében a tényleges kardinalitás \({n}^ { * }\), amelyet azon allélok számaként határoztak meg, amelyek véletlenszerűen azonos identitási valószínűséget biztosítanak, adott ekvivalens allélfrekvenciák, az allélfrekvenciák négyzetének összegénél eggyel becsülték meg40. A hatékony kardinalitásokból kiszámolhatjuk a hipotetikus biallelikus SNP-k számát, amelyeket a kilenc mikroszatellit a következőképpen egyenlít ki:
ahol \(m\) az index A\ (M=9\) mikroszatelliteken, a logaritmus pedig bázis \({n} _ {{\rm{SNP}}}^{* }\), a feltételezett átlagos tényleges kardinalitás egy hipotetikus SNP. Ez az ideális SNP esetében 2, a reális SNP40 esetében pedig körülbelül 1,5.
genetikai modell
a genetikai modell azt a valószínűséget adja ki, hogy egy visszatérő P. vivax epizód egy adott egyénben a recrudescence, relapszus, vagy újrafertőződés a korábban megfigyelt epizódok tekintetében, három bemenetet adva: (1) annak előzetes valószínűsége, hogy az epizód recrudescence, relapszus vagy újrafertőzés (ebben a munkában az eseményig eltelt idő adatain alapulnak); (2) populációs szintű allélfrekvencia-becslések halmaza; (3) rendelkezésre álló genetikai adatok az adott egyén megfigyelt epizódjairól, amelyek mindegyike legfeljebb kilenc poliallelikus mikroszatellit markerrel rendelkezik. Az (1) és (2) bizonytalanságának terjesztéséhez 100 Monte Carlo mintát veszünk az idő-esemény modellből és a posterior Dirichlet eloszlásokból az allél frekvenciákon minden markerhez. A genetikai modell nem ragadja meg a bizonytalanságot a genotipizált markerek számának változása miatt, mivel számítási szempontból ez jelenleg tiltó. Ennek ellenére a genetikai modell nem értelmezi túl a korlátozott adatokat: ha a genotipizált markerek kevések, akkor egyszerűen az előzőhöz közeli becsléseket ad vissza. A szakasz többi része informális leírást ad a modellről. A részletes leírás a feltételezések listájával és a teljes matematikai specifikációval a kiegészítő módszerekben található.
egy adott egyén esetében a fertőzéseken belüli és kívüli parazitákat vagy idegeneknek, testvéreknek vagy klónoknak tekintik egymáshoz viszonyítva (az idegenek minden olyan parazitára utalnak, amelynek közös származása egyetlen szúnyogon túlra nyúlik vissza). A paraziták közötti kapcsolatok halmazát egy teljesen összekapcsolt grafikon ábrázolhatja. Minden csúcs egy haploid genotípust képvisel, és a genotípusok közötti éleket testvérnek vagy idegennek jelölik, ha a genotípusok ugyanabban a fertőzésben vannak, vagy klónként, testvérként vagy idegenként, ha a genotípusok különböző fertőzésekből származnak. Komplex fertőzések esetén a csúcsok száma megegyezik a COI-val, amelyet a megfigyelt markerenkénti allélok maximális számaként határozunk meg.
a modell feltételezi, hogy relapszusok fordulhatnak elő minden parazita közötti kapcsolat esetén a fertőzések között (idegenek, testvérek és klónok), míg az újrafertőzések csak idegenként fordulnak elő, a rekrudescenciák pedig csak klónokként. A modell legfontosabb lépései a következők. Első, kiszámítjuk a genetikai adatok valószínűségét egy címkézett Kapcsolati grafikon alapján. Másodszor, kiszámítjuk a javasolt grafikon valószínűségét, mivel a visszatérő epizód egy recrudescence, relapszus és újrafertőzés. Harmadszor, összegezzük az összes lehetséges grafikont. A címkézett gráfok halmaza tartalmazza a mikroszatellit adatok fázisosításának minden lehetséges módját (azaz az allélokat haploid genotípusoknak tulajdonítják komplex fertőzésekben), valamint a haploid genotípusok közötti összes életképes kapcsolatot. Például, ha az A genotípus B klónja, B pedig C klónja, akkor az egyetlen életképes kapcsolat a és C között klonális.
az összefüggés fogalma (az IBD valószínűsége) az első lépésben szerepel. A modell azonban nem becsüli meg a rokonságot. Ehelyett megbecsüli a megadott adatok megfigyelésének valószínűségét IBD szorozva az IBD valószínűségével, amely egy meghatározott kapcsolattól függ (például 0,5 a testvérek esetében egy kitenyésztett populációban). Ez a számítás allélfrekvenciákat használ (a közös közös allélek valószínűleg azonosak, de nem feltétlenül a süllyedés miatt, míg a megosztott ritka allélek valószínűbb IBD). Ezután összegezzük a két lehetséges IBD forgatókönyvet (allélek IBD vagy sem), hogy megkapjuk a megfigyelt adatok valószínűségét a megadott kapcsolattól függően,
ezt a Kapcsolati grafikon összes páros kapcsolatára kiszámítják (a részletekért lásd a kiegészítő módszereket).
a genetikai modell számítási bonyolultsága három epizód (két kiújulás) együttes elemzésére korlátozza betegenként (adatainkban ez a helyzet 158 beteg esetében). Minden olyan egyén esetében, akinek több mint két kiújulása van (54 beteg), megbecsültük az epizódok közötti kiújulási állapotok páros valószínűségét (a fenti modell segítségével), és felépítettünk egy szomszédsági mátrixot. A relapszus valószínűségét ezután úgy határozták meg, hogy arányos legyen a relapszus maximális becsült valószínűségével az összes előző epizód tekintetében, valamint a recrudescencia valószínűségével a közvetlenül megelőző epizód tekintetében. Az újrafertőzés valószínűsége a relapszus valószínűségének kiegészítése plusz recrudeszcencia. Ezeket a valószínűségeket ezután újra súlyozták 1-re.
genetikai szimuláció
szimulációt használtunk a visszatérő állapotkövetés marker követelményeinek feltárására. A fent leírtak szerint 3-12 független mikroszatellit markerre vonatkozó adatokat szimuláltunk párosított fertőzésekre (egy elsődleges epizód, amelyet egyetlen kiújulás követ) három forgatókönyv szerint: a kiújulás haploid parazita genotípust tartalmaz, amely vagy testvér, idegen, vagy egy haploid parazita genotípus klónja az elsődleges fertőzésben. A szimulált adatokat úgy elemeztük, hogy az ismétlődési állapotokhoz képest egységes prior-t feltételeztünk (azaz a rekrudeszcencia, az újrafertőződés és a relapszus előzetes valószínűsége egyharmados). Mindegyik idegen, testvér és klonális forgatókönyv esetében szimuláltuk az adatokat egy kezdeti és visszatérő fertőzésre a megfelelő Coi-kkal 1 & 1, 2 & 1, és 1 & 2, hibával vagy anélkül; és a megfelelő COIs 3 & 1, hiba nélkül. A modell hibás adatokra történő alkalmazásának szemléltetésére a hibás adatokat rendkívül magas helyenkénti hibalehetőség alkalmazásával szimuláltuk (0,2 versus reális hiba \(<\ 0.01\)41). Amikor a COIs meghaladta az egyet, a testvér, az idegen vagy a klón nem kapcsolódó idegen haploid genotípusok közé tartozott (egy Kapcsolati grafikon legfeljebb egyetlen Nem Idegen éllel). Egy adott Coi-halmaz esetében az ilyen típusú grafikon rendkívül változatos adatokat szolgáltat, ezért a legnagyobb kihívást az elemzés jelenti. Az 1.vagy 2. Coi-val nem hibás epizódok esetében a 13. és a 4. kardinalitást vizsgáltuk (kilenc mikroszatellitből álló panelünk átlaga, illetve minimuma). A hibás adatok és a 3 & 1 COIs-val rendelkező epizódok esetében csak a 13-nak megfelelő kardinalitást használtuk. A genetikai szimulációk szemléltető részhalmazának eredményeit az ábra mutatja be. 5. Kiegészítő füge. 3 és 4. Az összes genetikai szimuláció megismételhető az online github adattárból, lásd a Simulation_Study mappát.
az ismétlődő epizódok osztályozása
a genetikai modell és a Fig hamis hibafelfedezési arányának becslése. 4 mindkettő szükségessé teszi az osztályozási határok meghatározását. Önkényesen választottuk az intervallumot a bizonytalanság zónájaként. Minden ismétlődést vagy újrafertőzésnek, vagy kudarcnak minősítenek, ahol a kudarc vagy visszaesés, vagy rekrudeszcencia: ha a relapszus plusz recrudeszcencia felső hiteles intervallumainak összege kevesebb, mint 0,3, akkor az ismétlődést újrafertőzésnek kell besorolni; ha a relapszus plusz recrudeszcencia alacsonyabb hiteles intervallumainak összege meghaladja a 0,7-et, akkor az ismétlődést kudarcnak kell besorolni; különben a besorolást bizonytalannak kell tekinteni. Mivel elhanyagolható bizonyíték volt a recrudescenciára, minden kudarc lényegében relapszus.
jelentés összefoglaló
a kutatási tervezéssel kapcsolatos további információk a cikkhez kapcsolódó Nature Research Reporting Summary-ban találhatók.