Rozwiązywanie przyczyn nawracającej malarii Plasmodium vivax probabilistycznie / Nature Communications

procedury kliniczne

zarówno badania VHX, jak i BPD zostały przeprowadzone przez Shoklo Malaria Research Unit w klinikach wzdłuż granicy Tajlandia–Mjanma w północno-zachodniej Tajlandii,na obszarze o niskiej sezonowej transmisji malarii 18, 19. Wśród pacjentów znajdują się pracownicy migrujący i przesiedleńcy z narodowości Burman i Karen 38. W czasie, gdy przeprowadzono te badania, leczenie primaquine rodnic cure nie było rutynowe.

w obu badaniach, nawracające epizody były aktywnie wykrywane podczas zaplanowanych wizyt mikroskopem (dolna granica wykrywalności to około 50 pasożytów na $\upmu{\mathrm{{l}}}$). Pacjenci byli zachęcani do przychodzenia do klinik między zaplanowanymi wizytami w przypadku złego samopoczucia, a więc niektóre nawroty były wykrywane biernie (mniej niż 5%). Wszystkie nawroty były leczone, niezależnie od objawów.

zatwierdzenie etyczne

badanie BPD zostało zatwierdzone zarówno przez Mahidol University Faculty of Tropical Medicine Ethics Committee (MUTM 2011-043, TMEC 11-008), jak i Oxford Tropical Research Ethics Committee (OXTREC 17-11) i zostało zarejestrowane w ClinicalTrials.gov (NCT01640574) Badanie VHX zostało zatwierdzone etycznie przez Mahidol University Faculty of Tropical Medicine Ethics Committee (MUTM 2010-006) i Oxford Tropical Research Ethics Committee (OXTREC 04-10) i zostało zarejestrowane w ClinicalTrials.gov (NCT01074905)

badanie Vivax w wywiadzie (VHX)

to randomizowane, kontrolowane badanie przeprowadzono w okresie od maja 2010 r.do października 2012 r. Łącznie 644 pacjentów w wieku powyżej 6 miesięcy i o masie ciała większej niż 7 kg, u których mikroskopowo potwierdzono niepowikłane zakażenie mono-gatunkowe P. vivax (tylko P. vivax), przydzielono losowo do grup otrzymujących artezunat (2 mg / kg mc.na dobę przez 5 dni), chlorochinę (25 mg zasady na kg mc. podzielone przez 3 dni: 10, 10 i 5 mg/kg mc.) lub chlorochinę i prymachinę (0,5 mg zasady na kg mc. na dobę przez 14 dni).

pacjenci z niedoborem G6PD (co określono za pomocą fluorescencyjnego testu punktowego) byli randomizowani tylko do grup otrzymujących artezunat i chlorochinę w monoterapii. Pacjenci byli codziennie Obserwowani w celu nadzorowanego leczenia farmakologicznego. Obserwacja kontynuowana co tydzień przez 8 tygodni, a następnie co 4 tygodnie przez łącznie 1 rok. Pacjenci z potwierdzonymi zakażeniami P. vivax w mikroskopie zostali poddani ponownej terapii tym samym badanym lekiem, co w pierwotnej alokacji. Pacjenci w grupach otrzymujących artezunat lub chlorochinę w monoterapii, u których wystąpiło więcej niż 9 nawrotów, otrzymywali leczenie radykalne standardowym schematem prymachiny (0, 5 mg zasady na kg mc.na dobę przez 14 dni).

Best Primaquine Dose trial (BPD)

między lutym 2012 r. a lipcem 2014 r. 680 pacjentów w wieku powyżej 6 miesięcy zostało włączonych do czterodrożnego, randomizowanego, kontrolowanego badania porównującego jednocześnie dwa schematy leczenia primaquiną (0, 5 mg/kg mc. na dobę przez 14 dni lub 1 mg/kg mc. na dobę przez 7 dni) w połączeniu z jednym z dwóch schematów leczenia w fazie krwi: chlorochina (25 mg zasady na kg) lub dihydroartemizynina-piperachina(dihydroartemizynina 7 i piperachina 55 mg / kg). Wszystkie dawki były nadzorowane.

kryteria włączenia i wykluczenia w tym badaniu były takie same jak w badaniu VHX, z wyjątkiem następujących przypadków: pacjenci zostali wykluczeni, jeśli w wyniku fluorescencyjnego testu punktowego mieli niedobór G6PD, hematokryt mniejszy niż 25% lub przeszli transfuzję krwi w ciągu 3 miesięcy.

wizyty kontrolne miały miejsce w 2 i 4 tygodniu, a następnie co 4 tygodnie przez łącznie jeden rok. Wszelkie nawracające P. zakażenia produktu vivax wykryte mikroskopowo (takie same kryteria jak w przypadku VHX) leczono standardowym schematem zawierającym chlorochinę (25 mg zasady na kg mc.przez 3 dni) i prymachinę (0,5 mg zasady na kg mc. na dobę przez 14 dni).

genotypowanie Mikrosatelitarne

krew pełną do badania morfologii krwi pobrano za pomocą wkłucia dożylnego w probówce EDTA o pojemności 2 mL. Pozostałą krew pełną zamrożono w temperaturze -80 °C. P. genomowy DNA vivax ekstrahowano z 1 mL krwi żylnej za pomocą automatycznego systemu ekstrakcji DNA QIAsymphony SP (Qiagen, Niemcy) i QIAsymphony DSP DNA Mini kit (Qiagen, Niemcy) zgodnie z instrukcjami producenta. W celu porównania wzorców genotypowych pierwotnych zakażeń i nawrotów, genotypowaliśmy początkowo przy użyciu trzech polimorficznych loci mikrosatelitów, które zapewniły bardzo czyste wzmocnienie: brak szczytów jąkania i niezawodność wzmocnienia PCR przy niskich gęstościach pasożytów zwykle występujących w nawracających infekcjach. Te główne loci były PV.3.27, PV.3.502 i PV.ms8. W odniesieniu do wszystkich fragmentów12,39 przyjęto podejście oparte na seminariach dotyczących PCR. Wszystkie reakcje amplifikacji przeprowadzono w całkowitej objętości 10 µL i w obecności 10 mmol/l Tris-HCl (pH 8,3), 50 mmol/l KCl, 250 nmol/l każdego startera oligonukleotydowego, 2,5 mmol / l MgCl2, 125 µmol / l każdego z czterech trifosforanów deoksynukleozydów i 0,4 U polimerazy Takara (TaKaRa BIO). Pierwotne reakcje amplifikacji inicjowano za pomocą 2 µL genomowego DNA szablonu przygotowanego z próbek krwi, a do inicjowania wtórnych reakcji amplifikacji użyto 1 µL produktu tych reakcji. Parametry cykli dla PCR były następujące: wstępna denaturacja przez 5 min w temperaturze 95 °C poprzedzona wyżarzaniem przez 30 s w temperaturze 52 ° C, przedłużanie przez 30 S w temperaturze 72 °C i denaturacja przez 30 S w temperaturze 94 °C. Po końcowym etapie wyżarzania, a następnie 2 min przedłużania, reakcję zatrzymano. Produkty PCR przechowywano w temperaturze 4 °C do czasu analizy.

genotypy pasożytów w próbkach nawracających porównano z genotypami w próbkach rekrutacyjnych, a parom próbek przypisano surową klasyfikację opartą na IBS, zdefiniowaną jako pokrewną w oparciu o Większość IBS, jeśli dwa lub trzy z trzech typowanych loci wykazały dowody IBS, a różne w oparciu o większość nie IBS, w przeciwnym razie. Heteroalleliczne połączenia miały dowody na IBS, jeśli zawierały połączenie, które było identyczne z innym w porównaniu. Jeśli sparowane próbki zostały sklasyfikowane jako powiązane na podstawie większości IBS lub jeśli jeden lub więcej początkowych loci nie uległo amplifikacji, genotypowano sześć dodatkowych (Nie-rdzeniowych) markerów mikrosatelitarnych (PV.1.501, PV. ms1, PV. ms5, PV.ms6, PV.ms7 i PV. ms16). dla każdego mikrosatelituszczegóły, w tym motyw, chromosom i położenie, przedstawiono w dodatkowej Tabeli 3. Liczby odcinków podzielonych na liczby dodatkowych znaczników wpisanych pomyślnie podano w dodatkowej tabeli 4. Aby sprawdzić, czy dodatkowe markery nie wpływają na wnioskowanie nawrotu, podzieliliśmy prawdopodobieństwo nawrotu wnioskowane w zerowych danych genetycznych na liczbę markerów używanych do oszacowania prawdopodobieństwa nawrotu. Dodatkowe markery nie odchylają wnioskowania o nawrocie choroby: prawdopodobieństwo nawrotu zmniejsza się od poprzedniego z jednym do trzech markerów, stabilizując się około 0,25 później (dodatkowe rys. 5).

w przypadku wywoływania alleli przez mikrosatelitów, długości produktów PCR mierzono w porównaniu ze standardami wielkości wewnętrznych (Genescan 500 LIZ) na analizatorze genetycznym ABI 3100 (PE Applied Biosystems), przy użyciu oprogramowania GENESCAN i GENOTYPER (Applied Biosystems) do pomiaru długości alleli i ilościowego określenia wysokości pików. Wielokrotne allele nazywano wtedy, gdy na locus było wiele szczytów i gdy mniejsze szczyty były $> 33 \%$ wysokości dominującego allelu. W każdej próbie amplifikacji uwzględniliśmy negatywne próbki kontrolne (ludzkie DNA lub brak szablonu). Podgrupa próbek (n = 10) była analizowana w trzech egzemplarzach w celu potwierdzenia spójności uzyskanych wyników. Wszystkie pary starterów testowano pod kątem swoistości przy użyciu genomowego DNA P. falciparum lub ludzi.

Model czasu do zdarzenia nawrotu malarii vivax

w przypadku nawracających zakażeń P. vivax w badaniach VHX i BPD opracowaliśmy i porównaliśmy dwa modele mieszanek bayesowskich o mieszanym działaniu opisujące dane dotyczące czasu do zdarzenia w zależności od podawanego leku. Pierwszy model (model 1) zakładał 100% skuteczność prymachiny w dużych dawkach z możliwością reinfekcji tylko po wyleczeniu rodnikiem. Drugi model (model 2) pozwalał na nawrót i ponowny proces po podaniu wysokiej dawki prymachiny. Pełny wykaz założeń dotyczących obu modeli znajduje się w dodatkowej Tabeli 5. Model 1 służył jako model podstawowy do oceny wytrzymałości. Model 2 został użyty jako ostateczny model i wszystkie zgłoszone szacunki pochodzą z niego. Notacja została wybrana tak, aby była zgodna z notacją matematyczną dla modelu genetycznego (patrz poniżej). Zauważ, że w notacji modelu, która następuje $n$ jest indeksem, podczas gdy powyżej jest używany do oznaczania liczników. Dla każdej osoby indeksowanej przez indeks dolny $n\w 1..N$, zapisujemy przedziały czasowe (w dniach) pomiędzy kolejnymi odcinkami P. vivax (odcinek zapisowy oznaczany jest jako odcinek 0). Ostatni przedział czasu jest dokładnie ocenzurowany pod koniec obserwacji. Modele nie zakładają nastawienia wyboru od straty do kontynuacji. Dla jednostki ${n}{{\mathrm{{th}}}$, dane dotyczące przedziału czasowego $t$ (czas pomiędzy odcinkiem $t-1$ A odcinkiem $t$) mają postać ${{\boldsymbol{x}}}_{n}^{(t)}$ = {$D}_{N}^{T}, {Z}_{N}^{t}, {C}_{n}^{t}, {s}_{n}$}, gdzie ${d}_{n}^{t}\in \{{\RM {as}}, {\RM {cq}}, {\RM {PMQ}}+\}$ to kombinacja leków stosowana w leczeniu epizodu $t-1$ (jako: monoterapia artesunatem; cq: monoterapia chlorochiną; PMQ${}^{+}$: ${Z}_{n}^{t}$ to przedział czasu w dniach, ${C}_{n}^{t}\in \{0,1\}$ oznacza, czy przedział został ocenzurowany, gdzie 1 odpowiada prawej ocenzurowanej obserwacji (tj. obserwacji zakończonej przed kolejnym nawrotem) i 0 odpowiada obserwowanemu nawrotowi zakażenia, A ${S}_{N}$ oznacza badanie, do którego włączono pacjenta (1: VHX, 2: BPD). Ogólnie niech ${{\boldsymbol{x}}}_{n}$ = {${{\boldsymbol{x}}}_{n}^{(0)},\ldots ,{{\boldsymbol{x}}} _ {n}^{(T)}$} oznaczają wszystkie dostępne dane dotyczące czasu do zdarzenia dla jednostki ${n} {{\mathrm{{th}}}}$. Kilka nawrotów (osiem) wystąpiło w ciągu pierwszych 8 tygodni u pacjentów zrandomizowanych do ramion dihydroartemizyniny-piperachiny w badaniu BPD, więc modelowaliśmy okres po profilaktyce piperachiny jako identyczny z okresem chlorochiny (tj.${}^{+}$ obejmuje zarówno chlorochinę, jak i dihydroartemizyninę-piperachinę jako leczenie na etapie krwi). W rzeczywistości profile eliminacji i wewnętrzne działania są nieco inne, a piperachina zapewnia nieco dłuższą aseksualną supresję niż chlorochina.

w obu modelach czas do nawrotu jest modelowany jako mieszanina czterech rozkładów, z masą mieszaniny w zależności od leczenia poprzedniego epizodu. Rozkład mieszaniny odpowiada różnym stanom nawrotu. Cztery mieszaniny to: reinfekcja, podana przez rozkład wykładniczy; wczesny (okresowy) nawrót, podany przez rozkład Weibulla z parametrami zależnymi od leku; nawrót późny (stały), podany przez rozkład wykładniczy; nawrót, podany przez rozkład wykładniczy. Model 2 określa różne proporcje mieszania dla komponentu reinfekcji w grupach innych niż prymachina i prymachina, ${p} _ {n}^{{\RM{AS}}} = {p}_{n}^{{\RM{CQ}}}$ i ${p}_{n}^{{\RM{PMQ+}}}$, odpowiednio. Proporcja mieszania pomiędzy wczesnymi/okresowymi i późnymi / stałymi nawrotami w składniku nawrotów jest taka sama w grupach prymachiny i innych niż prymachina.

Prawdopodobieństwo dla modelu 2 jest podane jako

$${Z}_{n}^{t} \sim \; {p} _ {n}^{D} _ {n}^{t}} {\mathcal{E}} ({\lambda }_{{S}_{n}})\left(1-{p}_{n}^{{D}_{n}^{t}}\right)\Big\{\left(1-{c}^{{D}_{n}^{t}}\right)\big(q{\mathcal{W}}({\mu} _ {d} _ {n}^{t}}, {k}_{D}_{n}^{t}})\\ + (1-q) {\mathcal {E}}(\gamma )\big)+{c}^{D}_{n}^{t}} {\mathcal{E}} ({\lambda } _{{\rm{RC}}}) \ Big\},$$

(1)

gdzie ${p}_{n}^{(\cdot )}\in (0,1)$ jest indywidualnym i specyficznym dla leku prawdopodobieństwem reinfekcji (ustawiamy poprzedni, aby odzwierciedlić nasze przekonanie, że ${p}_{n}^{{\RM{AS}}}={p}_{n}^{{\RM{CQ}}}\ < \ {p}_{n}^{{\RM{PMQ+}}}$) i ${C}^{(\cdot )}\in (0,1)$ jest zagnieżdżona mieszanina specyficzna dla leku prawdopodobieństwo rekrudescencji.

Prawdopodobieństwo dla modelu 1 jest takie samo, z wyjątkiem tego, że ${p} _ {n}^{{\RM{PMQ+}}}=1$ (możliwa jest tylko reinfekcja). ${\mathcal{E}} (\cdot )$ oznacza rozkład wykładniczy. W obu modelach ${\lambda } _ {{s} _ {n}}$ jest wskaźnikiem reinfekcji specyficznym dla badania. Zależność pomiędzy ${\lambda } _ {1}$ i ${\lambda }_{2}$ jest parametryzowana jako ${\lambda }_{2}=\delta {\lambda }_{1}$, Gdzie Priory są określone dla ${\lambda }_{1}$ i $\delta$. $\delta$ określa zmniejszenie transmisji między okresami badania VHX i BPD. ${\lambda }_{{\rm{RC}}}$ jest współczynnikiem recrudescencji (zakłada się, że lek jest niezależny). ${C}^{{D} _ {N}^{t}}$ jest zależną od leku zagnieżdżoną proporcją mieszania między ponownym odruchem a nawrotem. Czas do nawrotu jest rozkładem mieszaniny, gdzie $q$ jest podwójnie zagnieżdżoną proporcją mieszania między wczesnymi (pierwszy składnik) i późnymi (drugi składnik) nawrotami. Jest to stała proporcja we wszystkich osobach. Nawroty późnej / stałej szybkości są parametryzowane przez stałą szybkości $\gamma$. Przyjmuje się, że wczesne nawroty są rozproszone Weibulla, oznaczone ${\mathcal{W}}(\cdot, \cdot)$, z zależnymi od leku parametrami skali ${\mu} _{D}_{n}^{t}}$ i parametrami kształtu ${k}_{d}_{n}^{t}}$, przy czym ${\mu} _{{\rm {CQ}}}={\mu} _{{\RM {PMQ+}}}$ i ${K}_{{\RM {CQ}}}={k}_{{\RM {PMQ+}}}$.

Indywidualne marginalne prawdopodobieństwo reinfekcji jest podane przez ${p} _ {n}^{{D} _ {n}^{t}}$; Indywidualne marginalne prawdopodobieństwo ponownego wyleczenia jest podane przez $\left{c}^{{D} _ {n}^{t}}$; Indywidualne marginalne prawdopodobieństwo nawrotu jest podane przez $\left\left$.

zastosowaliśmy wstępne dystrybucje informacyjne (tabela uzupełniająca 1), aby zapewnić identyfikowalność składników mieszaniny. Zawartość informacji zawartych w danych, poza danymi określonymi w poprzednim, została zbadana wzrokowo z wykorzystaniem Wykresów przed-tylnych. Wykres przed-tylny dla modelu 2 przedstawiono na fig. uzupełniającym. 6. Identyfikowalność parametrów została określona za pomocą symulacji. Pięćdziesiąt syntetycznych zestawów danych zostało zaczerpniętych z każdego z procesów generowania danych zdefiniowanych przez modele 1 i 2 oraz zmodyfikowaną wersję modelu 2, która obejmowała reinfekcję sezonową. Składnik sezonowy oszacowano na podstawie empirycznego rozkładu tygodnia zapisów do badań BPD i VHX. Modele były następnie dopasowane do tych symulowanych zestawów danych, a szacowane parametry zostały porównane z parametrami symulacji-prawdy. Dodatkowe Rys. 7 pokazuje szacowane współczynniki awaryjności PMQ+ (przy użyciu modelu 2) w porównaniu z rzeczywistymi współczynnikami awaryjności dla danych generowanych w modelu 2 (dobrze określone dopasowanie modelu) i dla danych generowanych w wersji sezonowej modelu 2 (źle określone dopasowanie modelu), odpowiednio. Sezonowa reinfekcja skutkuje lekkim zawyżeniem wskaźnika niepowodzeń. Sprawdzenie modelu tylnego przeprowadzono symulując 500 syntetycznych zestawów danych dotyczących czasu do zdarzenia w ramach tylnego rozkładu predykcyjnego końcowego dopasowania modelu. Liczbę nawrotów na osobo-rok dla każdego z ramion leczenia wybrano jako zbiorczą statystykę wykorzystywaną do obliczenia tylnych predykcyjnych wartości p (Fig. 7).

modele stan wyprowadzają (i) rozkład Tylny Monte Carlo dla wszystkich parametrów modelu; (ii) tylne oszacowania Stanów nawrotów dla każdego przedziału czasowego ${{\boldsymbol{x}}}_{n}^{(t)}$; (iii) oszacowania prawdopodobieństwa logowania każdego losowania tylnego. Dla każdego modelu uruchomiliśmy osiem łańcuchów z $1{0}^{5}$ iteracje, przerzedzenie na 400 iteracji i odrzucenie połowy na wypalanie. Konwergencję łańcuchów MCMC oceniano za pomocą traceplots oceniających mieszanie i zgodność ośmiu niezależnych łańcuchów. Wszystkie te analizy można replikować za pomocą internetowego repozytorium github.

częstotliwości alleli i efektywna cardinalność

dla każdego genotypu mikrosatelitarnego, częstotliwości alleli oszacowano na podstawie wszystkich dostępnych danych genetycznych z epizodów rekrutacji (137 VHX, 79 BPD) i wielomianowego modelu Dirichleta (dodatkowe rys. 8). Dla każdego markera efektywna cardinalność ${n}^ {*}$, zdefiniowana jako liczba alleli, które dają takie samo prawdopodobieństwo identyczności przez przypadek, biorąc pod uwagę równe częstotliwości alleli, została oszacowana jako jeden nad sumą częstotliwości alleli do kwadratu40. Na podstawie efektywnych cardinalitów możemy obliczyć liczbę hipotetycznych biallelitycznych SNP, którym odpowiada dziewięć mikrosatelitów w następujący sposób:

$${\rm {\RM {SNP}}\ {\RM {count}}=\sum _{m = 1}^{M} {\mathrm{log}}_{{n}_{{\RM{SNP}}}^{* }}({n} _ {m}^{* }),$$

(2)

gdzie $M$ jest indeksem nad mikrosatelitami $m = 9$, a logarytm jest bazą ${n}_{{\rm{SNP}}}^{* }$, zakładana średnia efektywna cardinalność hipotetycznego SNP. Jest to 2 dla idealnego SNP i około 1,5 dla realistycznego SNP40.

Model genetyczny

Epizod vivax u danej osoby jest ponownym wystąpieniem, nawrotem lub reinfekcją w odniesieniu do wcześniej zaobserwowanych epizodów, biorąc pod uwagę trzy dane wejściowe: (1) wcześniejsze prawdopodobieństwo, że epizod jest ponownym wystąpieniem, nawrotem lub reinfekcją (w tej pracy są one oparte na danych dotyczących czasu do zdarzenia); (2) zestaw szacunków częstości alleli na poziomie populacji; (3) dostępne dane genetyczne dla obserwowanych epizodów dla danej osoby, każdy z co najwyżej dziewięcioma poliallelicowymi markerami mikrosatelitarnymi. Aby propagować niepewność w (1) i (2), rysujemy 100 próbek Monte Carlo z modelu time-to-event i z tylnego rozkładu Dirichleta po częstotliwościach alleli dla każdego markera. Model genetyczny nie wychwytuje niepewności spowodowanej zmiennością liczby markerów genotypowych, ponieważ obecnie jest to obliczeniowo zaporowe. Niemniej jednak model genetyczny nie interpretuje ograniczonych danych: gdy markerów genotypowych jest niewiele, po prostu zwraca szacunki zbliżone do wcześniejszych. Reszta tej sekcji podaje nieformalny opis modelu. Szczegółowy opis z listą założeń i pełną specyfikacją matematyczną znajduje się w metodach uzupełniających.

dla danego osobnika pasożyty wewnątrz i między zakażeniami są uważane za obcych, rodzeństwo lub klony w stosunku do siebie (strangers odnosi się do wszystkich pasożytów, których wspólne pochodzenie datuje się poza pojedynczym komarem). Zbiór relacji międzygatunkowych może być reprezentowany przez w pełni połączony Wykres. Każdy wierzchołek reprezentuje haploidalny genotyp, a każda krawędź między genotypami jest oznaczana jako rodzeństwo lub obcy, gdy genotypy są zawarte w tej samej infekcji, lub jako klon, rodzeństwo lub obcy, gdy genotypy pochodzą z różnych infekcji. W przypadku zakażeń złożonych liczba wierzchołków jest równa COI, która jest zdefiniowana jako maksymalna liczba alleli na obserwowany marker.

model zakłada, że nawroty mogą wystąpić dla wszystkich relacji między pasożytami w obrębie infekcji (obcy, rodzeństwo i klony), podczas gdy reinfekcje występują tylko jako obcy, a nawroty tylko jako klony. Kluczowe kroki w modelu są następujące. Po pierwsze, obliczamy prawdopodobieństwo danych genetycznych na oznakowanym wykresie zależności. Po drugie, obliczamy prawdopodobieństwo proponowanego wykresu, biorąc pod uwagę, że nawracający Epizod to ponowna dekrudescencja, nawrót i reinfekcja. Po trzecie, sumujemy wszystkie możliwe wykresy. Zestaw oznakowanych Wykresów zawiera wszystkie możliwe sposoby fazowania danych mikrosatelitarnych (tj. przypisywanie alleli genotypom haploidalnym w złożonych zakażeniach), jak również wszystkie możliwe relacje między genotypami haploidalnymi. Na przykład, jeśli genotyp a jest klonem B, A B jest klonem C, jedyną realną relacją między A I C jest klonalna.

pojęcie zależności (prawdopodobieństwa IBD) w pierwszym kroku. Model nie ocenia jednak pokrewieństwa. Zamiast tego szacuje prawdopodobieństwo obserwacji danych podanych IBD pomnożone przez Prawdopodobieństwo IBD w zależności od określonego związku (np. 0,5 dla rodzeństwa w populacji outbred). W obliczeniach tych wykorzystuje się częstotliwości alleli (wspólne allele wspólne mogą być identyczne, ale niekoniecznie ze względu na zejście, podczas gdy wspólne rzadkie allele są bardziej prawdopodobne). Następnie sumujemy dwa możliwe scenariusze IBD (allele są IBD lub nie), aby uzyskać prawdopodobieństwo obserwowanych danych uzależnione od określonej zależności,

$${\mathbb{P}}({\RM{data}}\ | \ {\RM{relationship}})= \;{\mathbb{P}}({\RM{data}}\ | \ {\RM{IBD}})\times {\mathbb{P}}({\RM{IBD}}\ | \ {\RM{relationship}})\\ + {\mathbb{P}}({\RM{data}}\ | \ {\RM{not}}\ {\RM{IBD}})\times {\mathbb{P}}({\RM{not}}\ {\RM{IBD}}\ | \ {\RM{relationship}}).$$

jest to obliczane dla wszystkich par relacji na wykresie zależności (zobacz metody uzupełniające, aby uzyskać szczegółowe informacje).

złożoność obliczeniowa modelu genetycznego ogranicza go do wspólnej analizy trzech epizodów (dwóch nawrotów) na pacjenta (w naszych danych dotyczy to 158 pacjentów). Dla każdego osobnika z więcej niż dwoma nawrotami (54 pacjentów) oszacowaliśmy parowe prawdopodobieństwo Stanów nawrotów między epizodami (stosując powyższy model) i skonstruowaliśmy macierz adjacency. Prawdopodobieństwo nawrotu zostało następnie zdefiniowane jako proporcjonalne do maksymalnego szacowanego prawdopodobieństwa nawrotu w odniesieniu do wszystkich poprzednich epizodów oraz prawdopodobieństwa nawrotu w odniesieniu do bezpośrednio poprzedzającego epizodu. Prawdopodobieństwo reinfekcji jest dopełnieniem prawdopodobieństwa nawrotu plus ponownej śmierci. Te prawdopodobieństwa zostały następnie ponownie ważone do sumy do 1.

symulacja genetyczna

wykorzystaliśmy symulację do zbadania wymagań markera dla wnioskowania Stanów nawracających. Jak opisano powyżej, dane dotyczące od 3 do 12 niezależnych markerów mikrosatelitowych symulowano w odniesieniu do sparowanych zakażeń (jeden epizod pierwotny, a następnie pojedynczy nawrót) w trzech scenariuszach: nawrót zawiera haploidalny genotyp pasożyta, który jest albo rodzeństwem, obcym, albo klonem haploidalnego genotypu pasożyta w pierwotnym zakażeniu. Symulowane dane analizowano przy założeniu jednakowego stanu poprzedzającego nawrót (tj. ponowne wyleczenie, reinfekcja i nawrót mają wcześniejsze prawdopodobieństwo jednej trzeciej). Dla każdego ze scenariuszy obcych, rodzeństwa i klonów symulowaliśmy dane dotyczące początkowej i nawracającej infekcji odpowiednimi Coi 1 & 1, 2 & 1, i 1 & 2, z błędem i bez błędu; i odpowiednie COIs 3 & 1, bez błędu. Aby zilustrować zachowanie modelu przy zastosowaniu do błędnych danych, dane z błędem były symulowane przy użyciu bardzo wysokiego prawdopodobieństwa błędu per-locus (0,2 w porównaniu z błędem realistycznym$<\ 0.01$41). Gdy COIs przekroczył jeden, rodzeństwo, obcy lub klon był wśród niepowiązanych genotypów haploidalnych obcych (Wykres relacji z co najwyżej pojedynczą krawędzią nie-obcego). Dla danego zestawu Coi, ten typ wykresu daje bardzo zróżnicowane Dane i dlatego jest najtrudniejszy do analizy. W przypadku nie błędnych epizodów z Coi w 1 lub 2 zbadaliśmy Kardynalność 13 i 4 (odpowiednio średnia i minimum z naszego panelu dziewięciu mikrosatelitów). Dla błędnych danych i dla odcinków z COIs 3 & 1 użyliśmy tylko cardinality równą 13. Wyniki ilustracyjnego podzbioru symulacji genetycznych przedstawiono na Fig. 5 i dodatkowe figi. 3 i 4. Wszystkie symulacje genetyczne mogą być replikowane z internetowego repozytorium github, patrz folder Simulation_Study.

Klasyfikacja epizodów nawracających

oszacowanie wskaźnika wykrywalności fałszywej porażki modelu genetycznego i Fig. 4 oba wymagają określenia granic klasyfikacji. Arbitralnie wybraliśmy przedział jako strefę niepewności. Każdy nawrót jest klasyfikowany jako reinfekcja lub niepowodzenie, w którym niepowodzenie jest albo nawrotem lub ponowną reakcją: jeśli suma górnych wiarygodnych interwałów nawrotu plus ponowna rekrucja jest mniejsza niż 0,3, nawrót jest klasyfikowany jako reinfekcja; jeśli suma niższych wiarygodnych interwałów nawrotu plus ponowna rekrucja przekracza 0,7, nawrót jest klasyfikowany jako niepowodzenie; w przeciwnym razie klasyfikacja jest uważana za niepewną. Ponieważ nie było nieistotnych dowodów na ponowną regenerację, wszystkie niepowodzenia są zasadniczo nawrotami.

podsumowanie sprawozdania

więcej informacji na temat projektu badawczego można znaleźć w podsumowaniu sprawozdania z badań przyrodniczych połączonym z tym artykułem.

rozwiązywanie przyczyn nawracającej malarii Plasmodium vivax probabilistycznie