Résolution probabiliste de la cause du paludisme récurrent à Plasmodium vivax / Communications nature

Procédures cliniques

Les essais VHX et BPD ont été menés par l’Unité de recherche sur le paludisme de Shoklo dans des cliniques situées le long de la frontière entre la Thaïlande et le Myanmar, dans le nord–ouest de la Thaïlande, une région à faible transmission saisonnière du paludisme.18,19. Les populations de patients comprennent les travailleurs migrants et les personnes déplacées d’ethnie birmane et karen 38. Pendant la période où ces études ont été menées, le traitement par cure radicale à la primaquine n’était pas systématique.

Dans les deux études, des épisodes récurrents ont été détectés activement lors des visites programmées par microscopie (la limite inférieure de détection est d’environ 50 parasites par $\upmu{\mathrm{{L}}}$). Les patients ont été encouragés à se rendre aux cliniques entre les visites programmées en cas de malaise et certaines récidives ont donc été détectées passivement (moins de 5%). Toutes les récidives ont été traitées, quels que soient les symptômes.

Approbation éthique

L’étude BPD a été approuvée à la fois par le Comité d’éthique de la Faculté de Médecine Tropicale de l’Université Mahidol (MUTM 2011-043, TMEC 11-008) et par le Comité d’Éthique de la Recherche Tropicale d’Oxford (OXTREC 17-11) et a été enregistrée à ClinicalTrials.gov (NCT01640574). L’étude VHX a reçu l’approbation éthique du Comité d’éthique de la Faculté de Médecine Tropicale de l’Université Mahidol (MUTM 2010-006) et du Comité d’Éthique de la Recherche Tropicale d’Oxford (OXTREC 04-10) et a été enregistrée à ClinicalTrials.gov (NCT01074905).

Essai historique Vivax (VHX)

Cet essai contrôlé randomisé a été mené entre mai 2010 et octobre 2012. Au total, 644 patients âgés de plus de 6 mois et pesant plus de 7 kg avec une infection mono-espèce non compliquée de P. vivax confirmée par microscopie (P. vivax uniquement) ont été randomisés pour recevoir de l’artésunate (2 mg / kg par jour pendant 5 jours), de la chloroquine (25 mg de base par kg répartis sur 3 jours: 10, 10 et 5 mg / kg) ou de la chloroquine plus primaquine (0,5 mg de base par kg par jour pendant 14 jours).

Patients déficients en G6PD (tels que déterminés par le test par points fluorescents) ont été randomisés uniquement dans les groupes artésunate et chloroquine en monothérapie. Les sujets étaient suivis quotidiennement pour un traitement médicamenteux supervisé. Le suivi s’est poursuivi chaque semaine pendant 8 semaines, puis toutes les 4 semaines pendant un total de 1 an. Les patients présentant des infections à P. vivax confirmées par microscopie ont été retirés avec le même médicament à l’étude que dans l’allocation initiale. Les patients des groupes artésunate ou chloroquine en monothérapie qui ont présenté plus de 9 récidives ont reçu un traitement curatif radical avec le schéma standard de primaquine (0,5 mg de base par kg par jour pendant 14 jours).

Meilleur essai sur la dose de primaquine (BPJ)

Entre février 2012 et juillet 2014, 680 patients de plus de 6 mois ont été inclus dans un essai contrôlé randomisé à quatre voies comparant simultanément deux schémas thérapeutiques de primaquine (0,5 mg/ kg par jour pendant 14 jours ou 1 mg/ kg par jour pendant 7 jours) associés à l’un des deux traitements au stade sanguin: chloroquine (25 mg de base par kg) ou dihydroartémisinine-pipéraquine (dihydroartémisinine 7 et pipéraquine 55 mg / kg). Toutes les doses ont été supervisées.

Les critères d’inclusion et d’exclusion de cette étude étaient les mêmes que pour l’essai VHX, à l’exception des suivants: les patients étaient exclus s’ils étaient déficients en G6PD par le test par points fluorescents, avaient un hématocrite inférieur à 25% ou avaient reçu une transfusion sanguine dans les 3 mois.

Les visites de suivi ont eu lieu les semaines 2 et 4, puis toutes les 4 semaines pendant un an au total. Tout P récurrent. les infections à vivax détectées par microscopie (mêmes critères que pour VHX) ont été traitées avec un schéma standard de chloroquine (25 mg de base par kg pendant 3 jours) et de primaquine (0,5 mg de base par kg et par jour pendant 14 jours).

Génotypage de microsatellites

Le sang total pour la numération globulaire complète a été recueilli par ponction veineuse dans un tube EDTA de 2 mL. Le sang total restant a été congelé à -80 °C.P. l’ADN génomique vivax a été extrait de 1 mL de sang veineux à l’aide d’un système d’extraction d’ADN automatisé QIAsymphony SP (Qiagen, Allemagne) et QIAsymphony DSP DNA mini kit (Qiagen, Allemagne) selon les instructions du fabricant. Afin de comparer les profils génotypiques des infections primaires et des récidives, nous avons d’abord génotypé en utilisant trois locus microsatellites polymorphes qui fournissaient une amplification très nette: pas de pics de bégaiement et fiabilité de l’amplification par PCR aux faibles densités de parasites habituellement trouvées dans les infections récurrentes. Ces loci centraux étaient PV.3.27, PV.3.502, et PV.ms8. Une approche de PCR seminested a été adoptée pour tous les fragments12,39. Toutes les réactions d’amplification ont été réalisées dans un volume total de 10 µL et en présence de 10 mmol/L de Tris-HCl (pH 8,3), 50 mmol/L de KCl, 250 nmol/L de chaque amorce oligonucléotidique, 2,5 mmol/L de MgCl2, 125 µmol/L de chacun des quatre désoxynucléosides triphosphates, et 0,4 U de TaKaRa polymérase (TaKaRa BIO). Des réactions d’amplification primaire ont été initiées avec 2 µL de l’ADN génomique modèle préparé à partir des échantillons de sang, et 1 µL du produit de ces réactions a été utilisé pour initier les réactions d’amplification secondaire. Les paramètres de cyclage pour la PCR sont les suivants : dénaturation initiale pendant 5 min à 95 °C précédée d’un recuit effectué pendant 30 s à 52 °C, d’une extension effectuée pendant 30 s à 72 °C et d’une dénaturation effectuée pendant 30 s à 94 °C. Après une dernière étape de recuit, suivie de 2 min d’extension, la réaction est arrêtée. Les produits PCR ont été conservés à 4 °C jusqu’à l’analyse.

Les génotypes des parasites dans les échantillons récurrents ont été comparés à ceux des échantillons d’enrôlement, et les paires d’échantillons ont reçu une classification brute basée sur le SCI, définie comme apparentée basée sur le SCI majoritaire, si deux ou trois des trois loci typés présentaient des signes de SCI, et différente basée sur la majorité et non sur le SCI, sinon. Les appels hétéroalléliques présentaient une preuve de SCI s’ils incluaient un appel identique à un autre dans la comparaison. Si les échantillons appariés étaient classés comme apparentés sur la base du SII majoritaire, ou si un ou plusieurs des loci initiaux ne s’amplifiaient pas, six marqueurs microsatellites supplémentaires (non essentiels) étaient génotypés (PV.1.501, PV.ms1, PV.ms5, PV.ms6, PV.ms7 et PV.ms16). Pour chaque microsatellite, les détails, y compris le motif, le chromosome et la position, sont fournis dans le tableau supplémentaire 3. Le nombre d’épisodes partitionnés par le nombre de marqueurs supplémentaires tapés avec succès est fourni dans le tableau supplémentaire 4. Pour voir si d’autres marqueurs biaisent l’inférence de rechute, nous avons divisé la probabilité de rechute déduite dans les données génétiques nulles par le nombre de marqueurs utilisés pour estimer la probabilité de rechute. Les marqueurs supplémentaires ne biaisent pas l’inférence de rechute : la probabilité de rechute diminue par rapport à la précédente avec un à trois marqueurs, se stabilisant ensuite autour de 0,25 (Fig. 5).

Pour les allèles faisant appel aux microsatellites, les longueurs des produits de PCR ont été mesurées par rapport aux étalons de taille internes (Genescan 500 LIZ) sur un analyseur génétique ABI 3100 (PE Applied Biosystems), à l’aide du logiciel GENESCAN et GENOTYPER (Applied Biosystems) pour mesurer les longueurs d’allèles et quantifier les hauteurs de pics. Plusieurs allèles ont été appelés lorsqu’il y avait plusieurs pics par locus et où des pics mineurs étaient $> 33 \%$ de la hauteur de l’allèle prédominant. Nous avons inclus des échantillons témoins négatifs (ADN humain ou pas de matrice) dans chaque cycle d’amplification. Un sous-ensemble des échantillons (n = 10) a été analysé en trois exemplaires pour confirmer la cohérence des résultats obtenus. Toutes les paires d’amorces ont été testées pour leur spécificité en utilisant de l’ADN génomique de P. falciparum ou d’humains.

Modèle de récurrence du paludisme à vivax

Pour les infections récurrentes à P. vivax dans les études VHX et BPD, nous avons développé et comparé deux modèles bayésiens de mélange à effets mixtes décrivant les données sur le délai de survenue conditionnelles au médicament de traitement administré. Le premier modèle (modèle 1) supposait une efficacité à 100 % de la primaquine à forte dose, avec une réinfection possible seulement après une guérison radicale. Le deuxième modèle (modèle 2) a permis la rechute et la recrudescence après une dose élevée de primaquine. Une liste complète des hypothèses relatives aux deux modèles se trouve dans le tableau supplémentaire 5. Le modèle 1 a servi de modèle de base pour évaluer la robustesse. Le modèle 2 a été utilisé comme modèle final et toutes les estimations déclarées en sont tirées. La notation a été choisie de manière à être cohérente avec la notation mathématique du modèle génétique (voir ci-dessous). Notez que dans la notation du modèle qui suit $n$ est un index, alors qu’au-dessus, il est utilisé pour désigner les nombres. Pour chaque individu indexé par l’indice $n\ in 1..N$, on enregistre les intervalles de temps (en jours) entre les épisodes successifs de P. vivax (l’épisode d’enrôlement est noté épisode 0). Le dernier intervalle de temps est correctement censuré à la fin du suivi. Les modèles ne supposent aucun biais de sélection entre la perte et le suivi. Pour l’individu ${n}{{\mathrm{{th}}}}$, les données concernant l’intervalle de temps $t$ (le temps entre l’épisode $t-1$ et l’épisode $t$) sont de la forme ${{\boldsymbol{x}}}_{n}^{(t)}$ = {${D}_{n}^{t}, {Z}_{n}^{t}, {C}_{n}^{t}, {S }_{n}$}, où ${D}_{n}^{t}\in\{{\rm{AS}}, {\rm{CQ}}, {\rm{PMQ}} +\}$ est l’association médicamenteuse utilisée pour traiter l’épisode \ (t-1\) (AS: artésunate en monothérapie; CQ: chloroquine en monothérapie; PMQ${}^{+}$: primaquine plus traitement au stade sanguin), ${Z}_{n}^{t}$ est l’intervalle de temps en jours, ${C}_{n}^{t}\in \{0,1\}$ indique si l’intervalle a été censuré où 1 correspond à une observation censurée à droite (c’est-à-dire le suivi s’est terminé avant que la récidive suivante ne soit observée) et 0 correspond à une infection récurrente observée, et ${S}_{n}$ désigne l’étude dans laquelle le patient a été recruté (1: VHX, 2 : BPD). En général, soit ${{\boldsymbol{x}}} _{n}$ = {${{\ boldsymbol{x}}} _{n}^{(0)}, \ldots, {{\boldsymbol{x}}}_{n}^{(T)}$} désignent toutes les données de délai d’événement disponibles pour l’individu ${n}{{\mathrm{{th}}}}$. Peu de récidives (huit) se sont produites au cours des 8 premières semaines chez les patients randomisés dans les bras dihydroartémisinine-pipéraquine de l’essai BPD, nous avons donc modélisé la période post-prophylactique de la pipéraquine comme étant identique à celle de la chloroquine (c.-à-d. PMQ${}^{+}$ comprend à la fois la chloroquine et la dihydroartémisinine-pipéraquine comme traitements au stade sanguin). En réalité, les profils d’élimination et les activités intrinsèques sont légèrement différents, la pipéraquine assurant une suppression du stade asexué légèrement plus longue que la chloroquine.

Dans les deux modèles, le temps de récurrence est modélisé comme un mélange de quatre distributions, les poids du mélange dépendant du traitement de l’épisode précédent. Les distributions de mélange correspondent aux différents états de récurrence. Les quatre mélanges sont les suivants : réinfection, donnée par une distribution exponentielle; rechute précoce (périodique), donnée par une distribution de Weibull avec des paramètres pharmacodépendants du traitement; rechute tardive (à taux constant), donnée par une distribution exponentielle; recrudescence, donnée par une distribution exponentielle. Le modèle 2 spécifie différentes proportions de mélange pour la composante de réinfection dans les groupes non-primaquine et primaquine, ${p}_{n}^{{\rm{AS}}} = {p}_{n}^{{\rm{CQ}}}$ et ${p}_{n}^{{\rm{PMQ+}}}$, respectivement. La proportion de mélange entre les rechutes précoces / périodiques et tardives / à taux constant au sein de la composante rechute est la même entre les groupes primaquine et non primaquine.

La probabilité pour le modèle 2 est donnée comme suit

$${ Z} _ {n}^{t} \sim \; {p} _{n}^{{D}_{n}^{t}} {\mathcal{E}} ({\lambda }_{{S}_{n}})\left(1-{p}_{n}^{{D}_{n}^{t}}\right)\Big\{\left(1-{c}^{{D}_{n}^{t}}\right)\big(q{\mathcal{W}}({\ mu}_{{D}_{n}^{t}}, {k} _{{D}_{n}^{t}}) \\ +(1-q) {\mathcal{E}}(\gamma)\big) +{c}^{{D}_{n}^{t}} {\mathcal{E}}({\lambda}_{{\rm{RC}}}) \Big\},$$

(1)

où ${p}_{n}^{(\cdot)}\in(0,1)$ est la probabilité de réinfection d’un mélange individuel et spécifique au médicament (nous avons défini la probabilité antérieure pour refléter notre croyance que ${p}_{n}^{{\rm{AS}}}={p}_{n}^{{\rm{CQ}}}\< \{p}_{n}^{{\rm{PMQ +}}}$) et ${c}^{ (\cdot) }\in(0,1)$ est le probabilité de recrudescence du mélange spécifique au médicament imbriqué.

La probabilité pour le modèle 1 est la même sauf que ${p}_{n}^{{\rm{PMQ+}}} = 1$ (seule réinfection possible). ${\mathcal{E}}(\cdot)$ désigne la distribution exponentielle. Dans les deux modèles, ${\lambda}_{{S}_{n}}$ est le taux de réinfection spécifique à l’étude. La relation entre ${\lambda}_{1}$ et ${\lambda}_{2}$ est paramétrée comme ${\lambda}_{2} = \delta{\lambda}_{1}$ où les priors sont spécifiés pour ${\lambda}_{1}$ et $\delta$. $\delta$ a spécifié la diminution de la transmission entre les périodes d’étude VHX et BPD. ${\lambda}_{{\rm{RC}}}$ est le taux de recrudescence (supposé indépendant du médicament). ${c}^{{D} _{n}^{t}} $ est une proportion de mélange imbriquée médicamenteuse entre la recrudescence et la rechute. Le temps de rechute est lui-même une distribution de mélange où $q$ est la proportion de mélange doublement imbriquée entre les rechutes précoces (première composante) et tardives (deuxième composante). Il s’agit d’une proportion fixe pour tous les individus. Les rechutes tardives/à taux constant sont paramétrées par la constante de taux $\gamma$. Les rechutes précoces sont supposées être distribuées de Weibull, notées ${\mathcal{W}}(\cdot, \cdot)$, avec des paramètres d’échelle dépendants du médicament ${\mu}_{{D}_{n}^{t}}$ et des paramètres de forme ${k}_{{D}_{n}^{t}}$ avec laquelle ${\mu}_{{\rm{CQ}}}= {\mu}_{{\rm{PMQ +}}} $ et ${k} _{{\rm{CQ}}} = {k} _{{\rm{PMQ+}}}$.

La probabilité marginale individuelle de réinfection est donnée par ${p}_{n}^{{D}_{n}^{t}}$; la probabilité marginale individuelle de recrudescence est donnée par $\left{c}^{{D}_{n}^{t}}$; la probabilité marginale individuelle de rechute est donnée par $\left\left$.

Nous avons utilisé des distributions antérieures informatives (Tableau supplémentaire 1) pour assurer l’identifiabilité des composants du mélange. Le contenu des informations contenues dans les données, en plus de celui spécifié dans la précédente, a été examiné visuellement à l’aide de tracés antérieurs à postérieurs. Le tracé antérieur à postérieur pour le modèle 2 est illustré à la Fig. 6. L’identifiabilité des paramètres a été déterminée par simulation. Cinquante ensembles de données synthétiques ont été tirés de chacun des processus de génération de données définis par les modèles 1 et 2 et d’une version modifiée du modèle 2 intégrant la réinfection saisonnière. La composante saisonnière a été estimée à partir de la distribution empirique de la semaine d’inscription dans les études BPD et VHX. Les modèles ont ensuite été adaptés à ces jeux de données simulés et les paramètres estimés ont été comparés aux paramètres de simulation-vérité. Fig. supplémentaire. 7 montre les taux de défaillance estimés de PMQ+ (en utilisant le modèle 2) par rapport aux taux de défaillance réels pour les données générées selon le modèle 2 (ajustement du modèle bien spécifié) et pour les données générées selon la version saisonnière du modèle 2 (ajustement du modèle mal spécifié), respectivement. La réinfection saisonnière entraîne une légère surestimation du taux d’échec. La vérification du modèle postérieur a été effectuée en simulant 500 ensembles de données synthétiques sur le temps d’événement sous la distribution prédictive postérieure de l’ajustement final du modèle. Le nombre de récidives par personne-année pour chaque bras de traitement a été choisi comme statistiques sommaires utilisées pour calculer les valeurs p prédictives postérieures (Fig. 7).

Les modèles stan produisent (i) des distributions postérieures de Monte Carlo pour tous les paramètres du modèle ; (ii) des estimations postérieures des états de récurrence pour chaque intervalle de temps ${{\boldsymbol{x}}}_{n}^{(t)}$; (iii) des estimations de vraisemblance logarithmique de chaque tirage postérieur. Pour chaque modèle, nous avons couru huit chaînes avec $1{0}^{5}$ itérations, éclaircissement par 400 itérations et élimination de la moitié pour le burn-in. La convergence des chaînes MCMC a été évaluée à l’aide de traceplots évaluant le mélange et l’accord des huit chaînes indépendantes. Toutes ces analyses peuvent être répliquées avec le référentiel github en ligne.

Fréquences des allèles et cardinalité effective

Pour chaque microsatellite génotypé, les fréquences des allèles ont été estimées à l’aide de toutes les données génétiques disponibles provenant des épisodes d’enrôlement (137 VHX, 79 BPD) et d’un modèle multinomial-Dirichlet (Fig. supplémentaire. 8). Pour chaque marqueur, la cardinalité effective ${n}^{*}$, définie comme le nombre d’allèles qui fournissent la même probabilité d’identité par hasard compte tenu des fréquences d’allèles équifréquentes, a été estimée à un sur la somme des fréquences d’allèles au carré 40. À partir des cardinalités effectives, nous pouvons calculer le nombre de SNP bialléliques hypothétiques que les neuf microsatellites assimilent comme suit:

$${\ rm {Hypothétique}} \{\rm{SNP}} \{\rm{count}} = \somme _{m= 1}^{M}{\mathrm{log}} _{{n} _{{\rm{SNP}}}^{* }}({ n } _ {m}^{* }),$$

(2)

où $m$ est l’indice sur les microsatellites $M= 9$ et le logarithme est la base ${n}_{{\rm{SNP}}}^{* }$, la cardinalité effective moyenne supposée d’un SNP hypothétique. C’est 2 pour un SNP idéal et environ 1,5 pour un SNP40 réaliste.

Modèle génétique

Le modèle génétique produit la probabilité qu’un P récurrent. l’épisode de vivax chez un individu donné est une recrudescence, une rechute ou une réinfection par rapport à des épisodes précédemment observés, compte tenu de trois entrées: (1) les probabilités antérieures que l’épisode soit une recrudescence, une rechute ou une réinfection (dans ce travail, ils sont basés sur des données sur le temps avant l’événement); (2) un ensemble d’estimations de la fréquence des allèles au niveau de la population; (3) les données génétiques disponibles pour les épisodes observés pour l’individu donné avec chacun au plus neuf marqueurs microsatellites polyalléliques. Pour propager l’incertitude dans (1) et (2), nous tirons 100 échantillons de Monte Carlo à partir du modèle de temps à événement et des distributions de Dirichlet postérieures sur les fréquences des allèles pour chaque marqueur. Le modèle génétique ne capture pas l’incertitude due à la variation du nombre de marqueurs génotypés, car il est actuellement prohibitif sur le plan informatique. Néanmoins, le modèle génétique ne surinterprète pas des données limitées: lorsque les marqueurs génotypés sont peu nombreux, il renvoie simplement des estimations proches de celles antérieures. Le reste de cette section donne une description informelle du modèle. Une description détaillée avec une liste d’hypothèses et la spécification mathématique complète se trouve dans les Méthodes supplémentaires.

Pour un individu donné, les parasites à l’intérieur et à travers les infections sont considérés comme des étrangers, des frères et sœurs ou des clones les uns par rapport aux autres (les étrangers désignent tous les parasites dont l’ascendance commune date au-delà d’un seul moustique). L’ensemble des relations interparasitaires peut être représenté par un graphe entièrement connecté. Chaque sommet représente un génotype haploïde, et chaque bord entre les génotypes est étiqueté comme un frère ou un étranger lorsque les génotypes sont contenus dans la même infection, ou comme un clone, un frère ou un étranger lorsque les génotypes proviennent d’infections différentes. Pour les infections complexes, le nombre de sommets est égal au COI, qui est défini comme le nombre maximum d’allèles par marqueur observé.

Le modèle suppose que des rechutes peuvent survenir pour toutes les relations interparasitaires entre les infections (étrangers, frères et sœurs et clones), alors que les réinfections se produisent uniquement en tant qu’étrangers et les récidives uniquement en tant que clones. Les étapes clés du modèle sont les suivantes. Tout d’abord, nous calculons la probabilité des données génétiques à partir d’un graphique de relation étiqueté. Deuxièmement, nous calculons la probabilité du graphique proposé étant donné que l’épisode récurrent est une recrudescence, une rechute et une réinfection. Troisièmement, nous additionnons tous les graphiques possibles. L’ensemble des graphiques marqués comprend toutes les façons possibles de mettre en phase les données des microsatellites (c.-à-d. attribuer des allèles à des génotypes haploïdes dans les infections complexes) ainsi que toutes les relations viables entre les génotypes haploïdes. Par exemple, si le génotype A est un clone de B et que B est un clone de C, la seule relation viable entre A et C est clonale.

Le concept de parenté (probabilité de MII) se présente dans la première étape. Cependant, le modèle n’estime pas la parenté. Au lieu de cela, il estime la probabilité d’observer les données fournies par la MII multipliée par la probabilité de MII conditionnelle à une relation spécifiée (par exemple, 0,5 pour les frères et sœurs dans une population surprisée). Ce calcul fait appel à des fréquences d’allèles (les allèles communs partagés sont susceptibles d’être identiques mais pas nécessairement dus à une descendance, alors que les allèles rares partagés sont plus susceptibles d’être des MII). Nous additionnons ensuite les deux scénarios de MII possibles (les allèles sont MII ou non) pour obtenir la probabilité des données observées conditionnée à la relation spécifiée,

$${\ mathbb{P}}({\rm{data}}\|\{\rm{relation}}) =\; {\mathbb{P}}({\rm{data}}\|\{\rm{IBD}})\times{\mathbb{P}}({\rm{IBD}}\|\{\rm{relation}}) \\+{\mathbb{P}} ({\rm{data}}\|\{\rm{not}} \{\rm{IBD }}) \times {\mathbb{P}} ({\rm{not}}\{\rm{IBD}}\|\{\rm{relation}}).$$

Ceci est calculé pour toutes les relations par paires dans le graphique des relations (voir Méthodes supplémentaires pour plus de détails).

La complexité de calcul du modèle génétique le limite à l’analyse conjointe de trois épisodes (deux récidives) par patient (dans nos données, c’est le cas pour 158 patients). Pour chaque individu présentant plus de deux récidives (54 patients), nous avons estimé les probabilités par paires d’états de récurrence entre les épisodes (en utilisant le modèle ci-dessus) et construit une matrice d’adjacence. Les probabilités de rechute ont ensuite été définies comme proportionnelles à la probabilité maximale estimée de rechute par rapport à tous les épisodes précédents et à celles de recrudescence par rapport à l’épisode directement précédent. La probabilité de réinfection est le complément de la probabilité de rechute et de recrudescence. Ces probabilités ont ensuite été pondérées à nouveau en somme à 1.

Simulation génétique

Nous avons utilisé la simulation pour explorer les exigences des marqueurs pour l’inférence récurrente des états. Comme décrit ci-dessus, les données sur 3 à 12 marqueurs microsatellites indépendants ont été simulées pour des infections appariées (un épisode primaire suivi d’une récurrence unique) selon trois scénarios: la récurrence contient un génotype de parasite haploïde qui est soit un frère, un étranger ou un clone d’un génotype de parasite haploïde dans la primo-infection. Les données simulées ont été analysées en supposant un antériorité uniforme sur les états de récurrence (c’est-à-dire que la recrudescence, la réinfection et la rechute ont chacune des probabilités antérieures d’un tiers). Pour chacun des scénarios étranger, frère et clonal, nous avons simulé des données pour une infection initiale et récurrente avec des COI respectifs 1 & 1, 2 & 1, et 1 & 2, avec et sans erreur; et COI respectifs 3 & 1, sans erreur. Pour illustrer le comportement du modèle lorsqu’il est appliqué à des données erronées, les données avec erreur ont été simulées en utilisant une probabilité d’erreur par locus extrêmement élevée (0,2 par rapport à une erreur réaliste $<\ 0.01$41). Lorsque le COI dépassait un, le frère, l’étranger ou le clone faisait partie des génotypes haploïdes étrangers non apparentés (un graphique de relation avec au plus un seul bord non étranger). Pour un ensemble donné de COI, ce type de graphique fournit des données très diverses et est donc le plus difficile à analyser. Pour les épisodes non erronés avec COIs en 1 ou 2, nous avons exploré les cardinalités de 13 et 4 (la moyenne et le minimum, respectivement, de notre panel de neuf microsatellites). Pour les données erronées et pour les épisodes avec COIs de 3 & 1, nous avons utilisé une cardinalité égale à 13 seulement. Les résultats d’un sous-ensemble illustratif des simulations génétiques sont présentés à la Fig. 5 et les Fig. 3 et 4. Toutes les simulations génétiques peuvent être répliquées à partir du référentiel github en ligne, voir dossier Simulation_Study.

Classification des épisodes récurrents

L’estimation du taux de découverte de faux échecs du modèle génétique et de la Fig. 4 les deux nécessitent la spécification des limites de classification. Nous avons choisi arbitrairement l’intervalle comme zone d’incertitude. Chaque récurrence est soit classée comme une réinfection, soit comme un échec lorsque l’échec est soit une rechute, soit une recrudescence : si la somme des intervalles crédibles supérieurs de rechute plus recrudescence est inférieure à 0,3, la récurrence est classée comme une réinfection; si la somme des intervalles crédibles inférieurs de rechute plus recrudescence dépasse 0,7, la récurrence est classée comme un échec; sinon, la classification est jugée incertaine. Comme il y avait des preuves négligeables de recrudescence, tous les échecs sont essentiellement des rechutes.

Résumé des rapports

De plus amples informations sur la conception de la recherche sont disponibles dans le Résumé des rapports de recherche sur la nature lié à cet article.

Résolution probabiliste de la cause du paludisme récurrent à Plasmodium vivax