abstrakt
Formål: Formålet med denne undersøgelse var at bestemme præstationsegenskaber for Ferriman Galvey selvscoring hos kvinder med polycystisk ovariesyndrom.
Design: en samtidig Ferriman Galvey kort scoring design blev brugt.
indstilling: Undersøgelsen blev udført på General Clinical Research Center i et Universitetsmedicinsk center.
patienter: enogtyve hirsute patienter med polycystisk ovariesyndrom blev undersøgt.
interventioner: interventioner omfattede maskeret patient, læge og forskningssygeplejerske samtidig og uafhængig Ferriman Galvey kort scoring.
Main Outcome Measures: de vigtigste outcome measures blev ændret.
resultater: Aftaleanalyse viste, at patientens selvscorer, læge scoringer og forskningssygeplejerske scoringer var ret uoverensstemmende.
konklusion: det modificerede Kortscoringssystem har for meget variation til at være klinisk nyttigt.
i 1996 havde der været 41 papirer i tre store kliniske endokrine tidsskrifter inden for det foregående årti, der var bekymret for behandlingen af hirsutisme (1). I 75% af undersøgelserne blev Ferriman scoring system brugt til at score overskydende mandlige mønster kropshår. Siden da bruger stort set alle undersøgelser, der evaluerer medicinske behandlinger for hirsutisme, dette instrument (2-7). Selvom der findes mere objektive værktøjer (herunder fotografisk evaluering, mikroskopisk måling af hårdiameter med omfattende tælling af aksler, computeriseret vurdering af fotografiske mål og andre), er disse komplekse, dyre eller vanskelige at bruge. Brugervenligheden og lave omkostninger ved Ferriman-systemet gør det til et potentielt attraktivt instrument.
Ferriman-indekset blev oprindeligt designet til antropologisk forskning (8). Hos patienter med polycystisk ovariesyndrom (PCOS) har det vist sig gyldigt at afspejle androgenoverskud sammenlignet med dyre og detaljerede objektive metoder, herunder mikroskopisk måling af hårdiameter med omfattende optælling af individuelle aksler (9). Selvom intraobserver aftale er rapporteret at være mindre end 3 point (10), overraskende, interobserver Reproducerbarhed er ikke blevet rapporteret.
formålet med denne undersøgelse var 1) at vurdere præstationsegenskaber og interobserveraftale ved hjælp af selvscoring ved hjælp af Ferriman-scoringskortet og 2) at vurdere patientens selvscoring til forskning og klinisk pleje. Hvis patientens selvscoring i denne sammenhæng er enig i det af læge/forskningssygeplejersteamet, ville dette frigøre ressourcer og lette gruppesammenligninger relateret til behandling af hirsutisme og identifikation af PCOS. I modsætning hertil, hvis niveauet for enighed viser sig at være uacceptabelt, stilles der spørgsmålstegn ved gyldigheden af undersøgelser, der kun bruger dette instrument til at klassificere hirsutisme. Vurdering af interobserver variation i en forskningsindstilling, som den, der blev rapporteret i denne undersøgelse, på en måde designet til at minimere konstatering bias er meget vigtig for at bestemme nøjagtig interobserver aftale. Bias kan potentielt introduceres af patienterne selv, de personer, der foretager vurderingen, eller begge dele. For eksempel kan viden om laboratorieresultater være forbundet med konstateringsforstyrrelse. For at undgå dette blev denne undersøgelse udført med korrekt maskering for at undgå konstatering bias.
patienter og metoder
generelt
hver patient, der deltager i denne undersøgelse, underskrev et informeret samtykke i overensstemmelse med Oklahoma University Health Sciences Center institutionel gennemgang godkendelse af protokollen. Alle patienter, der blev evalueret i denne rapport, opfyldte National Institutes of Health criteria of PCOS: de havde tegn/symptomer på androgenoverskud (Ferriman Gallvey score, >6) og uregelmæssige menstruationer (10 menses/år). Andre endokrinopatier blev udelukket. Det anvendte kortscoringssystem har 12 domæner, der viser dele af kroppen. Der er fem kategorier klassificeret fra 0-4 ved hjælp af en ordinær skala inden for hvert kropsoverfladedomæne. Samlede scoringer opnås ved at tilføje scoringer fra alle domæner. Den maksimale score er 60 (8). Vores erfaring viste, at intraobserver aftale var i overensstemmelse med tidligere rapporter. Når den primære efterforsker (PI) demonstrerede, at hans intraobserveraftale var inden for 3 point (10%), blev tre forskningssygeplejersker uddannet af PI og viste sig at være enige med lægen inden for 10%, før undersøgelsen begyndte. Forskning Sygeplejerske 1 og lægen var til stede for hver scoring. For at imødekomme planlægning, scoringer til forskningssygeplejerske 2 kunne være kommet fra en af de to andre uddannede sygeplejersker. Fire personer vurderede uafhængigt og blindt hver patients hirsutisme. Tre observatører var fra forskergruppen; den fjerde observatør var patienten selv ved hjælp af det modificerede Ferriman Galvey-kort. Efter lægeinstruktion i brug af kortet, 21 PCOS-patienter klassificerede deres egen hirsutisme uafhængigt og blindt. Samtidig scorede PI og to forskningssygeplejersker patientens hirsutisme ved hjælp af Ferriman Galvey-kortet. Hver observatør scorede uafhængigt uden kendskab til de andre observatørers score.
statistisk analyse
effektanalyse antog en 3-punkts forskel, hvilket er 15% af de gennemsnitlige Ferriman-scoringer rapporteret i litteraturen. Dette er også den rapporterede intraobserver aftale. Ved anvendelse af en KRP på 0,05 og en KRP på 0,20 var den beregnede stikprøvestørrelse 20 patienter. Enogtyve på hinanden følgende PCOS-patienter blev evalueret på samme måde som test interobserver aftale. Data blev indtastet i Microsoft (Microsoft Corp., Redmond, V). Beskrivende statistik blev udført for hver variabel. Analyse af korrelation, regression og aftale blev udført ved hjælp af SAS Version 9.0 (SAS Institute, Cary, NC). Vi testede for normalitet af distribution ved hjælp af grafiske metoder og Shapiro-test af alle variabler. Ferriman score varierede mellem 11 og 34 for både patienten og lægen. Scorerne blev normalt fordelt og var godt repræsenteret på tværs af området. Parametrisk analyse blev brugt til at sammenligne normalt distribuerede variabler, og ikke-parametrisk analyse blev anvendt, når signifikant afvigelse fra normalitet blev påvist.
resultater
patienternes alder varierede fra 18-36 år. Der var 10 kaukasiere, syv afroamerikanere, to latinamerikanere, en asiat og en indianer. Tretten patienter havde mere end en gymnasial uddannelse, og resten var gymnasieelever. Deres medianindkomst var $30.000, der spænder fra mindre end $10.000 til $100.000. Kvadratmeter) varierede fra 18-50 og var i gennemsnit 32,2, hvilket opfyldte National Institutes of Health-kriterierne for fedme. Ni patienter blev gift, og 12 var ikke gift. Det gennemsnitlige antal menstruationer om året var seks, der spænder fra nul til 10. Cirka halvdelen af patienterne havde aldrig været gravide; syv havde dog mere end to børn.
et plot af de rå score for hver patient, der sammenligner de patientrapporterede score med dem, der er rapporteret af lægen og de to forskningssygeplejersker, er vist i Fig. 1. En informativ analyse til kliniske formål er aftaleanalyse. Dette tegner forskellene i scorerne mod gennemsnittet af scorerne. Et eksempel er vist i Fig. 2. Dette viser forskellen i patientens score, og lægen scorer på y-aksen mærket forskel i metoderne vs. gennemsnittet af hver score på h-aksen mærket som middelværdien af metoderne. Vi fandt ud af, at individuelle scoringer kunne variere med 12 point, og at forskellene var 21 point (fra -9 til +12)! Aftaleanalyse viste også, at patient og forskningssygeplejerske 1 kunne variere individuelt med så meget som 11 point, med en rækkevidde på 21 point. Forskellen mellem patientens selvscore og scoren af forskningssygeplejerske 2 var så meget som 14 point. Området var 27 point. Denne endnu bredere forskel mellem scoren for forskningssygeplejerske 2 og patientens selvscore var ikke uventet på grund af behovet for at bruge mere end en uddannet anden sygeplejerske til at evaluere blindt.
sammenligning af blindede samtidige Ferriman-scoringer, der sammenligner patient (FGPt), læge (FGDr) og forskningssygeplejersker (FGN1 og FGN2). De blindede opnåede samtidig Ferriman – scoringer, der kontrasterer patientens, lægens og de to forskningssygeplejeres score.
sammenligning af blindede samtidige Ferriman-scoringer, der sammenligner patient (FGPt), læge (FGDr) og forskningssygeplejersker (FGN1 og FGN2). De blindede opnåede samtidig Ferriman – scoringer, der kontrasterer patientens, lægens og de to forskningssygeplejeres score.
forskellen i patientens selvscore vs. lægens score vises på den lodrette akse (mærket som Forskel mellem metoder) vs. gennemsnittet af begge scoringer (patient og læge) på den vandrette akse (mærket som gennemsnittet af alle metoder). Nul på den lodrette akse indikerer perfekt aftale.
forskellen i patientens selvscore vs. lægens score vises på den lodrette akse (mærket som Forskel mellem metoder) vs. gennemsnittet af begge scoringer (patient og læge) på den vandrette akse (mærket som gennemsnittet af alle metoder). Nul på den lodrette akse indikerer perfekt aftale.
Diskussion
da vi brugte Ferriman-kortet, var vores fortolkning, at selv i den mest optimistiske fortolkning var der betydelig individuel uoverensstemmelse mellem scoringer opnået af fire observatører for en given patient. Grafisk aftaleanalyse (11) viste, at individuelle variationer var ret brede. Nogle score kan være så meget som 60% højere eller 46% lavere mellem patienten og lægen eller mellem patienten og forskning sygeplejersker. Denne variation betyder, at individuelle sammenligninger eller små gruppesammenligninger ved hjælp af Ferriman-kortet ikke er pålidelige.
vigtigheden af at anvende aftale Grafisk test ved bestemmelse af acceptabel klinisk variation er indlysende. Dette afsløres ikke, når en korrelationskoefficient bruges til at bestemme, hvordan disse scoringer er korreleret. Variabiliteten bestemmer den kliniske anvendelighed eller mangel deraf. I den foregående analyse varierede forskellene ikke systematisk over måleområdet. Med andre ord var højere score ikke forbundet med bredere forskelle (regressionens hældning var ikke signifikant).
Ferriman-partituret er blevet beskrevet både som det valgte instrument og som subjektivt og ikke nyttigt. Selvom det har vist sig at afspejle androgenoverskud, fandt vi i denne undersøgelse, at selvscoring ikke er klinisk nyttig. Vi fandt dårlig interobserver aftale. Der er behov for mere objektive foranstaltninger til evaluering af hirsutisme. Forskning skal fortsætte mod at udvikle en metode til at klassificere hirsutisme hos kvinder med PCOS, der er enkel, praktisk, billig, gyldig, og reproducerbar.
anerkendelser
vi takker Michele Young, Administrativ Sekretær ved Institut for Biostatistik og epidemiologi, og det generelle kliniske Forskningscenter sygeplejersker, Beverly Bonnevell, R. N.; Jodie Groff, R. N.; Og Mai Muse, R. N., for deres flittige bidrag. Vi takker også Dr. Gary Raskob, rådgiver.
dette arbejde blev delvist støttet af National Institutes of Health, National Center for Research Resources, General Clinical Research Center Grant MO1-RR-14467 og Institut for Biostatistik og epidemiologi Oklahoma University Health Science Center.
forkortelser:
-
PCOS,
polycystisk ovariesyndrom;
-
PI,
inspektør.
:
–
,
,
,
,
:
–
,
,
:
–
,
,
:
–
,
,
,
,
:
–
,
,
:
–
,
,
,
:
–
,
:
–
:
–
:
–
,
:
–