kollektiv hukommelse former organiseringen af individuelle minder i den mediale præfrontale hjernebark

MR-deltagere

fireogtyve højrehåndede indfødte fransktalende mellem 22 og 39 år (gennemsnit = 28,6 år; s.d. = 4,4) blev betalt for at deltage (11 mænd, 13 kvinder). De havde ingen rapporteret historie med neurologiske, medicinske, visuelle eller hukommelsesforstyrrelser. Undersøgelsen blev godkendt af det regionale forskningsetiske udvalg (Comit Christ de Protection des Personnes Nord-Ouest III, sponsor ID: C13-46, RCB ID: 2014-A00126-41, clinicaltrial.gov registreringsnummer: NCT02172677). To yderligere deltagere blev også oprindeligt rekrutteret til designindstilling og justering (men ikke analyseret). En deltager blev udskiftet uden yderligere analyser på grund af vigtige MR-genstande, der forhindrede billedanalyse. Alle deltagere gav skriftligt samtykke, før de deltog. Deltagerne blev bedt om ikke at forbruge psykostimulerende midler, stoffer eller alkohol før eller i forsøgsperioden. Ingen statistiske metoder blev anvendt til at forudbestemme stikprøvestørrelsen, men stikprøvestørrelsen anvendt i denne undersøgelse (N = 24) er sammenlignelig med tidligere fMRI-undersøgelser, der anvender RSA.

materialer og Mindesmærke efterforskningsprocedure

stimuli var 119 billeder valgt fra området Verdenskrig, Total krig på Caen Memorial Museum. Hver skærm blev fotograferet ved Mindesmærket ved hjælp af et professionelt digitalkamera og professionel belysning. Disse billeder blev derefter justeret for kontrast og belysning, og den eksterne kontur blev beskåret ved hjælp af billedbehandlingsprogrammer.

hver deltager udforskede mindesmærket i slutningen af eftermiddagen, lige før Mindedøren lukker. Dette sikrede, at andre besøgende ikke ville forstyrre deltagernes ture. Deltagerne fik først generelle instruktioner om eksperimentet og var hver udstyret med et mobilt øjesporingssystem (Applied Science Laboratory) bestående af briller og en lille lagerenhed tilsluttet brillerne og båret som en rygsæk. Disse briller blev monteret med et lille kamera, der filmede deltagerens visuelle udforskning, som blev optaget og sendt på eksperimentatorens bærbare computer. Selvom vi ikke præsenterer disse eye-tracking-data, der går ud over omfanget af det nuværende papir, kunne vi således spore deltagernes udforskning uden at følge dem og dermed sikre, at de overholdt følgende instruktioner.

deltagerne blev bedt om at udforske et begrænset rum i mindesmærket og fik et kort, der beskriver det rumlige layout (Se Fig. 1a). Dette rum omfattede i alt 119 billeder, hver med en billedtekst nedenunder, og blev organiseret efter 22 tematiske områder (områdenumre er angivet i cirklerne i Fig. 1a). To andre områder blev inkluderet i begyndelsen og i slutningen af turen for recency og forrang effekter. Disse påfyldningsområder var altid de samme, og deres billeder var ikke inkluderet i den efterfølgende eksperimentelle protokol (og blev kun brugt til træning og fortrolighed med den efterfølgende tilbagekaldelsesopgave). Disse 22 områder blev grupperet efter 6 hovedsektorer (illustreret med de 6 hovedfarver på Mindekortet i Fig. 1a). Efterforskningsrækkefølgen for disse hovedsektorer blev opvejet på tværs af deltagerne. Efterforskningsrækkefølgen for områderne inden for hver sektor blev også randomiseret i henhold til 6 forskellige efterforskningslister (4 deltagere blev tildelt hver af disse 6 lister). Hvert område startede med et introduktionskort, der beskriver indholdet af det område, som deltagerne blev bedt om at læse først, før de udforskede området. Deltagerne måtte derefter undersøge hvert billede, der komponerede området. De gjorde det ved først at læse billedteksten nedenunder og var derefter fri til at udforske billedets indhold, så længe de ønskede, før de gik videre til det næste billede, indtil de afsluttede deres tur, hvis gennemsnitlige varighed var 76 min (s.d. = 13.8). Bemærk, at deltagerne under denne Mindetur ikke var klar over, at deres minder ville blive testet den næste dag.

Recall-opgave

den næste dag udførte deltagerne tilbagekaldelsesopgaven, som blev opdelt i tre fMRI-sessioner, hver omkring 10 minutter i længden. Hver session præsenterede korte sætninger svarende til korte uddrag, der beskriver virkelige billeder fra Anden Verdenskrig, som deltagerne havde udforsket (det vil sige målsætninger; gennemsnitligt antal ord = 7,8, s.d. = 2,4) eller ikke havde udforsket (det vil sige distraktor sætninger; gennemsnitligt antal ord = 7,7, s.d. = 2,1) dagen før. I alt blev 119 målsætninger og 63 distraktor sætninger præsenteret tilfældigt for deltagerne. Historiske begivenheder forbundet med distraktor-sætningerne blev valgt til at matche de billeder, der blev vist ved Mindesmærket med hensyn til både indhold og relativ andel af billeder pr. Det land, hvor begivenheden fandt sted, blev også vist under hver sætning, ligesom året var. Deltagerne var opmærksomme på nærheden mellem distraktor-og målsætninger og blev derfor kraftigt opfordret til at stole på deres evne til fuldt ud at huske og visualisere de tilknyttede billeder for at udføre denne opgave. Efter begyndelsen af hver cueing-sætning rapporterede deltagerne, om de kunne huske det tilknyttede billede eller ej ved at trykke på Ja med deres højre pegefinger eller nej med deres højre langfinger. Sætningerne dukkede op for 4,5 s centreret på en grå baggrund. Forsøgene blev præsenteret på en stokastisk måde i henhold til en Poisson-fordeling (Kurt = 4) med et 4,2 s gennemsnitligt interstimulusinterval (interval = 1-10 s) med 25% yderligere nulhændelser og blev adskilt af et fikseringskors. Nøjagtigheder og præstationer på tilbagekaldelsesopgaven er beskrevet i supplerende tabel 2.

Billedarrangementopgave

uden for scanneren udførte deltagerne en billedarrangementopgave, der blev brugt som fuldmagt til individuelle skemaer, på de 119 Mindebilleder. Billederne skulle placeres inden for 1 til 28 cirkler i henhold til deres historiske nærhed. Denne billedarrangementopgave blev skrevet i Javascript indlejret i HTML-kode til internetnavigation, hvilket giver stor fleksibilitet i opgaveudførelsen: deltagerne kunne forstørre et billede ved at klikke på det (med Memorial caption nedenunder), Memorial captions dukkede op på mouseover, og deltagerne kunne vælge og flytte flere billeder på en gang. Billeder blev oprindeligt placeret i en stor firkant over cirklerne. Deltagerne blev bedt om at gennemgå hvert billede og placere dem i cirklerne nedenfor, da de gik gennem hver af dem. De fik at vide at gruppere i samme cirkel alle billeder, de følte beskrevet tæt eller lignende historiske begivenheder. Hvis de følte billederne beskrevet frakoblede begivenheder, blev de instrueret til at placere dem i forskellige kredse. Deltagerne kunne frit bruge så mange cirkler, som de ønskede, fra en enkelt cirkel til alle tilgængelige cirkler på kortet. Instruktionerne understregede, at der absolut ikke var noget rigtigt antal cirkler, der skulle bruges, og at de frit kunne fortsætte, som de ønskede. Deltagerne blev også bedt om at være opmærksomme på afstanden mellem cirkler og deres relative positioner. Jo mere de vurderede, at billederne var knyttet til tilsluttede eller frakoblede begivenheder, jo tættere eller længere væk skulle deres relative positioner på tværs af cirkler være. Endelig, da hovedarrangementet var afsluttet for alle billeder, måtte deltagerne justere placeringen af billederne inden for hver cirkel. De euklidiske afstande mellem billedpositionerne afspejlede derefter den semantiske organisation af et givet individ og kunne kodes i en RDM.

MRI-erhvervelsesparametre

MRI-data blev erhvervet på en 3 T Achieva-scanner (Philips) ved Hjerneafbildningscyceron-centret i Caen. Alle deltagere gennemgik først højopløsnings-T1-vægtet anatomisk volumenafbildning ved hjælp af en tredimensionel (3D) hurtigfeltekko (FFE) sekvens (3D-T1-FFE sagittal; TR = 20 ms, TE = 4,6 ms, flip vinkel = 10 liter, SENSE factor = 2.180 skiver, skivetykkelse = 1 mm, intet mellemrum, synsfelt = 256 kg 256 kg 180 mm3, matrice = 256 kg 130 kg 180). Denne erhvervelse blev efterfulgt af de funktionelle sessioner, som blev erhvervet ved hjælp af en stigende T2-stjerne EPI-sekvens (MS-T2-stjerne-ffe-EPI aksial; TR = 2050 ms, TE = 30 ms, flip vinkel = 78 liter, 32 skiver, skivetykkelse = 3 mm, 0,75 mm mellemrum, matrice = 64 liter 63 liter 32, synsfelt = 192 liter 192 liter 119 mm3, 310 volumener pr.

MR-forbehandling

Data blev analyseret ved hjælp af statistisk parametrisk kortlægningsprogram (SPM12, velkommen afdeling for Imaging Neuroscience). Under forbehandling blev billeder først rumligt justeret for at korrigere for bevægelse og blev derefter korrigeret for tidsmæssig forsinkelse af skiveoptagelse. Efter registrering med T1-strukturbilledet blev funktionelle billeder derefter normaliseret ved hjælp af parametrene afledt af den ikke-lineære normalisering af individuelle gråstof-T1-billeder til T1-skabelonen fra Montreal Neurological Institute. Bemærk dog, at der blev brugt uskarpe og ikke-glatte billeder til RSA. Billednormalisering var ikke desto mindre nødvendig for at beregne det fremadrettede deformationsfelt og dets inversion for at normalisere søgelysbilleder eller pakke mPFC-Roi ‘ er tilbage til det oprindelige rum (se nedenfor). Brugen af ikke-glatte billeder er vigtig for RSA, da den bevarer det finkornede rumlige mønster, der kendetegner en regions repræsentationsgeometri.

analyse på første niveau

de forbehandlede tidsserier, svarende til indfødte rumbilleder (dvs.ikke-skæve og ikke-glatte billeder), blev derefter højpasfiltreret til 1/128 HS i hver voksel. Regressorer i en generel lineær model (GLM) for hver voksel blev oprettet ved at sammenvolde en delta-funktion (modelleret som 4,5 s kortepoke) ved stimulusudbruddet for hver tilstand af interesse med en kanonisk hæmodynamisk responsfunktion (HRF). En mindste kvadrater separat tilgang blev anvendt50, 51, som bestod i at estimere en separat GLM for hvert forsøg. I hver GLM blev forsøget af interesse modelleret som en regressor, og alle de andre forsøg blev kollapset i fem forskellige regressorer svarende til tilbagekaldelse, miss, falske alarmer, korrektionsafvisning og ingen responsbetingelser (se supplerende tabel 2 for adfærdsmæssige præstationer på tilbagekaldelsesopgaven). Denne tilgang er blevet fremmet for design med korte interstimulusintervaller, når der er et højt niveau af kollinearitet mellem hæmodynamiske reaktioner på successive forsøg51. Yderligere regressorer uden interesse var de seks omstillingsparametre for at tage højde for lineære restbevægelsesgenstande. Autokorrelation mellem GLM-rester blev korrigeret ved hjælp af den første ordens autoregressive proces, hvilket resulterede i forudhvidede data efter begrænset estimering af maksimal sandsynlighed.

regioner af interesse

mPFC blev defineret anatomisk ved hjælp af den automatiserede anatomiske mærkning atlas52 og blev opdelt i Vmpfc og Dmpfc Roi ‘ er. DmPFC svarede til den bilaterale frontale overlegne mediale gyrus i det automatiserede anatomiske Mærkningsatlas (indekser 2601 og 2602). Vmpfc-masken omfattede den bilaterale fronto-orbitale mediale gyrus (indekser 2611 og 2612), den bilaterale rectus (indekser 2701 og 2702) og den ventrale del (å-koordinater ringere eller lig med nul) af det bilaterale anterior cingulum (indekser 4001 og 4002). Disse to Roi ‘ er er vist i Fig. 3b. Disse to maskebilleder blev derefter pakket tilbage til hver deltagers oprindelige rum ved hjælp af det inverse af deformationsfeltet beregnet under normaliseringsprocessen.

repræsentativ lighedsanalyse

Kontrastkort over individuelle minder blev derefter beregnet for hvert tilbagekaldt billede og brugt til at beregne RDMs i Vores Roi ‘ er. For hver enkelt og hver ROI blev hjernens RDM ‘ er beregnet som følger: for hver voksel var aktivitetsvektoren på tværs af tilbagekaldte billeder middelcentreret og skaleret til dens standardafvigelse (dvs.; derefter blev aktivitetsmønstrene i et givet ROI for hvert par billeder sammenlignet ved hjælp af rumlig korrelation, og uligheden blev derefter givet med 1 minus korrelationen. På adfærdsmæssigt niveau blev individuelle RDM ‘ er afledt af de euklidiske afstande mellem alle mulige par billeder arrangeret af deltagerne på det todimensionale rumlige layout. De øverste trekantede former for disse hjerne-eller adfærdsmæssige RDM ‘ er blev derefter ekstraheret og sammenlignet med de øverste trekantede former for RDM-modeller, der beskriver kollektive skemaer, semantiske afstande (afledt af artikler fra Anden Verdenskrig; se nedenfor), kontekstuelle rumlige afstande (euklidiske afstande af billedernes rumlige positioner) og tidsmæssige afstande (euklidiske afstande af billedernes tidsmæssige rangorden under Mindeudforskning). Disse sammenligninger mellem hjerne/adfærd og model RDMs blev opnået ved hjælp af en regressionsmodel. Både regressorer og data blev oprindeligt rang-transformeret til at teste for ikke-lineære monotone forhold. I betragtning af at kollektive, semantiske og kontekstuelle (dvs.rumlige og tidsmæssige) Model RDM ‘ er ikke er ortogonale og overlapper til en vis grad, hjælper en regressionsmodel med at afklare den unikke varians, der kan tilskrives hver af modelprædiktorerne. For hver deltager blev denne regressionsmodel gentaget for hvert emne af interesse, og de ti gentagelser af emnemodellen og modelregressionskoefficienten blev gennemsnitligt på tværs af disse iterationer. Alle regressionsmodeller var i fuld rang, og variansinflationsfaktoren var mindre end 1,5 for hver regressor, hvilket bekræftede identifikationen og effektiviteten af vores modeller. Resultaterne af disse regressionsmodeller er rapporteret i hovedteksten, men vi rapporterer også resultaterne af standard Spearmans korrelationer testet isoleret, for fuldstændighedens skyld, i Fig. 3C og i supplerende tabel 1 For statistiske tests. Kun elementer, der er korrekt tilbagekaldt, blev inkluderet i analysen af aktivitetsmønstre. Konklusioner på gruppeniveau blev udført ved hjælp af ikke-parametriske tilfældige effekter statistik for at teste for både RDM-sammenhæng og forskelle ved at starte emnesættet med 5.000 iterations28. For hver model RDM eller hvert par kontrasterede model RDMs, vi havde ikke antagelser om den underliggende distribution og udførte ikke-parametriske tilfældige effekter statistiske tests ved hjælp af en bootstrapping-tilgang. Vi udførte en gennemsnitlig sammenligning ved hvert bootstrap-sæt og estimerede P-værdien som andelen af bootstrap-prøver længere i halerne end nul. De forventede proportioner af type i-fejl på tværs af flere tests af både RDM-modelrelateret og modelsammenligning blev kontrolleret ved hjælp af FDR-korrektionen med en ønsket FDR k = 0,05 og under forudsætning af en positiv afhængighed mellem betingelser34 [, 53. Til testen af RDM-modelrelateret blev den forventede FDR beregnet ved hjælp af alle de ukorrigerede en-halede P-værdier for testede modeller. Til test af RDM-model sammenligning begrænsede vi korrektionen til vores hovedhypotese og inkluderede kun sammenligninger, der involverede den kollektive hukommelse RDM (med hensyn til andre referencemodeller) for at beregne den forventede FDR ved hjælp af to-halede P-værdier. Vi rapporterer justerede p-værdier og bruger bootstrapping-iterationer til at bestemme 95% percentil CIs. Støjloftet rapporteret i Fig. 3c afspejler korrelationen mellem deltagerne i hjernens RDMS. Denne korrelation blev beregnet for hver deltager som korrelationen mellem deltagerens hjerne RDM og den gennemsnitlige hjerne RDM for de resterende deltagere34. Støjloftet afbildet i Fig. 3c svarer til gennemsnittet af disse individuelle korrelationer.

Søgelysanalyse

masker af det hvide stof og pialoverflader af barken blev rekonstrueret fra T1-vægtede billeder indsamlet for hver deltager ved hjælp af Freesurfer-programpakken version 554,55. Vi brugte RSA_DEFINESEARCHLIGHT MATLAB-funktionen fra RSA-værktøjskassen34 (https://github.com/rsagroup/rsatoolbox), som også er afhængig af Surfingværktøjskassefunktioner56 (https://github.com/nno/surfing) til at definere et overfladebaseret søgelys for begge halvkugler (ved hjælp af et 40-voksel søgelys med en radius på 10 mm). Vokaler i nærheden af en eller flere knudepunkter på overfladen blev valgt ved hjælp af en geodesisk afstandsmåling og ved at konstruere virtuelle linjer, der forbandt tilsvarende knudepunkter på pial-og hvidstofoverfladerne. Denne procedure frembringer et søgelys efter overfladekrumningen, hvilket reducerer rumlig bias under analysen af fMRI-mønstre. I modsætning til kvarterer defineret volumetrisk resulterede dette i kvarterer med en buet cylindrisk form, der fulgte konturerne af hver enkelt sulci og gyri. Når søgelysstrukturen for hvert toppunkt blev konstrueret og kortlagt til det funktionelle billedrum, blev mønstre af tilbagekaldt aktivitet ved hver voksel, der komponerede søgelyset, middelcentreret og skaleret til deres standardafvigelser, før man beregner uensartethedsstrukturen (1 minus den rumlige korrelation) på tværs af alle parvise sammenligninger af tilbagekaldte mønstre. De øverste trekantede former for disse søgelys RDM ‘ er blev derefter ekstraheret, rangtransformeret og sammenlignet ved hjælp af en regressionsmodel til den rangtransformerede øvre trekantede form af alle RDM-modeller (kollektiv, semantisk og kontekstuel). Resultatet af denne søgelysanalyse skabte et beta-kort, et volumen, hvor hver voksel indeholder en statistik for søgelyset centreret ved den voksel. Disse beta-kort på første niveau for hver model blev normaliseret til Montreal Neurological Institute T1-skabelon og udglattet ved hjælp af en 10 mm fuld bredde ved halv maksimal Gaussisk kerne. Disse beta-kort med standardrumsdeltagere blev sendt til en ikke-parametrisk analyse af tilfældige effekter på andet niveau i FSL version 5.0.1157. For at korrigere for flere sammenligninger blev betakortet på gruppeniveau sendt til maksimal permutationstest ved hjælp af tærskelfri klyngeforbedring58 (TFCE), som giver et godt kompromis mellem den alt for følsomme klyngebaserede tærskelværdi og den for konservative helhjerne-vokselbaserede korrektion. For at teste RDM-modelrelateret og forskelle blev TFCE-kort derefter korrigeret (Pcorrigeret < 0,05) for den familiemæssige fejlrate ved hjælp af standard permutationstest implementeret i FSL med randomiseringsfunktionen (10.000 permutationer). Resultaterne af søgelysanalysen rapporteres i udvidede Data Fig. 1.

Collective memory corpus beskrivelse og analyse

corpus blev samlet af MATRICE-projektet (http://www.matricememory.fr/?lang=en), en tværfaglig og teknologisk platform, hvis mål er at levere værktøjer og teknologisk og teoretisk baggrund for at forstå forholdet mellem kollektiv og individuel hukommelse. De audiovisuelle klip, der oprindeligt komponerede corpus, blev gemt på National Audiovisual Institute, en af de vigtigste partnere i MATRICE-projektet og et offentligt Institut, hvis mål er at arkivere alle audiovisuelle produktioner, der udsendes på fransk tv eller radio. Til denne undersøgelse inkluderede vi i vores corpus alle tv – nyhedsbulletiner og rapporter (ikke inklusive radioprogrammer eller dokumentarfilm) udsendt fra 1980 til 2010 med Anden Verdenskrig som det fælles tema, hvilket førte til i alt 3.766 dokumenter. Vi fokuserer på denne særlige tidsperiode af tre grunde. For det første overlapper 1980 til 2010 stort set med vores deltagers levetid. For det andet svarer denne periode til etableringen af en ny fortælling for den franske kollektive hukommelse (det vil sige en ny “r-Kr.af M-kr. 59). Dette omfattede fremkomsten og bekræftelsen af Shoah-hukommelsen såvel som større retssager, der anerkendte den franske stats og dens folks deltagelse og deres repræsentanter på det tidspunkt (f.eks. For det tredje, takket være fremskridt inden for automatisk talegenkendelse og tilgængeligheden af elektroniske tekster, som samtidige sprogmodeller blev bygget til at behandle data registreret efter 1980, blev de 3.766 lydfiler konverteret til format ved hjælp af tale-til-tekst konverteringsalgoritmer udviklet af Laboratoire d ‘Informatik pour la M’ informatik et les Sciences de L ‘ Ing Larnieur (LIMSI; Engineering Sciences and Computer Science Lab), en af de vigtigste partnere i MATRICE-projektet.

når det først var konverteret til tekst, blev vores korpus oprindeligt behandlet manuelt for at kassere segmenter, der ikke var relateret til anden verdenskrig (udelukkende at holde sektioner dedikeret til dette emne). Under denne operation blev de automatiske tale-til-tekst-transkriptioner yderligere korrigeret af en menneskelig læser. Efter denne indledende forbehandling blev der uddraget en separat fil for hvert dokument. Disse filer blev derefter behandlet med tekstdataanalysemetoder ved hjælp af programmel60 (http://textometrie.ens-lyon.fr/) forbundet med TreeTagger morphosyntactic analysator61 (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/). Det giver brugeren mulighed for at kommentere hver forekomst af et ord (dvs.token) til dets tilsvarende lemma (den kanoniske form af et sæt ord) og gå videre til en morfosyntaktisk mærkning af hvert ord i et korpus. Corpus kan derefter udforskes ved hjælp af corpus forespørgselssprog (CKL) anmodninger om at tagge og hente specifikke grammatiske kategorier, former, lemmas eller enhver information, der er knyttet til ordet. En liste over anmodninger blev først automatisk genereret for hvert substantiv, verb eller adjektiv lemma i corpus. Sjældne lemmas (mindre end ti forekomster), stopord og almindelige verb (for eksempel “være” og “have”) blev fjernet i processen og ikke inkluderet i efterfølgende analyser. For eksempel vil denne algoritme gå gennem corpus og producere en unik CKL-forespørgsel (for eksempel (lemma = “fight”%c)) svarende til enhver forekomst af verbet “fight” i corpus (det vil sige “fight”, “kæmpede” eller “fighting”). % C-modifikatoren, der er indarbejdet i denne anmodning, bruges til at neutralisere karaktersagen for assimilerede lemma-former (det vil sige “kamp”, “kamp” eller “kamp”). 6.500 anmodninger blev automatisk genereret på denne måde. Denne liste blev manuelt kontrolleret for at fjerne anmodninger produceret ved forkert transkription, for lejlighedsvis at gruppere visse anmodninger under en enkelt enhed(for eksempel (lemma = “drama”%c)|(lemma = “dramatisk”%c)), for at flette bigrams, når det er relevant (for eksempel (lemma = “chief”%c) ()?(lemma = ” stat “%C) for” statschef”) eller at tilpasse sig forskellige ortografiske former (for eksempel (lemma = “Gorbatchev “%C)|(lemma = “Gorbatchov” %C)). Efter denne indledende kontrol og justering forblev i alt 6.240 anmodninger for at opsummere de 1.431.790 tokens, der komponerede vores corpus.

en lemma-dokumentfrekvensmatrice, der tæller antallet af forekomster, blev ekstraheret og underkastet en Lda-analyse udført ved hjælp af Machine Learning For LanguagE Toolkit (MALLET; http://mallet.cs.umass.edu/topics.php). Emnemodeller26, 29, 30 overvej at dokumenter genereres af blandinger af emner. I denne sammenhæng svarer et emne til fordelingen af sandsynligheder over alle ord, der findes på tværs af alle dokumenter (hvor sandsynligt er et givet ord tilknyttet et emne). Fra dette perspektiv kan et dokument genereres ved at tildele en sandsynlighedsfordeling over emner. For hver forekomst i et dokument vælges et emne afhængigt af dets tidligere emnesandsynlighedsfordeling, og der trækkes et ord fra dette emne. MALLET bruger Gibbs-prøveudtagningsalgoritmen til at invertere denne proces og udlede det sæt emner, der var ansvarlige for at generere en samling dokumenter og deres sandsynligheder over ord.

vi trænede først emnemodeller på Anden Verdenskrig nyhedsbulletiner og rapporterer corpus ved hjælp af MALLET train-topic engine (se udvidede Data Fig. 2 for en illustration af de emner, der er oprettet med denne teknik). Vi varierede antallet af tilladte emner fra 2 til 100 i trin på 1, hvor alfa-parameteren blev indstillet til 50/N emner og start-beta-parameteren til 0,1 (som foreslået i andre værker, der modellerer et stort korpus af tekster til semantiske formål62). For hvert antal emner brugte vi 500 iterationer til at estimere ord-og dokumentemnesandsynlighederne. Vi brugte derefter MALLET inferencer-værktøjet til at passe LDA-modellen til Mindebillederne og estimere deres emnesandsynligheder. Til dette formål blev hvert billede behandlet som et nyt dokument og mærket med nøgleord (også lemmatiseret), som var direkte afledt af Mindeteksterne under billederne. I alt 449 lemmas blev brugt til at beskrive Mindebillederne. Af disse lemmaer blev 428 også fundet på listen over 6.240 lemmaer, der beskriver corpus af nyhedsbulletiner og rapporter. Emnets inferentielle proces førte således til en sandsynlighedsfordelingsmatrice på 119 billeder n emner, der beskriver den bageste Sandsynlighed for et emne givet et billede.

et 119 billede * 119 billede RDM blev derefter beregnet for hvert antal estimerede emner ved hjælp af afstandene mellem fordelingen af emnesandsynligheder for hvert par billeder (baseret her på cosinusafstanden, som giver et symmetrisk mål for ligheden mellem to emnevektorer). I betragtning af den tilfældighed, som Gibbs-prøvetagningsalgoritmen kan introducere under parameterestimering, gentog vi hele processen ti gange, hvilket førte til et 3D 119-billede 119-billede 10-gentagelse RDM for hvert antal estimerede emner. Målingerne af ligheden mellem hjerne-eller adfærdsmæssige RDMs og kollektive RDMs (beta-koefficienter for regressionsmodellen eller Spearmans korrelationskoefficienter) blev gennemsnitligt på tværs af de ti gentagelser af emnemodellering. For at opsummere hele processen for et givet antal emner: (1) vi trænede en emnemodel på de franske tv – nyhedsbulletiner og rapporterer corpus; (2) Vi passer denne emnemodel til Mindebillederne og deres billedtekster og behandler hvert billede som et nyt dokument; (3) En 119 billede n emnematrice, der beskriver den bageste Sandsynlighed for et emne givet et billede, blev ekstraheret og omdannet til en 119 liter 119 RDM; og (4) denne proces blev gentaget ti gange, og for hvert emnenummer blev den gennemsnitlige lighed med hjerne-eller adfærdsmæssige RDMs beregnet på tværs af disse ti tilfælde.

validering af den kollektive hukommelsesmodel og valg af emnenummer

vi forsøgte at kvantificere strukturen af delte repræsentationer på tværs af enkeltpersoner og sammenlignede sådanne delte skemaer med vores kollektive hukommelsesmodel. Denne procedure vil også give os mulighed for uafhængigt at vælge et optimalt antal emner til at beskrive den kollektive struktur af billeder, der bedst svarer til den delte hukommelse. Til dette formål udførte 54 indfødte fransktalende (23 mænd, 31 kvinder) mellem 20 og 39 år (gennemsnit = 27,3 år; s.d. = 5,6) billedarrangementopgaven. Denne opgave blev udført på nøjagtigt de samme 119 Mindebilleder, men i modsætning til vores MR-deltagere, der havde besøgt Mindesmærket dagen før, var disse nye deltagere helt ukendte med Mindesmærket. Vi afledte 54 individuelle RDMs fra de euklidiske afstande mellem billederne. Vi udførte derefter DISTATIS33 for at fange den fælles struktur af repræsentationer på tværs af disse kontrolindivider. DISTATIS er ideel til at beregne den bedste aftale eller kompromis på tværs af flere afstandsmatricer. Implementeringen i MATLAB af DISTATIS kan findes på https://www.utdallas.edu/~herve/, men kort sagt: (1) hver af de 54 RDMs blev først omdannet til en krydsproduktmatrice efter dobbeltcentrering og normalisering til sin første egenværdi; (2) cosinus-lighedsstrukturen for alle parvise sammenligninger af de 54 normaliserede tværproduktmatricer blev beregnet ved hjælp af RV-koefficienten; (3) RV-koefficientmatricen, der beskriver forholdet mellem RDMs, blev underkastet eigen-dekomponering, og kompromismatricen svarede til summen af de normaliserede tværproduktmatricer vægtet med deres første egenværdi; (4) eigen-dekomponeringen af de kompromisproducerede faktorscorer, der beskrev placeringen af hvert af de 119 billeder i et N-dimensionelt kompromisrum, der blev; og (5) afstandskorrelationsmatricen for disse multidimensionelle kompromisrum svarede derefter til den bedste aftale på tværs af alle 54 individuelle RDM ‘ er afledt af adfærdsbilledarrangementopgaven. Denne afstandskorrelationsmatrice kan ses som et delt skema, der afspejler den fælles semantiske organisation på tværs af enkeltpersoner. De kollektive RDMs ekstraheret fra corpus af tv-nyhedsbulletiner og rapporter lignede strukturen af delt hukommelse målt på tværs af kontrolindivider (Fig. 2c). Denne lighed mellem kollektiv og delt hukommelse blev gennemsnitligt af skraldespande med fem emner og nåede sit maksimum, da seks til ti emner blev inkluderet under emneopdagelse. Som et resultat blev alle efterfølgende analyser, der involverede kollektiv eller semantisk hukommelse, udført ved hjælp af seks til ti emner (og målinger af lighed mellem hjerne-eller adfærdsmæssige RDM ‘er og kollektive eller semantiske RDM’ er blev gennemsnitligt inden for dette valgte antal emner).

konstruktion af en kontrolmodel af Anden Verdenskrigs semantiske domæne

vi brugte franske artikler, der henviste til anden verdenskrig som en benchmarkmodel for de specifikke semantiske forhold mellem ord relateret til Anden Verdenskrig, og trænede en emnemodel, som vi derefter passer til Mindebillederne. Dette korpus (http://redac.univ-tlse2.fr/corpus/wikipedia.html) omfattede 664.982 artikler redigeret indtil juni 2008, blandt hvilke 2.643 artikler var specifikt relateret til Anden Verdenskrig, og er tidligere blevet ekstraheret fra den dump franske version af artikler (http://dumps.wikimedia.org/) og behandlet ved hjælp af det samme morfosyntaktiske taggeværktøj61, der blev brugt til at behandle vores korpus af franske tv-nyheder om Anden Verdenskrig. når vi først havde importeret korpuset til anden verdenskrig, anvendte vi nøjagtigt den samme analysemetode, som vi tidligere brugte til at konstruere modellen for kollektiv hukommelse og (se collective memory corpus beskrivelse og analyse).

Rapporteringsoversigt

yderligere information om forskningsdesign er tilgængelig i Nature Research Reporting Summary, der er knyttet til denne artikel.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

Previous post Laurie Money biografi
Next post Olive Branch Municipal Court ændringer i tidsplanen (Opdateret marts 19, 2020)