memoria colectivă modelează organizarea amintirilor individuale în cortexul prefrontal medial

participanții la RMN

douăzeci și patru de vorbitori nativi de franceză din dreapta între 22 și 39 de ani (medie = 28,6 ani; s.d. = 4,4) au fost plătiți pentru a participa (11 bărbați, 13 femei). Nu au raportat antecedente de tulburări neurologice, medicale, vizuale sau de memorie. Studiul a fost aprobat de Comitetul Regional de etică a cercetării (Comitetul pentru protecția persoanelor Nord-Ouest III, id sponsor: C13-46, ID RCB: 2014-A00126-41, clinicaltrial.gov număr de înregistrare: NCT02172677). Doi participanți suplimentari au fost, de asemenea, recrutați inițial pentru stabilirea și ajustarea proiectării (dar nu au fost analizați). Un participant a fost înlocuit fără alte analize din cauza artefactelor RMN importante care împiedică analiza imaginii. Toți participanții și-au dat acordul scris înainte de a participa. Participanții au fost rugați să nu consume psihostimulante, droguri sau alcool înainte sau în timpul perioadei experimentale. Nu au fost utilizate metode statistice pentru a predetermina dimensiunea eșantionului, dar dimensiunea eșantionului utilizată în acest studiu (n = 24) este comparabilă cu cea a studiilor anterioare fMRI care utilizează RSA.

materiale și procedura de explorare Memorial

stimulii au fost 119 imagini selectate din zona război mondial, război Total la Muzeul Memorial Caen. Fiecare afișaj a fost fotografiat la Memorial folosind o cameră digitală profesională și iluminat profesional. Aceste imagini au fost apoi ajustate pentru contrast și iluminare, iar conturul extern a fost decupat, folosind software-ul de procesare a imaginilor.

fiecare participant a explorat Memorialul la sfârșitul după-amiezii, chiar înainte ca ușa Memorialului să se închidă. Acest lucru a asigurat că alți vizitatori nu vor perturba tururile participanților. Participanții au primit mai întâi instrucțiuni generale despre experiment și au fost echipați fiecare cu un sistem mobil de urmărire a ochilor (Laboratorul de științe Aplicate) format din ochelari și un mic dispozitiv de stocare conectat la ochelari și transportat ca rucsac. Aceste ochelari au fost montate cu o cameră mică care filma explorarea vizuală a participantului, care a fost înregistrată și difuzată pe laptopul experimentatorului. Deși nu prezentăm aceste date de urmărire a ochilor, care depășesc domeniul de aplicare al lucrării actuale, am putea astfel să urmărim explorarea participanților fără a le urma și, astfel, să ne asigurăm că respectă următoarele instrucțiuni.

participanților li s-a spus să exploreze un spațiu restrâns al Memorialului și li s-a oferit o hartă care descrie aspectul spațial (vezi Fig. 1a). Acest spațiu a cuprins un total de 119 imagini, fiecare cu o legendă dedesubt și a fost organizat în funcție de 22 de zone tematice (numerele zonelor sunt indicate în cercurile din Fig. 1a). Alte două zone au fost incluse chiar la începutul și chiar la sfârșitul turului pentru efecte recente și de primat. Aceste zone de umplere au fost întotdeauna aceleași, iar imaginile lor nu au fost incluse în protocolul experimental ulterior (și au fost utilizate doar pentru instruire și familiarizare cu sarcina ulterioară de rechemare). Aceste 22 de zone au fost grupate în funcție de 6 sectoare principale (ilustrate cu cele 6 culori principale de pe harta Memorială din Fig. 1a). Ordinea de explorare a acestor sectoare principale a fost contrabalansată între participanți. Ordinea de explorare a zonelor din fiecare sector a fost, de asemenea, randomizată în funcție de 6 liste de explorare diferite (4 participanți au fost repartizați la fiecare dintre aceste 6 liste). Fiecare zonă a început cu o placă de introducere care descrie conținutul zonei pe care participanții au fost instruiți să o citească mai întâi înainte de a explora zona. Participanții au trebuit apoi să exploreze fiecare imagine care compune zona. Au făcut acest lucru citind mai întâi legenda de dedesubt și apoi au fost liberi să exploreze conținutul imaginii atâta timp cât doreau înainte de a trece la următoarea imagine până când și-au finalizat turul, a cărui durată medie a fost de 76 de minute (s.D. = 13,8). Rețineți că în timpul acestui turneu Memorial, participanții nu știau că amintirile lor vor fi testate a doua zi.

sarcina de rechemare

a doua zi, participanții au efectuat sarcina de rechemare, care a fost împărțită în trei sesiuni fMRI, fiecare cu o lungime de aproximativ 10 minute. Fiecare sesiune a prezentat propoziții scurte corespunzătoare unor fragmente scurte care descriu imagini reale din cel de-al Doilea Război Mondial pe care participanții le-au explorat (adică propoziții țintă; număr mediu de cuvinte = 7,8, s.d. = 2,4) sau nu au explorat (adică propoziții distractoare; număr mediu de cuvinte = 7,7, s.d. = 2,1) cu o zi înainte. În total, 119 propoziții țintă și 63 de propoziții distractoare au fost prezentate aleatoriu participanților. Evenimentele istorice asociate cu propozițiile distractorului au fost selectate pentru a se potrivi cu imaginile afișate la Memorial atât în ceea ce privește conținutul, cât și proporția relativă a imaginilor pe zonă. Țara în care a avut loc evenimentul a fost afișată și sub fiecare propoziție, la fel ca anul. Participanții au fost conștienți de proximitatea dintre propozițiile distractor și țintă și, prin urmare, au fost încurajați să se bazeze pe capacitatea lor de a-și aminti și vizualiza pe deplin imaginile asociate pentru a îndeplini această sarcină. După debutul fiecărei propoziții cueing, participanții au raportat dacă pot sau nu să-și amintească imaginea asociată apăsând Da cu degetul arătător drept sau nu cu degetul mijlociu drept. Propozițiile au apărut timp de 4,5 s centrate pe un fundal gri. Studiile au fost prezentate într-o manieră stocastică în conformitate cu o distribuție Poisson (XV = 4) cu un interval mediu interstimulus de 4,2 s (interval = 1-10 s) cu 25% evenimente nule suplimentare și au fost separate printr-o cruce de fixare. Preciziile și performanțele privind sarcina de rechemare sunt descrise în tabelul suplimentar 2.

Image arrangement task

în afara scanerului, participanții au efectuat o sarcină de aranjare a imaginilor, utilizată ca proxy pentru scheme individuale, pe cele 119 imagini memoriale. Imaginile trebuiau poziționate în 1 până la 28 de cercuri în funcție de proximitatea lor istorică. Această sarcină aranjament imagine a fost scris în Javascript încorporat în cod HTML pentru navigare pe internet, oferind astfel o mare flexibilitate în executarea sarcinii: participanții ar putea mări sau micșora cu un fundal în mișcare similar cu Google Maps, ar putea mări o imagine făcând clic pe ea (cu legenda memorială dedesubt), legendele memoriale au apărut pe mouseover, iar participanții ar putea selecta și muta mai multe imagini simultan. Imaginile au fost plasate inițial într-un pătrat mare deasupra cercurilor. Participanții au fost instruiți să revizuiască fiecare imagine și să le plaseze în cercurile de mai jos pe măsură ce treceau prin fiecare dintre ele. Li s-a spus să grupeze în același cerc orice imagini pe care le-au simțit descrise evenimente istorice apropiate sau similare. Dacă au simțit imaginile descrise evenimente deconectate, au fost instruiți să le plaseze în cercuri diferite. Participanții au fost liberi să folosească câte cercuri au dorit, de la un singur cerc la toate cercurile disponibile pe hartă. Instrucțiunile au subliniat că nu există absolut niciun număr corect de cercuri care să fie utilizate și că erau liberi să procedeze așa cum doreau. Participanții au fost, de asemenea, instruiți să acorde atenție distanțelor dintre cercuri și pozițiile lor relative. Cu cât au considerat mai mult că imaginile erau legate de evenimente conectate sau deconectate, cu atât ar trebui să fie mai apropiate sau mai îndepărtate pozițiile lor relative între cercuri. În cele din urmă, când aranjamentul principal a fost finalizat pentru toate imaginile, participanții au trebuit să reajusteze pozițiile imaginilor din fiecare cerc. Distanțele euclidiene dintre pozițiile imaginii reflectau apoi organizarea semantică a unui individ dat și puteau fi codificate într-un RDM.

parametrii de achiziție RMN

datele RMN au fost obținute pe un scaner 3 T Achiga (Philips) la Centrul de imagistică cerebrală Cyceron din Caen. Toți participanții au fost supuși mai întâi imagisticii de volum anatomic ponderat T1 de înaltă rezoluție folosind o secvență tridimensională (3D) Fast field echo (FFE) (3D-T1-FFE sagital; TR = 20 ms, TE = 4.6 ms, Unghi flip = 10 hectolix, factor de sens = 2.180 felii, grosime felie = 1 mm, fără decalaj, câmp vizual = 256 XT 256 XT 180 mm3, matrice = 256 XT 130 XT 180). Această achiziție a fost urmată de sesiunile funcționale, care au fost achiziționate folosind o secvență ascendentă T2-star EPI (MS-T2-star-FFE-EPI axial; TR = 2050 ms, TE = 30 ms, Unghi de răsturnare = 78 irakt, 32 felii, grosime felie = 3 mm, decalaj de 0,75 mm, matrice = 64 XT 63 XT 32, câmp vizual = 192 XT 192 XT 119 mm3, 310 volume pe cursă).

preprocesarea RMN

datele au fost analizate folosind software de cartografiere parametrică Statistică (SPM12, Departamentul Wellcome de Neuroștiințe imagistice). În timpul preprocesării, imaginile au fost mai întâi realiniate spațial pentru a corecta mișcarea și apoi au fost corectate pentru întârzierea temporală a achiziției feliei. După înregistrarea cu imaginea structurală T1, imaginile funcționale au fost apoi normalizate folosind parametrii derivați din normalizarea neliniară a imaginilor T1 individuale ale materiei cenușii la șablonul T1 al Institutului neurologic din Montreal. Rețineți, totuși, că pentru RSA s-au folosit imagini neacoperite și neacoperite. Normalizarea imaginii a fost totuși necesară pentru a calcula câmpul de deformare înainte și inversarea acestuia, pentru a normaliza imaginile reflectoarelor sau pentru a înfășura roi-urile mPFC în spațiul nativ (vezi mai jos), respectiv. Utilizarea imaginilor netezate este importantă pentru RSA, deoarece păstrează modelul spațial cu granulație fină care caracterizează geometria reprezentativă a unei regiuni.

analiza de prim nivel

seriile de timp preprocesate, corespunzătoare imaginilor spațiale native (adică imagini ne-deformate și neetanșe), au fost apoi filtrate la 1/128 Hz în fiecare voxel. Regresorii într-un model liniar general (GLM) pentru fiecare voxel au fost creați prin convolvarea unei funcții delta (modelată ca 4,5 s epocă scurtă) la debutul stimulului pentru fiecare condiție de interes cu o funcție de răspuns hemodinamic canonic (HRF). A fost utilizată o abordare separată cu cele mai mici pătrate50,51, care a constat în estimarea unui GLM separat pentru fiecare studiu. În fiecare GLM, studiul de interes a fost modelat ca un regresor, iar toate celelalte studii au fost prăbușite în cinci regresori distincți corespunzând rechemării, ratării, alarmelor false, respingerii corecției și fără condiții de răspuns (a se vedea tabelul suplimentar 2 pentru performanțele comportamentale în sarcina rechemării). Această abordare a fost promovată pentru proiectele cu intervale interstimulale scurte, când există un nivel ridicat de colinearitate între răspunsurile hemodinamice la testele succesive51. Alți regresori fără interes au fost cei șase parametri de realiniere pentru a ține cont de Artefactele de mișcare reziduală liniară. Autocorelația dintre reziduurile GLM a fost corectată folosind procesul autoregresiv de ordinul întâi, rezultând date pre-albe după estimarea limitată a probabilității maxime.

regiuni de interes

mPFC a fost definit anatomic folosind etichetarea anatomică automată atlas52 și a fost împărțit în Roi vmpfc și dmPFC. DmPFC a corespuns gyrusului medial superior frontal bilateral al atlasului automat de etichetare anatomică (indicii 2601 și 2602). Masca vmPFC a inclus girusul medial fronto-orbital bilateral (indicii 2611 și 2612), rectusul bilateral (indicii 2701 și 2702) și porțiunea ventrală (coordonatele Z inferioare sau egale cu zero) ale cingulului anterior bilateral (indicii 4001 și 4002). Aceste două roi sunt prezentate în Fig. 3b. Aceste două imagini de mască au fost apoi înfășurate înapoi în spațiul nativ al fiecărui participant folosind inversul câmpului de deformare calculat în timpul procesului de normalizare.

analiza similitudinii reprezentative

hărțile de Contrast ale amintirilor individuale au fost apoi calculate pentru fiecare imagine amintită și utilizate pentru a calcula RDMs în Roi-urile noastre. Pentru fiecare individ și fiecare ROI, RDM-urile cerebrale au fost calculate după cum urmează: pentru fiecare voxel, vectorul de activitate din imaginile amintite a fost centrat în medie și scalat la abaterea sa standard (adică scorul z); apoi, pentru fiecare pereche de imagini, tiparele de activitate într-un ROI dat au fost comparate folosind corelația spațială, iar diferența a fost dată apoi de 1 minus corelația. La nivel comportamental, RDM-urile individuale au fost derivate din distanțele euclidiene dintre toate perechile posibile de imagini aranjate de participanți pe aspectul spațial bidimensional. Formele triunghiulare superioare ale acestor RDM-uri cerebrale sau comportamentale au fost apoi extrase și comparate cu formele triunghiulare superioare ale modelelor RDM care descriu scheme colective, distanțe semantice (derivate din articolele Wikipedia din Al Doilea Război Mondial; vezi mai jos), distanțe spațiale contextuale (distanțe euclidiene ale pozițiilor spațiale ale imaginilor) și distanțe temporale (distanțe euclidiene ale ordinii rangului temporal al imaginilor în timpul explorării memoriale). Aceste comparații între RDMs cerebral/comportamental și model au fost realizate folosind un model de regresie. Atât regresorii, cât și datele au fost inițial transformate în rang pentru a testa relațiile monotone neliniare. Având în vedere că modelele RDM colective, semantice (adică Wikipedia) și contextuale (adică spațiale și temporale) nu sunt ortogonale și se suprapun într-o oarecare măsură, un model de regresie ajută la clarificarea varianței unice atribuibile fiecăruia dintre predictorii modelului. Pentru fiecare participant, acest model de regresie a fost reiterat pentru fiecare subiect de interes, iar cele zece repetări ale modelului de subiect și ale coeficientului de regresie a modelului au fost medii pe aceste iterații. Toate modelele de regresie au fost de rang complet, iar factorul de inflație a varianței a fost mai mic de 1,5 pentru fiecare regresor, confirmând identificabilitatea și eficiența modelelor noastre. Rezultatele acestor modele de regresie sunt raportate în textul principal, dar raportăm și rezultatele corelațiilor standard ale lui Spearman testate izolat, din motive de exhaustivitate, în Fig. 3c și în tabelul suplimentar 1 pentru testele statistice. Numai elementele corect rechemate au fost incluse în analiza tiparelor de activitate. Inferențele la nivel de grup au fost efectuate folosind statistici non-parametrice cu efecte aleatorii pentru a testa atât relația RDM, cât și diferențele prin bootstraparea setului de subiecte cu 5.000 de iterații28. Pentru fiecare model RDM sau fiecare pereche de modele RDM contrastate, nu am avut ipoteze cu privire la distribuția subiacentă și am efectuat teste statistice non-parametrice cu efecte aleatorii folosind o abordare de bootstrapping. Am efectuat o comparație medie la fiecare set bootstrap și am estimat valoarea P ca proporție de probe bootstrap mai departe în cozi decât zero. Proporțiile așteptate ale erorilor de tip I în mai multe teste atât ale relației modelului RDM, cât și ale comparației modelului au fost controlate folosind corecția FDR,cu un FDR dorit q = 0,05 și presupunând o dependență pozitivă între condiții34 [, 53. Pentru testarea corelării modelului RDM, FDR așteptat a fost calculat folosind toate valorile P necorectate cu o singură coadă ale modelelor testate. Pentru testul de comparație a modelului RDM, am limitat corecția la ipoteza noastră principală și am inclus doar comparații care implică memoria colectivă RDM (în raport cu alte modele de referință) pentru a calcula FDR așteptat, folosind valori p cu două cozi. Raportăm valorile P ajustate și folosim iterații de bootstrapping pentru a determina 95% percentila CIs. Plafonul de zgomot raportat în Fig. 3C reflectă corelația dintre participanți a RDMs-urilor cerebrale. Această corelație a fost calculată pentru fiecare participant ca corelație între RDM cerebral al participantului respectiv și RDM cerebral mediu al participanților rămasi34. Plafonul de zgomot descris în Fig. 3c corespunde mediei acestor corelații individuale.

analiza reflectoarelor

ochiurile materiei albe și suprafețele Piale ale cortexului au fost reconstruite din imagini ponderate T1 colectate pentru fiecare participant folosind pachetul software Freesurfer versiunea 554,55. Am folosit funcția rsa_defineSearchlight MATLAB de la RSA toolbox34 (https://github.com/rsagroup/rsatoolbox), care se bazează și pe funcțiile Surfing toolbox 56 (https://github.com/nno/surfing), pentru a defini un proiector bazat pe suprafață pentru ambele emisfere (folosind un proiector de 40 voxel cu o rază de 10 mm). Voxelii din vecinătatea unuia sau mai multor noduri ale suprafeței au fost selectați folosind o măsură de distanță geodezică și prin construirea de linii virtuale care conectau nodurile corespunzătoare pe suprafețele substanței pial și albe. Această procedură produce un proiector în urma curburii suprafeței, reducând astfel părtinirea spațială în timpul analizei modelelor fMRI. Spre deosebire de cartierele definite volumetric, acest lucru a dus la cartiere cu o formă cilindrică curbată care a urmat contururile sulci și gyri ale fiecărui individ. Odată ce structura luminii de căutare pentru fiecare vârf a fost construită și mapată la spațiul funcțional al imaginii, modelele de activitate amintită la fiecare voxel care compune lumina de căutare au fost centrate în medie și scalate la abaterile lor standard înainte de a calcula structura de disimilaritate (1 minus corelația spațială) în toate comparațiile perechi ale modelelor amintite. Formele triunghiulare superioare ale acestor RDM-uri cu lumină de căutare au fost apoi extrase, transformate în rang și comparate folosind un model de regresie cu forma triunghiulară superioară transformată în rang a tuturor modelelor RDM (colective, semantice și contextuale). Rezultatul acestei analize a luminii de căutare a creat o hartă beta, un volum în care fiecare voxel conține o statistică pentru lumina de căutare centrată la acel voxel. Aceste hărți beta de primul nivel pentru fiecare model au fost normalizate la Institutul Neurologic din Montreal T1 șablon și netezit folosind o lățime completă de 10 mm la jumătate maximă kernel Gaussian. Aceste hărți beta ale participanților la spațiul standard au fost trimise la o analiză a efectelor aleatorii non-parametrice de nivelul doi în versiunea FSL 5.0.1157. Pentru a corecta comparațiile multiple, harta beta la nivel de grup a fost supusă testării permutării maxime folosind îmbunătățirea clusterului fără prag58 (TFCE), care oferă un compromis bun între pragul excesiv de sensibil bazat pe cluster și corecția prea conservatoare bazată pe întregul creier voxel. Pentru a testa relația și diferențele modelului RDM, hărțile TFCE au fost apoi corectate (Pcorrected < 0,05) pentru rata de eroare din familie folosind teste standard de permutare implementate în FSL cu funcția randomize (10.000 permutări). Rezultatele analizei luminii de căutare sunt raportate în datele extinse Fig. 1.

descrierea și analiza corpusului Memoriei Colective

corpusul a fost colectat de proiectul MATRICE (http://www.matricememory.fr/?lang=en), o platformă multidisciplinară și Tehnologică, al cărei scop este de a oferi instrumente și fundal tehnologic și teoretic pentru a înțelege relația dintre memoria colectivă și cea individuală. Clipurile audio-vizuale care compun inițial corpusul au fost stocate la Institutul Național al Audiovizualului, unul dintre principalii parteneri ai proiectului MATRICE și un institut public al cărui scop este arhivarea tuturor producțiilor audio-vizuale difuzate la televiziunea sau radioul francez. Pentru acest studiu, am inclus în corpusul nostru toate buletinele și rapoartele de știri de televiziune (fără a include emisiuni radio sau documentare) difuzate din 1980 până în 2010 cu al doilea război mondial ca temă comună, ducând la un total de 3.766 de documente. Ne concentrăm asupra acestei perioade de timp din trei motive. În primul rând, 1980-2010 se suprapune în mare măsură cu durata de viață a participanților noștri. În al doilea rând, această perioadă corespunde stabilirii unei noi narațiuni pentru memoria colectivă franceză (și anume, o nouă „R-X-X-X-X-X-X-X-X-X-X-X-X-X-X-X-X-X-x”59). Aceasta a inclus apariția și afirmarea memoriei Shoah, precum și procese majore care recunosc participarea statului francez și a poporului Său și a reprezentanților acestora la acea vreme (de exemplu, Bousquet, Leguay, Touvier și Papon), la deportarea și uciderea evreilor. În al treilea rând, datorită progreselor în recunoașterea automată a vorbirii și disponibilității textelor electronice cu care au fost construite modele de limbaj contemporan pentru a prelucra datele înregistrate după 1980, cele 3.766 de fișiere audio au fost convertite în format XML folosind algoritmi de conversie discurs-text dezvoltați de Laboratoire d ‘informatique pour la M Inccanique et les Sciences de l’ Ing (LIMSI; Engineering Sciences and Computer Science Lab), unul dintre principalii parteneri ai proiectului MATRICE.

odată convertit în text, corpusul nostru a fost inițial procesat manual pentru a elimina segmente care nu au legătură cu Al Doilea Război Mondial (păstrând exclusiv secțiuni dedicate acestui subiect). În timpul acestei operații, transcrierile automate vorbire-text au fost corectate suplimentar de un cititor uman. După această preprocesare inițială, a fost extras un fișier XML separat pentru fiecare document. Aceste fișiere au fost apoi prelucrate cu metodologii de analiză a datelor textuale folosind software-ul TXM60 (http://textometrie.ens-lyon.fr/) conectat cu TreeTagger morphosintactic analyser61 (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/). TXM permite utilizatorului să adnoteze fiecare instanță a unui cuvânt (adică token) la lema corespunzătoare (forma canonică a unui set de cuvinte) și să procedeze la o etichetare morfosintactică a fiecărui cuvânt dintr-un corpus. Corpusul poate fi apoi explorat folosind cereri Corpus Query Language (CQL) pentru a eticheta și a prelua categorii gramaticale specifice, forme, Leme sau orice informație atașată cuvântului. O listă de Cereri CQL a fost generată automat pentru fiecare substantiv, verb sau adjectiv lema din corpus. Lemele Rare (mai puțin de zece apariții), cuvintele stop și verbele comune (de exemplu, „a fi” și „a avea”) au fost eliminate în acest proces și nu au fost incluse în analizele ulterioare. De exemplu, acest algoritm ar trece prin corpus și ar produce o interogare CQL unică (de exemplu, (lema = „luptă”%c)) corespunzătoare oricărei instanțe a verbului „luptă” din corpus (adică „luptă”, „luptat” sau „luptă”). Modificatorul %c încorporat în această cerere este utilizat pentru a neutraliza cazul caracterelor formelor de lemă asimilate (adică „luptă”, „luptă” sau „luptă”). O listă inițială de aproximativ 6.500 de Cereri CQL a fost generată automat în acest fel. Această listă a fost verificată manual pentru a elimina cererile CQL produse de transcriere incorectă, pentru a grupa ocazional anumite cereri sub o singură entitate (de exemplu, (lema = „drama”%c)|(lema = „dramatic”%c)), pentru a îmbina bigramele atunci când este cazul (de exemplu, (lema = „șef”%c)()?(lema = „stat”%C) pentru „șef de stat”) sau pentru a se adapta la diferite forme ortografice (de exemplu, (lema = „Gorbatchev „%c)|(lema = „Gorbatchov” %c)). După această verificare și ajustare inițială, au rămas în total 6.240 de solicitări pentru a rezuma cele 1.431.790 de jetoane care compun corpusul nostru.

o matrice de frecvență a documentului lema x care numără numărul de apariții a fost extrasă și supusă unei analize LDA efectuate utilizând setul de instrumente Machine Learning for LanguagE (MALLET; http://mallet.cs.umass.edu/topics.php). Modelele temelor26, 29, 30 consideră că documentele sunt generate de amestecuri de subiecte. În acest context, un subiect corespunde distribuției probabilităților peste toate cuvintele prezente în toate documentele (cât de probabil este un cuvânt dat să fie asociat cu un subiect). Din această perspectivă, un document poate fi generat prin atribuirea unei distribuții de probabilitate pe subiecte. Pentru fiecare instanță dintr-un document, un subiect este ales în funcție de distribuția probabilității subiectului anterior și un cuvânt este extras din acel subiect. MALLET folosește algoritmul de eșantionare Gibbs pentru a inversa acest proces, deducând setul de subiecte care au fost responsabile pentru generarea unei colecții de documente și probabilitățile lor asupra cuvintelor.

am pregătit mai întâi modele de subiecte despre buletinele de știri și Rapoartele din cel de-al doilea război mondial folosind motorul de tren ciocan-subiect (vezi date extinse Fig. 2 pentru o ilustrare a subiectelor create cu această tehnică). Am variat numărul de subiecte permise de la 2 la 100, în trepte de 1, setând parametrul alfa la 50/N subiecte și parametrul beta de pornire la 0,1 (așa cum se sugerează în alte lucrări care modelează un corpus mare de texte în scopuri semantice62). Pentru fiecare număr de subiecte, am folosit 500 de iterații pentru a estima probabilitățile subiectului word și document. Apoi am folosit instrumentul mallet inferencer pentru a potrivi modelul LDA la imaginile memoriale și pentru a estima probabilitățile subiectului. În acest scop, fiecare imagine a fost tratată ca un document nou și etichetată cu cuvinte cheie (de asemenea lemmatizate), care au fost derivate direct din legendele memoriale de sub imagini. Un total de 449 de Leme au fost folosite pentru a descrie imaginile memoriale. Dintre aceste Leme, 428 au fost găsite și în lista de 6.240 de Leme care descriu corpusul buletinelor și rapoartelor de știri. Procesul inferențial al subiectului a dus astfel la o matrice de distribuție a probabilității de 119 imagini x n subiecte, descriind probabilitatea posterioară a unui subiect dat unei imagini.

o imagine 119 x 119 imagine RDM a fost apoi calculată pentru fiecare număr de subiecte estimate folosind distanțele dintre distribuțiile probabilităților de subiect pentru fiecare pereche de imagini (bazată aici pe distanța cosinusului, care oferă o măsură simetrică a asemănării dintre doi vectori de subiect). Cu toate acestea, având în vedere caracterul aleatoriu pe care algoritmul de eșantionare Gibbs îl poate introduce în timpul estimării parametrilor, am reiterat întregul proces de zece ori, ducând la o repetare RDM 3D 119 imagine x 119 imagine x 10 pentru fiecare număr de subiecte estimate. Măsurătorile asemănării dintre RDM-urile cerebrale sau comportamentale și RDM-urile colective (coeficienții beta ai modelului de regresie sau coeficienții de corelație ai lui Spearman) au fost medii în cele zece repetări ale modelării subiectului. Pentru a rezuma întregul proces, pentru un anumit număr de subiecte: (1) am pregătit un model de subiect pe buletinele de știri și rapoartele televiziunii franceze corpus; (2) potrivim acest model de subiect imaginilor memoriale și subtitrărilor lor, tratând fiecare imagine ca pe un document nou; (3) o matrice de 119 imagini x n subiecte, care descrie probabilitatea posterioară a unui subiect dat unei imagini, a fost extrasă și transformată într-un RDM de 119 de 119 de metri pătrați; și (4) acest proces a fost reiterat de zece ori, iar pentru fiecare număr de subiecte, similitudinea medie cu RDM-urile cerebrale sau comportamentale a fost calculată în aceste zece cazuri.

validarea modelului de memorie colectivă și selectarea numărului de subiect

am căutat să cuantificăm structura reprezentărilor partajate între indivizi și am comparat astfel de scheme partajate cu modelul nostru de memorie colectivă. Această procedură ne-ar permite, de asemenea, să selectăm în mod independent un număr optim de subiecte pentru a descrie structura colectivă a imaginilor care corespunde cel mai bine memoriei partajate. În acest scop, 54 de vorbitori nativi de franceză (23 de bărbați, 31 de femei) între 20 și 39 de ani (medie = 27,3 ani; s.d. = 5,6) au efectuat sarcina de aranjare a imaginii. Această sarcină a fost efectuată pe exact aceleași 119 imagini memoriale, dar spre deosebire de participanții noștri la RMN, care au vizitat Memorialul cu o zi înainte, acești noi participanți nu erau complet familiarizați cu Memorialul. Am derivat 54 de RDM-uri individuale din distanțele euclidiene dintre imagini. Apoi am efectuat DISTATIS33 pentru a surprinde structura comună a reprezentărilor între acei indivizi de control. DISTATIS este ideal pentru a calcula cel mai bun Acord sau compromis pe mai multe matrice la distanță. Implementarea în MATLAB a DISTATIS poate fi găsită la https://www.utdallas.edu/~herve/, dar pe scurt: (1) fiecare dintre cele 54 de RDMs a fost transformat mai întâi într-o matrice de produse încrucișate după centrare dublă și normalizare la prima sa valoare proprie; (2) structura de similitudine cosinus a tuturor comparațiilor în perechi ale celor 54 de matrice de produse încrucișate normalizate a fost calculată folosind coeficientul RV; (3) matricea coeficientului RV care descrie relațiile dintre RDMs a fost supusă descompunerii proprii, iar matricea de compromis a corespuns sumei matricelor de produse încrucișate normalizate ponderate de prima lor valoare proprie; (4) descompunerea proprie a scorurilor factorului produs de compromis, care a descris poziția fiecăreia dintre cele 119 imagini; și (5) matricea de corelație la distanță a acestor spații de compromis multidimensionale a corespuns apoi celui mai bun acord pentru toate cele 54 de RDM-uri individuale derivate din sarcina de aranjare a imaginii comportamentale. Această matrice de corelație la distanță poate fi privită ca o schemă comună care reflectă organizarea semantică comună între indivizi. RDM-urile colective extrase din corpusul buletinelor și rapoartelor de știri de televiziune au fost similare cu structura memoriei partajate măsurată la indivizii de control (Fig. 2c). Această asemănare între memoria colectivă și cea partajată a fost mediată de coșuri de cinci subiecte și a atins maximul când au fost incluse șase până la zece subiecte în timpul descoperirii subiectului. Ca rezultat, toate analizele ulterioare care implică memoria colectivă sau semantică au fost efectuate folosind șase până la zece subiecte (și măsurile de similitudine între RDR-urile cerebrale sau comportamentale și RDR-urile colective sau semantice au fost medii în cadrul acestui număr selectat de subiecte).

construirea unui model de control al domeniului semantic al celui de-al Doilea Război Mondial

am folosit articole Wikipedia franceze referitoare la al doilea război mondial ca model de referință al relațiilor semantice specifice dintre cuvintele legate de al doilea război mondial și am pregătit un model de subiect pe care apoi îl potrivim imaginilor memoriale. Acest corpus (http://redac.univ-tlse2.fr/corpus/wikipedia.html) a inclus 664.982 de articole editate până în iunie 2008, dintre care 2.643 de articole au fost legate în mod specific de Al Doilea Război Mondial și au fost extrase anterior din versiunea franceză a articolelor Wikipedia (http://dumps.wikimedia.org/) și prelucrate folosind același instrument de etichetare morfosintactică61 folosit pentru a procesa corpusul nostru de știri de televiziune franceze despre Al Doilea Război Mondial. odată ce am importat corpusul în TXM, am aplicat exact aceeași metodă de analiză pe care am folosit-o anterior pentru a construi modelul memoriei colective (vezi colectiv descrierea și analiza corpusului de memorie).

rezumat de raportare

informații suplimentare privind proiectarea cercetării sunt disponibile în Rezumatul de raportare privind cercetarea naturii legat de acest articol.

Lasă un răspuns

Adresa ta de email nu va fi publicată.

Previous post Laurie Money Biografie
Next post Olive Branch Municipal Court modificări la program (actualizat în martie 19, 2020)