MK-osallistujille
kaksikymmentäneljä oikeakätistä 22-39-vuotiasta ranskaa puhuvaa (keskiarvo = 28,6 vuotta; s.d. = 4,4) maksettiin osallistumisesta (11 miestä, 13 naista). Heillä ei ollut raportoitu olleen neurologisia, lääketieteellisiä, näköhäiriöitä tai muistisairauksia. Tutkimuksen on hyväksynyt alueellinen tutkimuseettinen komitea (Comité de Protection des Personnes Nord-Ouest III, sponsor ID: C13-46, RCB ID: 2014-A00126-41, clinicaltrial.gov rekisterinumero: NCT02172677). Myös kaksi muuta osallistujaa rekrytoitiin alun perin suunnittelun säätämistä ja säätämistä varten (mutta ei analysoitu). Yksi osallistuja vaihdettiin ilman lisäanalyysejä, koska kuva-analyysit estivät tärkeän magneettikuvauksen. Kaikki osallistujat antoivat kirjallisen suostumuksen ennen osallistumista. Osallistujia pyydettiin olemaan käyttämättä psykostimulantteja, huumeita tai alkoholia ennen kokeilujaksoa tai sen aikana. Otoskoon määrittämiseen ei käytetty tilastollisia menetelmiä, mutta tässä tutkimuksessa käytetty otoskoko (n = 24) on verrattavissa aiempiin RSA: ta käyttäneisiin fMRI-tutkimuksiin.
aineistot ja muistomerkkien etsintäoperaatio
virikkeinä olivat 119 kuvaa, jotka oli valittu alueelta maailmansota, Total War Caenin Muistomuseossa. Jokainen näytös kuvattiin muistotilaisuudessa ammattimaisella digikameralla ja ammattimaisella valaistuksella. Näiden kuvien kontrastia ja valaistusta säädettiin, ja ulkoinen ääriviivat rajattiin kuvankäsittelyohjelmalla.
jokainen osallistuja tutki Muistonvieton iltapäivän päätteeksi, juuri ennen kuin Muistonvieton ovi sulkeutuu. Näin varmistettiin, etteivät muut kävijät häirinneet osallistujien kierroksia. Osallistujille annettiin ensin Yleisohjeet kokeesta, ja jokainen heistä varustettiin liikuteltavalla silmäseurantajärjestelmällä (Applied Science Laboratory), joka koostui silmälaseista ja laseihin kytketystä pienestä säilytyslaitteesta, jota kannettiin reppuna. Laseihin kiinnitettiin pieni kamera, joka kuvasi osallistujan visuaalista etsintää, joka tallentui ja lähetettiin kokeilijan kannettavalle tietokoneelle. Vaikka emme esitä näitä katseenseurantatietoja, jotka ylittävät nykyisen asiakirjan soveltamisalan, voisimme näin seurata osallistujien etsintöjä noudattamatta niitä ja varmistaa siten, että he noudattavat seuraavia ohjeita.
osallistujia käskettiin tutkimaan muistomerkin rajoitettua tilaa ja heille annettiin kartta, jossa kuvailtiin paikan sijoittelua(KS. 1 A). Tämä tila käsitti yhteensä 119 kuvaa, joista jokaisessa oli kuvateksti alla, ja se oli järjestetty 22 temaattisen vyöhykkeen mukaan (vyöhykkeen numerot on merkitty ympyröihin kuviossa. 1 A). Kaksi muuta vyöhykettä olivat mukana heti kiertueen alussa ja aivan lopussa recency-ja primacy-efektien vuoksi. Nämä täyttöalueet olivat aina samat, eikä niiden kuvia sisällytetty myöhempään koeprotokollaan (ja niitä käytettiin vain koulutukseen ja perehdyttämiseen myöhempään takaisinkutsutehtävään). Nämä 22 vyöhykettä oli ryhmitelty 6 pääalan mukaan(kuvitettu Muistokartan 6 päävärillä viikuna. 1 A). Näiden pääsektoreiden etsintäjärjestys oli vastapainona osallistujille. Kunkin sektorin vyöhykkeiden etsintäjärjestys satunnaistettiin myös 6 eri tutkimusluettelon mukaan (4 osallistujaa määrättiin kuhunkin näistä 6 listasta). Jokainen vyöhyke alkoi esittelytaululla, jossa kuvailtiin vyöhykkeen sisältöä, jonka osallistujat ohjeistettiin lukemaan ensin ennen vyöhykkeen tutkimista. Tämän jälkeen osallistujien piti tutkia jokainen kuva, joka muodostaa vyöhykkeen. He tekivät niin lukemalla ensin alla olevan kuvatekstin ja saivat sitten vapaasti tutustua kuvan sisältöön niin kauan kuin halusivat ennen kuin siirtyivät seuraavaan kuvaan, kunnes päättivät kiertueensa, jonka keskimääräinen kesto oli 76 min (s.d. = 13,8). Huomaa, että tällä Muistokierroksella osallistujat eivät tienneet, että heidän muistojaan koeteltaisiin seuraavana päivänä.
Takaisinkutsutehtävä
seuraavana päivänä osallistujat suorittivat takaisinkutsutehtävän, joka jaettiin kolmeen fMRI-istuntoon, joista jokainen oli noin 10 minuutin pituinen. Jokaisessa istunnossa esitettiin lyhyitä lauseita, jotka vastaavat lyhyitä otteita, jotka kuvaavat todellisia toisen maailmansodan kuvia, joita osallistujat olivat tutkineet (eli kohdelauseita; keskimääräinen sanamäärä = 7.8, s.d. = 2.4) tai joita he eivät olleet tutkineet (eli häiriötekijän lauseita; keskimääräinen sanamäärä = 7.7, S.d. = 2.1) edellisenä päivänä. Osallistujille esitettiin sattumanvaraisesti yhteensä 119 kohdelausetta ja 63 häiriötekijän lausetta. Häiriötekijän lauseisiin liittyvät historialliset tapahtumat valittiin vastaamaan muistomerkillä näytettyjä kuvia sekä sisällön että kuvien suhteellisen osuuden suhteen vyöhykettä kohti. Jokaisen lauseen alle oli merkitty myös maa, jossa tapahtuma järjestettiin, kuten myös vuosi. Osallistujat olivat tietoisia häiriötekijän ja kohdelauseiden läheisyydestä, ja siksi heitä kannustettiin voimakkaasti luottamaan kykyynsä muistaa ja visualisoida siihen liittyvät kuvat tämän tehtävän suorittamiseksi. Jokaisen cueing-lauseen alkamisen jälkeen osallistujat kertoivat, pystyvätkö he muistamaan siihen liittyvän kuvan painamalla oikealla etusormellaan kyllä vai ei oikealla keskisormellaan. Lauseet ilmestyivät 4,5 sekunnin ajan keskittyneinä harmaalle taustalle. Kokeet esitettiin stokastisesti Poisson-jakauman (λ = 4) mukaisesti, ja niiden keskimääräinen interstimulus-väli oli 4, 2 s (vaihteluväli = 1-10 s) ja lisäksi 25% null-tapahtumia, ja ne erotettiin toisistaan fiksaatioristillä. Takaisinkutsutehtävän tarkkuudet ja suoritukset on kuvattu täydentävässä taulukossa 2.
Kuvasovitustehtävä
skannerin ulkopuolella osallistujat suorittivat kuvasovitustehtävän, jota käytettiin yksittäisten skeemojen välityspalvelimena, 119 Muistokuvassa. Kuvat piti sijoittaa 1-28 ympyrään niiden historiallisen läheisyyden mukaan. Tämä kuva järjestely tehtävä kirjoitettiin Javascript upotettu HTML-koodi internet-navigointi, mikä tarjoaa suurta joustavuutta tehtävän suorittamisen: osallistujat voivat zoomata sisään tai ulos liikkuvalla taustalla, joka on samanlainen kuin Google Maps, he voivat suurentaa kuvaa klikkaamalla sitä (muistotekstin alla), Muistotekstit ilmestyivät mouseoveriin, ja osallistujat voivat valita ja siirtää useita kuvia kerralla. Kuvat sijoitettiin aluksi suurelle neliölle ympyröiden yläpuolelle. Osallistujia ohjeistettiin tarkistamaan jokainen kuva ja sijoittamaan ne alla oleviin ympyröihin, kun he kävivät jokaisen läpi. Heitä käskettiin ryhmittämään samaan piiriin kaikki kuvat, jotka heidän mielestään kuvattiin läheisiksi tai samankaltaisiksi historiallisiksi tapahtumiksi. Jos he kokivat kuvat irrallisiksi tapahtumiksi, heitä ohjeistettiin sijoittamaan ne eri ympyröihin. Osallistujat saivat vapaasti käyttää niin monta ympyrää kuin halusivat, yhdestä ympyrästä kaikkiin kartalla oleviin ympyröihin. Ohjeissa korostettiin, että ympyröitä ei ollut missään nimessä oikea määrä, vaan ne saivat vapaasti edetä haluamallaan tavalla. Osallistujia ohjeistettiin myös kiinnittämään huomiota ympyröiden välisiin etäisyyksiin ja niiden suhteellisiin asemiin. Mitä enemmän he arvioivat kuvien liittyvän toisiinsa tai irrallisiin tapahtumiin, sitä lähempänä tai kauempana heidän suhteelliset sijaintinsa ympyröissä tulisi olla. Kun kaikkien kuvien pääjärjestely lopulta saatiin valmiiksi, osallistujien oli oikaistava kuvien paikat kunkin ympyrän sisällä. Tämän jälkeen Kuvapaikkojen väliset Euklidiset etäisyydet heijastivat tietyn yksilön semanttista organisaatiota, ja ne voitiin koodata RDM: ään.
MK: n hankintaparametrit
MK-tiedot hankittiin 3 T Achieva-skannerilla (Philips) Caenissa sijaitsevassa brain imaging cyceron Centressä. Kaikille osallistujille tehtiin ensin korkearesoluutioinen T1-painotettu anatominen tilavuuskuvaus kolmiulotteisella (3D) fast field echo (FFE)-sekvenssillä (3D-T1-FFE sagittal; TR = 20 ms, TE = 4,6 ms, flip angle = 10°, SENSE factor = 2, 180 viipaletta, slice paksuus = 1 mm, no gap, näkökenttä = 256 × 256 × 180 mm3, matriisi = 256 × 130 × 180). Tätä hankintaa seurasivat toiminnalliset sessiot, jotka hankittiin käyttäen nousevaa T2-tähden EPI-sekvenssiä (MS-T2-tähti-FFE-EPI aksiaalinen; TR = 2050 ms, TE = 30 ms, kääntökulma = 78°, 32 viipaletta, viipalepaksuus = 3 mm, 0,75 mm rako, matriisi = 64 × 63 × 32, näkökenttä = 192 × 192 × 119 mm3, 310 volyymia per juoksu).
MRI-esikäsittely
tiedot analysoitiin tilastollisen parametrisen Karttaohjelmiston avulla (SPM12, Wellcome Department of Imaging Neuroscience). Esikäsittelyn aikana kuvat muokattiin ensin spatiaalisesti oikeiksi liikettä varten, minkä jälkeen ne korjattiin siivunhankinnan ajallista viivettä varten. Kun T1-rakennekuva oli mukana, funktionaaliset kuvat normalisoitiin käyttäen parametreja, jotka on johdettu yksittäisten harmaan aineen T1-kuvien epälineaarisesta normalisoinnista Montrealin neurologisen instituutin T1-malliin. Huomaa kuitenkin, että RSA: ssa käytettiin värittömiä ja silottamattomia kuvia. Kuvan normalisointi oli kuitenkin tarpeen laskea eteenpäin muodonmuutoskentän ja sen inversion, normalisoida searchlight kuvia tai kääri takaisin mPFC ROIs natiiviavaruuteen (katso alla), vastaavasti. Hiomattomien kuvien käyttö on RSA: lle tärkeää, koska se säilyttää hienojakoisen tilakuvion, joka luonnehtii alueen esitysgeometriaa.
ensimmäisen tason analyysi
esikäsitellyt aikasarjat, jotka vastaavat natiiviavaruuskuvia (eli vääristymättömiä ja vaimentamattomia kuvia), suodatettiin sitten ylipäästösuodattimella arvoon 1/128 Hz kussakin vokselissa. Regressorit yleisen lineaarisen mallin (GLM) jokaiselle voxel luotiin convolving delta-toiminto (mallinnettu 4.5 s lyhyt-epoch) kun ärsyke alkaa kunkin edun kanssa kanoninen hemodynaaminen vaste toiminto (HRF). Pienimmän neliösumman erillistä lähestymistapaa käytettiin 50,51, joka koostui erillisen GLM: n arvioinnista kullekin kokeelle. Jokaisessa GLM: ssä interest-kokeessa mallina oli yksi regressori, ja kaikki muut kokeet jaettiin viiteen erilliseen regressoriin, jotka vastasivat takaisinkutsua, hutia, vääriä hälytyksiä, korjauksen hylkäämistä ja ilman vasteolosuhteita (Katso täydentävä Taulukko 2, jossa esitetään käyttäytymistä takaisinkutsutehtävässä). Tätä lähestymistapaa on edistetty malleissa, joissa on lyhyet intertimulus-intervallit, kun peräkkäisten trialien hemodynaamisten vasteiden välillä on suuri kollineaarisuus51. Muita regressors ei ole merkitystä olivat kuusi uudelleensuuntaus parametrit huomioon lineaarinen jäljellä liikkeen artefacts. GLM: n jäännösten välinen autokorrelaatio korjattiin käyttäen ensimmäisen kertaluvun autoregressiivistä prosessia, jonka tuloksena saatiin prewhitened data rajoitetun maksimitodennäköisyyden estimoinnin jälkeen.
kiinnostavat alueet
mPFC määriteltiin anatomisesti automatisoidulla anatomisella merkinnällä atlas52 ja jaettiin vmpfc: hen ja dmPFC ROIs: iin. Dmpfc vastasi automatisoidun anatomisen Merkintäatlaksen (indeksit 2601 ja 2602) molemminpuolista frontaalista superior medial gyrusta. VmPFC-maskiin kuuluivat molemminpuolinen fronto-orbital medial gyrus (indeksit 2611 ja 2612), bilateraalinen rectus (indeksit 2701 ja 2702) ja ventraalinen osa (Z-koordinaatit pienempi tai yhtä suuri kuin nolla) molemminpuolisessa anterior cingulumissa (indeksit 4001 ja 4002). Nämä kaksi ROIs on esitetty kuvassa. 3 B. Nämä kaksi naamiokuvaa käärittiin sitten takaisin kunkin osallistujan natiivitilaan käyttäen käänteistä muodonmuutoskenttää, joka on laskettu normalisointiprosessin aikana.
edustava samankaltaisuusanalyysi
yksittäisten muistojen Kontrastikartat laskettiin sitten jokaista muistikuvaa varten ja niitä käytettiin RDMS: n laskemiseen ROIs: ssamme. Jokaisen yksilön ja jokaisen ROI: n osalta aivojen RDMs-arvot laskettiin seuraavasti: kunkin vokselin osalta muistettujen kuvien aktiivisuuden vektori keskitettiin keskihajontaan ja skaalattiin sen keskihajontaan (eli z-pistemäärään); sitten kunkin kuvaparin osalta tietyn ROI: n aktiivisuusmalleja verrattiin käyttäen spatiaalista korrelaatiota, ja erilaisuus annettiin sitten luvulla 1 miinus korrelaatio. Käyttäytymistasolla yksittäiset RDMs: t johdettiin kaikkien mahdollisten kuvaparien Euklidisista etäisyyksistä, jotka osallistujat järjestivät kaksiulotteiseen tilajärjestelyyn. Näiden aivojen tai käyttäytymisen RDMS ylemmät kolmiomuodot erotettiin sitten ja verrattiin RDM-mallien Ylempiin kolmiomuotoihin, jotka kuvaavat kollektiivisia skeemoja, semanttisia etäisyyksiä (johdettu Wikipedian toisen maailmansodan artikkeleista; KS.alla), kontekstuaalisia tilallisia etäisyyksiä (kuvien Euklidisia etäisyyksiä’ tilallisia sijainteja’) ja ajallisia etäisyyksiä (kuvien Euklidisia etäisyyksiä ’ ajallisia paremmuusjärjestyksiä muistonetsinnän aikana). Nämä aivojen/käyttäytymisen ja mallin RDMs: n väliset vertailut tehtiin regressiomallilla. Sekä regressorit että data muunnettiin aluksi epälineaaristen monotonisten suhteiden testaamiseksi. Koska kollektiivinen, semanttinen (eli Wikipedia) ja kontekstuaalinen (eli spatiaalinen ja ajallinen) malli RDMs eivät ole ortogonaalisia ja osittain päällekkäisiä, regressiomalli auttaa selventämään kunkin mallin ennustajan yksilöllistä varianssia. Kunkin osallistujan osalta tämä regressiomalli toistettiin kunkin kiinnostavan aiheen osalta, ja aihemallin ja mallin regressiokertoimen kymmenen toistoa laskettiin näiden iteraatioiden keskiarvoiksi. Kaikki regressiomallit olivat täysilukuisia, ja varianssi-inflaatiokerroin oli alle 1,5 jokaista regressoria kohti, mikä vahvisti malliemme tunnistettavuuden ja tehokkuuden. Näiden regressiomallien tulokset raportoidaan päätekstissä, mutta raportoimme myös Standard Spearmanin korrelaatioiden tulokset, jotka on testattu erikseen, täydellisyyden vuoksi, Fig: ssä. 3c ja täydentävässä taulukossa 1 tilastollisia testejä varten. Toimintakuvioiden analysointiin otettiin mukaan vain oikein palautetut kohteet. Ryhmätason päättelyt tehtiin käyttäen ei-parametrisia satunnaisvaikutustilastoja, joilla testattiin sekä RDM: n relatedness että erot käynnistämällä aihejoukko 5 000 iteraatiolla28. Kunkin mallin RDM tai kunkin parin vastakkaisen mallin RDM, meillä ei ollut oletuksia taustalla jakauma ja suoritetaan ei-parametrinen satunnaisvaikutusten tilastollisia testejä käyttäen bootstrapping lähestymistapa. Suoritimme keskivertovertailun jokaisella bootstrap-sarjalla ja arvioimme p-arvon bootstrap-näytteiden osuutena kauempana hännässä kuin nolla. Tyypin I virheiden odotetut osuudet useissa testeissä sekä RDM-mallin suhteellisuudessa että mallivertailussa kontrolloitiin FDR-korjauksella, jolloin haluttu FDR q = 0.05 ja olettaen,että Ehtojen välinen riippuvuus on positiivinen 34 [, 53. RDM-mallin suhteellisuustestiä varten odotettu FDR laskettiin käyttäen kaikkia testattujen mallien korjaamattomia yksihäntäisiä P-arvoja. RDM-mallivertailun testausta varten rajoitimme korjauksen päähypoteesiimme ja sisällytimme vain kollektiivisen muistin RDM: n (suhteessa muihin viitemalleihin) vertailuja odotetun FDR: n laskemiseksi käyttäen kaksihäntäisiä P-arvoja. Raportoimme mukautetut P-arvot ja käytämme bootstrapping iteraatioita määrittääksemme 95% prosenttipisteen CIs. Melukatto raportoitu Fig. 3c heijastaa aivojen RDMs: n osallistujien välistä korrelaatiota. Tämä korrelaatio laskettiin kullekin osallistujalle korrelaationa kyseisen osallistujan aivojen RDM: n ja jäljellä olevien osallistujien aivojen RDM: n keskiarvon34. Melukatto kuvattu kuvassa. 3c vastaa näiden yksittäisten korrelaatioiden keskiarvoa.
Searchlight analysis
aivokuoren valkean aineen ja piaalipintojen silmät rekonstruoitiin T1-painotetuista kuvista, jotka kerättiin kullekin osallistujalle Freesurfer-ohjelmistopaketin version 554,55 avulla. Käytimme RSA toolbox34: n (https://github.com/rsagroup/rsatoolbox) rsa_defineSearchlight MATLAB-toimintoa, joka tukeutuu myös Surfing toolbox-toimintoihin56 (https://github.com/nno/surfing), määritelläksemme pinta-alaisen valonheittimen molemmille puolipalloille (käyttäen 40 voxelin valonheitintä, jonka säde on 10 mm). Yhden tai useamman pinnan solmun naapurissa olevat vokselit valittiin geodeettisella etäisyysmittarilla ja rakentamalla virtuaaliviivat, jotka yhdistivät vastaavat solmut pial-ja valkean aineen pinnoille. Tällä menetelmällä saadaan aikaan valonheitin, joka seuraa pinnan kaarevuutta, mikä vähentää spatiaalista vinoumaa fMRI-kuvioiden analysoinnin aikana. Toisin kuin volyymisesti määritellyt lähiöt, tuloksena oli kaarimaisen lieriömäisen muotoinen kaupunginosa, joka noudatti kunkin yksilön suljen ja Gyrin ääriviivoja. Kun searchlight rakenne jokaisen huippupiste oli rakennettu ja kartoitettu funktionaalinen kuva-avaruus, kuviot muistutti toiminnan kunkin Voxel säveltäminen searchlight oli keskitetty ja skaalattiin niiden keskihajonnat ennen laskemista erilaisuus rakenne (1 miinus spatiaalinen korrelaatio) kaikissa parivertailut muistutti malleja. Näiden searchlight RDMs-mallien ylemmät kolmiomuodot erotettiin, rank-muunnettiin ja verrattiin regressiomallin avulla kaikkien RDM-mallien (kollektiivinen, semanttinen ja kontekstuaalinen) rank-muunnettuun ylempään kolmiomuotoon. Tämän searchlight-analyysin tuloksena syntyi beta-kartta, tilavuus, jossa jokainen Vokseli sisältää statistiikan tuolle vokselille. Nämä ensimmäisen tason beetakartat kullekin mallille normalisoitiin Montrealin neurologisen instituutin T1-malliin ja tasoitettiin käyttäen 10 mm: n täysleveyttä puolen maksimin Gaussin ytimellä. Nämä vakioavaruuden osallistujien beta-kartat toimitettiin toisen tason ei-parametriseen satunnaisvaikutusanalyysiin FSL-versiossa 5.0.1157. Monivertailujen korjaamiseksi ryhmätason beta-kartta toimitettiin maksimaaliseen permutaatiotestaukseen, jossa käytettiin kynnysvapaata cluster enhancement58 (TFCE)-testiä, joka tarjoaa hyvän kompromissin liian herkän klusteripohjaisen raja-arvon ja liian konservatiivisen kokoaivojen vokselipohjaisen korjauksen välillä. RDM-mallin suhteellisuuden ja erojen testaamiseksi TFCE-karttoja korjattiin (Pcorrected < 0.05) perhekohtaisen virhetason osalta käyttäen FSL: ssä randomize-funktiolla toteutettuja standardipermutaatiotestejä (10 000 permutaatiota). Searchlight-analyysin tulokset raportoidaan Extended Data Fig-julkaisussa. 1.
kollektiivisen muistin korpuksen kuvaus ja analyysi
korpuksen on koonnut MATRICE-projekti (http://www.matricememory.fr/?lang=en), monitieteinen ja teknologinen alusta, jonka tavoitteena on tarjota työkaluja sekä teknologista ja teoreettista taustaa kollektiivisen ja yksilöllisen muistin välisen suhteen ymmärtämiseksi. Corpuksen alun perin säveltäneet audiovisuaaliset pätkät tallennettiin kansalliseen audiovisuaaliseen instituuttiin, joka on yksi MATRICE-projektin pääyhteistyökumppaneista, ja julkiseen instituuttiin, jonka tavoitteena on arkistoida kaikki Ranskan televisiossa tai radiossa lähetetyt audiovisuaaliset tuotannot. Tätä tutkimusta varten sisällytimme corpukseemme kaikki television uutistiedotteet ja raportit (lukuun ottamatta radio-ohjelmia tai dokumentteja), joita lähetettiin vuosina 1980-2010 toisen maailmansodan ollessa yhteisenä teemana, ja tuloksena oli yhteensä 3766 dokumenttia. Keskitymme tähän ajanjaksoon kolmesta syystä. Ensinnäkin Vuodet 1980-2010 ovat suurelta osin päällekkäisiä osallistujien eliniän kanssa. Toiseksi tämä ajanjakso vastaa uuden kerronnan perustamista ranskalaiselle kollektiiviselle muistille (eli uusi ”Régime of Mémorialité”59). Tähän sisältyi Shoahin muiston syntyminen ja vahvistaminen sekä suuret oikeudenkäynnit, joissa tunnustettiin Ranskan valtion ja sen kansan sekä niiden silloisten edustajien (esimerkiksi Bousquet, Leguay, Touvier ja Papon) osallistuminen juutalaisten karkottamiseen ja tappamiseen. Kolmanneksi automaattisen puheentunnistuksen edistymisen ja sellaisten sähköisten tekstien saatavuuden ansiosta, joiden avulla nykyiset kielimallit on rakennettu käsittelemään vuoden 1980 jälkeen tallennettuja tietoja, 3766 äänitiedostoa muunnettiin XML-muotoon käyttäen puheesta tekstiin-muunnosalgoritmeja, jotka on kehittänyt laboratoire d ’informatique pour la mécanique et les Sciences de l’ ingénieur (LIMSI; Engineering Sciences and Computer Science Lab), joka on yksi MATRICE-projektin pääyhteistyökumppaneista.
kun corpus oli muunnettu tekstiksi, se oli alun perin käsin käsitelty hylkäämään segmenttejä, jotka eivät liittyneet toiseen maailmansotaan (piti ainoastaan tälle aiheelle omistettuja osioita). Tämän operaation aikana automaattiset puheesta tekstiin-transkriptiot korjattiin lisäksi ihmislukijalla. Tämän alustavan esikäsittelyn jälkeen jokaiselle dokumentille purettiin erillinen XML-tiedosto. Nämä tiedostot käsiteltiin sitten tekstimuotoisilla data-analyysimenetelmillä käyttäen TXM-ohjelmistoa 60 (http://textometrie.ens-lyon.fr/), joka liittyi TreeTagger morphosyntaktiseen analysaattoriin61 (http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/). TXM: n avulla käyttäjä voi merkitä sanan jokaisen ilmentymän (eli tokenin) sen vastaavaan lemmaan (sanajoukon kanoniseen muotoon) ja edetä kunkin sanan morfosyntaktiseen merkintään korpuksessa. Corpusta voidaan sitten tutkia Corpus Query Language (CQL) – pyyntöjen avulla tägätä ja hakea tiettyjä kieliopillisia kategorioita, lomakkeita, lemmoja tai mitä tahansa sanaan liitettyä tietoa. Ensin luotiin automaattisesti luettelo CQL-pyynnöistä jokaiselle substantiiville, verbille tai adjektiiville heidät korpuksessa. Harvinaiset lemmat (alle kymmenen esiintymää), pysäytyssanat ja yleiset verbit (esimerkiksi ”olla” ja ”on”) poistettiin prosessissa, eikä niitä otettu mukaan myöhemmissä analyyseissä. Esimerkiksi tämä algoritmi kävisi korpuksen läpi ja tuottaisi ainutlaatuisen CQL-kyselyn (esimerkiksi (aine = ”fight”%c)), joka vastaa mitä tahansa verbin ”fight” ilmentymää korpuksessa (eli ”fight”, ”fighted” tai ”fighting”). Tähän pyyntöön sisältyvää % c-muunnosta käytetään neutralisoimaan assimiloitujen lemma-muotojen (eli ”fight”, ”Fight” tai ”FIGHT”) merkistötapaus. Näin syntyi automaattisesti noin 6 500 CQL-pyynnön alustava lista. Tämä lista tarkistettiin käsin virheellisen transkription tuottamien CQL-pyyntöjen poistamiseksi, tiettyjen pyyntöjen ryhmittelemiseksi joskus yhden kokonaisuuden alle(esimerkiksi (lemma = ”drama”%c)|(lemma = ”dramatic”%C)), bigramsin yhdistämiseksi tarvittaessa (esimerkiksi (lemma = ”chief”%C) ()?(lemma = ”valtio ”%c)” valtionpäämies”) tai sopeutua erilaisiin ortografisiin muotoihin (esimerkiksi (lemma = ”Gorbatshov ”%c)|(lemma = ”Gorbatshov” %c)). Tämän alkutarkistuksen ja säätämisen jälkeen jäljellä oli yhteensä 6240 pyyntöä, jotka tiivistivät 1431790 kuponkia, jotka muodostavat corpuksemme.
otettiin aine x-dokumenttitaajuusmatriisi, jossa lasketaan esiintymien lukumäärä, ja toimitettiin LDA-analyysiin, joka tehtiin käyttäen koneoppimista kielten työkalupakkia varten (MALLET; http://mallet.cs.umass.edu/topics.php). Aihemallit26, 29, 30 katsovat, että dokumentit syntyvät aiheiden sekoituksista. Tässä yhteydessä aihe vastaa todennäköisyyksien jakautumista kaikkien esitettyjen sanojen kesken kaikissa asiakirjoissa (kuinka todennäköistä on, että jokin sana liittyy aihepiiriin). Tästä näkökulmasta dokumentti voidaan luoda asettamalla todennäköisyysjakauma aiheiden päälle. Jokaiselle asiakirjan instanssille valitaan aihe sen edellisen aiheen todennäköisyysjakauman mukaan, ja siitä muodostetaan sana. MALLET käyttää Gibbsin näytteenottoalgoritmia kääntääkseen tämän prosessin, päättelemällä joukon aiheita, jotka olivat vastuussa asiakirjojen kokoelman tuottamisesta ja niiden todennäköisyyksistä sanojen suhteen.
koulutimme ensimmäisen kerran aihemalleja toisen maailmansodan uutisjulisteissa ja raporteissa corpus käyttäen MALLET train-topic-moottoria(KS. 2 jotta kuva aiheista luotu tällä tekniikalla). Vaihdoimme sallittujen aiheiden määrän 2: sta 100: aan, 1: n välein, asettaen alfa-parametrin 50/n: n aiheisiin ja aloittavan beta-parametrin 0.1: een (kuten muissa teoksissa on ehdotettu laajan tekstikokoelman mallintamista62). Jokaista aihemäärää varten käytimme 500 iteraatiota arvioidaksemme sanan ja asiakirjan aiheen todennäköisyyksiä. Sitten käytimme MALLET päättelytyökalua sovittaaksemme Lda-mallin Muistokuviin ja arvioimme niiden aiheen todennäköisyydet. Tätä varten jokainen kuva käsiteltiin uutena dokumenttina ja merkittiin avainsanoilla (myös lemmatisoitu), jotka johdettiin suoraan kuvien alla olevista Muistoteksteistä. Muistokuvia käytettiin yhteensä 449 lemmestä. Näistä lemmas, 428 löytyi myös luettelo 6 240 lemmas kuvataan corpus of news tiedotteet ja raportit. Aiheen päättelyprosessi johti siten todennäköisyysjakaumamatriisiin, jossa oli 119 kuvaa x n aiheita, jotka kuvasivat aiheen posteriorista todennäköisyyttä.
jokaiselle arvioidulle aihepiirille laskettiin 119 kuvan x 119 kuvan RDM käyttäen kunkin kuvaparin aihetodennäköisyyksien jakaumien välisiä etäisyyksiä (perustuu tässä kosinietäisyyteen, joka antaa symmetrisen mittarin kahden aihevektorin samankaltaisuudesta). Kuitenkin, koska satunnaisuus, että Gibbs näytteenotto algoritmi voi ottaa käyttöön aikana parametrin estimointi, toistimme koko prosessin kymmenen kertaa, mikä 3D 119 kuva x 119 kuva x 10 toistoa RDM kunkin määrän arvioituja aiheita. Aivojen tai käyttäytymisen RDMs: n ja kollektiivisten RDMS: ien (regressiomallin beetakertoimet tai Spearmanin korrelaatiokertoimet) samankaltaisuuden mittaukset laskettiin keskiarvoina kyseisillä aihealueen mallinnuksen kymmenellä toistolla. Yhteenvetona koko prosessi, tietyn määrän aiheita: (1) koulutimme aihe malli Ranskan television uutiset tiedotteet ja raportit corpus; (2) sovit tämän aiheen malli Muistokuvat ja niiden kuvatekstit, käsitellään jokainen kuva uutena asiakirjana; (3) a 119 picture x n topic matrix, joka kuvaa posterior todennäköisyys aihe annetaan kuva, uutettiin ja muunnettiin 119 × 119 RDM; ja (4) Tämä prosessi toistettiin kymmenen kertaa, ja kunkin aiheen numero, keskimääräinen samankaltaisuus aivojen tai käyttäytymisen RDMs laskettiin koko nämä kymmenen tapauksissa.
kollektiivisen muistimallin validointi ja aihenumeron valinta
pyrimme kvantifioimaan yksilöiden välisten jaettujen esitysten rakenteen ja vertasimme näitä yhteisiä skeemoja kollektiiviseen muistimalliimme. Tämä menettely mahdollistaisi myös sen, että voisimme itsenäisesti valita optimaalisen määrän aiheita kuvaamaan kuvien kollektiivista rakennetta, joka parhaiten vastaa jaettua muistia. Tätä varten 54 äidinkielenään ranskaa puhuvaa (23 miestä, 31 naista) 20-39-vuotiasta (keskiarvo = 27,3 vuotta; s.d. = 5,6) suoritti kuvajärjestelytehtävän. Tämä tehtävä suoritettiin täsmälleen samoilla 119 Muistokuvalla, mutta toisin kuin magneettikuvaukseen osallistuneet, jotka olivat käyneet muistotilaisuudessa edellisenä päivänä, nämä uudet osallistujat olivat täysin tuntemattomia muistomerkille. Johdimme 54 yksittäistä RDMs: ää kuvien Euclidean etäisyyksistä. Sitten suoritimme DISTATIS33: n kuvataksemme näiden kontrolliyksilöiden yhteistä representaatioiden rakennetta. DISTATIS soveltuu ihanteellisesti parhaan sopimuksen tai kompromissin laskemiseen useiden etäisyysmatriisien välillä. DISTATIKSEN toteutus MATLABISSA löytyy kohdasta https://www.utdallas.edu/~herve/, mutta lyhyesti: (1) Jokainen 54 RDMs muunnettiin ensin ristitulomatriisiksi kaksoiskeskeytyksen ja normalisoinnin jälkeen ensimmäiseen eigenvalueensa; (2) Kaikkien 54: n normalisoidun ristitulomatriisin parivertailujen kosinin samankaltaisuusrakenne laskettiin käyttäen RV-kerrointa; (3) RDMS: n välisiä suhteita kuvaava RV-kerroin matriisi toimitettiin eigen-hajoamiselle, ja kompromissimatriisi vastasi normalisoitujen ristitulomatriisien summaa painotettuna niiden ensimmäisellä eigen-arvolla; (4) kompromissin tuottaman tekijän eigen-hajoaminen, joka kuvasi kunkin 119 kuvan sijainnin n-ulotteisessa kompromissiavaruudessa; ja (5) Näiden moniulotteisten kompromissiavaruuksien etäisyyskorrelaatiomatriisi vastasi silloin parasta sopimusta Kaikkien 54 yksittäisen RDMS: n välillä, jotka on johdettu käyttäytymiskuvan järjestelytehtävästä. Tätä etäisyyskorrelaatiomatriisia voidaan pitää yhteisenä skeemana, joka heijastaa yksilöiden yhteistä semanttista organisaatiota. Kollektiivinen RDMs poimittu corpus television uutisten tiedotteet ja raportit olivat samanlaisia rakenne jaetun muistin mitattuna kontrolliyksilöiden (Kuva. 2c). Tämä samankaltaisuus kollektiivisen ja jaetun muistin oli keskimäärin Roskakorit viisi aiheista, ja saavutti maksiminsa, kun kuudesta kymmeneen aiheet olivat mukana aikana topic discovery. Tämän seurauksena kaikki myöhemmät kollektiivista tai semanttista muistia koskevat analyysit tehtiin käyttäen kuudesta kymmeneen aihetta (ja aivojen tai käyttäytymisen RDMs: n ja kollektiivisen tai semanttisen RDMs: n samankaltaisuuden mittarit laskettiin keskiarvona tässä valitussa aihepiirissä).
toisen maailmansodan semanttisen verkkotunnuksen ohjausmallin rakentaminen
käytimme ranskankielisen Wikipedian artikkeleita, joissa viitattiin toiseen maailmansotaan, vertailumallina toiseen maailmansotaan liittyvien sanojen erityisestä semanttisesta suhteesta, ja koulutimme aihemallin, jonka sitten sovitimme Muistokuviin. Tämä corpus (http://redac.univ-tlse2.fr/corpus/wikipedia.html) sisälsi 664 982 artikkelia, joita oli muokattu kesäkuuhun 2008 asti, joista 2 643 artikkelia liittyi erityisesti toiseen maailmansotaan, ja se on aiemmin poimittu Wikipedian artikkeleiden dump-ranskankielisestä versiosta (http://dumps.wikimedia.org/) ja käsitelty samalla morphosyntaktisella tunnistustyökalulla61, jota käytettiin toisen maailmansodan ranskalaisen televisiouutisemme käsittelemiseen. Corpus description and analysis).
Raportointikooste
lisätietoja tutkimuksen suunnittelusta on tämän artikkelin yhteydessä olevassa Nature Research Reporting Summary-julkaisussa.