Differentiaaliekspressioanalyysi tarkoittaa normalisoidun lukuaineiston ottamista ja tilastollisen analyysin tekemistä kokeellisten ryhmien välisten ekspressiotasojen kvantitatiivisten muutosten löytämiseksi. Käytämme esimerkiksi tilastollista testausta päättääksemme, onko tietyn geenin kohdalla havaittu ero lukumäärissä merkittävä, eli onko se suurempi kuin olisi odotettavissa pelkästään luonnollisen satunnaisvaihtelun vuoksi.
Differentiaaliekspressioanalyysin menetelmät
differentiaaliekspressioanalyysille on olemassa erilaisia menetelmiä, kuten negatiivisiin binomijakaumiin (NB) perustuva Edger ja DESeq tai negatiiviseen binomimalliin perustuva baySeq ja EBSeq. Analyysimenetelmää valittaessa on tärkeää ottaa huomioon kokeellinen suunnittelu. Vaikka jotkut differentiaalinen lauseke työkalut voivat suorittaa vain pari-viisas vertailu, toiset, kuten edgeR, limma-voom, DESeq ja maSigPro voivat suorittaa useita vertailuja.
alla olevassa kuvassa 11 hahmotellaan RNA-seq-prosessointiputkea, jota käytetään datan tuottamiseen Expression-Atlasta varten.
tässä putkessa raw lukee (FASTQ tiedostot) tehdään laadunarviointi ja suodatus. Laatusuodatetut lukemat ovat linjassa HISAT2: n kautta referenssigenomin kanssa. Kartoitetut lukemat tiivistetään ja kootaan geenien päälle htseq: n kautta. Perusilmaisussa FPKMs lasketaan iRAP: n raakamääristä. Nämä lasketaan keskiarvona kullekin teknisten rinnakkaisnäytteiden joukolle, minkä jälkeen kvantiili normalisoidaan kunkin biologisten rinnakkaisnäytteiden joukon sisällä käyttäen limmaa.