analiza expresiei diferențiale înseamnă luarea datelor normalizate de citire și efectuarea analizei statistice pentru a descoperi modificări cantitative ale nivelurilor de expresie între grupurile experimentale. De exemplu, folosim testarea statistică pentru a decide dacă, pentru o anumită genă, o diferență observată în numărul de citire este semnificativă, adică dacă este mai mare decât ceea ce s-ar aștepta doar din cauza variației aleatorii naturale.
metode pentru analiza expresiei diferențiale
există diferite metode pentru analiza expresiei diferențiale, cum ar fi edgeR și DESeq bazate pe distribuții binomiale negative (NB) sau baySeq și EBSeq care sunt abordări Bayesiene bazate pe un model binomial negativ. Este important să luați în considerare proiectarea experimentală atunci când alegeți o metodă de analiză. În timp ce unele dintre instrumentele de Expresie diferențială pot efectua doar comparații în pereche, altele precum edgeR, limma-voom, DESeq și maSigPro pot efectua comparații multiple.
în Figura 11, mai jos, prezentăm conducta de procesare ARN-seq utilizată pentru a genera date pentru Atlasul de Expresie.
în această conductă raw citește (fișiere FASTQ) sunt supuse evaluării calității și filtrare. Citirile filtrate de calitate sunt aliniate la genomul de referință prin HISAT2. Citirile mapate sunt rezumate și agregate peste gene prin HTSeq. Pentru expresia de bază, FPKMs sunt calculate din numărul brut de iRAP. Acestea sunt medii pentru fiecare set de replici tehnice și apoi cuantile normalizate în cadrul fiecărui set de replici biologice folosind limma.