funkcionális mikroRNS-célok előrejelzése a mikroRNS-kötési és célexpressziós adatok integratív modellezésével

RNS-seq a miRNS-túlexpresszióval csökkentett transzkriptumok azonosítására

jól megalapozott, hogy a miRNS-nek a cél transzkriptumához való kötődése nem feltétlenül eredményezi a génexpresszió csökkentését. Valójában a legtöbb megfigyelt miRNS-kötési eseménynek, amint azt a CLIP elemzés feltárta, kevés funkcionális következménye van . Így a miRNS-kötésre való összpontosítás önmagában korlátozott értékkel bír a funkcionális miRNS-célok, azaz a lefelé szabályozott célok előrejelzésében. Ezen aggodalom enyhítése érdekében közvetlenül meghatároztuk a miRNS által az RNS-seq-val végzett célleépítést. Az általános vizsgálati tervet az 1. kiegészítő fájl foglalja össze: S1 ábra. Első lépésként 25 miRNS-t, valamint egy negatív kontroll RNS-t külön-külön túlexpresszáltunk a HeLa sejtekben transzfekcióval. Ezt a 25 miRNS-t az 1. táblázat sorolja fel. A miRNS túlzott expressziójának hatását transzkriptom szinten profilozták RNS-seq kísérletekkel. A kísérleti variációk ellenőrzése érdekében minden miRNS-t különböző napokon két példányban transzfektáltak sejtekké, és az RNS-seq könyvtár felépítését és szekvenálását is két példányban végezték különböző napokon. Összesen 1,5 milliárd olvasást generáltak 52 RNS-minta expressziós profilozására. A profilozási adatokat a 2. Kiegészítő fájl tartalmazza: S1 táblázat. Az összes szekvenálási adatot kombináltuk a miRNS túlzott expressziója által szabályozott gének azonosítására. Elemzésünkben azok az átiratok, amelyek legalább egy miRNS magkötő helyet tartalmaznak, és mindkét duplikált kísérletben legalább 40% – kal csökkentették a szabályozást, miRNS célpontnak minősülnek. Ezzel szemben azok az átiratok, amelyek legalább 1 vetőmaghelyet tartalmaznak, de nem volt kifejezésváltozás, nem célvezérlőnek minősülnek. Ily módon 2240, illetve 4127 miRNS célpontot, illetve nem célzott kontrollt azonosítottak RNS-seq-val. Pontosabban, minden miRNS-re átlagosan 90 célt azonosítottak, és a célszámok jelentősen eltérnek az egyes miRNS-ek között (11-től 206-ig, 1.táblázat).

1. táblázat huszonöt miRNS-t elemeztek az RNS-seq kísérletekben

a miRNS magtípusok hatása a cél lefelé szabályozására

korábbi tanulmányok a kanonikus miRNS célhelyek több fő típusát azonosították, beleértve azokat is, amelyek megfelelnek a 6-mer, 7-mer vagy 8-mer miRNS mag szekvenciáknak (2.táblázat). A szekvencia-megőrzési elemzés azt sugallta, hogy a hosszabb miRNS-magokkal párosított célhelyek konzerváltabbak a fajok között, így nagyobb valószínűséggel jóhiszemű miRNS-célpontok . A magtípus erősségére vonatkozó hipotézist heterogén mikroarray adatkészletek elemzésével is megerősítették a céllehatárolás összefüggésében . Az egyes vetőmagtípusok hozzájárulásának pontos számszerűsítéséhez azonban további elemzésre van szükség. Újonnan létrehozott nagyszabású RNS-seq adatkészletünk, felölelve 25 egységes kísérleti körülmények között értékelt miRNS-ek, egyedülálló lehetőséget biztosított a különböző miRNS-magok erősségének mennyiségi értékelésére a célleszabályozás során. Kimondottan, értékeltük az egyes vetőmagtípusok dúsulását a szabályozatlan célhelyeken a nem célhelyekhez képest.

2. táblázat a miRNS vetőmag-mérkőzés dúsítása a célhelyeken

amint azt a 2. táblázat és az ábra mutatja. Az 1a, seed6 a legelterjedtebb típus, amelyet az összes visszafogott célkitűzés 86% – ában azonosítottak. Rövid hossza miatt azonban a vetőmag6 nem specifikusan a nem Célzott területek 36%-ában is jelen van, ami a legalacsonyabb vetőmag-dúsítási arányt eredményezi (2.40 a 2.táblázatban). A másik végén, a seed8A1 a legszelektívebb típus, dúsítási aránya 6.83 és 30% – ban jelen van az alulszabályozott célok között. Az összes 7 mer mag közül a seed7b és seed7A1 hasonló dúsítási arányokkal rendelkezik, mindkettő magasabb, mint a seed7a aránya.

Fig. 1
ábra1

a miRNS magtípusok hatása a célcsökkentésre. Hat vetőmagtípust értékeltek (a vetőmag-meghatározásokat lásd a 2. táblázatban). az egyes magtípusokat tartalmazó, lefelé szabályozott gének százalékos aránya a génexpressziós változásokhoz viszonyítva. Mind a 25 miRNS-t bevonták az elemzésbe. b 8 miRNS-ek egy részhalmazának elemzése, amelyek nem tartalmaznak 5′-U-t

egy másik típusú 8-mer vetőmag, seed8, a második legmagasabb dúsítási aránya 5,48, ami magasabb, mint az összes 7-mer mag aránya. A terminál alapegyezésének lehetséges hozzájárulásának további megkülönböztetése a célhely a terminál bázisától, kizárólag 8 miRNS-re összpontosítottunk, amelyek nem rendelkeznek 5′ – end U-val (ábra. 1b). Mind a 25 miRNS-rel összehasonlítva hasonló dúsítási arányokat figyeltünk meg a 7b, illetve a 8A1 vetőmag esetében a miRNS-ek ezen részhalmazából (2.táblázat). Ezek az eredmények arra utalnak, hogy az a-U terminál tökéletes egyezésének kevés hatása van a célfelismerésre, mivel az a terminál jelenléte a célhelyeken, függetlenül a miRNS-hez való párosítási állapotától, a cél csökkentéséhez kapcsolódik. Érdekes módon megfigyeltük a seed8 dúsítási arányának drámai csökkenését is ebből a miRNS részhalmazból. Valójában a seed8 Arány (3,32) még alacsonyabb, mint a seed7b esetében (2.táblázat). Így az a-U-tól eltérő tökéletes terminális mérkőzés káros (nem pedig hozzájárul) a célfelismeréshez. A vetőmag-elemzés alapján úgy döntöttünk, hogy a 3 legerősebb vetőmagtípusra összpontosítunk, beleértve a seed8a1, seed7b és seed7A1, a cél-előrejelzési modellezéshez. Ezeket a 3 magtípust együttesen azonosították a 3 ‘ – UTR-ben, a szabályozatlan átiratok 76% – ában.

a céllehatárolás és a CLIP kötési adatok kombinálása a közös célzási jellemzők azonosítására

a miRNS-túlexpressziós vizsgálatok egyik közös problémája az, hogy kihívást jelent a pontos miRNS-kötési hely megtalálása a célátiraton belül. Ezen aggodalom enyhítésére, kanonikus 7-mer vagy 8-mer maghelyek jelenléte alapján azonosítottuk a jelölt célhelyeket. A miRNS túlexpressziós elemzésével ellentétben a CLIP-ligációs vizsgálatok képesek egyértelműen azonosítani a miRNS kötőhelyeit a cél transzkriptumban a miRNS és rokon célhelyének térhálósításával ugyanabban a RISC komplexben. A miRNS célkötésének funkcionális következménye azonban, amint azt a CLIP azonosítja, nem lehet könnyen meghatározni. Így mind a CLIP kötési, mind a miRNS túlexpressziós módszereknek vannak előnyei és hátrányai, és mindegyik módszer önmagában a miRNS célszabályozásának csak egy fontos aspektusát ábrázolja, azaz a célkötést és a funkcionális szuppressziót.

elemzésünkben érdekeltek vagyunk a funkcionális célszabályozásra jellemző közös jellemzők azonosításában, beleértve mind a miRNS kötését, mind az azt követő célcsökkentést. Egy nemrégiben készült cél-előrejelzési elemzésben összeállítottunk egy miRNS célkötési adatkészletet, amely több nyilvános klip lekötési vizsgálatból származik . A klip lekötési módszer előnyösnek tekinthető a hagyományos klip módszerekkel szemben, mivel mind a miRNS, mind annak rokon kötési helye a cél transzkriptumban egyértelműen azonosítható ugyanazon RISC komplexhez való térhálósodással. Jelen tanulmányban a CLIP-kötési adatkészletet tovább kombináltuk új miRNS-túlexpressziós adatokkal, hogy azonosítsuk azokat a célzási jellemzőket, amelyek mind a miRNS-kötésben, mind a célszuppresszióban közösek. Ily módon 4774 célhelyet és 8081 nem célhelyet azonosítottak mind a CLIP, mind a miRNS túlexpressziós vizsgálatokból, összevonták és értékelték a későbbi jellemzőelemzés során.

a kombinált adatkészletben a cél-és nem célhelyeket hasonlították össze, hogy azonosítsák azokat a jellemzőket, amelyek általában társulnak a miRNS célszabályozásához. Ezek a funkciók szerepelnek további Fájl 3: táblázat S2. Jól megalapozott, hogy a miRNS célhelyei evolúciósan konzerváltak . Tanulmányunkban a célmegőrzést két egymást kiegészítő megközelítés alkalmazásával értékeltük. Először kiszámítottuk a magkötési pozíciók és a szegélyezési pozíciók közötti megőrzési pontszámok különbségét, amelyet a 100-utas multi-Genom összehangolásából származó phyloP pontszámok határoztak meg . Másodszor azt is meghatároztuk, hogy a teljes magterület (7-mer vagy 8-mer) több fajban megtalálható-e szókereséssel. Mindkét természetvédelmi elemzés azt mutatta, hogy a célhelyek nagyon jelentősen konzerváltak voltak a nem célhelyekhez képest. Valójában a magmegőrzés volt a leginkább gazdagított tulajdonságok között, függetlenül attól, hogy a miRNS túlzott expresszióját és a KLIPKÖTÉSI adatokat külön-külön vagy kombinációban elemezték-e. Pontosabban, a konzervált seed8A1 volt a leginkább dúsított a célhelyeken (p = 2,8 E−245 A Fajok közötti vetőmag-mérkőzés, p = 7,3 E−218 A phyloP pontszám szerint). A másik végén a nem konzervált seed7A1 volt a leginkább kimerült magtípus (9,5 e−134 a seed match, illetve p = 1,3 E−138 a phyloP pontszám szerint). A magmegőrzés mellett, sok más jellemző is megtalálható volt mindkét adatkészletben. Például a miRNS célhelyeket előnyösen rövidebb 3′-UTR szekvenciákkal társították (p = 4,7 e−126), és nagyobb valószínűséggel találhatók meg a 3′-UTR szekvencia vége felé (p = 5,4 E−66) és távol a hosszú transzkripciók középpontjától (p = 2,5 E−87).

a sok hasonlóság ellenére jelentős különbségek vannak a miRNS túlexpressziója és a KLIPKÖTÉSI adatok között. Az egyik kiemelkedő példa a célhely GC-tartalmához kapcsolódik. A nem célhelyekkel összehasonlítva a célhely GC tartalma sokkal alacsonyabb volt a KLIPKÖTÉSI adatokban (p = 1.9E-146), de a miRNS túlexpressziós adataiban csak szerényen alacsonyabb (p = 2,1 E−10). A C nukleotid kimerülése mindkét adatkészletben mérsékelt volt. Így a két adatkészlet közötti GC-tartalom drasztikus különbsége elsősorban a CLIP−adatokban a G−nukleotiddal szembeni sokkal erősebb torzítás eredménye volt (p = 7,7 E-137), szemben a túlexpressziós adatokkal (p = 1,2 E-19). Az egyik lehetséges magyarázat a CLIP vizsgálatokban használt RNáz T1-hez kapcsolódhat, amely előnyösen a G nukleotidnál vág, ami a belső g kimerülését eredményezi a szekvenálás során. Igaz lehet azonban az is, hogy a G dúsítása akadályozza a célhely kötődését a miRISC komplex által, mivel a g a miRNS túlexpressziós adataiban is kimerült, bár csak mérsékelten. Egy másik érdekes tulajdonság a magkötési stabilitás, amelyet a mag/cél duplex szabad energiája határoz meg. A magkötési stabilitást előnyben részesítették a miRNS túlexpressziós adataiban (p = 2,5 E−12), de a KLIPKÖTÉSI adatokban nem kedvelték (p = 5,4 E−26). Összességében ez a tulajdonság már nem volt szignifikáns a két adatkészlet kombinálásakor (p = 0,26).

közös célzási jellemzőkkel rendelkező cél-előrejelzési modell kidolgozása

az összes miRNS-célzási funkciót, amint azt a kiegészítő Fájl 3: S2 táblázat felsorolja, egy támogató vektorgép (SVM) keretrendszerben modellezték az algoritmus fejlesztéséhez. Ezenkívül rekurzív funkcióeliminációs (szer) elemzést is végeztünk az egyes funkciók relatív fontosságának rangsorolására a modell teljesítményéhez való független hozzájárulása szempontjából. Ebben az RFE értékelésben az összes funkciót együttesen elemeztük az SVM segítségével. Pontosabban, első lépésként a legkevésbé fontos jellemzőt azonosították, majd ezt követően eltávolították a modellből. Ezután a fennmaradó jellemzőket kiértékeltük, hogy azonosítsuk az elimináció második legkevésbé fontos jellemzőjét. Ezt az értékelési folyamatot megismételtük, minden egyes iterációból egy funkciót kiküszöbölve, amíg csak egy funkció maradt. Az RFE megközelítés segít megérteni a modellben szereplő egyedi jellemzők független hozzájárulását. Táblázat 3 összefoglalja 20 legmagasabb rangú célzási funkciók szerf elemzés. A teljes szer soraiban az összes funkció szerepel további Fájl 3: táblázat S2. Összhangban az előző szakaszban bemutatott jellemzőelemzéssel, a többszörös vetőmag-megőrzési jellemzők az RFE-elemzés szerint a legmagasabbak közé tartoztak, a konzervált seed8A1 pedig a leghatásosabb tulajdonság. A végső SVM modellünkben mind a 96 funkciót, beleértve mind a statisztikailag szignifikáns, mind a nem szignifikáns jellemzőket, integráltuk az előrejelzési modell felépítéséhez, amelyet MirTarget v4.0-nak neveztünk el. Ötszörös keresztellenőrzést végeztünk az SVM kernel funkció optimális paramétereinek meghatározásához a rács segítségével.py eszköz a libsvm csomagban. Ezután kidolgoztak egy pontozási sémát az előrejelzés bizalmának képviseletére. Minden jelölt célhely esetében a MirTarget kiszámítja az SVM modellező eszközből, a libsvm-ből származó valószínűségi pontszámot (0-1 tartományban), amint azt korábban leírtuk . Ez a célhely pontszám tükrözi az előrejelzés pontosságának statisztikai értékelését. Az egyéni célhely-pontszámok alapján a MirTarget megjósolja, hogy egy gén miRNS-cél-e, az összes hely pontszám kombinálásával a 3′-UTR-en belül a következő képlet segítségével:

$$ S=100 \szor \ bal(1 – \ alulbeállítás{i=1} {\túlbeállítás{n} {\Pi}} {P}_i \ jobb) $$

ahol n A jelölt célhelyek számát jelenti a 3′-UTR-ben, a Pi pedig az egyes helyek valószínűségi pontszámát jelenti, a MirTarget becslése szerint. A legtöbb célgén csak egy helyet tartalmaz, így a végső célértéket ugyanezzel az egyenlettel számítják ki n = 1. A mirtarget pontszámokat használták az előrejelzett célok relatív jelentőségének rangsorolására. Ily módon MirTarget-et alkalmaztunk a miRNS-célok genomszintű előrejelzéséhez. Az összes előre jelzett célt a miRDB (http://mirdb.org) tartalmazza .

3. táblázat az RFE elemzéssel azonosított legmagasabb rangú miRNS-célzási funkciók összefoglalása

algoritmus kiértékelés független kísérleti adatokkal

az algoritmusfejlesztés egyik gyakori problémája, hogy egy modell jól működhet a képzési adatokon, de nem olyan jól a független láthatatlan adatokon. Így a MirTarget teljesítményének értékelésének legjobb módja az lenne, ha független kísérleti adatokra alkalmaznánk. Jelen tanulmányban heterogén kísérleti adatokat elemeztünk az algoritmus értékeléséhez, beleértve azokat is, amelyek mind a KLIPKÖTÉSBŐL, mind a miRNS leütési kísérletekből származnak. A MirTarget teljesítményét négy másik jól bevált algoritmussal is összehasonlították, köztük a TargetScan 7.0, A DIANA-MicroT, a miRanda (mirSVR) és a PITA. Ezek az algoritmusok a legnépszerűbb miRNS cél-előrejelző eszközök közé tartoznak, és a transzkriptóm egészére kiterjedő előrejelzési adatok könnyen letölthetők az adott webhelyekről.

validálás CLIP-seq adatokkal

Chi et al. úttörő szerepet játszott a HITS-CLIP módszer a miRNS célátiratok kísérleti azonosításához . Ezzel a módszerrel térhálósító immunprecipitációt hajtottak végre az mRNS transzkriptumok lehúzására, amelyek az egér agyában a miRISC-hez kapcsolódtak. Ezután nagy áteresztőképességű szekvenálást végeztünk ezen mRNS transzkript címkék, azaz rövid RNS-fragmensek azonosítására, amelyeket az Ago védett az RNáz emésztésétől. Chi et al. bebizonyította, hogy általában, az átirat címkék középpontjában a magkötő helyek . Ezt a HITS-CLIP adatkészletet tanulmányunkban tovább elemeztük a potenciális miRNS célhelyek azonosítása érdekében. Összesen 886 potenciális célhelyet azonosítottak a hat leginkább kifejezett miRNS magillesztési szekvenciája alapján. Negatív kontrollként egy sor potenciális nem célzott szekvenciát is kiválasztottunk a következő kritériumok alapján: (1) nem fedik át egymást a találatok-klip kísérletben azonosított szekvenciacímkékkel, és (2) olyan átiratokból származnak, amelyek kimutatható expressziós szintekkel rendelkeznek, amint azt a mikroarray feltárja. Ezekből a nem célzott helyekből 889 magillesztési szekvenciát választottak ki negatív kontrollként.

elemzésünkben öt számítási algoritmus, köztük a MirTarget, a TargetScan, a DIANA-MicroT, a miRanda és a PITA teljesítményét értékeltük úgy, hogy összehasonlítottuk képességüket a célok megkülönböztetésére a nem céloktól, amint azt a HITS-CLIP feltárja. ROC analízist végeztünk a predikciós algoritmusok általános érzékenységének és specifikusságának értékelésére. Amint az ábrán látható. 2a, a MirTarget a legjobb teljesítményt nyújtja, a ROC görbe (AUC) alatti területe 0,78. A DIANA-MicroT a második legjobb teljesítményt nyújtja (AUC = 0,73). Érdekes módon a DIANA-MicroT-ot KLIPKÖTÉSI adatokkal való képzéssel fejlesztették ki, míg más nyilvános algoritmusokat miRNS túlexpressziós adatokkal képeztek ki. Így nem meglepő, hogy a DIANA-MicroT viszonylag jól illeszkedik a klip tesztelési adataihoz. A ROC elemzés mellett precision-recall (PR) görbéket is készítettünk az előrejelzés pontosságának értékelésére. A PR görbéket általában az algoritmus értékelésében használják az előrejelzési pontosság meghatározására (a valódi pozitívumok aránya az összes megjósolt pozitív között) a visszahívási arányhoz viszonyítva (az azonosított valódi pozitívok aránya az összes valódi pozitív között). Amint az ábrán látható. 2b, a MirTarget mind az öt algoritmus közül a legjobb teljesítményt nyújtja. Különösen a mirtarget pontossága meghaladja a 90% – ot, ha a visszahívási arány 20% alatt van. Ez azt jelzi, hogy a MirTarget különösen pontos a nagy megbízhatóságú előrejelzéseknél (azaz magas előrejelzési pontszámok).

Fig. 2
alak2

miRNS cél-előrejelzési algoritmusok összehasonlítása a HITS-CLIP adatkészlet segítségével. A MirTarget és négy másik cél-előrejelző algoritmus került be az elemzésbe. a Vevő működési jellemző (ROC) görbe elemzése, hogy értékelje az arány a hamis pozitív predikció arányához képest a valódi pozitív predikció. B Precision-recall (PR) görbe elemzés az előrejelzési pontosság értékeléséhez a visszahívási sebességhez viszonyítva

validálás miRNS leütési adatokkal

a Célpredikciós algoritmusokat a célkifejezés változásainak összefüggésében is értékeltük. Ebben az összehasonlító elemzésben, az algoritmusokat Hafner et al. . Ebben a nyilvános tanulmányban a szerzők egyidejűleg elnyomták a 25 miRNS funkcióit antiszensz inhibitorokkal, és értékelték a cél RNS expressziójára gyakorolt hatást mikroarray-kkel. Az ezen miRNS-ek által megcélzott géneket a miRNS gátlása miatt várhatóan felülszabályozták. Elemzésünkben a célpredikciós pontszámok és a célexpressziós upreguláció közötti korrelációt értékeltük. Amint az ábrán látható. 3a, összehasonlítva más algoritmusokkal, a mirtarget által kiszámított predikciós pontszámok a legmagasabb korrelációt mutatják a génexpresszió upregulációjával. Továbbá, az egyes algoritmusok által a legmagasabb rangú előrejelzések génexpressziós változásait is értékeltük, mivel a kutatókat különösen a nagy megbízhatóságú céljelöltek érdeklik. Ebből a célból miRNS-enként átlagosan 100 legmagasabb rangú előrejelzett célt értékeltünk minden algoritmus szerint. A korrelációs elemzéssel összhangban a MirTarget által előrejelzett célokat átlagosan a legjobban szabályozták a többi algoritmus által előrejelzettekhez képest (ábra. 3b).

Fig. 3
3. ábra

cél-előrejelzési algoritmusok összehasonlítása mikroarray adatok felhasználásával. A mikroarray profilozási adatokat elemeztük a 25 miRNS egyidejű gátlásából eredő célfelesleg azonosítására. a target upregulation és a target predikciós pontszámok korrelációja, amelyet 5 egyedi algoritmus számít ki, Pearson korrelációs együtthatóval mérve. b az előrejelzett célok kifejeződésének átlagos szintje. Minden algoritmus esetében átlagosan miRNS-enként 100 legjobban becsült célt vettek figyelembe az elemzésben

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

Previous post Bükkgomba
Next post Fokhagyma kagyló recept