Abstract
Tradisjonelle mutasjon vurderingsmetoder generelt fokus på forutsi forstyrrende forandringer i protein-kodende regioner i stedet for ikke-kodende regulatoriske områder som ikke-translaterte regioner (UTR) av mRNA. De UTR er imidlertid kjent for å ha mange sekvens og strukturelle motiver som kan regulere translasjonelle og transkripsjonelle effektivitet og stabilitet av mRNA gjennom interaksjon med RNA-bindende proteiner og andre ikke-kodende RNA som microRNAs (mirnas). I en fersk studie, transcriptomes av tumorceller husing mutant og villtype
KRAS plakater (V-Ki-ras2 Kirsten rotte sarkom viral onkogen homolog) gener hos pasienter med ikke-småcellet lungekreft (NSCLC) har vært sekvensert å identifisere single nucleotide variasjoner (SNVs). Om lag 40% av de totale SNVs (73,717) identifiserte ble kartlagt til UTR, men utelatt i forrige analyse. For å møte denne åpenbare behov for analyse av UTR, vi utformet et omfattende rørlednings å forutsi effekten av SNVs på to store regulatoriske elementer, sekundærstruktur og miRNA målwebområder. Ut fra 29,290 SNVs i 6462 gener, spår vi 472 SNVs (i 408 gener) som påvirker lokal RNA sekundærstruktur, 490 SNVs (i 447 gener) som påvirker miRNA målwebområder og 48 som gjør begge deler. Sammen danner disse forstyrrende SNVs var tilstede i 803 forskjellige gener, hvorav 188 (23,4%) som tidligere var kjent for å være kreftrelatert. Spesielt er dette forholdet signifikant høyere (ensidig Fishers eksakte test p-verdi = 0,032) enn forholdet (20,8%) av kjente cancerassosierte gener (n = 1347) i vår første datasett (n = 6462). Nettverksanalyse viser at genene som bærer forstyrrende SNVs var involvert i molekylære mekanismer for kreft, og de signalveier i LPS-stimulerte MAPK, IL-6, iNOS, EIF2 og mTOR. Avslutningsvis har vi funnet hundrevis av SNVs som er svært forstyrrende i forhold til endringer i den sekundære strukturen og miRNA målwebområder innenfor UTR. Disse endringene har potensial til å endre uttrykket av kjente kreftgener eller gener knyttet til kreft-assosiert trasé
Citation. Sabarinathan R, Wenzel A, Novotny P, Tang X, Kalari KR, Gorodkin J (2014) transkriptomet-Wide Analyse av UTR i ikke-småcellet lungekreft avslører kreft-relaterte gener med SNV-indusert forandringer på RNA sekundærstruktur og miRNA Target nettsteder. PLoS ONE 9 (1): e82699. doi: 10,1371 /journal.pone.0082699
Redaktør: Akio Kanai, Keio University, Japan
mottatt: 02.08.2013; Godkjent: 26 oktober 2013; Publisert: 08.01.2014
Copyright: © 2014 Sabarinathan et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dansk Senter for Scientific Computing (DCSC, DeiC); Danske Rådet for strategisk forskning (Programme Commission on Strategic Growth Technologies); Danske Rådet for Independent forskning (teknologi og produksjon Sciences). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Neste generasjons genomsekvensering er nå mye brukt for identifikasjon av genetiske variasjoner i kreft genomer [1], [2]. Ikke-småcellet lungekreft (NSCLC) er den vanligste formen for lungekreft, og det er ofte funnet med aktiverende mutasjoner i
KRAS
onkogen som fører til at kreftceller til å være aggressiv og motstandsdyktig mot kjemoterapi [3] – [5]. I en fersk undersøkelse, Kalari et al. [6] utført transkriptomet-wide sekvensering av NSCLC og identifiserte forskjellig uttrykte gener, alternative spleise isoformer og single nucleotide varianter (SNV) for svulster med og uten
KRAS
mutasjoner. En nettverksanalyse ble utført med de genene som viser differensial uttrykk (374 gener), alternativ spleising (259 gener) og SNV-relaterte endringer (65 gener) som er forskjellig stede i lunge kreftgrupper med og uten
KRAS
mutasjoner . Integrert pathway analyse identifisert NFkB, ERK1 /2 og AKT trasé som de mest betydningsfulle veier forskjellig deregulerte i
KRAS
villtype sammenlignet med
KRAS
muterte prøver.
En enkelt nukleotid variant (SNV) er en nukleotid-forandring ved en enkelt base stilling som finner sted ved en lav frekvens (også omtalt som en sjelden variant). SNVs observert i tumorceller er for det meste somatiske varianter og svært få er bakterie linjer varianter. Genom-wide assosiasjonsstudier (GWAS) rapporterer at SNVs meste skjer i ikke-kodende regioner i forhold til koding (exonic) regioner av RNA [7]. I det siste, men de fleste studier har vært fokusert på effekten av SNVs i koding regioner (kjent som cSNVs eller nsSNVs) [8] snarere enn effekten av SNVs i regelverket ikke-kodende DNA eller ikke-kodende RNA (rSNV) . I tilfellet med NSCLC, Kalari et al. [6] identifisert totalt 73,717 unike SNVs stede i og rundt (+/- 5 kb) RefSeq gener. Av disse 23 987 var cSNVs og deres effekt på kodende områder har tidligere blitt spådd (se [6] for mer informasjon). Virkningene av rSNVs som er lokalisert i ikke-translaterte regioner (UTR) av protein-kodende gener, men trenger å bli analysert.
Det er velkjent at UTR spille viktige roller i post-transkripsjonell regulering inkludert mRNA stabilitet [ ,,,0],9], transport [10], lokalisering [11], [12], translasjonelle aktiverings [13] og undertrykkelse [14], [15]. Disse funksjonelle regelverket utføres av
cis
regulatoriske elementer til stede i 5 «og 3» UTR. Spesielt noen av
cis
regulatoriske elementer er strukturert, f.eks jern-responsive element (IRE), intern ribosomet oppføring hotellet (IRES) og selenocystein innsetting sekvens (SECIS). Den primære strukturen til
cis
regulatoriske elementer er også viktig for bindingen av
trans
-acting RNA-bindende proteiner eller andre ikke-kodende RNA. For eksempel microRNAs (mirnas) er små ikke-kodende RNA (ca 22 nt) som binder målnettsteder stort sett til stede i 3 «UTR. Denne interaksjonen resulterer i enten spalting av mål-mRNA eller undertrykkelse av deres oversettelse. Flere studier har rapportert at miRNA-mediert genregulering spiller en stor rolle i kreftceller og slik regulering har vært ansett som en potensiell narkotika mål (se anmeldelse [16]). Alt dette bevis støtter både rekkefølge og strukturelle motiver av UTR være viktig for kontroll av genuttrykk.
Forekomst av genetisk variasjon (e) i UTR potensielt kan påvirke deres rekkefølge og /eller strukturelle motiver og dermed føre til endringer i post-transkripsjonell regulering [17] – [20]. For eksempel, en SNP i et la-7 miRNA målstedet (miRTS) i det 3′-UTR av
KRAS
har blitt identifisert til å påvirke bindingen av la-7 mirnas. Dette resulterer i overekspresjon av
KRAS
, som fører til økt risiko for NSCLC [21]. I tillegg nyere studier rapporterer at genetisk variasjon kan potensielt skape, endre eller ødelegge miRNA er rettet mot områder, noe som resulterer i feilregulering av målet mRNA [22], [23]. Spesielt har dette blitt identifisert i tumorceller, så vel [24]. Videre, en kreft-drevet mutasjon til stede i en IRES i human
p53
mRNA forandrer strukturen av IRES-elementet, som inhiberer binding av en trans-virkende faktor essensiell for oversettelse [25]. Den nylige antall web-servere og databaser utviklet for å håndtere varianter påvirker miRTSs demonstrerer også den økende betydningen av målområdet varianter [22], [26] -. [28]
I denne studien, spår vi mulige effekter av 29,290 SNVs forbundet med NSCLC som er plassert i UTR regioner av mRNA. Den lokale effekten av SNVs på den sekundære strukturen i UTR er beregnet med RNAsnp [29], og effekten av SNVs på miRTSs i UTR er beregnet med TargetScan [30] og Miranda [31], noe som viste seg å være blant de mer pålitelige miRNA mål prediksjon metoder [32]. De eksperimentelt identifisert miRNA-mRNA kart ved hjelp argonaute (siden) kryssbinding immunoprecipitation kombinert med high-throughput sekvensering (CLIP-Seq), er videre brukt til å redusere de falske positive spådommer om miRTSs [33].
materialer og metoder
data~~POS=TRUNC kilder~~POS=HEADCOMP
SNVs identifisert gjennom RNA-sekvensering av 15 primære lunge adenokarsinom svulster (8 med
KRAS
mutasjon og 7 uten
KRAS
mutasjon) ble ekstrahert fra Kalari et al. [6]. Det bør bemerkes at den tidligere studie [6] hadde ingen RNA-sekvenseringsdata på normale celler slik at det ikke var mulig å skille SNVs avledet fra bakterie-line eller somatisk mutasjon. Således datasettet innhentet, 29290 UTR SNVs i 6462 kodende gener, avledet fra både bakterie-linje og somatiske varianter som ble uttrykt i lunge adenokarsinom tumorer. Basert på overlappingen av disse SNVs med dbSNP (135 build), kan vi anslå at 40% av de 29,290 SNVs er bakterie-line varianter. For de SNVs som overlapper med dbSNP oppføringer, vi også pakket ut SNPs i sammenhengen dis-likevekt med SNAP server [34] (versjon 2.2, med standard parametere: r
2≥0.8, avstand limit 500 kb, SNP data satt 1000 genomer pilot en, og befolkningen panel CEU).
RefSeq mRNA-sekvenser som tilsvarer de 6462 gener (hg19 Build) ble lastet ned fra UCSC genom nettleser (https://genome.ucsc.edu) [35 ]. For genene med flere vitnemål, ble alle isoformer vurdert. Ved kartlegging av 29,290 SNVs til disse RefSeq mRNA-sekvenser, fikk vi 3646 i 5 «UTR, 25627 i 3» UTR og 17 i både 5 «og 3» UTR av overlapp transkripsjoner. Disse SNVs ble ytterligere utsatt for vårt omfattende rørledning (figur 1) for å forutsi deres effekt på RNA sekundærstruktur og miRNA målwebområder, som er beskrevet i de neste avsnittene.
En liste over kreftassosierte gener ble hentet fra COSMIC [36] og Qiagen /SABioSciences [37]. Denne listen inneholder 1347 av de 6462 gener vurderes i denne analysen. For å finne den anrikning av gener som bærer forstyrrende SNVs, som har virkning på sekundærstruktur og /eller miRTSs, i cancer, utførte vi en ensidig Fishers eksakte test. Dette ble beregnet fra en 2 x 2 beredskaps bord (n = 6462) med det antall gener som bærer /bærer ikke forstyrrende SNVs på den ene side og antallet kreftassosiert /andre gener på den andre siden. På lignende måte ble det berikelse for forstyrrende SNVs i cancerassosierte gener beregnet ved å klassifisere det totale antall SNVs (n = 29 290) inn i nedbrytende /ikke-nedbrytende SNVs på den ene side, og de er og ikke er tilstede i cancerassosierte gener på den andre.
Et sett av eksperimentelt verifiserte eksempler på SNP’er med effekter på miRNA målse er ekstrahert fra litteraturen (se tabell S1). Disse 19 SNPs (fore 25 miRNA-mRNA interaksjoner) har blitt brukt til å teste filtreringskriteriene som brukes i miRNA del av vår rørledningen.
Prediction of SNVs «effekt på RNA sekundærstruktur
effekten av SNVs på RNA sekundærstruktur ble beregnet med RNAsnp (versjon 1.1) [29]. De villtype mRNA-sekvenser og SNVs ble gitt som innspill sammen med standard parametere av RNAsnp. For hver SNV, RNAsnp betraktes som et vindu på +/- 200 nts rundt SNV posisjon for å generere villtype (WT) og mutant (MT) og subsekvenser beregnet sine respektive basepar sannsynlighet matriser og. Deretter ble forskjellen mellom basepar sannsynligheten for villtype og mutant struktur målt ved anvendelse av euklidsk avstand (d) og Pearson korrelasjonskoeffisient (r) for alle lokale regioner i subsequence. For fullstendighet, vi kort oppsummere disse to tiltakene som følger. Den første beregner forskjellen mellom to matriser direkte ved (1) hvor stor er sannsynligheten for baser
i
og
j
blir paret. Det andre tiltaket bruker posisjonsmessig pair sannsynligheter. For et lokalt område, inneholder vektoren elementene. Da forskjellen mellom to vektorer og måles ved hjelp av (2)
Endelig forutsagt et lokalt område med maksimal euklidsk avstand (d
max) eller minimum Pearson korrelasjonskoeffisient (r
min) og den tilsvarende p-verdien blir deretter rapportert. Vi benytter både tiltak uavhengig som begge tiltakene holder sine respektive styrker og svakheter (se [29] for detaljer). Vi genererte to lister (hver med p 0,1) av kandidater, d
max og r
min, og hver av dem underkastes en fler testing korreksjon ved hjelp av Benjamini-Hochberg prosedyre [38], som begrenser den falske funnraten å være noe mer enn en valgt terskel (typisk 10%).
for å analysere om RNAsnp spådd lokale regionen er strukturelt bevart, vi brukte merknadene av konservert RNA sekundærstruktur spådommer fra vår in- huset rørledning [39], som gjør bruk av en rekke verktøy, inkludert CMfinder [40] og RNAz [41] programmer.
Forutsi av SNVs «effekt på mikroRNA målse
for hver SNV i datasettet, er en subsekvens av 30 nts på hver side av SNV stilling hentes. Videre ble alle 2042 menneskelige moden miRNA sekvenser fra miRBase (V19) [42] brukes til å søke etter mulige målområder i villtype og mutant (med SNV) sekvenser. Som et første trinn ble TargetScan (versjon 6.0) [30] anvendes for å identifisere par av SNVs og mirnas for hvilken den type frø kamp er forskjellig mellom villtype og mutant som er eller er bare til stede i noen av dem. De ulike frø typer som brukes av TargetScan er 7mer-1a, 7mer-m8, og 8MER-1a (i økende styrke), hvor «1a» refererer til en adenosin i miRTS 3 «til frøet kamp (dvs. motsatt av den første nukleotid av miRNA) og «-m8» refererer til et Watson-Crick-matchet nukleotid i posisjon 8. Deretter ble samspillet energi av disse parene beregnet ved hjelp av Miranda (versjon 3.3a) [31]. Som et frø kamp endringene allerede kreves av TargetScan filtrering, ble parametrene for Miranda satt til ikke veie frøet regionen for høy ( «-skala 2 «i stedet for standard 4) og med avslappet cutoffs (skår 45, energi -5 kcal /mol), for å fange opp de tilfeller hvor en dårlig frø kamp kan kompenseres. For å klassifisere et samspill som arbeider vi senere bruke en mer konservativ energi terskelen til -11 kcal /mol basert på vår tidligere studie [43]. For hvert par av miRNA og 61mer, bare de sterkeste bindingssetet (lavest) som skiller mellom WT og SNV-sekvensen er beholdt. Antatte interaksjoner er klassifisert som
opprettet
,
ødelagt
eller
endret
på mutasjon basert på MIRANDA spådommer.
opprette
sett inneholder målse som er indusert av SNV, dvs. ha et samspill energi fra -11 kcal /mol eller lavere i SNV variant, mens ingen interaksjon er spådd i villtype (enten grunn å score eller energi terskel). Tilsvarende vil et tap av målområde bli registrert i
ødelegge
sett, hvis samspillet er spådd for villtype, men ikke med SNV. Til slutt,
forandre
sett inneholder mulige interaksjoner som er forutsagt med en bindingsenergi på høyst -11 kcal /mol for minst én variant. For disse ble energi forskjell observert for binding av miRNA før og etter SNV innføring målt som deres log-ratio
lr
= ld (/), for 0.
lr
er 0 hvis det ikke er endring i energi; negativ hvis villtypen har større samspill (lavere energi), positiv ellers. Gitt størrelsen på datasettet, fokuserer vi på (øverst) kandidater som absolutt
lr
verdi er over gjennomsnittet (μ) absolutt
lr
verdier fra alle parene klassifisert som alter. Effektiviteten av denne terskel klart varierer med data, men det vil alltid beholde de beste kandidater med høyest relativ energidifferanse. Selv om det ikke bør bli sett på som en fast cut-off, vi har brukt den til vårt sett av kjente eksempler, hvor 14 av 23 interaksjoner stiger verdien vi brukt her (se tabell S1). Terskelverdier basert på fordelingen av MFE endringer har blitt brukt på en lignende måte før [24].
For å redusere falske positive spådommer, Mirna målse spådd for villtype (
ødelegge
eller
endre
) ble kryssjekket med eksperimentelt identifisert mikroRNA-målet interaksjons kart. Disse data, avledet gjennom Ago CLIP-Seq, ble lastet ned fra Starbase [44]. Bare SNVs som er plassert inne strenge Ago CLIP-Seq peak klynger med en biologisk kompleksitet (BC) på minst to ble beholdt. Dette filteret kan ikke brukes for samhandling fra
skape
sett, som CLIP-Seq data er tilgjengelig for den eneste villtype.
Til slutt settet med miRNAs ble filtrert for de som er uttrykt i luftveiene (lungene og luftrøret) i henhold til kropps kartet miRNA [45]. Oversikten over miRNA analysen er beskrevet i Figur 2.
Flytskjemaet viser de ulike trinnene i prediksjon og filtrering med antall individuelle SNVs, mirnas, og par av disse på hvert trinn.
Fra PhenomiR [46] database, vi hentet informasjon om mirnas som har blitt funnet å være opp- eller nedregulert i lungekreft. Dette settet består av 264 individuelle miRNA stilk-løkke tiltredelser, tre av disse er «døde oppføringer «. De resterende 261 stilk-buer gi opphav til 430 modne miRNA produkter, som vi refererer til som
lungekreft-forbundet mirnas
. I dette datasettet, 27 mirnas er spesifikke for NSCLC [47] skriver ifølge miRNA kroppen kart [45]. Den senere datasettet betegnes som
NSCLC-forbundet mirnas
.
oppfinnsomhet Pathways Analyse
interactome nettverk av kandidat gener ble konstruert ved hjelp av oppfinnsomhet Pathway Analysis (IPA) programvare (Oppfinnsomhet ® Systems, www.ingenuity.com, bygge versjon: 220217, innhold versjon: 16542223). Network generasjon er basert på den «globale Molecular Network» i IPA, som består av en omfattende, manuelt kuratert sett gen-gen-relasjoner basert på funn fra den vitenskapelige litteraturen. Genene av interesse (kandidater satt ut av vår rørledningen og brukes som input for IPA) som også er til stede i dette globale nettverket er de såkalte fokus gener. Høyt sammenkoblet fokus gener utgjør startpunktet i nettverket generasjon. Andre ikke-fokus gener fra Global Molecular Network kan bli brukt som linker gener mellom små nettverk. Nettverk er forlenget til en omtrentlig størrelse på 35 gener, som regnes som optimal for visualisering og tolkning (for mer informasjon se [48]). P-verdien beregnet for hvert nettverk representerer sannsynligheten for å finne den samme (eller høyere) antall fokus gener i en tilfeldig utvalgt sett av gener fra det globale nettverket. Den beregnes ved en rett-tailed Fisher Exact Test med (ikke-) fokus molekyler på den ene side og molekyler (ikke) i nettverket på den andre side av en 2 x 2 beredskaps tabell. Dette er forvandlet til en poengsum som er negativ logg av p-verdien. Videre IPA ble anvendt for å identifisere de beste sykdommer og lidelser, molekylære og cellulære funksjoner, og kanoniske trasé forbundet med genene i våre kandidatsett (såkalt «fokus gener «). P-verdien for en gitt (sykdom, funksjon eller sti) merknad beskriver sannsynligheten for at sammenhengen mellom inngangs genet sett og merknaden skyldes tilfeldigheter. Dette er også basert på en høyre-tailed Fishers eksakte test som er angitt ovenfor.
Resultater
Effekt av SNVs på RNA sekundærstruktur
De strukturelle effektene av 29,290 UTR SNVs var beregnet med RNAsnp (v1.1). Både Euklidsk avstand (d
max) og Pearson korrelasjonskoeffisient (r
min) tiltak av RNAsnp (modus 1) ble selvstendig næringsdrivende til å forutsi effekten av SNVs på lokal RNA sekundærstruktur. Fordelingen av p-verdier som er beregnet for 29290 UTR SNVs er vist i figur S1A. På et signifikansnivå på 0,1 (valgt fra vår tidligere studie [29]), 3237 og 3062 SNVs ble spådd av henholdsvis d
max og r
min tiltak. Videre justering for multiple sammenligninger (ved hjelp Benjamini-Hochberg prosedyre [38]) forut 3204 og 1813 SNVs respektive til d
maks- og r
min tiltak. Etter å fusjonere disse to listene, fikk vi 3561 unike SNVs i 2411 gener.
Videre har vi beregnet avstanden mellom plasseringen av disse 3561 SNVs og spådd lokale regionen hvor den maksimale strukturelle endringen ble oppdaget (figur S1B) . Den viser at de fleste av SNVs føre strukturendring i og rundt SNV stilling. I tillegg viser lengdefordeling av den forutsagte lokale området at størsteparten av SNVs ha virkning på den lokale område av størrelse 50 til 100 nts imidlertid visse SNVs (n = 47) har virkning på global struktur hvor størrelsen av forventet lokale regionen overstiger 300 nts (Figur S1C). Videre sjekket vi om disse forstyrrende SNVs er anriket i GC eller AU rike regioner, som sekvenser med slik partisk nucleotide innhold har vist seg mer følsomme for strukturelle endringer forårsaket av mutasjoner [49]. For hver SNV vi beregnet GC innholdet i sine flankeregioner (som tidligere ved hjelp av 200 nts opp- og ned-stream), se Materialer og metoder. Dette viste at både de faste data SNVs og forstyrrende SNVs er sterkt anriket i de regionene med GC-innhold i området fra 40 til 60 prosent (se fig S2), noe som bør derfor gjør dem mindre følsom for variasjoner. I tillegg fant vi at det var ingen signifikante forskjeller mellom GC innhold distribusjoner av forstyrrende SNVs og data sett SNVs (se Figur S2 med Kolmogorov-Smirnov).
Det er kjent at UTR av mRNA Harbor evolusjonært konserverte regulatoriske elementer ([50] – [52], også se [53], [54]). Dermed vi kryss-sjekket for overlapping mellom forstyrret lokale regionen spådd av RNAsnp og konservert RNA sekundære konstruksjoner beregnet med våre interne rørledning [39] (se Materiale og metode seksjoner for detaljer). Interessant, spådde den lokale regionen for 472 SNVs (p-verdi under 0,1) overlapper med de antatt bevart RNA sekundære strukturer. Disse 472 SNVs tilsvarer 408 gener; hvorav 111 SNVs tilsvarer 98 gener som er involvert i kreftrelatert baner (se Fil S1.xlsx)
Basert på p-verdien, ble de ovennevnte 111 SNVs videre klassifiseres i to grupper. 28 så høy tillit som både d
max og r
min p-verdi 0,05 (tabell 1), og den andre 83 som middels tillit (enten d
max eller r
min p -verdi 0,1) (se Fil S2.xlsx). Vi forutsi at SNV-induserte strukturelle endringer i UTR regionene potensielt kan påvirke stabiliteten av mRNA eller forstyrre funksjonen av regulatoriske elementer til stede i UTR. For eksempel, den SNV A2304C (tabell 1) som er tilstede i den 3 «UTR av
MAPK14
mRNA viser en betydelig strukturell endring (p-verdi: 0,0076) i den lokale RNA sekundærstruktur som er strukturelt konservert ifølge både CMfinder og RNAz spådommer fra vår interne rørledning [39]. Denne strukturelle bevaring viser at regionen er i henhold til evolusjonært trykk for å opprettholde den struktur som er egnet til å ha noen funksjonell betydning. Proteinet som kodes av
MAPK14
genet er et medlem av MAP-kinase-familien, som er kjent for å være involvert i mange veier relatert til celledeling, modning og differensiering (oversikt i [55]). Også har det blitt spådd til å bli en av de viktigste aktørene i lungekreft interactome [6]. Dermed endring i genuttrykket av
MAPK14
på en post-transkripsjonsnivået på grunn av SNV-indusert strukturelle endringer kan potensielt påvirke MAKP14-relaterte signalveier.
Som en annen eksempel, er genet
GPX3
ansvarlig for koding av plasma glutation peroksydase, en antioksidant enzym som inneholder selenocystein i sin aktive sete og katalyserer reduksjon av hydrogenperoksyd. Aminosyren selenocystein blir kodet av UGA kodon, som normalt virker som et stoppkodon. I
GPX3
mRNA, den alternative anerkjennelse av en UGA kodon som selenocystein kodon er mediert av
cis
-acting regulerende element, selenocystein innsetting sekvens (SECIS), til stede i tre « UTR og andre
trans
-acting co-faktorer [56]. Den SNV U1552G (tabell 1) ligger i 3 «UTR av
GPX3
mRNA ble spådd å forårsake betydelig strukturell effekt (p-verdi: 0,0474) i den lokale regionen som inneholder SECIS regulerende element. Figur 3 viser de basepar-sannsynligheter svarende til den lokale regionen (NM_002084: 1544-1692) av villtype og mutant mRNA. Det kan sees at villtype har høyere basepar-sannsynligheter for å danne stabile stammesløyfestrukturen SECIS (markert med en sirkel i figur 3), mens i det mutante formen er det forstyrret på grunn av SNV, som ligger utenfor SECIS regionen. Tidligere studie har vist at den karakteristiske stilk-løkke struktur av SECIS er viktig for effektiviteten av UGA omkoding
in vivo Hotell og
in vitro product: [56]. Basert på dette, spekulerer vi at SNV U1552G indusert strukturelle endringer i SECIS element kan påvirke effektiviteten av UGA omkoding.
prikkplott fra RNAsnp webserveren [67] viser basepar sannsynlig stemmer med den lokale region spådd med signifikant forskjell (
d
max
p-verdi: 0,0474) mellom villtype og mutant. Den øvre trekant representerer basepar sannsynligheter for villtype (grønn) og den nedre trekant for den mutante (rød). På sideveggene er det minimum fri energi (MFE) struktur av vill-type og mutanter vises i plan grafisk representasjon. Den SECIS regionen er uthevet i blå sirkel og SNV posisjon vises med pil merket.
Videre vurderer både sett med høy selvtillit og mellom tillit SNVs, vi fant ut at genene (n = 15) beskrevet i tabell 2 havn mer enn en forstyrrende SNV i den forutsagte konserverte strukturelle regionen av mRNA. For eksempel genet
ID2
koder for DNA-bindende protein-inhibitor-ID-2, som er en kritisk faktor for celleproliferasjon og differensiering i normal utvikling virveldyr. Overekspresjon av ID-2-proteinet blir ofte observert i forskjellige humane tumorer, inkludert NSCLC [57]. I mRNA-sekvensen av
ID2
gen, to SNVs lokalisert i 5′-UTR-regionen ble uavhengig er forutsagt til å forårsake betydelig lokal strukturendring i den konserverte regionen. Tidligere studier har vist at SNP eller mutasjon indusert strukturelle endringer i de 5 «UTR kan føre til ukontrollert oversettelse eller overekspresjon av de respektive proteiner [58], [59]. Vi spår at de to SNVs som forårsaker betydelig endring i strukturelt konservert område kan påvirke oversettelsen effektiviteten av
ID2
mRNA.
Av de 472 forstyrrende SNVs hentet fra den sekundære strukturen analyse (før kryssende med kreft-assosiert gener), 199 overlapping med SNPs fra dbSNP (bygge 135). Av disse 199 SNVs, 17 er i ledd dis-likevekt (LD) med andre SNP’er som er plassert proksimalt (+/- 200 nts) til den SNV stilling. Disse 17 parene ble testet med RNAsnp å sjekke om SNP i LD med (nedbrytende) SNV er en struktur stabiliserende haplotype [60]. Av disse 17 parene, fem ble spådd å forårsake noen betydelige strukturelle endringer, som kan være mulige struktur stabiliserende haplotyper; mens de andre 12 par har vist betydelige strukturelle endringer (se Fil S3.xls).
Effekt av SNVs på mikroRNA målse
Screening alle menneskelige modne mirnas mot alle identifiserte SNVs med flankerende sekvens avkastning 2 × 59810180 mulige kombinasjoner. Den innledende TargetScan trinnet er en konservativ filter og reduserer mengden av SNV-miRNA parene til 0,2% av denne. Vi bruker da Miranda som et andre mål prediksjon metode, etterfulgt av et sett med filtre. Fordelingen av
lr
verdier i
endre
sett er vist i figur S3, bare saker med relative endringer større enn de beskrevne avskåret anses (se Materialer og metoder). Figur 2 viser de ulike trinnene med individuelle tilfeller av mulige interaksjonssider på hvert trinn. Dette gir oss 490 SNVs i 447 gener spådd å påvirke 707 interaksjoner med 344 mirnas (se Fil S4.xlsx). Etter krysset med kjente kreftassosierte gener (siste trinn i rørledningen, figur 1), finner vi 124 SNVs og 148 mirnas å være involvert i 186 interaksjoner som avviker med mutasjonen. Disse SNVs som induserer antatte miRTS endringer kan videre klassifiseres i de styrke samhandlingen med mutant (80) eller vill-type (52) variant.
Tabell 3 viser alle genene som inneholder mer enn én miRTS spådd å være endret mellom vill-type og SNV. Dette inkluderer eksempler der samme SNV endrer målområde for ulike modne mirnas fra samme familie, men også eksempler der ulike SNVs innenfor genet forårsaker en gevinst eller tap av en miRTS. Tilsvarende er alle mirnas med mer enn to endrede målsepresentert i tabell 4. Den viser medlemmer av MIR-29-familien som tidligere er blitt rapportert å virke som tumor-suppressorer samt onkogener (se [61] for en gjennomgang).
av de 148 mirnas (ansvarlig for 186 mulige interaksjoner) i vår endelige kandidatsett, 89 er
lungekreft forbundet mirnas
(i 117 interaksjoner) (angitt i File S4.xlsx). Tabell 5 lister alle 14 mulige målområder i vår siste kandidat sett med
NSCLC-forbundet mirnas
. Spesielt listen omfatter fire mirnas med mer enn én spådd mål endret. For MIR-184 en target nettstedet er opprettet mens en annen er svekket ved innføring av mutasjonen. Videre er MIR-30a, d, og e spådd å målrette 3′-UTR av
SUZ12
genet. Men den anslåtte interaksjonene er sannsynlig å være funksjonelle i villtype og tapt i mutant skyldes SNV-induserte endringer i frøet regionen. SUZ12 har tidligere vært vist å være direkte målrettet av MIR-200B og inhibering av denne miRNA øker dannelsen av kreft stamceller (cscs) [62], som bidrar til tumor aggressivitet. Tapet av MIR-30 regulering av (en av) de tre tilstøtende SNVs i frø av målområdet kunne ha en lignende effekt i NSCLC.
I tillegg til 48 SNVs den anslåtte miRTSs ble funnet å være plassert inne i lokale regionen der en betydelig sekundærstrukturendring ble spådd av RNAsnp. Av disse ble 15 SNVs ligger i kreft-assosiert gener (se tabell 6). Basert på tidligere studier [63], [64], spekulerer vi at SNV-indusert miRTS endre sammen med de sekundære strukturelle endringer i og rundt miRTS kan potensielt påvirke bindingen av spådd miRNA.