Abstract
Long ikke-kodende RNA (lncRNAs) regulerer genuttrykk ved å handle med microRNAs (miRNAs). Imidlertid er rollene til kreft spesifikk lncRNA og dens tilhørende konkurranse endogene RNA (Cerna) nettverk i levercellekreft (HCC) ikke fullt ut forstått. De lncRNA profiler i 372 HCC pasienter, inkludert 372 svulsten og 48 tilstøtende ikke-tumor levervev, fra Kreft Genome Atlas (TCGA) og NCBI GEO studenter (GSE65485) ble analysert. Kreft spesifikke lncRNAs (eller HCC relatert lncRNAs) ble identifisert og korrelert med kliniske funksjoner. Basert på bioinformatikk generert fra miRcode, Starbase, og miRTarBase, bygget vi en lncRNA-miRNA-mRNA-nettverk (Cerna nettverk) i HCC. Vi fant 177 kreftspesifikke lncRNAs i HCC (endring ≥ 1,5, P 0,01), 41 av dem ble også discriminatively uttrykt med kjønn, rase, svulst klasse, AJCC tumor stadium, og AJCC TNM staging system. Seks lncRNAs (CECR7, LINC00346, MAPKAPK5-AS1, LOC338651, FLJ90757, og LOC283663) ble funnet å være signifikant assosiert med total overlevelse (OS, log-rank P 0,05). Samlet våre resultater viste lncRNA uttrykk mønstre og en kompleks Cerna nettverk i HCC, og identifisert en kompleks kreft bestemt Cerna nettverk, som omfatter 14 lncRNAs og 17 mirnas i HCC
Citation. Zhang J, Fan D, Jian Z, Chen GG, Lai PBS (2015) Kreft Spesifikk Long kodende RNA Vis Differensial uttrykk mønstre og konkurrerer Endogen RNA Potensielle i leverkreft. PLoS ONE 10 (10): e0141042. doi: 10,1371 /journal.pone.0141042
Redaktør: Xin Yuan Guan, The University of Hong Kong, Kina
mottatt: 6 august 2015; Godkjent: 02.10.2015; Publisert: 22 oktober 2015
Copyright: © 2015 Zhang et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer
Finansiering:. Denne studien ble støttet av Specialized forskningsfond for doktorgradsutdanning av høyere utdanning og forskning Grants Council øremerket stipend~~POS=HEADCOMP Joint Research Scheme (No. M-CUHK406 /13) og Natural Science Foundation of China National (nr 81472339). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
ikke-kodende RNA er RNA-molekyler som ikke koder for proteiner. De kan deles inn i flere undertyper, inkludert lange ikke-kodende RNA (lncRNA), mikroRNA (miRNA), ribosomal RNA (rRNA), liten nukleolært RNA (snoRNA), og overføring av RNA i henhold til HUGO Gene Nomenclature Committee (HGNC) (http: //www.genenames.org).
Etter identifisering av lncRNA i malignitet sykdommer, et økende antall studier på de biologiske roller lncRNAs er utført på ulike kreftformer, inkludert HCC [1], esophageal plateepitel karsinom [2], kolorektal kreft [3], nyrecellekarsinom [4] og prostatakreft [5]. Den unormale uttrykk for lncRNAs gjennom interaksjoner med mirnas eller mRNA er involvert i reguleringen av tumorprogresjon og tumor biologiske atferd i HCC [6-8]. Kreft spesifikke lncRNAs kan også påvirke invasjon og metastasering av HCC [9].
I 2011 Salmena
et al
. presentert en konkurrerende endogen RNA (Cerna) hypotese, som enhetlig transkriptom og dannet en regulatorisk RNA nettverk [10]. Hovedtanken er at alle typer RNA transkripsjoner kommunisere med hverandre ved å konkurrere for binding til felles miRNA-bindingsseter ( «miRNA responselementer» eller «MREs»). Denne typen RNA konkurranse krysstale mellom et protein-kodende messenger RNA og ikke-kodende RNA som lncRNA, pseudogener og sirkulære RNA [11]. Videre kan kunstige miRNA svamper deltar også i dette nettverket for å regulere genekspresjon [12].
Zhu et al. rapporterte at lncRNA ekspresjonsprofilen av HCC av microarray analyse fra tre HCC pasienter [13]. Men det er mangel på studier med stor skala utvalgsstørrelse og høy gjennom deteksjonsmetoder på de uttrykk mønstre av kreft bestemt lncRNA i HCC, og det er ukjent om lncRNAs er korrelert med total overlevelse, kjønn eller andre kliniske funksjoner eller om avvik uttrykk for lncRNAs i HCC har noen Cerna potensial. Nylig, RNA sekvense data fra Kreft Genome Atlas (TCGA) prosjekt eller GEO gi publikum lncRNA, miRNA, og mRNA data for HCC. For å møte de ovennevnte spørsmålene, vi utforsket lncRNAs i HCC bruker datasett fra TCGA og GEO. Disse to datasettene inngår RNA sekvens resultater for totalt 372 HCC tumorvev og 48 tilstøtende prøver ikke-tumor levervev. Så langt vi kjenner til, er denne studien den første til å gjøre bruk av storskala sekvense database for å undersøke kreftspesifikke lncRNA uttrykk mønstre og Cerna nettverk i HCC. Denne nye tilnærmingen for å forutsi kreft spesifikk lncRNA og Cerna nettverk kan hjelpe oss til å forstå funksjonen av lncRNAs i HCC.
Metoder
Pasienter og prøver
Totalt 360 pasienter med HCC ble hentet fra TCGA data portal. Eksklusjonskriteriene ble satt som følger: 1) histologic diagnose er ikke HCC; 2) prøver uten fullført data for analyse; og 3) Total overlevelse mer enn 2000 dager. Overall, totalt 322 HCC pasienter ble inkludert i vår studie. Blant disse 322 HCC pasienter, ble de tilstøtende ikke-tumor levervev hentes fra 43 forsøkspersoner. Denne studien oppfyller publiserings retningslinjer gitt av TCGA (https://cancergenome.nih.gov/publications/publicationguidelines). En annen GEO datasett (GSE65485) ble lastet ned fra GEO (https://www.ncbi.nlm.nih.gov/geo/) som inkluderte 50 HCC vev og 5 tilstøtende ikke-tumor leveren vev. Som dataene ble innhentet fra TCGA og GEO, ikke var nødvendig lenger godkjennes av en etisk komité.
RNA sekvens data prosesjon og beregningsorientert analyse
RNA uttrykk data (nivå 3) av den tilsvarende pasienter (tumor og /eller tilstøtende ikke-tumorvev) ble lastet ned fra TCGA data portal (opp til 24 februar 2015). De lncRNA og mRNA uttrykk profiler ble samlet inn via RNA sekvense rå leser av RNASeqV2 post-behandling av rørledninger og demonstrert som RSEM (RNA-Seq av forventning-maksimering) normaliserte telledata. Den miRNA uttrykket profilen ble utført ved hjelp av miRNA sekvense plattformer Illumina HiSeq 2000 (Illumina Inc, USA) og demonstrert som leser per million miRNA (RPM) kartlagt data. Fordi mRNA, lncRNA, og miRNA uttrykket profildata allerede var normalisert ved TCGA, ble ingen ytterligere normalizations brukt på disse dataene. GEO datasettet ble også generert fra Illumina HiSeq 2000 plattform og normalisert som FPKM (fragmenter per kilo baser av eksoner for per million kartlagt leser) data. Den lncRNA analysene ble utført ved hjelp av BRB-ArrayTools (versjon 4.4) som er utviklet av Dr. Richard Simon og BRB-ArrayTools Development Team [14].
Byggingen av Cerna nettverk og KEEG Pathway Analysis
byggingen av Cerna nettverk omfattet tre trinn: (i) kreft spesifikk lncRNA filtrering: kreftspesifikke lncRNAs med absolutt ganger endring ≥ 3,0 (enten oppregulering eller nedregulering) og P 0,05 ble beholdt. For å forbedre datapåliteligheten har kreftspesifikke lncRNAs ikke blitt kommentert av GENCODE (https://www.gencodegenes.org/) ble forkastet; (Ii) lncRNA-miRNA interaksjoner ble spådd av miRcode (https://www.mircode.org/) og Starbase v2.0 (https://starbase.sysu.edu.cn/); (Iii) mRNA målrettet av mirnas med eksperimentell støtte ble hentet fra miRTarBase (https://mirtarbase.mbc.nctu.edu.tw/). For ytterligere å styrke robust av denne Cerna nettverk, ble maksimal informasjon koeffisient (MIC) algoritme og maksimal informasjonsbaserte nonparametric lete (mine) statistikk brukes i TCGA datasett for å filtrere pair-wised forhold [15]. Et nettverk graf ble konstruert og visualisert ved hjelp Cytoscape v3.0 [16]. Kodingen gener involvert i Cerna nettverk var innspill til Database for kommentering, visualisering og integrert Discovery (DAVID) [17] for KEEG vei berikelse analyse.
Statistisk analyse
Data ble presentert som gjennomsnitts ± SD. Forskjeller mellom gruppene ble evaluert av to-utvalgs t-test og signifikansnivået ble satt som 0.001 som standard for å kontrollere den falske funnraten (FDR). Den univariate Cox regresjon ble gjennomført for å finne ut lncRNAs korrelert med total overlevelse [18]. P-verdi mindre enn 0,05 ble ansett som statistisk mindre spesifikt angitt. De statistiske analysene ble utført av BRB-ArrayTools eller R språk [19].
Resultater
Kreft spesifikke lncRNAs i HCC
Vi identifiserte 604 lncRNAs fra TCGA datasett og 357 lncRNAs fra GSE65485. For en enkelt lncRNA, det dukket opp i TCGA datasett eller begge TCGA og GEO datasett. Vi fant at 177 lncRNAs og 37 lncRNAs ble uttrykt forskjellig mellom HCC vev og tilstøtende ikke-tumorvev i TCGA datasett og GEO datasett (absolutt ganger endring ≥ 1,5, P 0,01, S1 Table) hhv. For ytterligere å forsterke data pålitelighet, valgte vi 28 lncRNAs inkludert i GENCODE og disse lncRNAs hadde en absolutt ganger endring ≥ 3,0 fra enten TCGA eller GEO datasett å bygge Cerna nettverk [20]. Endelig 28 lncRNAs (18 oppregulert, 10 nedregulert). Ble valgt for Cerna nettverk (tabell 1)
Denne tabellen viser 28 kreftspesifikke lncRNAs for Cerna nettverk konstruksjon med absolutt ganger endring ≥ 3,0, P 0,01 og inkludert i GENCODE.
Korrelasjonene mellom kreftspesifikke lncRNAs og kliniske funksjoner
177 lncRNAs fra det foregående kapitelet ble videre analysert i henhold til kliniske funksjoner, inkludert kjønn, rase, tumor klasse, AJCC TNM staging system, AJCC patologisk stadium, vaskulær invasjon, ny svulst hendelse, tumorstatus, og alder ved diagnose i TCGA og /eller GEO datasett. Det var totalt 41 kreftspesifikke lncRNAs, nivåene av disse var også signifikant forskjellig i kliniske sammenligning av funksjoner (P 0,001, Tabell 2). Fem lncRNAs (LINC01554, LOC255167, A1BG-AS1, LINC00526, og MIR22HG) ble uttrykt forskjellig i tre eller fire kliniske sammenligning av funksjoner.
Denne tabellen viser 41 kreftspesifikke lncRNA som også ble uttrykt forskjellig i kliniske sammenligning av funksjoner.
Deretter for å identifisere potensielle lncRNAs med prognostiske kjennetegn, ble nivåene av 177 lncRNAs i TCGA datasettet ble profilert med univariate Cox regresjonsmodellen og seks lncRNAs funnet å være signifikant assosiert med total overlevelse (log-rank P 0,05). Blant de seks betydelige lncRNAs, tre lncRNA (CECR7, LINC00346, og MAPKAPK5-AS1) ble negativt assosiert med OS, mens de resterende tre (LOC338651, FLJ90757, og LOC283663) var positivt korrelert med OS (fig 1).
(horisontal akse: total overlevelse tid: dager, vertikal akse: overlevelsesfunksjonen).
miRNA målretting lncRNAs forutsett av miRcode og Starbase
Vår tidligere studie har funnet 207 HCC- tilknyttede mirnas som ble forskjellig uttrykt mellom HCC vev og tilstøtende ikke-tumorvev [21]. Vi valgte 33 mirnas fra 207 HCC-forbundet mirnas i dagens TCGA datasett (absolutt ganger endring ≥ 3,0, P 0,001, S2 tabell). Her fokuserte vi på om disse mirnas vil målrette over 28 kreftspesifikke lncRNAs. I Cerna nettverk, mirnas samhandle med lncRNAs gjennom MREs, og dermed søkte vi om de potensielle MREs i lncRNAs bruker miRcode [22] og Starbase v2.0 [23]. Resultatene viste at 17 av 33 kreftspesifikke mirnas kan samhandle med 15 av 28 kreftspesifikke lncRNAs (Tabell 3).
MIR-199A-1 og MIR-199A-2 var oppfatter som en enkelt miRNA i vår studie
miRNA mål spådd av miRTarBase
for å etablere lncRNA-miRNA-mRNA-nettverk (Cerna nettverk), var neste skritt å søke etter mRNA målrettet av miRNAs. Basert på mirnas beskrevet i tabell 3, vi søkte miRNA-målrettede mRNA med eksperimentelle bevis hjelp miRTarBase [24]. Resultatene identifisert 17 mirnas inkludert Mir-10B, MIR-135A-1, MIR-139, MIR-182, MIR-183, MIR-184, MIR-195, MIR-199A-1/2, MIR-214, speil 33B, MIR-34C, MIR-375, MIR-376c, MIR-383, MIR-424, MIR-93, og MIR-96 (tabell 4). Hver miRNA-mRNA par ble eksperimentelt validert av minst to av følgende metoder inkludert reporter analysen, western blot, qPCR, microarray, pSILAC (pulset stabile isotop merking med aminosyrer i cellekultur) eller NGS (CLIP-seq eller Degradome-seq ). Ifølge allOnco database (https://www.bushmanlab.org/links/genelists), de fleste av sine mål er kreft-assosiert gener som SIRT1, VEGFA, RASA1, RAF1, PTEN, MAPK9, MAPK8, MAPK1, MYC, MYB, KRAS, JAK2, IGF1R, IDH2, FOXO3, FOXO1, E2F3, E2F1, MAPK14, CDKN2A, CDKN1A, CDK6, CD44, CCNF, CCNE1, CCND3, CCND2, RUNX2, BCL2, CCND1, APC, akt2, akt1, ABCA1, etc.
Cerna nettverk bygging og KEEG pathway analyse
Basert på ovennevnte data (tabell 3 og 4), da laget en lncRNA-miRNA-mRNA Cerna nettverk. For å få mer robuste resultater, brukte vi den maksimale informasjon koeffisient (MIC) algoritme for å skjerme de par-wised relasjoner basert på uttrykket nivåer av lncRNA, miRNA, og mRNA i TCGA datasett (MIC 0,15 og MIC-p
2 0,15, se Methods). 14 lncRNAs og 17 mirnas var involvert i den foreslåtte Cerna nettverk (fig 2).
For å forstå signalveier involvert i Cerna nettverket, mRNA ble analysert ved DAVID database. Ifølge antall gener som er involvert, har vi listet de 15 KEGG trasé i vår studie (tabell 5). Ti kreft-relaterte pathways inkludert trasé i kreft, bukspyttkjertelkreft, melanom, prostatakreft, kronisk myelogen leukemi, tykktarmskreft, gliom, småcellet lungekreft, blærekreft, og ikke-småcellet lungekreft, ble beriket med mRNA, en annen 5 ikke-kreftrelaterte trasé som MAPK signalveien, brennvidde heft, cellesyklus, neurotrofin signalveien, T-celle reseptor signalveien ble også beriket.
P-verdi ble korrigert for multippel hypotesetesting ved hjelp av Benjamini- Hochberg metode (se også S3 Table)
Diskusjoner
Nylig lncRNAs har dukket opp som rikelig regulatorer av cellefysiologi i HCC og deres funksjoner kan variere [25, 26] . Bare noen få studier har forsøkt å avsløre lncRNA uttrykk profiler i HCC av microarray med dusinvis av eller enda mindre utvalgsstørrelse [13]. LncRNA og mRNA koekspresjon nettverk ble bygget av unormalt uttrykte lncRNA og mRNA [13]. Noen få studier som er beskrevet interaksjoner mellom miRNA og lncRNAs [27, 28] eller mRNA og lncRNA [29] i HCC, og resultatene av disse indikerte at lncRNAs kan fungere som en del av CERNA nettverk, men slik CERNA nettverk er fremdeles dårlig utforsket. I denne studien har vi identifisert kreftspesifikke lncRNAs i HCC og undersøkt deres distribusjoner i ulike kliniske egenskaper og deres foreninger med total overlevelse på grunnlag av genom-wide RNA profiler av 372 HCC vev og 48 tilstøtende ikke-tumor leveren vev. Videre bygget vi et Cerna nettverk med kreftspesifikke lncRNAs og mirnas som gir et system biologiske utsikt over lncRNA-miRNA-mRNA interaksjoner.
Basert på neste generasjons RNA sekvens data fra TCGA og GEO, har vi funnet at 177 kreftspesifikke lncRNAs ble uttrykt forskjellig i HCC tumorvev og tilstøtende ikke-tumor leveren vev. Så, vi viste at 41 kreftspesifikke lncRNAs ble også unormalt uttrykk i ulike grupper av kliniske patologiske funksjoner som kjønn, rase, svulst klasse, AJCC TNM staging system, AJCC patologisk stadium, vaskulær invasjon, ny svulst hendelse, tumorstatus og alder ved diagnose. Blant de lncRNAs som forskjellig uttrykt i tre eller fire grupper, ble MIR22HG rapportert å være en indikator på kjemiske stressresponser i menneskeskapte pluripotente stamceller [30]. Vi konkluderte med at ekspresjonen av enkelte lncRNAs ikke er likt fordelt i visse situasjoner. Fremtidige studier på dette feltet bør være riktig utformet for å takle dette faktum. Tidligere studier rapporterte seksuelle misforhold av HCC forekomsten [31], uttrykte forskjellig lncRNA mellom kvinnelige og mannlige funnet i denne studien kan bidra til dette fenomenet. Men disse ujevnt fordelt lncRNAs kanskje ikke signifikant assosiert med total overlevelse.
Når det gjelder sammenhengen mellom kreft bestemte lncRNAs og pasientenes overlevelse, fant vi at seks lncRNAs var knyttet til HCC total overlevelse. Blant de tre risikofylte lncRNAs, er CECR7 en kandidat lncRNA for Cat Eye syndrom [32]. Funksjonene til de andre to risikabelt og tre beskyttende nye lncRNAs er fortsatt uklart. Det bemerkes også at fem av disse seks lncRNAs (CECR7, LINC00346, LOC338651, FLJ90757, og LOC283663) ikke ble uttrykt forskjellig i noen klinisk funksjonen sammenligning. Derfor kan lncRNAs som ikke forskjellig uttrykk i kliniske funksjons sammenligninger være korrelert med total overlevelse, mens lncRNAs at forskjellig uttrykk i kliniske har sammenligninger ikke kan være nødvendig å bli assosiert med total overlevelse.
Vi tror at det kan være noen kryss-forhandlingene mellom lncRNA, miRNA og mRNA i fremdriften av HCC. Vi søkte flere tiltak for å øke nøyaktigheten av Cerna nettverksforslag. Først må vi bare inkludert kreftspesifikke lncRNAs og mirnas som hadde en absolutt ganger endring ≥ 3,0 og ble kommentert av GENCODE. For det andre, ble forholdet mellom lncRNA og miRNA, og miRNA og mRNA spådd av eksperiment støttes algoritmer eller databaser som miRcode, Base og miRTarBase. Disse to målingene sørget for at relasjonene identifiserte ville oppstå ikke bare
i silikoaluminofosfater
situasjoner, men også av eksperimentelle-støttet bevis.
For å ytterligere forbedre ytelsen til vår prediksjon, maksimal informasjon koeffisient (MIC ) algoritme og maksimal informasjonsbaserte nonparametric lete (mine) statistikk ble brukt til å filtrere par-wised relasjoner basert på lncRNA-miRNA-mRNA uttrykk sammenhenger. Generelt gen koekspresjon nettverksanalyse, er Pearsons korrelasjon et mål for lineær regresjon, men det er svært følsom for utliggere. MIC og MINE er i stand til å undersøke og karakterisere alle potensielt interessante relasjoner i et komplekst datasett [33].
Cerna nettverket vi bygget bringer frem i lyset en ukjent Cerna regulatoriske nettverk i HCC. I denne nylig identifiserte Cerna nettverk, mange onkogener og tumor dempere delta i HCC utvikling og behandlinger. En fersk studie identifiserte også at lncRNA-miRNA-mRNA interaksjoner var aktive og kan fungere som potensielle prognostiske biomarkører i kreft [34].
I konklusjonen, vår studie har funnet kreftspesifikke lncRNAs i HCC bruker hundrevis av kandidat lncRNAs og store prøver, og avslørt unormal uttrykk mønster av kreftspesifikke lncRNAs under forskjellige kliniske funksjoner. Viktigere, har vi bygget et Cerna nettverk for å foreslå en ny tilnærming til lncRNA forskning i HCC. Våre funn tyder på at kreftspesifikke lncRNAs i HCC kan delta i en kompleks Cerna nettverk.
Hjelpemiddel Informasjon
S1 Table. 177 og 37 forskjellig uttrykt lncRNAs mellom HCC vev og tilstøtende ikke-tumorvev i TCGA datasett og GEO datasett
doi:. 10,1371 /journal.pone.0141042.s001 plakater (XLS)
S2 Table. 33 HCC-forbundet mirnas mellom HCC vev og tilstøtende ikke-tumorvev i TCGA datasett
doi:. 10,1371 /journal.pone.0141042.s002 plakater (XLS)
S3 Table. Alle KEEG trasé beriket av de kodende gener involvert i Cerna nettverk (P 0,05)
doi: 10,1371 /journal.pone.0141042.s003 plakater (XLS)
Takk
Vi takker Mr. Rocky Ho for deres tekniske assistanse. Resultatene er publisert eller vist her er helt eller delvis basert på data generert av TCGA Research Network: https://cancergenome.nih.gov/. Denne studien ble støttet av SRFDP og RGC ERG Joint Research (No: M-CUHK406 /13). Og Natural Science Foundation National of China (No.81472339)