Abstract
microRNAs (mirnas) har vist seg å være lovende biomarkører i å forutsi kreft prognose. Imidlertid kan upassende eller dårlig optimalisert prosessering og modellering av miRNA uttrykket data negativt påvirke prediksjon ytelse. Her foreslår vi en helhetlig løsning for miRNA biomarkør utvalg og prediksjon modellbygging. Dette arbeidet innfører bruken av et nettverk kaskade, en kaskade konstitueringen av små kunstige nevrale nettverk enheter, for å vurdere miRNA uttrykk og pasient utfall. En miRNA microarray datasett av nasofaryngeal karsinom ble hentet fra Gene Expression Omnibus å illustrere metodikken. Resultatene viste en ikke-lineær sammenheng mellom miRNA uttrykk og pasient dødsrisiko, noe som tyder på at direkte sammenligning av uttrykket verdier er upassende. Men utfører denne metoden transformasjon av miRNA uttrykk verdier i en miRNA poengsum som lineært måler dødsrisiko. Spearman korrelasjon ble beregnet mellom miRNA score og overlevelse status for hver miRNA. Til slutt ble en ni-miRNA signatur optimalisert for å forutsi risikoen død etter nasopharyngeal carcinoma ved å etablere et nevralt nettverk kaskade bestående av 13 kunstige nevrale nettverk enheter. Arealet under ROC var 0,951 for den interne valideringssettet, og hadde en forutsigelse nøyaktighet på 83% for den eksterne valideringssettet. Spesielt ble det etablert nettverk kaskade funnet å ha sterk immunitet mot støy forstyrrelser som forstyrrer miRNA uttrykk verdier. Denne studien gir en effektiv og enkel å bruke metoden som tar sikte på å maksimere klinisk anvendelse av miRNAs i prognostisk risikovurdering av pasienter med kreft
Citation. Zhu W, Kan X (2014) Neural Network Cascade Optimaliserer mikroRNA biomarkør Utvalg for Nasofaryngeal kreft prognose. PLoS ONE 9 (10): e110537. doi: 10,1371 /journal.pone.0110537
Redaktør: Raffaele A. Calogero, Universitetet i Torino, Italia
mottatt: 7 august 2014; Godkjent: 15 september 2014; Publisert: 13 oktober 2014
Copyright:. © 2014 Zhu, Kan Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium , forutsatt den opprinnelige forfatteren og kilden krediteres
data~~POS=TRUNC tilgjengelighet:. forfatterne bekrefter at alle data som underbygger funnene er fullt tilgjengelig uten restriksjoner. Alle relevante data er i avisen og dens saksdokumenter filer
Finansiering:. Dette arbeidet ble støttet av National Natural Science Foundation of China (nr 31301136). Den Funder hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
microRNAs (mirnas) tilhører en klasse av små (~22 nt) endogene ikke-kodende RNA-molekyler. Mirnas spille viktige roller i regulering mRNA uttrykk og finjustering protein nivåer posttranscriptionally [1], [2]. Betydelige bevis har vist at mirnas kan tjene som lovende terapeutisk mål for klinisk behandling kreft i nær fremtid [3] – [5]. I mellomtiden er de potensielle kliniske anvendelser av diagnostiske og prognostiske biomarkører også mye studert og sterkt at nytten av å måle sirkulerende og vevsprøver mirnas [6] – [8]. På grunn av stadige teknologiske nyvinninger de siste årene, har høy gjennomstrømming metoder som miRNA microarray vært vellykket i identifisering av potensielle biomarkører fra tusenvis av modne mirnas hos mennesker [9], [10]. Som et resultat, har slike anstrengelser ført til en økende ansamling av miRNA ekspresjon data på den offentlige Gene Expression omnibus (GEO) database [11].
Samtidig påvisning av mange mirnas genererer et stort datasett av biologiske data som krever betydelig matematisk analyse. Selv om dagens miRNA sporingsteknologien er allerede godt etablert, er det fortsatt ingen anerkjent metode for å analysere den massive mengden av data innhentet av high-throughput metoder [12]. De aller fleste tidligere studier antatt en lineær sammenheng mellom miRNA uttrykk og sykdom fenotype [13] – [15]. Dette førte til bred anvendelse av enkle statistiske metoder som Student
t
-test eller analyse av varians test for mellom-gruppe sammenligning av miRNA uttrykk verdier. Men denne antakelsen er ikke spesifikt testet, eller vist seg å være gyldig. Alternativt, i stedet for et lineært forhold, spekulert vi at en ikke-lineær krets kan være mulig mellom miRNA ekspresjon og sykdoms fenotype. Denne antakelsen er i hovedsak basert på den kunnskapen som mirnas spille mangefasetterte og komplekse roller i mange biologiske prosesser [16]. Hvis den ikke-lineære forholdet er gyldig, kan det innebære at tradisjonell miRNA uttrykket databehandling, analyse og modellering med lineære metoder er utilstrekkelige.
feil valg av statistiske eller modellering metoder kan skade den potensielle ytelsen miRNAs som biomarkører og resultere i dårlig diskriminering av pasienter [17], [18]. Vi foreslår en mulig måte å løse dette problemet gjennom trans miRNA uttrykk verdier i en lineær variabel før etablere en diagnostisk eller prognostisk modell. Ved hjelp av denne foreslåtte metoden, har som mål denne undersøkelsen for å gi en helhetlig og generisk løsning for miRNA biomarkør utvalg og prediksjon modell konstruksjon. I de senere år har kunstig nevralt nettverk (ANN) modellering blitt brukt i kreftdiagnose og forvaltning [19] – [21]. Heri, ble en ny kunstig nevralt nettverk (ANN) modelleringsmetode etablert for dette formålet: nevralnettet kaskade (NNC), en utvidbar og pyramidelignende kaskade av små ANN enheter. Hver liten ANN enhet har enkel nettverksarkitektur og er begrenset til å håndtere med bare én oppgave, for eksempel datatransformasjon, dataintegrasjon, eller prediksjon utgang. I teorien kan et NNC modell samtidig huse og behandle store mengder informasjon i parallell. Selv om en enkelt inngang har dårlig logisk ytelse, så lenge som tilstrekkelig legge inn informasjon er gitt, blir et nøyaktig slutt forutsigelse garantert. Antallet inngangsparametere som inngår i modellen er avhengig av krav til nøyaktighet plassert på den endelige prediksjon.
For å bedre illustrere vår metode, har vi utviklet en NNC prognostisk modell for døden risikovurdering hos pasienter med nasofaryngeal karsinom (NPC) ved hjelp av en miRNA uttrykk datasett hentet fra GEO (datasett ID: GSE32960). Våre resultater tyder på en ikke-lineær sammenheng mellom miRNA uttrykk og død risiko for pasienter diagnostisert med NPC. Den etablerte NNC modellen viste god prediksjon ytelse ved nøyaktig identifisere høyrisikopasienter, selv i tilfeller hvor miRNA uttrykk nivåer var kunstig forstyrret. I sammendraget, skal en slik innsats for å analytisk forbedre nytten av miRNAs som kliniske biomarkører for å oppnå nøyaktig diagnose og individuell kreftbehandling. Vår vellykket case study analyse av NPC prognose med romanen NNC modellen tyder på at denne modellen vil også være gjeldende for diagnose og prognose av andre menneskelige sykdommer
Materialer og metoder
miRNA uttrykket data. Oppkjøp og pre-prosessering
miRNA uttrykket datasettet for pasienter med NPC (GSE32960) ble hentet fra GEO. Bare 312 NPC prøvene ble inkludert i vår studie. Vi har lastet ned de forhåndsbehandlet mikroarray ekspresjons-verdier for 873 mirnas for hver prøve og registrert overlevelse status (i live: 0 eller død: 1) av den tilsvarende pasient. Den opprinnelige microarray expression verdiene av hver miRNA var så normalisert som tall mellom 0 og 1 som beregnet nedenfor:
MAX_VALUE og MIN_VALUE er maksimums- og minimums opprinnelige miRNA uttrykk verdier i hele innsamling av prøver, henholdsvis. Etter dette ble prøvene tilfeldig delt inn i to sett: en modelltreningssett (n = 208) og en ekstern valideringssett (n = 104). For prøvene i treningssettet ble ANN programvaren Statistica Neural Networks (SNN, Release 4.0E) brukes til å bygge ANN enheter, som forvandler miRNA uttrykk verdier i miRNA score for hver av de 873 miRNAs. Ann enheter har tre lag: input variable, utgang variable, og en funksjon for å koble de to. Vi brukte de importerte normalis miRNA uttrykk verdier som input variabel og overlevelse status som utgang variabel. For det midterste laget, ble den avanserte versjonen av Intelligent Problemløser (IPS) verktøyet brukes til å bygge en radial basis funksjon (RBF) -Ann med 11 skjulte enheter. Nettverksutgangsverdier ble referert til som miRNA score, som ble antatt å være lineært assosiert med døden risiko for pasientene. Den nonparametric Spearman korrelasjonskoeffisient (Spearman R) ble beregnet til å vurdere lineær sammenheng mellom de normaliserte miRNA score og overlevelse status for hver pasient.
miRNA biomarkør utvalg og ANN modellbygging
Antatte mirnas biomarkører ble rangert og valgt på grunnlag av Spearman R-verdier. I denne studien valgte vi å beholde bare de ni mirnas med høyest R verdier og kast de andre. De normaliserte miRNA uttrykket verdier og normaliserte miRNA score til tre mirnas med de beste Spearman R verdier (MIR-29C, MIR-34C-5p, og MIR-93) ble brukt til å bygge de transformerte nevrale nettverksmodeller (UNN) og forvandlet nettverk (TNN), henholdsvis. Begge modellene hadde samme nettverksarkitektur (3-11-1). Alle de miRNA score til de ni mirnas ble så brukt for å bygge romanen ANN-modellen, som vi kalte nettverk kaskade (NNC). En NNC er sammensatt av mange ANN enheter. Hver ANN enhet er en uavhengig ANN modell. I en NNC modell, ble de primære ni ANN enheter brukes for de valgte ni mirnas å forvandle dem fra miRNA uttrykk nivåer i miRNA score. Hver enhet hadde et 1-11-1 nettverksarkitektur. Etter det ble en sekundær ANN enhet med en 3-11-1 rammeverk deretter bygget for å integrere utgangssignalene fra de tre dataomformingsenheter. I alt tre slike sekundære enheter var nødvendig for de ni miRNAs. Til slutt ble et tertiært ANN enhet som er bygget for å kombinere utgangene fra de ovennevnte tre sekundære ANN enheter. Den ultimate utgang er en numerisk prediksjon av dødsrisikoen for pasienter med NPC basert på deres miRNA genekspresjonssignaturer. Spesielt, heter vi alle modell utganger som miRNA score, uavhengig av deres opprinnelse fra Ann enheter eller kompositt modeller. I tillegg er en detaljert beskrivelse av NNC modellbygging ble gitt i Tekst S1.
Intern og ekstern validering
holdout kryssvalidering metoden ble brukt til å utføre intern validering for hver ANN enhet ved hjelp av standardinnstillingene for IPS verktøyet. 208 trening modellprøver ble tilfeldig delt inn i tre sett, blant annet treningssettet, verifikasjon set, og testing sett i et forhold på 02:01:01. Lineær regresjon ble brukt for å vurdere konsistensen av trening og testing sett utganger. Lignende korrelasjonskoeffisienter for trening og testing sett innebærer den gitte ANN enheten har god generalisering evne og
vice versa
. Videre ble et uavhengig sett som bestod av 104 prøver som brukes til å utføre ekstern validering av prediksjon nøyaktighet på den NNC modell. I tillegg til lineær regresjon, ble en mottaker drift karakteristikk (ROC) kurve analyse også utført for å vurdere prediksjon effektene av UNN, TNN, og NNC modeller ved hjelp av programvaren MedCalc (versjon 13.0). Den positive prediktive verdi (PV) på hver miRNA poengsum kriterium ble beregnet og brukt til å anslå sannsynligheten for dårlig prognose for de 104 pasientene i den eksterne valideringssettet.
Statistisk analyse
Student
t
-test ble brukt for sammenligninger mellom to overlevelse statuspasientgrupper med NPC fra ulike aspekter, inkludert miRNA uttrykk, miRNA score, og sannsynligheten for dårlig prognose. Analyse av arealet under ROC-kurven (AUROC) ble brukt for å sammen hver risiko prediksjon ytelse av miRNA score til ulike mirnas, miRNA uttrykk, og score av samme miRNA, eller slutt utgangene forskjellige ANN modeller [22]. Forskjeller ble ansett som statistisk signifikant når
p
. 0,05 for alle de statistiske metodene som brukes i denne studien
Resultater
Ni mirnas ble valgt som NPC prognostiske biomarkører fra 873 målte mirnas
Først vi normalisert og behandlet de opprinnelige miRNA uttrykket verdiene som ble lastet ned fra GEO datasett av genuttrykk hos pasienter med NPC (GSE32960). Deretter blir 312 pasientprøver ble tilfeldig delt inn i en modelltreningssett og en ekstern valideringssettet i et forhold på 2:01. I modellen treningssett, ble små ANN modeller med nettverksarkitektur for 1-11-1 brukes til å konvertere miRNA uttrykk verdier i miRNA score for hvert miRNA analysert. Programvaren GraphPad Prism 6.0 ble så brukt til å beregne Spearman R mellom miRNA score og pasient overlevelse status for hver av de 873 miRNAs. Til slutt, blant 873 mirnas, ni mirnas med de høyeste Spearman R verdier ble fremhevet: Mir-93, MIR-29C, MIR-34C-5p, MIR-202, MIR-145-stjerne, MIR-1292, MIR-26a, MIR-30e, og Mir-15b (i synkende rekkefølge av Spearman R-verdi). Mir-93 miRNA poengsum viste best lineær korrelasjon med overlevelse status (Figur 1A, Spearman R = 0,3091). Til sammenligning ble det la-7-stjerners miRNA poengsum seg å være irrelevant med NPC pasient overlevelse (figur 1B, Spearman R = 0,0075). Dette resultatet ble ytterligere bekreftet ved vår ROC-analyse (figur 1C). Den AUROC av prediksjon modellen ved hjelp av MIR-93 miRNA poengsum var betydelig høyere enn for prediksjon modellen ved hjelp av miRNA score på la-7e-stjerners (
p
= 0,0001). Videre har vi beregnet AUROCs for de andre åtte mirnas som ble valgt som potensielle biomarkører for NPC prognose. En stringent Korrelasjonsforbindelsen ble avslørt mellom verdiene til Spearman R og de av AUROCs (figur 1D). Dette resultatet antyder beregne Spearman R eller AUROC fører til tilsvarende effektivitet i evnen til å oppdage foretrukne biomarkører fra miRNA microarray eksperimenter.
A) En vesentlig lineær sammenheng eksisterer mellom de normaliserte MIR-93 score og pasient overlevelse status. Spearman R = 0,3091;
p
0,0001. B) Ingen signifikant lineær sammenheng ble funnet mellom norm la-7e-stjerners score og pasient overlevelse status. Spearman R = 0,0075;
p
0,895. C) AUROC sammenligning mellom dødsrisiko prediksjonsmodeller ved hjelp av MIR-93 og la-7e-stjerners score. En vesentlig forskjell ble observert (
p
= 0,0001). D) En perfekt lineær korrelasjon sammenheng ble funnet mellom Spearman R-verdier og AUROCs (n = 9).
p
. 0,0001
Uttrykk av ni kandidat mirnas biomarkører ble lineært relatert til overlevelse status
Scatter tomter ble trukket for å illustrere forholdet mellom miRNA uttrykk og miRNA score (Figur 2A). Som et resultat ble ingen lineær sammenheng oppdaget mellom miRNA uttrykk og miRNA score for de ni utvalgte kandidat miRNA biomarkører. Som miRNA stillingen er en lineær variabel vurdere risikoen død av pasienter med NPC, indikerer et slikt resultat et ikke-lineært forhold mellom miRNA ekspresjon og pasientens overlevelse statuser. Dette funn antyder også at direkte mellom-pasient sammenligning av miRNA uttrykk ikke kan være egnet for å forutsi prognose. Den miRNA MIR-15b ble brukt til å ytterligere undersøke dette punktet. I henhold til Spearman R-verdien ble MIR-15b valgt som en av de ni foretrukne miRNA biomarkører som indikerer NPC prognose. Men vi fant ikke noen forskjell i Mir-15b uttrykk mellom de to pasientgrupper med ulike overlevelses statusene av Student
t
-test (figur 2B). I motsetning til vår metode for å transformere miRNA genuttrykk verdiene i miRNA poengsum mulig for oss å kunne skille mellom de to pasientgruppene (figur 2C). Sammenlignet med miRNA uttrykk, miRNA stillingen ga en positiv forutsigelse, noe som ble ytterligere bekreftet ved ROC-analyse (figur 2D). Lignende resultater ble også observert i MIR-34C-5p, MIR-145-stjerne, MIR-202, og MIR-1292 (figur S1).
A) Illustrasjon av forholdet mellom normalisert miRNA uttrykk og normalisert miRNA scorene til de valgte ni miRNA biomarkører. B) Ingen signifikant forskjell ble observert i normalisert Mir-15b uttrykk mellom pasienter med overlevelses statusene «live» og «død». Gjennomsnitt ± SEM;
p
= 0,61. C) Mirna score til Mir-15b var signifikant forskjellig når pasienter med overlevelses statusene «levende» og «død» ble sammenlignet. Gjennomsnitt ± SEM;
p
0,0001. D) AUROC sammenligning mellom dødsrisiko prediksjonsmodeller ved hjelp av miRNA uttrykk og miRNA score til Mir-15b, henholdsvis. En vesentlig forskjell ble funnet (
p
= 0,0011).
Den NNC modellen viste best prediksjon av pasientens død risiko
I denne studien ble det bygd tre ANN-modeller for ytterligere å demonstrere betydningen av lineære transformasjonen av miRNA uttrykksverdier inn i en miRNA poengsum. Den UNN modellen var en tradisjonell ANN modell med 3-11-1 nettverk rammeverk bygget ved hjelp av de normaliserte miRNA uttrykket verdiene av MIR-29C, MIR-34C-5p, andmiR-93 som inngangsvariable. Med det samme nettverket rammer, TNN modellen brukt norm miRNA score av disse tre mirnas som input variabler. ROC-analyse avslører en bedre forutsigbar ytelse av TNN modell enn den til UNN modellen (figur 3A). Den siste ANN modellen vi inne var en NNC-modell, som hadde de mest komplekse nettverk rammeverk, som omfatter 13 ANN enheter som vist i figur 3B. Den NNC modellen har en AUROC av 0,951, noe som indikerer denne modellen har den beste prediktiv evne til å skille pasienter med ulike overlevelsesstatuser (figur 3A). Intern validering indikerer at den har god generalisering evne til prognosen prediksjon av pasientene utover modellering treningssettet (Figur 3B)
UNN: untransformed nevrale nettverk;. TNN: forvandlet nevrale nettverk; NNC: nettverk kaskade. Tr og Te representerer korrelasjonskoeffisienter mellom utgangsvariabelen og miRNA score på trening sett og testing satt i hver ANN enhet, henholdsvis.
Den NNC modellen viste sterk immunitet mot forstyrret miRNA uttrykket
Scatter tomter tydeligere vise diskriminerende effekt av ulike ANN modeller (Figur 4A). Sammenlignet med UNN eller TNN, er det lett å identifisere som NNC hadde best ytelse, til tross for at alle tre modellene kunne gi en betydelig skille pasienter med overlevelse status som «død» fra de med «levende» status (
p
0,0001). Den høye prediktive ytelsen NNC ble bekreftet da testet på de 104 pasientene som brukes til ekstern validering (figur 4B). Videre ROC-analyse viste at prediksjonsnøyaktigheten var 83% for å identifisere høyrisikopasienter ved hjelp av NNC modellen etablert her. Med tanke på mangfoldet av reelle pasienter i klinikken, vi også undersøkt anti-forstyrrelser evne forskjellige modeller ved å erstatte Mir-93 miRNA uttrykk verdier med de av la-7e-stjerners. I denne studien hadde utleid-7e-stjerners miRNA poengsum vist noe forhold til døden risiko for pasienter diagnostisert NPC (figur 1B og C). Resultatet av denne swap fant at UNN ikke kunne overleve hvis Mir-93 expression verdiene ble alvorlig forstyrret (Figur 4C). Det er ingen vesentlig forskjell i miRNA score mellom to pasientgrupper i denne modellen (
p
= 0,20). Til sammenligning de to andre modellene, spesielt NNC modellen, viste fortsatt robust ytelse skille pasientens status.
Sammenligninger av miRNA score ble utført mellom pasienter med ulike overlevelsesstatuser i modellen treningssett (A) og eksterne valideringssett med normal MIR-93 uttrykk inngang (B) og med forstyrret MIR-93 uttrykk inngang (C). UNN: untransformed nevrale nettverk; TNN: forvandlet nevrale nettverk; NNC. Nevrale nettverk kaskade
I tillegg vurderte vi sannsynligheten for en dårlig prognosisfor hver pasient med NPC. Den midlere sannsynlighet for pasientene med overlevelsen status av «levende» var 0,50, noe som indikerer at dødsrisikoen fremdeles eksisterer for denne pasientgruppen (figur 5A). Sammenlignet med UNN eller TNN, NNC mest nøyaktig estimert død risikoen for pasienter med overlevelsen status av «døde», selv i situasjoner hvor ekspresjonen av MIR-93 ble alvorlig forstyrret (figur 5B). Dette funnet antyder at NNC modellen kan ha sterk immunitet mot støy forstyrrelser forårsaket av ukjente faktorer.
A) Normal MIR-93 uttrykk inngang. B) Disturbed MIR-93 uttrykk inngang. UNN: untransformed nevrale nettverk; TNN: forvandlet nevrale nettverk; NNC: nettverk kaskade. Alle data er uttrykt som gjennomsnitt ± SEM.
Diskusjoner
mirnas er allment antatt å være den mest lovende klasse av endogene stoffer til kliniske diagnostiske og prognostiske biomarkører for kreft [23]. Denne overbevisningen har bedt forskere over hele verden til å utføre sykdomsspesifikke miRNA uttrykk profilering i et omfattende felt av kreftforskning [24], [25]. I denne studien forsøker vi for første gang å presentere en generisk fremgangsmåte for å oversette miRNA ekspresjonsdata til klinisk relevante språk, for eksempel muligheten for å ha kreft eller risikoen for dårlig prognose grunn lider av kreft. Kort fortalt ble en beregningsmodell konstruert ved å integrere mange små enkeltfunksjons ANN heter til en kaskade nettverk system. Vi kalte den nevrale nettverk kaskade. Vi viste at det nevrale nettverk kaskade var effektiv for å identifisere død risikoen for pasienter diagnostisert med NPC.
Den teoretiske hjørnestein for NNC modellen etablert her er forutsetningen at miRNA uttrykk ikke kan være lineært assosiert med kliniske fenotype indikatorer . Denne hypotesen er rimelig og realistisk gitt kompleksiteten av miRNAs engasjement i menneskets biologi [16], [26], [27]. Basert på denne antagelsen, bør miRNA uttrykk bli omdannet til en lineær variabel før det kan brukes for å vurdere muligheten for kliniske konsekvenser, slik som det hvorvidt en pasient har høy risiko for å dø på grunn av kreft. Våre resultater støtter gyldigheten av hypotesen. Vi fant en ikke-lineær sammenheng mellom miRNA uttrykk og død risiko for pasienter med NPC. Dette funnet innebærer betydningen av miRNA uttrykket data forbehandling før noen miRNA baserte kliniske beslutninger fattes
Til forskjell fra tradisjonelle nevralt nettverk som tidligere er brukt i kreftdiagnose og behandling [19] -. [21], den NNC gjorde ikke direkte bruke miRNA uttrykk. Snarere NNC forvandler første miRNA genuttrykk i en miRNA score, en lineær variabel for å vurdere klinisk fenotype. Som et resultat av miRNA scorer i stedet for miRNA uttrykket ble brukt i den hensikt å velge potensielle miRNA biomarkører og endelige beslutninger. I NNC-modellen, ble den transformasjon og integrasjon av data og slutt prediksjon utgang oppnås trinnvis. Dette sikrer generelle beregnings forenkling av modellen drift. En annen fordel med NNC er at hver miRNA er tilordnet en uavhengig kanal for informasjon om inndata. Ved en slik konstruksjon, hvis er behov for flere mirnas for bedre forutsigelse, kan man utvide omfanget av NNC modellen uten å øke kompleksiteten nettverk av en enkelt enhet. Dette gjør NNC modellen fritt kan utvides i henhold til spesifikke krav. Ekspresjonsdata av forskjellig mirnas kan betraktes som diverse informasjon bidra til vår nåværende kunnskap om død risiko for pasientene. I vår studie var inkludering av flere mirnas resulterte i bedre spådommer. Den TNN inneholdt tre mirnas og hadde en AUROC av 0,862. I motsetning til dette NNC modellen hadde en AUROC av 0,951, som inneholdt 9 mirnas. Det er imidlertid også mulig at en større NNC modell for NPC prognose kan inneholde mer enn ni mirnas. De ni mirnas brukes i NNC modell her bare servert som en metodikk illustrasjon.
Våre eksterne validerings resultater fra UNN og TNN indikerer at lineær transformasjon av miRNA uttrykket særlig forbedrer prediksjon effekten av modellen. Viktigere, har denne fremgangsmåte ikke øke antall miRNA biomarkører som kreves, noe som innebærer den fordel at ved hjelp av en kaskadestruktur av ANN. I tillegg fant vi at kaskade ANN grunnloven hadde en mer robust ytelse enn den tradisjonelle ANN-modellen, hvor uforklarlig variasjon i MIR-93 uttrykk forårsaket en feil ANN enhet. Selv ikke i stand til å beregne graden av slike forstyrrelser på sykdom prognose i faktiske kliniske settinger, er det fortsatt mulig at denne variasjonen vil være en viktig faktor som hindrer miRNA-baserte prediksjonsmodeller i praksis. Sammenligning av TNN og NNC modeller tyder på at inkludering av flere mirnas ville øke robustheten i etablert ANN modellen mot støy.
I konklusjonen, vår studie gitt en rasjonell og gjennomførbare metoden for miRNA biomarkør utvalg og prediksjon modell etablering . Fordelen med en kaskade bygging av små kunstige nevrale nettverk enheter blir reflektert fra flere sider, inkludert skalerbar kapasitet og fleksibel kombinasjon av miRNA uttrykk innganger, bedre prediksjon med robust stabilitet, og større muligheter for meningsfull modellering dersom antall miRNA biomarkører er ubegrenset. I fremtiden bør flere forsøk gjøres for ytterligere å validere bruk av vår tilnærming ved å oversette miRNA uttrykk data til klinisk relevant informasjon for diagnose og prognose av kreft.
Hjelpemiddel Informasjon
Figur S1. Host Sammenligning av miRNA uttrykk og miRNA score mellom de to pasientgrupper med ulike overlevelsesstatuser. A) MIR-26a; B) MIR-29b; C) MIR-30e; D) MIR-34C-5p; E) MIR-93; F) MIR-145-stjerne; G) MIR-202; H) MIR-1292. Alle data er uttrykt som gjennomsnitt ± SEM
doi:. 10,1371 /journal.pone.0110537.s001 plakater (TIF)
Tekst S1.
En trinn-for-trinn prosedyre for NNC modellbygging
doi:. 10,1371 /journal.pone.0110537.s002 plakater (docx)