Abstract
Bakgrunn
Lungekreft er fortsatt den ledende årsak til kreft-relaterte dødsfall på verdensbasis. Tilbakefallsprosenten varierer fra 35-50% blant tidlig stadium ikke-småcellet lungekreft pasienter. Til dags dato er det ingen fullt validert og klinisk brukt prognostisk gen signatur for personlig behandling.
metodikk /hovedfunnene
Fra genom-wide mRNA uttrykk profiler generert på 256 lunge adenokarsinom pasienter, en 12-genet signaturen ble identifisert ved hjelp av kombi genet seleksjonsmetoder, og en risiko poengsum algoritmen ble utviklet med
naive Bayes
. Den 12-genet modell skaper betydelige pasientutvelgelse i opplæringen kohorten HLM UM (
n
= 256, log-rank
P
= 6.96e-7) og to uavhengige valideringssett, MSK (
n
= 104; log-rank
P
= 9.88e-4) og DFCI (
n
= 82, log-rank
P
= 2.57e-4), analyser ved hjelp av Kaplan-Meier. Dette genet signatur stratifiserer også stadium I og IB lunge adenokarsinom pasienter i to atskilte overlevelse grupper (log-rank
P
0,04). Den 12-genet risikoscore er mer signifikant (hazard ratio = 4,19, 95% KI: [2,08, 8,46]) enn andre vanlige kliniske faktorer unntatt tumorstadium (III vs. I) i multivariat Cox analyser. Den 12-genet modellen er mer nøyaktig enn tidligere publiserte lungekreft genet signaturer på de samme datasettene. Videre denne signaturen spår nøyaktig chemoresistance /kjemosensitivitet til cisplatin, karboplatin, Paclitaxel, Etoposide, Erlotinib og Gefitinib i NCI-60 kreftcellelinjer (
P
0,017). De identifiserte 12 gener utviser kuratert interaksjoner med store lungekreft signal kjennetegnene i funksjonell sti analyse. Uttrykket mønstre av signatur gener har blitt bekreftet i RT-PCR-analyser av uavhengige tumorprøver.
Konklusjon /Betydning
Resultatene viser den kliniske nytten av de identifiserte genet signatur i prognostisk kategorisering. Med denne 12-genet risikoscore algoritme, kan tidlig stadium pasienter med høy risiko for svulst tilbakefall identifiseres for adjuvant kjemoterapi; mens stadium I og II pasienter med lav risiko kan bli spart giftige bivirkninger av cellegifter
Citation. Wan Y-W, Sabbagh E, Raese R, Qian Y, Luo D, Denvir J et al. (2010) Hybrid Modeller Identifiserte en 12-Gene Signatur for Lung Cancer Prognoser og Chemoresponse Prediction. PLoS ONE 5 (8): e12222. doi: 10,1371 /journal.pone.0012222
Redaktør: Jörg Hoheisel, Deutsches Krebsforschungszentrum, Tyskland
mottatt: 4 mai 2010; Godkjent: 20 juli 2010; Publisert: 17 august 2010
Copyright: © 2010 Wan et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Denne studien støttes av NIH /NLM R01LM009500 (PI: Guo) og NCRR P20RR16440 og Supplement (PD: Guo). Programvarelisensen og opplæring for IPA og Pathway Studio ble støttet av NIH /NCRR P2016477. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Lungekreft er den ledende årsak til kreft-relaterte dødsfall i industrialiserte land [1]. Lokal og fjernmetastaser er den viktigste årsaken til behandlingssvikt (dvs. dødsfall) i lungekreft. Foreløpig er kirurgi den fremste behandlingsalternativ for pasienter med stadium I ikke-småcellet lungekreft (NSCLC). Imidlertid 35-50% av fase I NSCLC pasienter vil få tilbakefall i løpet av 5 år [2], [3]. Det er fortsatt en viktig utfordring å bestemme risikoen for tilbakefall i tidlig stadium kreftpasienter. Pasienter med høy risiko for tilbakefall kan ha nytte av adjuvant kjemoterapi, mens de med lav risiko for svulst tilbakefall kan bli spart av bivirkningene av cellegift. Etter dette, en annen kritisk problem i klinikker er å finne en individuell pasients predisposisjon for en bestemt kreft narkotika. Den nye bruken av biomarkører kan gjøre det mulig for leger å ta behandling på grunn av de spesielle egenskapene til enkeltpasienter og deres svulst, istedenfor bare av på befolkningsstatistikken [4].
Fremskritt i microarray teknologi gi løftet i den molekylære prediksjon av individuell klinisk utfall. Slik suksess er manifestert av de kommersielle genet tester for brystkreft, Oncotype DX [5] og MammaPrint [6], [7]. Likevel har høy dimensjonalitet data kompliserte store diagnostiske og prognostiske gjennombrudd [8] og setter en premie på innovative data mining metoder. I dagens biomarkør identifikasjons studier, er gener rangeres etter deres tilknytning til det kliniske utfallet, og den øverste rangerte gener er inkludert i klassifikator. Det har blitt bemerket at enkelte biomarkører viser sterk sammenheng med utfallet er ikke nødvendigvis gode classifiers [9] – [11]. Videre har hver enkelt gen seleksjonsalgoritmen forskjellige styrker og begrensninger. . En hybrid modell som kombinerer flere genet seleksjonsmetoder kan bedre identifisere nye biomarkører fra high-throughput data for klinisk nytte
Det har vært noen studier på lungekreft prognose ved transkripsjonen profilering [12] – [19]. Til dags dato er det ingen fullt validert og klinisk anvendt modell for å forutsi lungekreft gjentakelse [20]. Denne studien viser et kombinatorisk gen utvalg system for identifikasjon av en 12-gen lungekreft prognostisk signatur. Denne 12-genet signatur er mer nøyaktig i forhold til tidligere publiserte underskrifter i en multi-institusjonelle studie av lunge adenokarsinom (
n
= 442) [19]. Denne 12-genet signatur kunne identifisere stadium I og stadium II pasienter som kan ha nytte av adjuvant kjemoterapi og som kunne bli spart for det. Kvantitativ RT-PCR-analyser av uavhengige NSCLC vevsprøver bekreftet genuttrykksmønster av de identifiserte biomarkører i form av svulst egenskaper. En funksjonell sti analyse da avslørt at signaturen genene hadde samhandling med godt etablerte kreft kjennetegnene, og oppgi de viktigste rollene i signatur gener i startfasen og progresjon. Videre er 12-genet signatur nøyaktig spådde chemoresistance og kjemosensitivitet til cisplatin, karboplatin, Paclitaxel (Taxol), Etoposide, Gefitinib og Erlotinib i et panel av 60 kreftcellelinjer (NCI-60).
Resultater
Prognostic modellsystem
i det post-genomisk æra, hybridmodeller som kan dra nytte av ulike algoritmer i ulike stadier av genet utvalg er nødvendig for biomarkører og sykdom klassifisering. I denne studien kombinert vi statistiske metoder og maskinlæring algoritmer for å identifisere prognostiske biomarkører av lunge adenokarsinom. Den kirurgiske reseksjoner samlet inn fra University of Michigan Cancer Center (UM) og Moffitt kreftsenter (HLM) danner treningssettet (
n
= 256), mens prøvene hentet fra Memorial Sloan-Kettering Cancer Center (MSK
n
= 104) og Dana-Farber Cancer Institute (DFCI,
n
= 82) utgjør to uavhengige valideringssett. De kliniske kjennetegn ved pasientkullene ble beskrevet i forrige publisering [19]
Den prognostiske Studien omfatter tre faser (Fig. 1):. 1) identifikasjon av et lite sett med signatur gener ved å kombinere Betydningen Analyse av mikromatriser (SAM) [21], forskjellig varians
t
-UNDERSØKELSER, og
Relief
algoritme fra genom-skala transkripsjons profiler av opplæringen kohorten (UM HLM), 2) bygging av en klassifikator å bruke
Naive Bayes
algoritme for å forutsi total overlevelse i lungekreftpasienter, og 3) validering av genuttrykk baserte prognostisk modellen i to uavhengige pasient kohorter (MSK og DFCI). Uavhengige testsett ble brukt i modellen validering og evaluering av de identifiserte genet signatur i løpet av tidligere utgitt lungekreft prognostiske signaturer.
Identifisering av en 12-genet prognostisk signatur
En kombi ordningen med flere genet seleksjonsmetoder ble vedtatt i prosessen med å identifisere en lungekreft prognostisk gen signatur. Det første trinnet valgt kandidat gener fra 22,283 sonder kvantifiseres på trenings kohort (
n
= 256). En kombinasjon av
t
-UNDERSØKELSER og SAM ble så brukt til å velge gener med uttrykk nivåer vesentlig forskjellig mellom lav risiko (pasient som overlevde lengre enn 5 år) og høy risiko (de som døde innen 5 år etter kirurgi) grupper med en forhåndsdefinert falske funnrate. Tjuesyv sensurert tilfeller med oppfølgings tid mindre enn 5 år ble fjernet fra denne analysen på grunn av usikkerhet om pasientens postoperative status. Spesielt en annen-varians
t
-test valgt 718 gener med betydelig differensial uttrykk (
P
0,01) mellom de to prognosegrupper. For å kontrollere falske funnrate (
FDR
), SAM ble brukt til å velge 1,431 gener som i vesentlig grad differensiert de to prognostiske grupper på en
FDR
på 25% (
delta
= 0,46). Det var 583 gener som er valgt av både
t
-UNDERSØKELSER og SAM, og disse ble ansett for den neste fasen av analysen.
For å avgrense genet satt inn i en mer gjennomførbart størrelse for klinisk anvendelse,
Relief
algoritme implementert i WEKA 3.4 ble brukt til å rangere hver av disse 583 gener i form av makt for å skille lav risiko og høyrisikogrupper. Denne rangert liste ble anvendt i en trinnvis fremover valg for å identifisere et gen delsett med høyeste nøyaktighet forutsigelse. Nærmere bestemt starter fra toppen rangeres-genet, ble en gen tilsatt i hvert trinn for å genet settet, inntil klassifiseringen nøyaktighet ikke kan forbedres ved tilsetning av en mer genet. Dette genet sett ble brukt til å klassifisere god prognose og dårlig prognose grupper med
Naive Bayes
algoritme. Denne prosessen stoppes når tillegg av et nytt gen ikke økte klassifisering nøyaktighet som vurderes i et 10-fold kryssvalidering. Som et resultat, en 12-gen signatur (tabell 1) ble identifisert som kunne gi best prediksjon for total overlevelse.
Survival prediksjon ved hjelp av 12-genet prognostisk modell
Ved hjelp av mRNA uttrykk profiler av de identifiserte 12 gener som prediktorer, ble en prognostisk klassifikator konstruert for å stratifisere pasienter i lav-risiko (5-års overlevelse) og høy risiko (ikke-fem-års overlevelse) grupper.
Naive Bayes
klassifikator implementert i WEKA 3.4 ble brukt i klassifiseringen på UM HLM opplæring prøver (lav-risiko
n
= 104; høy-risiko
n
= 125). Tjuesyv sensurert tilfeller uten tilstrekkelig oppfølging informasjonen ble fjernet i modellen konstruksjonen. Priors estimert av modellen er 0,45 for lav risikoklasse og 0,55 for høy risikoklasse. Andre parametere for trent
Naive Bayes
modell, inkludert gjennomsnitt og standardavvik for hver av de 12 gener i både lav- og høyrisikogrupper, oppført i tabell 2.
naive Bayes
klassifikator beregner bakre sannsynligheten for død innen 5 år etter operasjonen i hver pasient. Dette posterior sannsynlighet representerer risiko for svulst tilbakefall hos pasienter, siden tilbakefall er den viktigste årsaken til behandlingssvikt (dvs. død) i lungekreft. Basert på den bakre sannsynlighet, blir en pasient klassifisert inn i høyrisikogruppen hvis verdien er større enn 0,5; eller inn i lav-risikogruppe ellers. Treningen modellen ble evaluert i en 10-fold kryssvalidering. Uten parameter re-estimering, ble denne modellen så brukt til å forutsi posteriori sannsynlighet som representerer risiko for tumor tilbakefall hos hver enkelt pasient i to testsett (MSK og DFCI), så vel som sensurerte tilfeller utelatt fra modellen konstruksjonen. Fordelingen av den bakre sannsynlighet av 442 pasienter i denne studien ble illustrert på fig. 2A. Etter å ha fått den anslåtte resultater, ble Kaplan-Meier (KM) analyse gjennomført for å beregne gjennomsnittlig overlevelse sannsynlighet på 5-års merket etter operasjonen. Resultatene viser at høyrisiko posteriors fra den prognostiske modellen er sterkt forbundet med 5 års overlevelsessannsynlighet (Fig. 2B). Pasienter med en høy sannsynlighet for tumorresidiv tendens til å være mer sannsynlig å ha behandlingssvikt etter operasjonen. Dette indikerer at høy-risiko posteriori sannsynlighet beregnes av modellen er en god prognostisk faktor for lungekreft overlevelse. Den brede 95% konfidensintervall på posteriors spenner 0,35 til 0,6 (Fig. 2B) kan være på grunn av den lille størrelsen på utvalget i denne distribusjonen (Fig. 2A). Videre, en bakre på 0,5 betyr at sjansen for tumorresidiv er tilfeldig, noe som også fører til en løsere konfidensintervall.
(A). Histogram som viser fordelingen av risiko score (bakre sannsynlighetene for høy risiko) i 442 lunge adenokarsinom pasienter. (B). Gjennomsnittlig rente for døden på fem år etter operasjonen som tilsvarer 12-genet risikoscore (posterior mulighet). De stiplede linjene representerer 95% konfidensintervall.
Ved hjelp av den prognostiske kategorisering ordningen beskrevet ovenfor, 12-genet signatur atskilt pasienter i høy- og lav-risikogrupper med betydelig distinkte (log-rank
P
= 6.96e-7) postoperativ overlevelse på trenings kohort i Kaplan-Meier analyse (fig. 3A). Denne ordningen genererte betydelige pasientutvelgelse på uavhengig validering setter MSK (log-rank
P
= 9.88e-4, Fig. 3B) og DFCI (log-rank
P
= 2.57e-4 fig. 3C). Den 3-årige postoperativ overlevelse for lav-risikogruppene er 79-94% i de undersøkte kohorter, som representerer en betydelig bedre prognose sammenlignet med tilsvarende høyrisikogrupper som 3-års overlevelse varierer fra 48% til 63 %. Når 3-års overlevelse ble brukt til å definere høy og lav-risikogrupper (høy risiko: døden innen tre-y, lav-risiko: live etter tre-y), oppnådde 12-genet risiko algoritme en følsomhet (korrekt spådde høyrisikopasienter) på 73,65% i treningssettet, 86,96% i MSK, og 68,18% i DFCI, og en spesifisitet (korrekt spådde lav-risiko pasienter) av 59,21% i treningssettet, 57,75% i MSK, og 76,36 % i DFCI (tabell S9). Sensitivitet og spesifisitet av 12-genet signatur i å forutsi 5-års overlevelse er også gitt i tabell S9
Modell stratifisert pasientene i to signifikant forskjellig (log-rank
P
6.96e-7) prognostiske grupper i treningssettet (A) i 10-fold kryssvalidering. Treningen modellen ble anvendt på to testsett (B og C) og skapt betydelige pasient lagdeling. Denne modellen skilt (log-rank
P
0,04) stadium I pasienter i begge testsett (D og E) samt stadium IB pasienter (log-rank
P
4,73 e-3) fra testsett (F).
i dagens praksis, behandling for pasienter diagnostisert med NSCLC er basert på AJCC tumorstadium. Kirurgisk reseksjon er den viktigste behandlingsalternativ for stadium I NSCLC pasienter. Men ca 35-50% av stadium I NSCLC pasienter vil utvikle og dø fra tumorresidiv innen fem år etter operasjonen [2], [3]. På den annen side, trinn IB pasienter som fikk kirurgisk reseksjon etterfulgt av adjuvant kjemoterapi viste forbedret overlevelse [22]. Derfor søkte vi å undersøke om 12-genet signatur kunne identifisere spesifikke høyrisikopasienter med stadium I svulster. Resultatene viser at 12-genet prognostisk signatur kan sikkert identifisere høyrisikopasienter med stadium I svulster på både trening kohort (resultater ikke vist) og to validerings kohorter (log-rank
P
= 0,04; fig. 3D og 3E). Den prognostiske modellen også skilt høy- og lav-risikogrupper (log-rank p = 4.73e-3) innen scene IB pasientene i den kombinerte testsett (Fig. 3F). Den 12-genet signatur ikke generere betydelig prognostisk lagdeling på scenen IA pasienter (resultater ikke vist). Disse resultater viser at det identifiserte 12-genet signatur er uavhengig av og gir mer raffinert prognose enn dagens AJCC staging system. Ved hjelp av denne modellen, stadium I NSCLC pasienter kan bli bedt om å motta adjuvant kjemoterapi i henhold til uttrykk profiler av de 12 genetiske markører.
Behandling utvalg for stadium I og II NSCLC pasienter basert på 12-genet signatur
for å kunne vurdere om 12-genet signaturen kunne brukes til behandling valg for stadium i og II ikke-småcellet lungekreft, ble pasientene som ikke fikk kjemoterapi valgt for videre analyse. Den prognostiske modellen skilles høy- og lav-risiko stadium I pasienter uten kjemoterapi i opplæringen (UM HLM, log-rank
P
= 0,04; fig 4A.) Og test kohorter (MSK DFCI; log-rank
P
= 0,02, fig. 4B). Tilsvarende modell differensiert høy- og lav-risiko stadium II pasienter uten kjemoterapi i opplæringen (log-rank
P
= 0,06, Fig. 4C) og test kohorter (log-rank
P
= 0,03, fig. 4D) i Kaplan-Meier-analyser. Resultatene tyder på at dette genet uttrykk definert prognostisk modell kunne velge en pålitelig måte pasienter med tidlig stadium NSCLC for adjuvant kjemoterapi. I mellomtiden kan det også spare noen stadium I og II NSCLC pasienter fra kjemoterapi basert på uttrykk mønstre av de identifiserte genet markører i svulstene.
12-genet signatur skilles høy- og lav-risikogrupper fra pasienter som ikke fikk kjemoterapi (log-rank
P
0,05) i følgende årskull: (A) stadium i pasienter fra trening årsklasse, (B) stadium i pasienter fra to test kohorter, (C) stadium II pasienter fra treningen årsklasse, (D) stadium II pasienter fra de to test kohorter.
Prognose evaluering av 12- gensignaturen med kliniske kovariater
for å bekrefte den prognostiske kraften i den identifiserte 12-genet signatur, ble uttrykket definert prognostisk modell evalueres med vanlig brukte prognostiske faktorer av lungekreft, inkludert kjønn, alder, og tumorstadium på de kombinerte test gruppene (DFCI og MSK). Den bakre Sannsynligheten for høy risiko, betegnet som 12-genet risiko score, ble brukt som en kovariat i multivariat Cox analyse (tabell 3). Uten 12-genet risikoscore, tumor stadium var den eneste faktoren signifikant (
P
0,00006) forbundet med økt risiko for lungekreft død. Når 12-genet risk score ble tilsatt til den multivariate Cox-modellen, 12-genet risiko stillingen vist en sterk assosiasjon med lungekreft overlevelse (HR = 3,94, 95% CI: [2,07, 7,52]), og tumorstadium forble signifikant (Tabell 3). Tilsvarende ble en omfattende evaluering utført med alle tilgjengelige kliniske kovariater og demografiske data i datasettet, inkludert røyking historie, rase, og tumor differensiering (tabell 4). I denne omfattende evaluering, forble den 12-genet risikoscore en svært signifikant prognostisk faktor med en hasardratio på 4,19 (95% KI: [2,08, 8,46]). I begge multivariate analysene fare forholdstall på 12-genet risikoscore algoritmen var høyere enn andre kliniske kovariater unntatt tumorstadium (III vs. I), mens det er ingen signifikant forskjell mellom hasardratio på 12-genet signatur og tumor scene. Disse resultatene viser at 12-genet signatur er en mer nøyaktig prognostisk faktor enn noen vanlige kliniske parametre.
Sammenligning med andre lungekreft gen signaturer
I studien av Shedden et al. [19], prognostiske classifiers ble konstruert med genekspresjonssignaturer alene eller genekspresjonssignaturer kombinert med kliniske kovariater. Blant tolv genet signaturer som er identifisert i deres studium (tabell S7), ble den beste signaturen rapportert som «metode A» (referert til som «Shedden A» i denne studien), som inneholder omtrent 9591 gener /prober. For å sammenligne den prediktive resultatene av vår prognostisk modell med sitt beste modellen, ble det anslått hasardratio og samstemmighet sannsynlighet estimat (CPE) av modellene evalueres. Hazard ratio større enn 1 indikerer at pasienter med høye spådd risiko score har dårlig klinisk utfall. Modellen har sterk prediktiv kraft hvis CPE verdien er nær 1; CPE verdi nær 0,5 indikerer at modellen har dårlig prediktiv kraft (kan sammenlignes med tilfeldig prediksjon). Resultatene viser at den foreslåtte 12-genet signatur har den høyeste hazardratio og CPE i begge testsettene i forhold til genet signaturer fra Shedden et al. [19] (Fig. 5)
For å vurdere 12-genet signatur med tidligere publiserte 14 lungekreft signaturer [12], [13], [16] -. [19], [22 ] – [25] (tabell S6), Gene sett Enrichment Analysis (GSEA) ble brukt til å vurdere anrikning av disse signaturene på 5 års overlevelse. Den normaliserte berikelse score (
NES
) og den tilsvarende falske funnrate (
FDR
) knyttet til hvert gen signatur ble evaluert på alle 442 prøvene som brukes i denne studien. Generelt et gen satt med høy
NES Hotell og lav
FDR
er ønskelig, så det tyder på at genet sett uttrykker Variert med hensyn til klinisk utfall og funn er usannsynlig å være med sjanse. I forhold til 14 andre publiserte gen signaturer, viser 12-genet signatur høy berikelse i pasientgruppen som overlevelse er lengre enn fem år med betydelig lav
FDR plakater (absolutt
NES
= 1,5;
FDR
. 0,10) (figur S1). I denne analysen, den mest beriket signatur med lavest
FDR
var SHEDDEN_MH av 244 gener (absolutt
NES
= 2,00;
FDR
0,002). Totalt sett, blant de 15 gensettene studert, er 12-genet signatur en av de beste lungekreft signaturer evaluert med GSEA.
RT-PCR Validering av genuttrykksmønster
For å videre bekrefte uttrykket mønstre av de identifiserte 12 genene, ble RT-PCR-mikrofluid lav densitet matriser anvendes for å analysere uavhengige NSCLC-tumorprøver. Først ble 12-genuttrykksmønster hentet fra både microarray og RT-PCR forhold i form av lymfeknutemetastase (Fig. 6A). På RT-PCR-data normalisert med
POLR2A
, genekspresjon brette forandringer av de 12 gener i lymfeknute positive (LN +) versus lymfeknute negativ (LN) prøver ble sammenlignet med dem i mikroarray data fra et Shedden al [19]. Resultatene viser at mRNA-ekspresjon mønstre av 12-genet signatur målt i begge plattformene er overensstemmende i form av lymfeknutemetastase. Så, for å bekrefte genuttrykksmønster i form av total overlevelse, brett endringer mellom lav risiko (live etter 3 år) og høy risiko (død innen 3 år) gruppene ble også sammenlignet (Fig. 6C). Tre års overlevelse ble brukt til å holde balansen i høy-risiko (
n
= 11) og lav-risiko (
n
= 12) grupper i RT-PCR kohort. Alle genmarkører utstilt konsekvent uttrykk mønstre i løpet overlevelse unntatt
XPO1
i begge plattformene.
Gene uttrykk ganger endring i lymfeknute positive (LN +) pasienter vs. lymfeknute negative (LN) pasienter ble sammenlignet med (A). Prøver som inngår i falsen endringen sammenligning ble sammenfattet i (B). Genuttrykk ganger endring i høy-risiko (død innen tre-y) vs. lav risiko (live etter tre-y) grupper ble også sammenlignet med pasienter med oppfølgingsinformasjon (C). RT-PCR data ble normalisert med POLR2A i en prøve-klok måte. DNA microarray data ble hentet fra Shedden et al [19]. En stjerne (*) ble satt over en bar hvis det genet viste signifikant differensial uttrykk i
t
-UNDERSØKELSER (
P
0,05).
Tippe av chemoresponse i NCI-60 cellelinjer
Etter bygger den kliniske relevansen av 12-genet signatur i å forutsi lunge adenokarsinom total overlevelse, vi søkt å undersøke om signaturen kan forutsi chemoresponse til anti-lunge kreft agenter, inkludert cisplatin, Karboplatin, Paclitaxel, Etoposide, Erlotinib og Gefitinib. Her blir NCI-60-cellelinjer, uavhengig av vev opprinnelse, ble anvendt i studien. For hvert legemiddel, ble cancer cellelinjer som enten er sensitiv eller resistent overfor medikamentet tatt med for å bygge opp en chemoresponse klassifikator basert på den 12-genekspresjonsprofiler i cellelinjer. Ytelsen til classifiers ble evaluert med leave-one-out kryssvalidering (tabell 5). Statistisk signifikans av klassifikasjonen ble evaluert ved å sammenligne den totale nøyaktigheten av 12-genet signatur med den av 1000 tilfeldige signaturer av samme størrelse ved hjelp av den samme algoritme. Den samlede prediksjonsnøyaktigheten av chemoresponse var 81% (
P
0,004) for Paclitaxel (Taxol), 78% (
P
0,001) for karboplatin, 80% (
P
0,005) for Cisplatin, 73% (
P
0,017) for Etoposide, 79% (
P
0,001) for Erlotinib, og 94% (
P
0,001) for Gefitinib. Disse resultater viser at den 12-genet signatur nøyaktig forut sensitivitet og resistens mot felles lungekreft kjemoterapeutiske midler i kreftcellelinjer.
differensial-ekspresjon i sensitive og resistente lungekreft cellelinjer ble analysert for hver signatur genet. Stoffet reaksjoner fra lungekreftcellelinjer i NCI-60 panel ble gitt i tabell S8. Blant signatur gener, over-uttrykk for
STK24
var knyttet til chemoresistance til alle de undersøkte stoffene unntatt Gefitinib i lungekreft cellelinjer; mens over-uttrykk for
FAM14A
var assosiert med kjemosensitivitet til alle de undersøkte stoffene unntatt Gefitinib i lunge kreft cellelinjer. Den under uttrykk for
STK24
var assosiert med resistens mot Gefitinib (
P
0,05). Den under uttrykk for
CCDC99
ble observert i motstand mot Paclitaxel (
P
0,05). Den over-uttrykk for
DLC1
var assosiert med chemoresistance til Erlotinib (
P
0,05), Paclitaxel og Cisplatin; mens dens under-uttrykket var forbundet med chemoresistance til Etoposide og karboplatin (ikke statistisk signifikant)
I grafen, differensial uttrykk med statistisk signifikans (
P
. 0,05
t
-UNDERSØKELSER) er markert med en rød stjerne.
EGFR
mutasjon er et velkjent faktor i narkotika svar på Gefitinib og Erlotinib. I de NCI-60 cellelinjene,
EGFR
mutasjon ble detektert bare i SK-MEL-28 melanom og RPMI-8226-myelomlinjer, men ikke i noen lungekreft-cellelinjer [26]. Vi analyserte rå uttrykket nivåer av
EGFR
probe sett. Spesielt en fold endring på 1,76 over-uttrykk for
EGFR plakater (210984_x_at) ble observert i Erlotinib motstandsdyktig vs. sensitive lungekreft cellelinjer (
P
0,05), mens ingen signifikant differensial uttrykket for
EGFR
ble observert i andre studier legemidler (resultater ikke vist). I den samlede pasient gruppene (
n
= 442) fra Shedden et al [19],
EGFR
uttrykk var ikke signifikant assosiert med lungekreft total overlevelse i univariat Cox modellering.
funksjonell pathway analyse
Etter å ha etablert den kliniske relevansen av 12-genet prognostisk signatur, forsøkte vi å utforske den funksjonelle involvering av dette genet satt i lunge tumorigenesis og tumorprogresjon. To funksjonelle verktøy pathway analyse, Oppfinnsomhet Pathway Analysis (IPA) og Pathway Studio 7.0, ble brukt for å kuraterte molekylære interaksjoner relatert til de 12 genene. Resultater fra IPA viser at signaturen gener samhandle med store kreft signalveier, for eksempel
TNF Hotell og
AKT plakater (Fig. 8A). Pathway Studio 7.0 ble brukt til å finne samspill mellom de 12 genene og 13 større lungekreft kjennetegnene (
EGF
,
EGFR
,
KRAS
,
MET
RB1
,
TP53
,
E2F1
,
E2F2
,
E2F3
,
E2F4
,
E2F5
,
akt1
, og
TNF
) rapportert i litteraturen. Pathway Studio avdekket ulike typer interaksjoner som spenner fra regulering til protein endring blant de 12 genene og åtte av 13 kreft kjennetegnene (Fig. 8B). Den funksjonelle pathway analyse antyder at de 12 signatur gener som er involvert i lungekreft onkogenese og tumorprogresjon.
(A) Bruke kjerneanalyser fra Oppfinnsomhet Pathway Analysis (IPA), ble kuratert interaksjoner avdekket blant de identifiserte signatur gener og store lungekreft signalveier. (B) Seks av de 12 signatur genene også utstilt ulike kuraterte interaksjoner med åtte fremtredende lungekreft kjennetegnene med Pathway Studio 7.0.
Diskusjoner
Lungekreft er fortsatt den ledende dødsårsaken i verden . Det er viktig å identifisere klinisk relevante prognostiske biomarkører for å utvikle personlig behandling. Enda viktigere, kan de oppdagede biomarkører avslører grunnleggende molekylære mekanismer av denne dødelige sykdommen, og forbedre vår forståelse av hvorfor pasienter med visse kreft molekylære egenskaper har en dårlig klinisk utfall og hvordan deres utfall kan forbedres.
Denne studien presenterer et hybrid modell system for identifikasjon av en 12-gen signatur for lungekreft prognose og chemoresponse prediksjon. Den 12-genet signatur kvantifiserer nøyaktig overlevelse hos pasienter med resectable lunge adenokarsinom, og gir betydelig prognostisk kategorisering innen stadium I og IB pasienter. Denne signaturen pålitelig identifisert høyrisikopasienter innen stadium I og II som ikke fikk kjemoterapi. Genuttrykket definerte risikoscore er en mer nøyaktig prognostisk faktor enn vanlig brukte kliniske parametre. Dette prognostisk signatur spår også chemoresistance og kjemosensitivitet til flere store anti-lunge kreft narkotika i NCI-60 kreftcellelinjer. Sammen tyder resultatene på at den 12-genet signaturen kan brukes til å velge tidlig stadium lunge adenokarsinom pasienter med høy risiko for tumorresidiv for adjuvant kjemoterapi. I mellomtiden kan det spare stadium I og II lavrisiko pasienter fra unødvendig kjemoterapi. Videre har 12-genet signatur potensiale til å bli brukt til å informere lege som antikreftmidler bør brukes i behandling av en bestemt pasient. De uttrykk mønstre av 12-genet signatur ble bekreftet i RT-PCR. Kuratert interaksjoner mellom signatur gener og store kreft signal kjennetegnene avdekket i den funksjonelle sti analysen gir ytterligere bevis for at 12-genet signatur kan være involvert i kreft onkogenese lunge og tumorprogresjon.
I det post-genomisk æra, innovative beregningsmodeller for å identifisere klinisk viktige sykdomsmarkører. Gitt den nåværende omfanget av høy gjennomstrømning data, blir et kombinatorisk gen seleksjonsskjema nødvendig på ulike stadier av genet filtrering.