PLoS ONE: Identifisering og validering av en multigen Predictor av tilbakefall i Primær Strupe Cancer

Abstract

Formål

Lokale gjentakelse er den viktigste manifestasjonen av behandlingssvikt hos pasienter med operabel strupekreft. Etablerte clinicopathological faktorer kan ikke i tilstrekkelig grad forutsi pasienter som sannsynligvis vil gjenta seg etter behandling. Flere verktøy er derfor nødvendig å nøyaktig identifisere pasienter med høy risiko for tilbakefall. Denne studien forsøker å identifisere og uavhengig validere genuttrykk modeller, prognostisk av sykdomsfri overlevelse (DFS) i operativ strupekreft.

Materialer og metoder

Ved hjelp av Affymetrix U133A Genechips, vi profilert fersk- frosne tumor vev fra 66 pasienter med strupekreft behandles lokalt med kirurgi. Vi søkte Cox regresjon proporsjonale farer modellering for å identifisere multigen prediktorer for gjentakelse. Gene modeller ble deretter validert i to uavhengige kohorter av 54 og 187 pasienter (fersk frosset og formalinfiksert vev valideringssett, henholdsvis).

Resultater

Vi har fokusert på gener univariately forbundet med DFS (

p

0,01) i treningssettet. Blant flere modeller som omfatter ulike antall gener, en 30-probe sett modellen demonstrert optimal ytelse i både trening (log-rank,

p

0,001) og en

st validering (

p

= 0,010) stiller. Spesielt i en

st valideringssett, median DFS som spådd av 30-probe sett modellen, var 34 og 80 måneder for høy- og lav-risiko pasienter, henholdsvis. Hazard ratio (HR) for tilbakefall i høyrisikogruppen var 3,87 (95% KI 1,28 til 11,73, Wald er

p

= 0,017). Testing av uttrykk av utvalgte gener fra ovenstående modellen i to

nd valideringssett, med qPCR, viste signifikante assosiasjoner til enkeltmarkører, som ACE2, FLOT1 og PRKD1, med pasienten DFS. Høy PRKD1 forble et ugunstig prognostisk markør ved multivariat analyse (HR = 2,00, 95% KI 1.28 til 3.14,

p

= 0,002) sammen med positiv lymfeknutestatus.

Konklusjoner

Vi har etablert og validert genet modeller som kan lykkes lagdelt pasienter med strupekreft, basert på deres risiko for tilbakefall. Det synes verdig til prospektivt validere PRKD1 uttrykk som en strupekreft prognostisk markør for rutinemessige kliniske formål

Citation. Fountzilas E, Kotoula V, Angouridakis N, Karasmanis jeg, Wirtz RM, Eleftheraki AG, et al. (2013) Identifisering og validering av en multigen Predictor av tilbakefall i Primær Strupekreft. PLoS ONE åtte (8): e70429. doi: 10,1371 /journal.pone.0070429

Redaktør: John D. Minna, Univesity of Texas Southwestern Medical Center i Dallas, USA

mottatt: 11 mars 2013; Godkjent: 18 juni 2013; Publisert: 09.08.2013

Copyright: © 2013 Fountzilas et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av en intern Hellenic Cooperative Oncology Group (HeCOG) stipend (HE R_5G). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. Forfatterne har følgende interesser: På tidspunktet for undersøkelsen Ralph M. Wirtz og Elke Veltrup ble ansatt i Siemens Healthcare Diagnostics. På vegne av Hellenic Foundation for Cancer Research, Athen, Hellas, senior forfatter (GF) har patentsøknader med Siemens Healthcare Diagnostics, Tarrytown, NY. Det er ingen ytterligere patenter, produkter under utvikling eller markedsført produkter å erklære. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer, som beskrevet på nettet i veiledningen for forfatterne.

Innledning

Strupekreft er den ellevte vanligste typen av kreft hos menn over hele verden. Hvert år 52.000 tilfeller er nylig diagnostisert i Europa og 10 000 i USA [1], [2]. Til tross for de siste fremskritt i diagnostiske og terapeutiske teknikker, de fleste av pasientene fortsatt gjenoppstå etter behandling [3]. Etablerte clinicopathological faktorer kan ikke i tilstrekkelig grad forutsi pasienter som vil gjenta seg. Andre faktorer er derfor nødvendig å nøyaktig identifisere pasienter med dårlig prognose. Ekspresjonsanalyse har blitt brukt i lagdeling av kreftpasienter med ugunstig prognose [4], [5], [6], [7]. Tidligere studier i hode og hals kreftpasienter har knyttet genuttrykk profiler til lymfeknutestatus [8], [9], [10], fjernmetastaser [11], [12] og sykdomsfri overlevelse [13], [14], [15], [16]. Selv om disse studiene gitt stor innsikt i den molekylære kompleksitet hode og nakke kreft de ikke identifisere en robust gen profil. Den kliniske anvendelse av disse modellene er blitt begrenset av et stort antall gener, de små størrelse datasett og mangelen på reproduserbarhet og uavhengig validering. Videre ingen av disse studiene fokuserte utelukkende på strupekreft.

I denne studien, søkte vi å identifisere gener prognostiske av tilbakefall hos pasienter med primær strupekreft. Endepunktet av våre analyser var sykdomsfri overlevelse (DFS). Vi profilert tumorprøver fra to separate kohorter av pasienter som bruker global genekspresjon profilering. Ved hjelp av det første kullet som et treningssett, identifiserte vi flere prognostiske genet modeller, som så ble validert i andre kohort av pasienter. For ytterligere å bekrefte resultatene, profilert vi utvalgte gener av modellene for relativ ekspresjon med kvantitativ sanntid-polymerase kjedereaksjon (QRT-PCR) i en uavhengig kohort av pasientene.

Materialer og Metoder

studiepopulasjonen

Vår studie bestående av 307 pasienter diagnostisert med primær plateepitelkarsinom strupe cancinoma (treningssett: 66, 1

st validering sett: 54 og 2

nd validering sett: 187 pasienter ), med median oppfølging på 52, 33 og 89 måneder, henholdsvis. Alle pasientene gjennomgikk kirurgisk fjerning av svulsten ved otolaryngologi Institutt for AHEPA Hospital i Thessaloniki, Hellas, mellom 1985 og 2008. Postoperativ administrasjon av strålebehandling ble avgjort av behandlende lege og oftest ble gitt til pasienter med positive tumoravgrensninger, pasienter med T4 svulster eller de med T1 /T2 supraglottic svulster for hvem en profylaktisk valgfag lymphadenectomy ble ikke gjort. Ingen av pasientene mottok systemisk terapi som en del av sin opprinnelige behandling. Dette er den nåværende standard vare i mange europeiske land [17], men dette kan ikke være tilfelle i andre land, som USA, hvor hovedfokus er bevaring av strupehodet med samtidig kjemoradioterapi, forvarslet i enkelte tilfeller ved induksjon kjemoterapi [18]. Oppfølging inkludert fysisk undersøkelse, hver tredje måned for de første tre årene og hvert halvår etterpå. Avbildnings undersøkelser ble utført, som antydet med symptomer og fysisk undersøkelse. Detaljerte demografi og kliniske karakteristika for pasienter med gyldige gen data er oppført i tabell 1, mens individuelle pasientdata er vist som i tabell S1.

vevsprøver

Frisk frosset svulst vevsprøver fra pasienter som omfatter opplæring og 1

st valideringssett, ble prospektivt samlet på tidspunktet for kirurgi, 2004-2008, ble umiddelbart frosset i flytende nitrogen og lagret i -80 ° C til behandling. Formalinfiksert parafin-embedded (FFPE) svulst vevsprøver, fra pasienter som omfatter to

nd valideringssettet, ble retrospektivt samlet (behandlede pasienter mellom 1985 og 2008). De sistnevnte ble fiksert i formalin i minst 6 timer før den ble innstøpt i parafin. Laryngeal svulster ble histologisk vurdert og verifisert i alle tilfeller, inkludert de friske frosne vevsprøver.

Etikk erklæringen

Frisk frosset og FFPE tumor vevsprøver ble samlet i henhold til protokoller godkjent av Institutional Review Board av «AHEPA» Hospital og bioetikkomité av Aristoteles-universitetet i Thessaloniki, School of Medicine. Skriftlig informert samtykke for den vitenskapelige bruken av biologisk materiale ble innhentet fra alle pasienter som omfatter opplæring og 1

st valideringssett og fra pasientene av 2

nd validering sett behandlet etter 2004. frafallelse av samtykke ble innhentet fra bioetikkomité for pasienter som ble behandlet før 2004 og for hvem FFPE- svulst vevsprøver trengte å bli retrospektivt samlet. Alle kliniske undersøkelser knyttet til denne studien har blitt gjennomført i henhold til de prinsipper som er nedfelt i Helsinkideklarasjonen.

RNA isolering fra fersk frosset vev og global genekspresjon profilering

RNA isolert fra friske frosne vevsprøver ble utført ved bruk av RNeasy-protokollen (Qiagen, Hilden, Tyskland), som tidligere beskrevet [19]. RNA mengden ble bestemt ved å måle UV absorbans ved 260 og 280 nm, mens RNA kvalitet ble vurdert ved hjelp av en Agilent 2100 Bioanalyzer RNA 6000 LabChip kit (Agilent Technologies, Palo Alto, California). RNA ble revers transkribert, merket og hybridisert til Affymetrix (Santa Clara, CA) HG-U133A matriser, slik som tidligere beskrevet [19]. Eksperimenter vedrørende opplæring og 1

st validerings settene ble utført separat, på ulike tidspunkter, på Siemens Healthcare diagnostiske produkter (Köln, Tyskland). De genuttrykk data har blitt deponert i National Center for Biotechnology Information Gene Expression Omnibus (GEO, https://www.ncbi.nlm.nih.gov/geo/), og er tilgjengelig gjennom GEO-serien sjonsnummer GSE27020. Følgende link har blitt opprettet for å gi en vurdering av GSE27020: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?token=dxcdxksauqicizy acc=GSE27020

RNA isolert fra FFPE- svulst vevsprøver og QRT-PCR

Alle undersøkelser som involverer FFPE- vevsprøver ble utført ved Laboratorium for molekylær onkologi, Hellenic Foundation for Cancer Research, Aristoteles-universitetet i Thessaloniki School of Medicine. For å validere den prognostiske verdi av gener som stammer fra vår mikromatriseanalyse, benyttet vi en separat kohort av pasienter med tilgjengelige tumorvevet materiale. Denne prøven gruppen inkluderte 187 FFPE- vevsprøver som ble macrodissected på tidligere histologisk evaluering for å inneholde 50% tumorceller. RNA ble isolert etter fullstendig over natten vev lyse hjelp Trizol-LS (Life Technologies, Paisley, UK), som tidligere beskrevet [20] og ble reverstranskribert med Hevet III (Life Technologies), i henhold til produsentens instruksjoner. cDNA ble normalisert ved 25 ng /ul og lagret ved -20 ° C inntil bruk. mRNA uttrykk ble undersøkt med FAM-merket TaqMan® genekspresjon Analyser i duplex reaksjoner som involverer en primer begrenset VIC-merket referanse assay for glucuronidase beta (GUSB, analyse # Hs00939627_m1), som en endogen mal kontroll. GUSB ble foretrukket framfor vanligvis anvendt endogene kontroller fordi ingen pseudo har, som ennå er rapportert for dette genet. I tillegg har det blitt identifisert som en av de best bevarte mRNA mål i FFPE- vev [21]. qPCR mRNA målet utvalg inkludert evaluering av de 30 sonder av U133A signatur for genet duplikater, Gene egenskaper (gyldig gen identiteter, type gen, innspilte spleisevarianter som ikke ville bli preget av sonden på tabellen eller ved qPCR analyse), så vel som en parametrisk

p

-verdi av 0,05 for fold-forandring i genekspresjon. Ut av de 30 U133A sonder, 23 forble gyldig for QRT-PCR-programmet (tabell 2). For disse 23 målene, søkte vi etter pre-laget TaqMan® genekspresjon Analyser (Applied Biosystems) som ville matche målet sekvenser oppdaget av de tilsvarende sonder i U133A array. Det var mulig å hente 16 slike analyser (tabell 2). Duplex 10 ul reaksjoner ble utført i duplikater, hver inneholdende 50 ng templat, i en ABI PRISM 7900HT system (Applied Biosystems /Life Technologies) på en 384-brønners kloss under standardbetingelser som involverer 45 amplifiseringscykluser, sammen med et referanse RNA-prøve ( TaqMan® Kontroll Total RNA, kat. 4307281, Applied Biosystems) og ingen-mal kontroller. Referanse RNA ble anvendt som en positiv kontroll plate og for evaluering av analyseytelse mellom kjøringer (inter-løp validering). To av de 16 utvalgte analysene ga deltaRQ verdier av 1,5 mellom ulike løyper og dermed mislyktes inter-run validering og ble ikke videre undersøkt (tabell 2)

Cycle terskler (CT, tilsvarende. til Cq i MIQE retningslinjer) for hvert mål og for det endogene referanse ble automatisk oppnådd ved standardbetingelser, i forhold kvantifisering (RQ) ble beregnet i en lineær modus [22] ved å subtrahere (45-avg deltaCT), hvorved 45 var den totale forsterkning syklus nummer og avg DCT = gjennomsnitt [(CT mål) – (CT GUSB)] for duplikater. Kriteriene for ytterligere prøve evaluering inkludert GUSB CT verdier av 38 for hver reaksjon og deltaRQ for hvert duplikat (intra drevet variant) av 0,8. For 3 analyser ingen forsterkning kurver ble oppnådd for FFPE og referanse mRNA prøver, mens for en ekstra analyse høye intra kjøre RQ verdiforskjeller ble observert i 87% av prøvene (tabell 2). Basert på ovennevnte filtreringstrinn for analyse og prøve valgbarhet, var det endelig mulig å evaluere RQ resultater for 10 gener bare.

Ved å bruke de ovennevnte kriteriene for prøve valgbarhet, ble følgende antall informative prøver innhentet per mRNA målet (informative analyser only): ACE2, 159; DHTKD1 171; FLOT1, 178; MAP4K1, 169; NEK2, 156; SFRS8, 184; PRKD1, 162; TBC1D4, 165; TGOLN2, 183 og YTHDC2, 176.

Statistisk analyse

Prognostic genekspresjon modeller ble utviklet utelukkende i treningssettet. DFS ble målt fra tidspunktet for diagnosen inntil bekreftede sykdomsprogresjon eller død. Alive pasienter uten bekreftet sykdomsprogresjon ble sensurert på datoen for siste kontakt. Gener utvalgte måtte univariately forbundet med DFS (

p

0,01, Cox proporsjonal risikomodell). Algoritmen passer proporsjonale farer modeller for å relatere DFS til hvert gen, ett gen i en tid, og gir en

p

verdi for hvert gen, å teste den hypotese at DFS er uavhengig av ekspresjonsnivået av det spesielle genet. Gener ble funnet å være assosiert med DFS i treningssettet ble deretter rangert basert på deres absolutte risikoforhold verdi, levert av algoritmen. Prognostiske genet modeller, bestående forskjellig antall topp rangering gener, ble utviklet ved hjelp av overvåket prinsipal komponent overlevelse algoritme [23]. Algoritmen beregner hovedkomponenter og utfører Cox proporsjonal hazard regresjonsanalyse til å beregne en regresjonskoeffisient (vekt) for hver hovedkomponent. En overvåket hovedkomponent modellen er utviklet for å gi en prognostisk indeks for hver pasient av studien. En høy prognostisk indeks tilsvarer en høy verdi av fare for gjentakelse. For å evaluere den prediktive verdien av denne metoden, brukte vi La-ett-Out-Cross-validering, der hvert enkelt tilfelle er utelatt og hele analysen er utført ved hjelp av resten av prøvene. For å direkte bruke disse modellene til en

st valideringssett, vi normalisert trening og en

st valideringssett, ved hjelp av empirisk Bayes (EB) metoden [24]. Fremgangsmåten anvender en algoritme utformet for å justere for den ikke-biologiske eksperimentelle variasjon ( «sats effect») mellom ulike datasett. Det reduserer inter-laboratorium variasjon, så vel som teknisk forskjeller på grunn av utnyttelse av forskjellige plattformer og metodiske tilnærminger. Etter normalisering, vi brukt direkte gense modellene til en

st valideringssett uten noen modifikasjoner.

Kaplan-Meier-kurver og log-rank tester ble brukt for å beregne og sammenligne overlevelse distribusjoner hos pasienter med høy – og lav risiko for tilbakefall. Alle rapporterte

p

verdiene er tosidig. Cox proporsjonal fareanalyse ble brukt for univariat analyse og multivariat justering for kjente prognostiske faktorer. Statistisk analyse ble utført ved hjelp av BRB-ArrayTools utviklet av Dr. Richard Simon og BRB-ArrayTools Development Team og SPSS statistikkpakke, versjon 18.0, (IBM Corporation, Armonk, New York).

Vi brukte uten tilsyn «Underklasse Mapping» (Submap) metoden [25] for å evaluere den molekylære korrespondanse av pasienter med gunstige og ugunstige prognose mellom treningssett og en

st valideringssettet. Denne metoden begge veier vurderer sammenslutning av forhåndsdefinerte subtyper i flere uavhengige datasett, til tross for deres tekniske variasjon. Algoritmen gir beregningen av en

p

verdi å demonstrere sannsynligheten for molekylær likhet mellom de forskjellige underklasser, det er implementert i GenePattern programvaren (versjon 3.0, Broad Institute, Cambridge, MA) og kan nås på https://www.broad.mit.edu/genepattern/

Gene sett analyse (GSA) ble anvendt for å påvise genet nettverk deregulering karakteristisk for pasientgrupper med god eller dårlig prognose [26]. Ved hjelp av offentlig tilgjengelige data, vi så spådde onkogene pathway aktivering status på hver pasient av opplæringen og 1

st valideringssett. Vi anvendte genekspresjon modeller, tidligere utviklet og validert in vitro, for å anslå sannsynligheten for sti-aktivering i hver prøve [27]. Til slutt, ved hjelp av Bayesiansk probit regresjonsmodeller vi tildelt hver pasient en sannsynlighet på vei aktivering.

Resultater

Identifisering og validering av prognostiske klassifikasjonsapparater hjelp genuttrykk profilering

flytskjema av vår studie er vist i figur 1 (gemalinne diagram). Vi analyserte primære laryngeal svulster fra 66 pasienter (opplæring sett) og 54 pasienter (1

st validering sett) ved hjelp av global genekspresjon profilering. Etter en evaluering av kvaliteten på microarray data, ekskluderte vi 7 og 4 tekniske uteliggere fra de to settene, henholdsvis. For noen av genene, ble ekspresjon evaluert ved å bruke to forskjellige sondesett. Prognostiske probe sett modellene ble identifisert utelukkende i treningssettet. Etter eksklusjon av en fjerdedel av de minst varianten genene, har vi fokusert på gener assosiert med DFS (Wald er

p

0,01). Vi deretter rangert de 253-probe-sett ble funnet å være signifikant assosiert med DFS, basert på deres Cox regresjon koeffisient. Vi identifiserte flere prognostiske probe sett modeller som består av så mange som 250 til så få som 20 probe sett, som utføres like godt i treningssettet.

Deretter søkte vi disse multigen prediktorer direkte til en

st valideringssettet. Den 30-probe sett modellen utføres best i valideringssettet (modellen med færrest gener som viser høyest statistisk forskjell i DFS mellom høy- og lav-risiko pasienter). Median DFS for grupper av pasienter med ugunstige og gunstig prognose, som spådd av 30-probe sett modellen, var 34 og 80 måneder, henholdsvis (log-rank,

p

= 0,010). Hazard ratio (HR) for tilbakefall i høyrisikogruppen versus lav-risikogruppen var 3,87 (95% KI 1,28 til 11,73, Wald er

p

= 0,017). Kaplan-Meier kurver for alle probe sett modeller i opplæring og 1

st valideringssett kan bli funnet i File S1. Samsvar mellom de risikooppdrag både i trening og en

st valideringssett basert på de ulike klassifiserings var høy, 81-87% (Cramer V test = 0,62 til 0,75).

Stempler av alle 30 probe sett inngår i vår modell er vist i tabell 3, mens en grafisk representasjon av genuttrykksmønster av 30-probe set modell i de høy- og lav-risikopasienter er vist i figur 2a. Det ble observert at i denne modellen, to gener (ACE2 og MAP4K1) var representert ved to probe-sett. For å unngå effekten av å veie disse to genene dobbelt så mye i forhold til hver av de andre individuelle sondesett, som representerer et enkelt gen, vi testet på nytt vår modell i opplæring og en

st valideringssett ved hjelp av en enkelt sonde innstilt for hvert gen. I treningssettet, statistisk signifikans i 28-genet modell forble identisk (log-rank test,

p

0,001, figur 3a) med en basert på 30-probe set modell. Median DFS i en

st valideringssett, som spådd av 28-genet modell, var 34 og 80 måneder, henholdsvis (log-rank,

p

= 0,029, figur 3b). Hazard ratio (HR) for tilbakefall i høyrisikogruppen versus lav-risikogruppen var 4,38 (95% CI 1.6 til 7.1, Wald er

p

= 0,036).

Grafisk representasjon av 30-probe sett modellen uttrykk mønstre hos pasienter med gunstige og ugunstige prognose vises i panelet en. Rød farge angir overekspresjon og grønn farge underexpression av de respektive genene. Molekylær likheten av pasienter med gunstige og ugunstige prognose i opplæring og 1

st valideringssett, bruker Submap, vises i panelet b. Baren nedenfor viser forholdet mellom farge og Bonferonni korrigert

p

verdier. Rød farge representerer høy tillit for molekylær homogenitet mellom de respektive gruppene, mens blå farge representerer manglende selvtillit av dette.

Kaplan-Meier overlevelsesestimatene for høy- og lav-risiko pasienter basert på 28-genet modellen risiko spådommer i treningssettet (a) og en

st valideringssett (b).

for ytterligere å validere den prognostiske betydningen av disse profilene, søkte vi vår 28-genet modellen til en offentlig tilgjengelig kohort av pasienter med tidlig stadium strupekreft [28]. På grunn av teknisk variasjon mellom de to datasettene, 23 av de 28 genene til vår modell ble brukt til å stratifisere pasienter basert på deres risiko for tilbakefall. Til tross for de tekniske og biologiske begrensninger (forskjellige plattformer, forskjellig antall gener, tidlig vs all-trinns sykdom) vår modell opprettholdt sin prognostisk betydning. Median DFS for grupper av pasienter med ugunstige og gunstig prognose, som spådd av 23-genet modell, var 118 og 161 måneder, henholdsvis (log-rank,

p

= 0,011, figur S1). HR for gjentakelse i høyrisikogruppen versus lav-risikogruppen var 4,37 (95% KI 1,24 til 15,34, Wald er

p

= 0,022).

Molecular homologi av pasienter med gunstig og ugunstig prognose i trening og en

st valideringssett

28-genet profilen ser ut til å ikke bare være en samling av prognostiske gener, men å faktisk fange den underliggende biologi av svulstene. For å demonstrere den molekylære homogenitet av høyrisikosvulster, brukte vi underklasse kartlegging (Submap), en metode som vurderer molekylær likhet med forhåndsdefinerte grupper som tilhører ulike datasett. Vi har faktisk vist at grupper av pasienter med dårlig og god prognose i treningssettet har de samme biologiske mønstre med de respektive gruppene i valideringssettet, utover uttrykket av spesifikke gener. Diagrammer som viser god «molekylær kamp» av høy- og lav-risiko pasienter er vist i figur 2b.

Uavhengig prognostisk betydning av 28-genet modell

Vi var interessert i å demonstrere den uavhengige prognostisk betydning av vår multigen prediktor. Vi inkluderte i analysen scenen og klasse, de eneste kjente prognostiske faktorer, for hvilke data som var tilgjengelige for pasientene i vår studie. Vi har også inkludert strålebehandling, siden det er kjent for å redusere lokale tilbakefall. I multivariat analyse, vår 28-genet modellen opprettholdes border prognostisk betydning i en

st valideringssettet. HR for gjentakelse i høyrisikogruppen var 2,67 (95% KI 0,99 til 7,22, Wald er

p

= 0,05) (detaljer er vist i tabell 4).

Pathway analyse i høy og lav-risikogrupper

for å få litt ekstra innsikt i biologiske prosesser hos pasienter med gunstige og ugunstige prognose, utførte vi Gene Set Analysis (GSA). Vi utforsket genet nettverk og biologiske temaer, som beskrevet av Kyoto Encyclopedia of gener og genomer (KEGG) Pathway Database. Vi faktisk identifisert en rekke veier, uttrykt forskjellig mellom de to gruppene av pasienter (GSA Goeman globale test

p

verdier 0,01). Vi fokuserte på stier deregulerte både i trening og i en

st valideringssett. Tabell 5 presenterer valgt trasé av interesse, mens den fullstendige listen over veier kan bli funnet som i tabell S2. Flere av disse banene har tidligere blitt vist å spille en viktig rolle i hode- og halskreft progresjon. Interessant, observerte vi at gener fra fokal adhesjon (FA) pathway [29], som er vist å være prognostisk i vår datasettet, så vel som i hode- og nakkekreft, hell stratifisert våre pasienter basert på deres risiko for tilbakefall (detaljer i figur 4 )

Kaplan-Meier sykdomsfri overlevelse estimater for høy- og lav-risiko pasienter, som definert av fokale vedheft sti gener (log-rank,

p

. 0,005).

Oncogene pathway aktiveringsmønstre i enkelte pasienter

i tillegg til de nevnte sti analyseresultater som stammer fra å vurdere pasientgrupper, søkte vi å utforske veien aktivering hos enkelte pasienter . Vi brukte tidligere utviklet og validert «in vitro» genuttrykk «Read-outs» for å identifisere aktivering av kjente onkogene baner i hver pasient av opplæringen og 1

st valideringssett. Vi undersøkte Src, Ras, p-catenin og E2F3 veier, som tidligere er blitt vist å være assosiert med overlevelse i andre typer av kreft [27]. Interessant, vi viste at pasienter med dårlig prognose oftere hadde svulster preget av Ras vei aktivering, odds ratio (OR) = 2,92 (95% KI 1,33 til 6,39, Wald er

p

0,01), mens pasienter med god prognose oftere hadde svulster stiller Src og β-catenin vei aktivering, OR = 4,54 (95% KI 1,64 til 12,50,

p

= 0,003) og 2,63 (95% KI 1,16 til 5,88,

p

= 0,03), respektivt. I tillegg utførte vi Cox proporsjonal farer overlevelse regresjon og observerte at Ras veien aktivering ble funnet å være assosiert med dårlig prognose, HR = 2,55 (95% KI 1,19 til 5,45,

p

= 0,020). SRC, beta-catenin og E2F3 trasé synes ikke å bli assosiert med DFS hos pasienter med strupekreft. Tilsvarende Kaplan-Meier-kurver er vist i figur 5. Til slutt, har vi utført multivariat analyse, inkludert 28-genet modellen og Ras-reaksjonsveien, og fant at prediktoren opprettholdt uavhengig prognostisk signifikans (Wald s

p

= 0,001) det samme gjorde onkogene pathway (tabell 6).

RQ verdier er kombinert som binære variabler for å få tre-skala profiler i henhold til matrise data. Markører som angitt. Blå og røde kurver matche de forventede prognostiske mønstre oppnådd i 28-genet modell for de spesielle gener. Grå kurver: Uklassifisert pasienter (middels skala)

qPCR validering av en undergruppe av gener fra 28-genet prediktor

De nevnte analysene ble utført ved hjelp av fersk frosset. vevsprøver. Imidlertid har denne tilnærmingen enkelte metodiske begrensninger når det gjelder daglig klinisk praksis. Dermed forsøkte vi å validere vår multigen prediktor hjelp qPCR på FFPE- svulst vevsprøver, en lettere anvendelig metodikk. Som beskrevet i avsnittet Materialer og metoder, imidlertid, var det mulig å undersøke en pålitelig måte i vårt FFPE prøveserie ekspresjon av bare 10 av de 28 gener i den opprinnelige prediktor. De beskrivende kjennetegner RQ verdier oppnådd fra de informative sampler pr analysen er beskrevet i tabell 7 (middel, median, SD, min, max). I begynnelsen prøvde vi å klynge kontinuerlig RQ verdier for alle disse genene. Imidlertid gjorde hierarkisk clustering ikke gi resultater sammenlignes med 28-genet prediktor på en meningsfull måte, med de fleste av høye og lave RQ verdier gruppert i motsatt retning (figur 6a og b). Dette var ingen overraskelse, fordi vi bare undersøkt 1/3 av genene fra autosøk i rekken signatur, mens fold-endring i uttrykket av disse genene var veldig smale og kan lett bli reversert med en annen metode (qPCR vs. rekke hybridisering ) eller en annen type materiale (FFPE vs. fersk frosset vev). Detaljerte analytiske og statistiske metoder for oppførselen til hver qPCR analyse vs. rekken sonde i matchet FFPE kontra ferske frosne prøvene vil være behov for avklaring av dette avviket, men en slik grundig analyse var utenfor rammen av den foreliggende studere. Derfor neste søkte vi forhåndsbestemt profilering for etterforskningen av mulige effekter av gener testet med qPCR på pasienten DFS. For dette formålet, forvandlet vi kontinuerlig RQ verdier til binære parametere (høy /lav uttrykk). Basert på den smale fold-endring av genuttrykk mellom de gode og dårlige prognose grupper i 28-genet prediktor, brukte vi median RQ verdiene til å klassifisere høyt og lavt uttrykk for de 10 evaluerbare gener. Log-rank test for disse genene som enkeltmarkører ga assosiasjoner med utfallet lik de som ble observert for de tilsvarende gener i U133A signatur (høy /lav mønstre sammenlignbare med opp- og nedregulering av genekspresjon, henholdsvis for 6 av 10 gener), noen som var signifikant (PRKD1) eller viste en trend for signifikans (ACE2, FLOT1) (tabell 8). Hierarkisk gruppering av kontinuerlige RQ-verdier for de sistnevnte tre gener ga to grupper av pasienter med betydelig forskjellige DFS (figurene 6c og d). Den forventede genuttrykksmønstrene var til stede i riktig sammenheng med utfallet, men var fraværende i de fleste tilfeller.

hierarkisk clustering av RQ verdier fra gener testet i to

nd valideringssett (FFPE-prøver ). I panelene a og b, ble RQ verdier av de 10 aktuelle genene evaluert. To store klynger ble identifisert (a) som ble vist å ha en betydelig effekt på pasient DFS (b). Klynge 1 ble assosiert med en bedre prognose i forhold til klynge 2. Imidlertid var de fleste av disse genene gruppert i motsatt retning enn det som var forventet fra den 28-genet klassifikator. I paneler c og d, clustering av de 3 gener med individuelt signifikante sammenhenger ga 2 pasientgrupper med forskjellig utfall; i forhold til den opprinnelige 28-genet klassifikator, korrekte mønster av genekspresjon var til stede i de tilsvarende gode og dårlige prognose grupper. Røde og grønne farger i paneler A og C betegner høy og lav uttrykk, henholdsvis.

Anvendelse av god prognose høy /lav genuttrykksmønster til de binære forvandlet RQ verdier avslørt ingen enkelt svulst med forventede mønsteret for alle 10 gener.

Legg att eit svar