PLoS ONE: Biologisk Convergence of Cancer Signatures

Abstract

Gene uttrykk profilering har identifisert kreft prognostiske og prediktive signaturer med overlegen ytelse til vanlige histopatologiske eller kliniske parametre. Følgelig er signaturer blir innlemmet i klinisk praksis, og vil snart påvirke hverdagslige avgjørelser i onkologi. Men liten overlapp i genet identitet mellom signaturer for samme krefttype eller tilstand reiser spørsmål om deres biologiske og kliniske implikasjoner. For å avklare disse spørsmålene, er bedre forståelse av molekylære egenskaper og mulige interaksjoner underliggende tilsynelatende ulike signaturer nødvendig. Her evaluert vi om underskriftene til 24 uavhengige studier er relatert til genom, transkriptom eller proteomet nivåer. Signifikante sammenhenger ble konsekvent observert i disse molekylære lag, som tyder på at det eksisterer en felles kreftcelle fenotype. Konvergens på celleproliferasjon og død støtter avgjørende involvering av disse prosessene i prognose, metastaser og behandlingsrespons. I tillegg ble det funksjonelle og molekylære forbindelser identifisert ved immunresponsen i forskjellige krefttyper og tilstander som utfyller bidraget av celleproliferasjon og død. Undersøkelse av flere, uavhengige, kreft datasett bekreftet våre observasjoner. Denne studien foreslår en helhetlig strategi for å tolke kreft signaturer som avslører felles design prinsipper og systemer-nivå egenskaper

Citation. Solé X, Bonifaci N, López-Bigas N, Berenguer A, Hernández P, Reina O, et al. (2009) Biologisk Convergence of Cancer signaturer. PLoS ONE 4 (2): e4544. doi: 10,1371 /journal.pone.0004544

Redaktør: Gustavo Stolovitzky, IBM Thomas J. Watson Research Center, USA

mottatt: 07.10.2008; Godkjent: 16 januar 2009; Publisert: 20 februar 2009

Copyright: © 2009 Sole et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. LA Caixa Foundation stipend BM 05/254 (MAP) og det spanske helsedepartementet bevilger FIS 05/1006 (VM) og 06/0545 (MAP), RCESP C03 /09 og RTICCC C03 /10 (VM og GC). CAM støttes av en Beatriu de Pinos fellesskap fra AGAUR byrå i den katalanske regjeringen, er HA støttet av en postdoktorstilling av det spanske helsedepartementet og MAP er et Ramon y Cajal Forsker med det spanske departementet for utdanning og forskning. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

de siste årene har sett beskrivelsen av et stort antall av genekspresjon profiler eller signaturer med klinisk verdi for nøyaktig prognostisk eller prediktiv karakterisering av kreftpasienter eller svulster. Brystkreft er trolig paradigmet av slike studier, med minst tre forskjellige signaturer under utprøving i kliniske studier og kommersielt tilgjengelig for rutinemessig klinisk praksis i onkologi [1], [2]. Imidlertid har mangelen på overlapping i de utvalgte gener reist grunnleggende spørsmål om deres biologiske og kliniske implikasjoner [3], [4]. Denne situasjonen er ikke unik for brystkreft prognose, og beskrivelsen av nye uttrykk profiler tyder på at det er vanlig for andre krefttyper eller vilkår-dvs. metastaser og behandlinger [5]. Grunner til dette paradoks kan være metodiske ulikheter [6] og statistiske begrensninger som er opprettet av det store antall gener undersøkt med hensyn til det forholdsvis lite antall prøver profilert [7] – [9]. Viktigere, en fersk undersøkelse utført av Perou og kolleger [10] etablert felles prognostisk verdi av enkelte brystkreft signaturer, til tross for mangelen på overlapping i genet identiteter. Denne observasjonen bekreftet den kliniske relevansen av signaturene, og foreslo at de kan effektivt fange en vanlig svulst celle fenotype (er) [11]. Denne antatte felles fenotype for brystkreft og for andre neoplasier må defineres hvis vi skal bedre forstå betydningen av signaturer.

Noen av de tidlige beskrivelser av signaturer bemerket tilstedeværelsen av spesifikke biologiske prosesser overrepresentert i tilsvarende genet lister. Blant disse fremgangsmåter, ble individuelle gener som er involvert i cellesyklusen og apoptose markert (for eksempel [12], [13]). Nyere bevis peker til bestemte gener som er globalt i forbindelse med brystkreft prognose og knyttet til celleproliferasjon blant andre prosesser eller veier [14] – [21]. Det er imidlertid fremdeles uklart hvordan dette bevis karakteriserer forskjellige molekylnivå, og hvor nivåene integreres i et system-nivå modell inneholdende genet og /eller protein-interaksjoner for brystkreft og til human kreft generelt. Her har vi brukt et integrerende tilnærming for å bestemme eksistensen av et antatt felles tumorcelle-fenotype (er) forbundet med forskjellige krefttyper og tilstander. Studien identifiserte felles molekylære egenskaper og nettverks samhandling knyttet til celleproliferasjon og død, og avslørte assosiasjoner med immunresponsen. Våre resultater markere betydningen av å studere signaturer fra en systemnivå perpective

Resultater

Genomisk egenskaper:. E2Fs og østrogen reseptor (ER)

For å identifisere felles egenskaper blant kreft signaturer vi samlet litteratur genet lister fra 24 studier (Tabell S1). Disse representerer 19 prognostiske signaturer, to signaturer fokusert hovedsakelig på metastaser, og syv prediktive behandlingsrespons signaturer. Alle signaturer som benyttes tilsvarte validerte sett av gener på samme nivå. Vi først undersøkte de molekylære egenskaper eller nettverkstopologi karakteristikker av gener og /eller proteiner i disse signaturene til de genom, transkriptom og proteom nivåer. Deretter ble de identifiserte egenskaper og nettverks foreninger bekreftet i uavhengige uttrykk datasett av ulike krefttyper og forhold (Fig. 1).

Strategi for å definere felles egenskaper og interaksjoner mellom signaturer på genomet, transkriptom og proteom nivåer og validering i uavhengige datasett.

Egenskaper på genomet nivå ble vurdert ved sondering den relative berikelse i spådd transkripsjonsfaktorbindende språk motivene på arrangører av signatur gener (se Methods). I disse analysene de topprangerte motiver over flere underskrifter var fra E2F familien. Betydelig overrepresentasjon av E2F motiver ble identifisert i ~45% (13/28) av signaturene som ble testet, inkludert prognostisk (blære, bryst og sentralnervesystemet (CNS) kreft, og tre multi-kreft signaturer) og prediktiv signaturer (docetaxel i brystsvulster, EGFR tyrosinkinasehemmere (TKI) i lungesvulster og pemetrexed i avanserte solide tumorer) (false funnrate (FDR) -adjusted

P

verdier. 0,05) (figur 2

A

). I motsetning til dette bare en signatur (immunresponsen prognostisk signatur i østrogenreseptor (ER) -negativ brystkreft [22]) viste underrepresentasjon av E2F-motiver. Denne observasjonen vil bli diskutert i de neste avsnittene.

En

, representasjon av E2F motivene basert på Jaspar og TRANSFAC matriser og Poissonfordelingen, med

P

verdier justeres ved hjelp FDR tilnærming for analyser-kolonner. Verdiene er vist som beskrevet i innfelt: rød /oransje indikerer betydelig overrepresentasjon og blått indikerer betydelig underrepresentasjon. Den E2F1_Q6 motiv representerer den antatte virkningen av E2F1 og MYC.

B

, representasjon av E2F1-AP2 og E2F4 bindingsseter fra kromatin immunoprecipitation (chip) analyser ved hjelp av samme statistiske metode som beskrevet ovenfor. De E2F4 data svarer til felles analyse av cellesyklus faser [23].

C

, representasjon av gener med periodisk uttrykk gjennom cellesyklusen.

D

, representasjon av ER transkripsjonsregulering fra kromatin immunoutfellingsstudier analyser eller transkripsjons endringer i MCF7 celler.

E

, representasjon av ytterligere promoter motivene ved hjelp TRANSFAC matriser. Såret responsen signatur uten cellesyklusassosierte gener er angitt med suffikset «(-Cc)», og «total set» signatur av ER-negativ brystkreft inneholder immunresponsen i tillegg til andre biologiske prosesser som cellesyklusen. Den dasatinib prediktive signatur er delt inn i to sett for effekten i prostata og brystkreft hhv. De kolorektal prognostiske signaturer er som definert i tabell S1.

For å evaluere motiv spådommer i promotor sekvenser av signatur gener, vi undersøkt eksperimentelle data fra kromatin immunoutfellingsstudier analyser av transkripsjonsfaktorer [23], [24] . Denne analysen bekreftet den store rolle E2F transkripsjonsprogrammer. Omtrent 65% av signaturer viste signifikant overrepresentasjon av E2F1-AP2 og /eller E2F4 bindingsseter (fig. 2

B

). De sterkeste over-representasjoner ble påvist i prognostisk-spesielt brystkreft-og prediktiv behandling respons signaturer for E2F1-AP2 nettsteder. Likevel særegenheter ble også foreslått for immunforsvaret, noe som viste underrepresentasjon av E2F1-AP2, og for prediktiv signaturer som ikke viser differensial representasjon av E2F4 i alle fall.

E2Fs er viktige regulatorer av celle spredning og død [25], [26], og felles deregulering av E2F-medierte transkripsjonsprogrammer er et kjennetegn på kreft transcriptomes [27]. Koblingen med potensial for celleformering ble ytterligere bedømt ved å undersøke transkripter med periodisk uttrykk gjennom cellesyklusen [28], som tyder på en direkte eller indirekte rolle i fase (r) av celledeling, og ved å analysere ER funksjonelle genomiske data [29 ]. Betydelig overrepresentasjon av periodisk uttrykte gener ble observert i ~45% av signaturer, de fleste som var prognostiske signaturer for ulike krefttyper (Fig. 2

C

). Detaljert undersøkelse av cellesyklusfaser viste spesifikk overrepresentasjon av gener med et uttrykk topp ved G2 og G2 /M, som er i overensstemmelse med deres rolle i celledelingen (data ikke vist). I tillegg, i samsvar med koblingen mellom celleproliferasjon og ER signalveien [30], betydelig overrepresentasjon av ER-bindingsseter og /eller ER-medierte transkripsjonsregulering ble påvist i de fleste av de signaturer (~90%), uansett deres type eller tilstand (fig. 2

D

). Denne høye overlapping med ER regulering gjenspeiler trolig en sterk tilknytning til celleproliferasjon utover kreft hormon-avhengigheter.

Totalt alle unntatt to av signaturer undersøkt her viste betydelig overrepresentasjon av ett eller flere av de molekylære bevisene forbundet til regulering av celleproliferasjon og død. Unntakene var immunresponsen signatur, noe som kan gjenspeile involvering av forskjellige biologiske prosesser, og den B-celle lymfom prognose signatur, noe som kan forklares ved den statistiske kraften som trengs for å påvise forskjeller i det minste genet settet undersøkt (

n

= 19). Likheter for disse signaturene på flere molekylære nivåer vil bli presentert i de neste avsnittene.

Andre programmer av celleproliferasjon, død og metastase

I en undersøkelse for flere mekanismer for transkripsjonsregulering av signaturer, motiver av AHR, ble EGR1, MYB og MYC funnet å være overrepresentert i en ny periode. Disse over-representasjoner var ikke så utbredt som for E2Fs eller ER, noe som antyder at de spiller bare en mindre rolle, men ulike krefttyper og forhold ble inkludert: en EGR1 Motivet ble funnet å være overrepresentert i CNS og kolorektal kreft og β-catenin multi-kreft prognostiske signaturer, brystkreft lungemetastaser signatur og prediktive signaturer av cisplatin og dasatinib (FDR justert

P

verdier 0,05) (fig. 2

E

) . Etter avtale med disse observasjonene, har vi funnet lungemetastase signaturen til å inneholde 22% (12/54) av genene spådd andre steder for å være EGR1 transkripsjons mål [31] – [34] og såret respons ble tidligere vist seg å være koordinert med

MYC

forsterkning [35]. I tillegg overrepresentasjon av en AHR motiv er forenlig med dens assosiasjon med ER for å regulere celleproliferering [36].

Deretter betydningen av motiv representasjoner ble evaluert ved analyse av genekspresjon korrelasjoner i representative kreft datasett. Således, beregnet vi korrelasjoner ved hjelp av Pearsons korrelasjonskoeffisient (PCC) mellom de syv transkripsjonsfaktorer som er presentert ovenfor og gener assosiert med brystkreft prognose [12] eller med responsen til docetaxel behandling av brystkreft [37], og sammenlignet med gener uten -differentially uttrykt i disse forholdene. Høyere absolutte grunnfondsbevis mellom transkripsjonsfaktorer og gener assosiert med prognose eller behandlingsrespons ble identifisert i alle tilfeller for gener og /eller microarray prober (Mann-Whitney (MW) test

P

verdier 0,001) (Fig. 3) . Prognosen datasettet inneholdt en eneste representant microarray sonde for hver transkripsjonsfaktor, derfor alle av dem viste signifikante forskjeller (Fig. 3

A

). Den behandlingsrespons datasettet inneholdt flere sonder for noen faktorer som ble vurdert individuelt for å identifisere tekniske eller biologiske forskjeller. I dette datasettet,

AHR

,

EGR1 Hotell og

HIF1A

ble hver representeres av en enkelt sonde og alle av dem viste signifikant høyere korrelasjoner med respons (Fig. 3

B

).

E2F1

,

E2F4

,

MYC Hotell og

MYB

hadde mer enn en sonde hver, med uharmoniske resultater i noen tilfeller, men med gjennomsnittlig grunnfondsbevis signifikant forbundet med responsen i tre av dem (fig. 3

B

), mens

E2F4

forble unclassifiable som to prober ble signifikant korrelert og to var ikke (data ikke vist).

En

, uttrykk sammenhenger mellom syv transkripsjonsfaktorer-genet navn som vises på toppen av hver graf-og gener forskjellig uttrykt for brystkreft prognose målt ved metastase hendelser opp til 5 år (rosa kurver) i forhold til ikke- forskjellig uttrykt gener i denne tilstanden (brune kurver). Grafene viser absolutte grunnfondsbevis verdier.

B

, samme analyse for differensielt uttrykte gener etter docetaxel behandling av brystkreftpasienter i forhold til ikke-differensielt uttrykte gener i denne tilstanden. Resultater for

E2F1

,

E2F4

,

MYB Hotell og

MYC

er for gjennomsnittsverdier for alle microarray prober som representerer hver faktor, mens innfellinger vise resultater for individuelle sonder med signifikante forskjeller.

for å ytterligere evaluere disse observasjonene, beregnet vi korrelasjoner mellom de syv transkripsjonsfaktorer og 5000 tilfeldig utvalgte sett tilsvarende størrelsen på forskjellig uttrykt gensettene ovenfor. Høyere grunnfondsbevis ble observert for de fleste transkripsjonsfaktorer i begge kreft forhold, med unntak av

E2F4

i prognose og behandlingsrespons (

P

verdier innhentet ved hjelp av empiriske fordelingen av tilfeldige grunnfondsbevis (empirisk

P

-verdier) var på 0,16 og 0,11, henholdsvis). Overall, identifisering av signifikante sammenhenger med minst seks av de syv faktorene som ble testet støtter motiv spådommer og antyder eksistensen av felles transkripsjons programmer som konvergerer på celleproliferasjon og død, samt metastaser som avslørt av EGR1 [33].

Analyse av motiver og uttrykks sammenhenger også avdekket en sammenheng mellom den tilsynelatende ulik immunrespons sett og ulike prognose signaturer. Selv om det underrepresenterte E2F1 motiver, immunresponsen felles overrepresentasjon av en MYB motiv med 21-genet, sår respons brystkreft, og blærekreft prognostiske signaturer (fig. 2

E

). Overrepresentasjon av denne faktoren i immunresponsen er i samsvar med dets rolle i hematopoese [38], og dens overrepresentasjon i andre signaturer er i overensstemmelse med den nye involvering av immunrespons i prognose av forskjellige krefttyper [39]. De høye korrelasjoner observeres i fig. 3

En

mellom

MYB Hotell og gener globalt assosiert med brystkreft prognose (dvs. ikke begrenset av ER status) støtter denne hypotesen. Sammenslutninger av denne signaturen på andre molekylære nivåer vil bli presentert i de neste avsnittene.

Transcriptomic sammenhenger mellom signaturer

Gitt identifisering av felles transkripsjons programmer, bør globale uttrykk sammenhenger mellom signaturer være høyere enn forventet tilfeldigvis. Ved hjelp av en brystkreft datasett [40] og gjennomsnittlig PCC tvers av alle microarray probe par mellom to underskrifter, ble betydelig co-uttrykk identifisert i omtrent halvparten av analysene sammenlignet med 10.000 tilsvarende, tilfeldig utvalgte gensettene (empirisk

P

verdier 0,05) (figur 4

A

).. Disse resultatene støtter eksistensen av funksjonelle og molekylære forbindelser mellom mange tilsynelatende ulike signaturer, til tross for det faktum at datasettet som ble benyttet hadde tydelige tekniske og biologiske spesifisiteter. Videre immunresponsen signatur viste signifikant co-uttrykk med 15 av signaturene studert (data ikke vist), som også støtter konvergens på denne prosessen.

En

, varmekart over gjennomsnittlig grunnfondsbevis mellom kreft signatur i en brystkreft-genekspresjon datasett [40]. Betydelig co-uttrykk (empirisk

P

verdier 0,05) er angitt med prikker. Legg merke til at matriksen er ikke symmetrisk, fordi resultatene var avhengig av størrelsen av hvert gen set; Derfor, jo større gensettene (f.eks viklet respons eller invasivitet) viste signifikant ko-ekspresjon med mange andre signaturer, muligens delvis på grunn av det faktum at de hadde større statistisk kraft som brukes til å oppdage dem. Hvert punkt svarer til sammenligningen mellom en signatur til venstre (simulert set) og en signatur på bunnen. Celledød og mitose sett er uthevet i rosa.

B

, venstre panel, listen over signaturer som viste signifikant korrelasjon med celledød eller mitose komplett GO sett. Høyre panel, listen over signaturer som viste signifikant korrelasjon med celledød eller mitose sett, men bare ved hjelp av sine viktigste komponenter.

C

, observert (usammenhengende rød linje) mot forventet (svart kurve for 10.000 tilfeldig utvalgte sett) gjennomsnittlig grunnfondsbevis mellom Mitose satt, og 70-genet sett, celledød sett, eller gener med periodisk uttrykk gjennom cellesyklus.

for ytterligere å teste linken til celleproliferasjon og død på transcriptomic nivå, og med unntak av

a priori

informasjon om uttrykk nivåer eller profiler som kan skjevhet analysen, vi undersøkt sammenhenger med gensettene valgte å bruke kun de kriteriene for Gene ontologi (GO) termer celledød og Mitosen. Disse settene ble utelukkende definert ved å velge Entrez gener merket med disse vilkårene, og deretter brukt i sammenligninger på samme måte som enhver annen signatur. Bruke 10.000 tilsvar tilfeldige sett, absolutt korrelasjon mellom disse GO settene og underskriftene ble funnet å være signifikant høyere hos ≥ 12 sammenligninger (Fig. 4

B

,

forlot

). Celledød sett var signifikant korrelert med fem signaturer og Mitosis sett var signifikant korrelert med 11 underskrifter av forskjellige krefttyper eller betingelser. Viktigere, forskjeller i GO setter i forhold til tilfeldig var av samme størrelsesorden som sammenligninger mellom signaturer (Fig. 4

C

).

Denne analysen antydet at måling av uttrykket nivåer av gener som er kjent for å delta i spesifikke biologiske prosesser vil trolig være av prognostisk eller prediktiv verdi i ulike situasjoner. Imidlertid analysen ble begrenset av den mulige tilstedeværelsen av ikke-informative ekspresjon eller sub-sett av gener med ulik oppførsel i løpet av de GO settene. Dermed reduserer dimensionality av celledød og Mitosis sett ved hjelp av prinsipal komponent analyse som fanget ~80% av variansen hevet antall signifikante korrelasjoner til 12 og 14 sett henholdsvis (Fig. 4

B

,

høyre

); disse tallene samsvarer med totalt -60% av signaturer undersøkt, uavhengig av type eller tilstand.

interactome nettverks foreninger

Funksjonelle relasjoner mellom proteiner kan identifiseres som direkte interaksjon, komplekse medlemskap eller relativt nære forbindelser i nettverket av protein-protein interaksjoner eller interactome nettverk. Gitt bevis på genomisk og transcriptomic nivåer presentert ovenfor, hypotese vi at proteiner kodet av tilsynelatende ulike signaturer vil bli nærmere ligger i interactome nettverk enn forventet ved en tilfeldighet. For denne analysen brukte vi et datasett bestående hovedsakelig av eksperimentelt identifisert protein-protein interaksjoner, unntatt homodimerer og orthology baserte spådommer, og beregnet den korteste veien mellom to noder eller proteiner i det gigantiske nettverkskomponent (dvs. den komponenten som inneholder flest tilkoblede proteiner) [41].

Alle signatur sammenligninger viste korteste vei distribusjoner forskjøvet mot lavere verdier enn forventet fra den gigantiske komponent (fig. 5). Statistisk evaluering ved hjelp av ikke-parametrisk MW test identifisert betydelige forskjeller med hensyn til gigantiske komponent distribusjon i 90% av sammenligninger. De minste korteste banene ble identifisert for den 21-genet prognostisk, og dasatinib og EGFR-TKI prediktiv signaturer, selv om resultatene kan være gjenstand for skjevhet fordi disse settene inneholder flere proteiner som er mye studert i litteraturen, og derfor har høy nettverk sentralitet.

En

, varmekart over gjennomsnittlig korteste stier mellom proteiner kodet av signaturer. Denne analysen ble utført kun ved hjelp av gigantiske nettverkskomponent. Et eksempel på korteste vei forskjeller med hensyn til den gigantiske komponenten er vist i panelet til høyre for sammenligning mellom komplett celledød og Mitosis GO sett.

B

, varme kartet sammenligninger av 1000 tilfeldig utvalgte 50-protein setter i den gigantiske komponenten. Høyre panel, tetthet tomt på gjennomsnittlig korteste veien i tilfeldig utvalgte sett: 5% lavere verdier er uthevet, noe som tilsvarer en gjennomsnittlig korteste veien 4,09. Sammenligninger mellom signaturer under denne empiriske cut-off vises med prikker i

A

.

C

, venstre panel, nettverk representasjon av gjennomsnittlig korteste stier mellom celledød og Mitosis og kreft signaturer som vist i innfelt. Kanter lengder er proporsjonal med den gjennomsnittlige korteste vei verdier. Høyre panel, nettverk representasjon av gjennomsnittlig korteste stier mellom celledød og Mitosis og kreft signaturer eller tilfeldig utvalgte protein sett med tilsvarende grad sentralitet.

For å ytterligere evaluere disse forskjellene, vi tilfeldig valgt 1000 sett av 50 proteiner med tilsvarende gjennomsnittlig grad sentralitet til signaturer og oppnådde sine korteste vei distribusjoner. Mesteparten av kreftskriftene ble tettere plassert enn forventet ved en tilfeldighet og også i nærheten av celledød og mitose komplette sett (empirisk

P

verdier. 0,05 merket med prikker i figur 5

A og B

). Ifølge disse observasjonene, undersøkelse av GO merknader i de direkte og one-hop bydelene signaturer identifisert betydelig overrepresentasjon av cellesyklus eller celledød vilkår eller sine barn i alle tilfeller (FDR justert

P

verdier 0,05) (GO sikt detaljer ikke vist), som forsterker hypotesen om at signaturen genprodukter er molekylært og funksjonelt forbundet med disse fremgangsmåter.

Deretter skriftene ble fremstilt som noder i et nettverk hvor lengden av kantene er proporsjonal med gjennomsnittlig korteste veien til celledød og mitose sett (figur 5

C

,

forlot

). I dette nettverket, ble de fleste signaturer funnet nær disse sentrale prosesser i forhold til 100 tilfeldige sett med tilsvarende utdanning sentralitet (Figur 5

C

,

midt

). Fjernt signaturer representert beskjedne forbindelser ved de forskjellige molekylnivåer undersøkt ovenfor, slik som prognostiske signaturer for B-celle-lymfom, kolorektal kreft og hypoksi respons. Disse observasjonene antydet sammenheng på tvers av ulike molekylære nivåer. Dermed ble det ikke observert negative korrelasjoner for alle signaturer mellom PCC co-uttrykk verdier og interactome korteste vei avstander (gjennomsnittlig

r

= -0,31 og

σ

= 0,16; Mantel test

P

-verdi = 0,059), noe som er konsistent med funksjonelle relasjoner [42] – [45]. Følgelig høyere koekspresjon mellom signaturer delvis korrelert med mindre korteste baner mellom dem i det interactome nettverket. Disse observasjonene markere betydningen av integrerende studien, som avslørte tidligere uidentifiserte relasjoner i genet lister.

Immunresponsen signaturen ble også plassert i nærheten av celledød og mitose sett (MW test

P

verdier og lt; 0,001) (Figur S1

A

). Derfor undersøkelse av andelen av GO merknader i ett-hop-området i denne signaturen identifisert over-representasjoner av vilkår knyttet til celleproliferasjon og død, mens de direkte interactors bare viste overrepresentasjon av begreper knyttet til immunsystemet (Figur S1

B

). Således, selv om genproduktene med prognostisk verdi for ER-negativ brystkreft ikke er direkte knyttet til de vanlige prosesser som er identifisert ovenfor, de er signifikant assosiert i en andre periode, så vel som transkripsjonelt ko-uttrykt og ko-regulert med flere signaturer.

Evaluering av eiendommer og interaksjoner i uavhengige datasett

observasjonene som er beskrevet ovenfor, ble undersøkt i to uavhengig genererte signaturer av kreft forhold. En fersk studie beskrev en lungemetastase underskrift av brystkreft ved bruk av en annen metodisk tilnærming [46]. Vi fant ~70% (15/21) av genene i denne signaturen å inneholde E2F TRANSFAC motiver og -60% (13/21) for å være mål for E2F1-AP2 og /eller ER. I tillegg ble det signifikante sammenhenger med åtte prognostiske signaturer identifisert, syv av dem av brystkreft (empiriske

P

verdier 0,001) (resultatene av analysene av denne signaturen er detaljert i tabell S2). Korrelasjonen med Mitosis var høyere enn forventet (empirisk

P

0,001), mens korrelasjonen med Cell Døden var ikke signifikant (empirisk

P

= 0,18). Endelig genprodukter i denne signaturen viste mindre gjennomsnittlig korteste stier enn forventet med 21 av de 28 underskrifter, inkludert celledød, Mitose og lungemetastase signatur presenteres tidligere [31] (empiriske

P

verdier 0,05).

For ytterligere å underbygge våre observasjoner, valgte vi en annen neoplastisk tilstand fra nyere litteratur: metastatisk kolorektalcancer behandles med EGFR-hemmer cetuximab (Erbitux®) [47]. Tidligere studier antyder at EGFR mutasjoner er assosiert med responsen på TKI, men ikke til cetuximab [48], [49]. Vi evaluerte våre observasjoner ved å undersøke fordelingen av genet merknader i rangeringen av hazard ratio (HRS) som måler respons på cetuximab behandling av progresjonsfri overlevelse. I denne analysen ble celleproliferasjon og immunresponsen identifisert som prosessene med størst effekt på responsen (fig. 6). Viktigere, sett av gener som har høy uttrykk sterkest forbinder til responsen var for en sår-lignende fenotype som tidligere ble vist seg å gi prognose verdi for brystkreft, lungekreft og magekreft [50]. De neste tilhørende høy-ekspresjon settene var for doxorubicin behandling i magekreft, brystkreft prognose (70-genet) og prognose av forskjellige krefttyper som ikke er undersøkt i denne studie (hepatocellulært karsinom og multippel myelom prognose). Videre høy uttrykk for E2F1, hypoksi og MYC mål var også assosiert med responsen med tilsvarende styrke (Fig. 6

A

). Sammen er disse observasjonene gir sin tilslutning til biologisk konvergens av underskrifter.

En

, venstre panel, GSEA resultater for den sterkeste forbundet fenotype med høy uttrykket genene forutsi behandlingsrespons (log

2 HR 0). Central panel, uttrykk analyse tomt på den ekstreme genuttrykk (

EREG

), som også ble nevnt i den opprinnelige publikasjonen [47]. Høyre panel, ekstra fenotypiske og GO sikt sett med high-uttrykk gener assosiert til behandlingsrespons på FDR

Q

verdier 1%.

B

, venstre panel, GSEA resultater for den sterkeste forbundet fenotype med lav-uttrykk genene forutsi behandlingsrespons (log

2 HR 0). Central panel, uttrykk analyse tomt på den ekstreme genuttrykk (

IL15

). Høyre panel, ekstra fenotypiske og GO sikt sett med lav-uttrykk gener assosiert til behandlingsrespons på FDR

Q

verdier 1%.

C

, Histogram tomt på gjennomsnitts uttrykk verdier av gener merket med immunresponsen eller Mitosis tvers prøver i cetuximab datasett. Gjennomsnittlig GO settuttrykk verdier viser en negativ korrelasjon med bestilt metastatisk prøver.

Analysen av cetuximab datasettet også avdekket en utfyllende oppførsel av celleproliferasjon og immunrespons i samsvar med representasjon av E2F1 motiver vist ovenfor . Pasienter med høy ekspresjon av cellespredningsrelaterte gener og lavt uttrykk av immunresponsrelaterte gener til behandling svarte (Fig. 6

B

), mens det var ingen pasienter med høye uttrykk verdier av begge prosessene. Derfor ble det observert en sterk anti-sammenheng mellom gener merket med GO sikt immunrespons og gener merket med Mitose (

r

= -0,79) (Fig. 6

C

). Denne observasjonen fører å spekulere i at disse prosessene spille balansering roller i prognose og behandlingsrespons. Gode ​​respondere til cetuximab kan vise sterk avhengighet av en «celledeling-on» molekylære program, mens ikke-respondere kan være følsomt for immunsystembasert terapi.

Diskusjoner

Til tross for den lave graden overlapping i form av genet identitet, tilsynelatende ulike kreft signaturer sammen på spesifikke biologiske prosesser. Konvergens er definert av betydelige molekylære og funksjonelle sammenhenger mellom gener og /eller proteiner: i /spådd promoter motiver; ii /eksperimentelt identifisert DNA bindingssteder; iii /cellesyklus-periodisk profiler; iv /ER-mediert transcriptional regulering;

Legg att eit svar