Abstract
Vi ga en cross-vev komparativ analyse av mellom-subtype molekylær felles for eggstokkreft, brystkreft, leverkreft, gliom, lunge plateepitel karsinom og nasofaryngeal karsinom . Vår analyse viser at molekylære undergrupper med lignende fenotype eller lignende kliniske resultatet kan være korrelert med deres transkripsjonen profil og sti profil. Pathway dysregulation tvers av flere kreft undergrupper ble også avslørt av Gene Set berikelse Analysis. Feilregulering av «utfylle og koagulasjon kaskader» ble observert i totalt elleve undergrupper over fem vev, impliserer at rollen til denne prosessen i personlig immunbasert terapi kan være verdt videre utforskning
Citation. Lin P, Huang Z (2013) korrelasjonsanalyse Kobler Cancer Subtyper. PLoS ONE 8 (7): e69747. doi: 10,1371 /journal.pone.0069747
Redaktør: Raya Khanin, Memorial Sloan Kettering Cancer Center, USA
mottatt: 08.01.2013; Akseptert: 12. juni 2013, Publisert: 08.07.2013
Copyright: © 2013 Lin et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Foundation Natural Sciences of China (tilskudd nummer~~POS=HEADCOMP: 30400496 og 90612020, URL: http: //www.nsfc.gov.cn). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Basert på høye gjennom genomewide transkriptom data, har molekylære subtyper av kreft hos mennesker blitt identifisert og preget av forskjellig biologi. For eksempel ble distinkte undergrupper av brystkreft i forbindelse med ulike mønstre av terapeutisk respons [1], ulike fortrinnsrett områder av tilbakefall [2]. I hode- og halskreft, ble ulike molekylære undergrupper forbundet med forskjellige mønstre av kopitall endring av kanoniske kreftgener [3]. I tykktarmskreft, subtyper delt likheter til forskjellige celletyper innenfor det normale kolon krypten og viser ulik grad av «stemness» og Wnt signal [4].
En fersk studie avbildet molekyl felles mellom basal-lignende brystkreft og eggstokkreft ved korrelasjonsanalyse av transkripsjonen profil [5], men det var uklart om basal-lignende brystkreft hadde en «vennskap» med en bestemt subtype av eggstokkreft. Egentlig molekylære kreft undergrupper med lignende biologiske egenskaper allerede finnes på ulike vev nettsteder. For eksempel, både Mes subtype av glioma og claudin
–
lav indre subtype av brystkreft ble preget av uttrykket av mesenchymale markører og immunrespons [6-8]. Tar sammen ble det reist spørsmål som hvorvidt undergrupper med lignende fenotype, eller lignende klinisk resultat, ville vise korrelasjon på et molekylært nivå? For å besvare dette spørsmålet, utførte vi korrelasjonsanalyse av transkripsjonen profil og sti profilen til eggstokkreft, brystkreft, leverkreft (HCC), gliom, lunge plateepitel karsinom (lunge SCC) og nasofaryngeal karsinom (NPC). Videre har vi analysert pathway aktiviteter for hver subtype og identifisert sti ofte perturbed på tvers av ulike vev.
Materialer og metoder
Mikromatrise datasett
Alle microarray datasett ble lastet ned fra GEO. For Affymetrix data, omregnet vi genuttrykk signal intensiteter av RMA [9] med Dai s EntrezGene-senter chip beskrivelse fil [10]. For to-farge data ble normalisert data matrise brukes direkte som forutsatt og prober for det samme genet ble slått sammen ved gjennomsnitt. Beskrivelsen av alle microarray data i denne studien var å finne i tabell S1. Datasett GSEA10186 ble ikke brukt for korrelasjonsanalyse av transkripsjonen profil på grunn av for mindre vanlige gener med andre datasett. Nasofaryngeal karsinom ble klassifisert i to undertyper basert på vårt tidligere arbeid (upubliserte data).
Publisert Mesenchymale overgang signatur
Tre publisert genuttrykk underskrift av epithelial-Mesenchymale Transition (EMT) eller Mesenchymale Transition ( MT) ble benyttet i vår analyse. Den Taube er «EMT kjerne signatur» representerer gener som deles av uavhengige genekspresjonssignaturer (gess) i menneskelige mammary epitelceller (HMLE) overtalt til å gjennomgå en EMT ved å uttrykke GSC, sneglen, Twist, eller TGF-β1 eller ved å slå ned uttrykket av E-cadherin [11]. Den Groger signatur inkludert gener som enten opp- eller ned-reguleres i minst 10 uavhengige GES av EMT [12]. Den Cheng underskrift ble foreslått for å representere en mer generell biologisk prosess med mesenchymale overgang fordi det ble også funnet i ikke-epitelial cancer inkludert hjernesvulst, neuroblastom og Ewings sarkom [13].
Korrelasjons analyse av transkripsjonen profil og sti-profil
data~~POS=TRUNC var median-sentrert av gener i hver årsklasse separat på første [5]. Så alle genekspresjon verdier for en prøve ble betraktet som sin transkripsjonen profil. De justerte datasett ble sendt til GenePattern [14] for enkeltprøve GSEA analyse [15]. De resulterende pathway berikelse score ble brukt som sti profil. Positive skår indikert gener i et bestemt gen sett er koordinert oppregulert i en prøve, og vice versa. Spearman rank korrelasjon av transkripsjonen profil og sti profilen ble beregnet som mellom-prøven likhet beregning.
Fylogeni av kreft subtyper
Medianen for Spearman rank korrelasjon av transkripsjonen profil mellom to undergrupper var minus etter 1 og deretter vedtatt som ulikheten avstand. Gjennomsnittlig-kobling hierarkisk clustering av den resulterende ulikheten matrisen ble utført i R.
hierarkisk clustering av veien profilen
hierarkisk clustering av veien profilen matrise (rader for vei og kolonner for subtype) ble utført i Cluster 3.0 [16] med Spearman korrelasjon som likhet metriske og gjennomsnittlig kobling som clustering metode. Poeng generert av ssGSEA ble benyttet direkte uten noen ytterligere data justering. Heatmap ble generert i R med positive vei berikelse score farget av gult mens negativ poengsum farget av blått.
Gene sett berikelse analyse (GSEA)
GSEA analyse [17] ble utført mellom svulster en bestemt subtype og de andre undertyper i hver årsklasse for seg. For Affymetrix genekspresjon profil og GSE10186 datasettet som ble representert av absolutte signalintensitetene, ble signal-til-støy-forhold som brukes som metrisk for å beregne genet differensialuttrykk. For GSE17710 datasettet som inneholder dataene var i log-ratio skala, ble forskjellen på klasse midler brukes til å beregne ganger endring og som metriske av differensial uttrykk. KEGG trasé levert av MSigDB 3,1 ble anvendt og bare veier som vesentlig anriket på minst en kreft subtype ved en FDR q-verdi 25% ble beholdt.
Resultater
korrelasjon analyse av molekylære profil koblet kreft subtyper
Vi først spurt om undergrupper med lignende fenotype eller lignende kliniske resultatet kan være korrelert med transkripsjonen profil og /eller sti-profil. For å besvare dette spørsmålet har vi målt mellom-subtype alminnelighet ved korrelasjonsanalyse av transkripsjonen profil og sti profil. En lignende landskapet ble funnet for begge to molekylære profiler, men det generelle nivået av Spearman rang korrelasjonskoeffisienter av hovedbane profiler var høyere enn for transkripsjons profiler (figur S1). Dette kan forklares ved det faktum at overlappingen av deler mellom gensettene kan legge til likheten av deres statistiske oppførsel.
Her har vi demonstrert molekyl felles mellom kreft subtyper ved hjelp av brystkreft, som et eksempel (figur 1). Den basal-lignende brystkreft har en tendens til å være positivt korrelert med glioma formeringen, HCC spredning, lunge SCC primitive og type II NPC som alle var preget av økt spredning signatur. Dette var konsistent med det faktum at basal-lignende brystkreft er også kjennetegnet ved høy ekspresjon av gener assosiert med celleproliferasjon. I tillegg basal-lignende brystkreft viste korrelasjon med bare subtyper C2, C4 og C5 for eggstokkreft [18].
tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentes.
Sammenligning med basal-lignende, luminal A hadde en nesten motsatt mønster av korrelasjon. Det viste tydelig sammenheng med andre bedre overlevelse subtype som glioma PN, lunge SCC sekretorisk og eggstokkreft C3, C6. Claudin-lav brystkreft ble preget av høy berikelse for epitel-til-mesenchymale overgang markører og immunresponsgener [7]. Den korrelasjonsanalyse med hell tatt likheten mellom claudin lave og glioma Mes, som også var en mesenchymale subtype [6] med overekspresjon av inflammatoriske gener og økt tetthet av tumor infiltrerende lymfocytter [8]. Uventet ble det observert en anti-korrelasjon mellom claudin-lav og mesenchymale eggstokk subtype C5. Heatmaps viser mellom-subtype molekylær alminnelighet fra visningen av andre krefttyper ble også gitt som supplerende tall (figur S2-S6).
For ytterligere å få en systematisk oversikt over mellom-subtype likhet, brukte vi medianen av korrelasjon koeffisientene til transkripsjons profiler mellom to undergrupper som likheten metriske og beregnet fylogeni av kreft undergrupper (figur 2). Vi har funnet at bedre overlevelse-subtyper brystkreft luminal A og eggstokk-kreft C3, C6 ble gruppert nær gliom PN som vist neuronal avstamning markører og viste lengre overlevelse [6]. Eggstokkreft C3 og C6 representert hovedsakelig serøs lav malignt potensial og lav grad endometrioid subtyper [18]. En annen undergruppe ble funnet som besto av brystkreft basal-lignende, brystkreft claudin-lav, glioma formeringen og HCC Chiang s proliferasjon. Den tidligere tre undergrupper var alle med dårlig overlevelse mens Chiang sin spredning ble betydelig korrelert med overekspresjon av alfaføtoprotein (AFP) og makrovaskulær invasjon [19]. Ovarian C1, C2 og gliom Mes ble gruppert med HCC Chiang sin betennelse. De tidligere tre som var assosiert med høyere tetthet av tumor-infiltrerende lymfocytter mens Chiang s betennelse var et interferon-relaterte underklasse [19]. Den fylogeni av kreft subtype også fanget histologi relaterte likheten, som undertyper av to plateepitel karsinom, lunge SCC og NPC, ble gruppert sammen.
Medianen for Spearman rank korrelasjon av transkripsjonen profil mellom to undergrupper var minus etter en og deretter vedtatt som ulikheten avstand. Beregning av svulst fylogeni ble deretter gjort ved å bruke gjennomsnittlig kobling clustering i R.
Kobling kreft subtyper med pathway aktiviteter
neste søkt å gi en global kartet pathway aktiviteter på tvers av seks typer av kreft hos mennesker (figur 3). En annen HCC datasett ble lagt som ble klassifisert i tre undertyper av Hoshida et al (betegnet som S1, S2 og S3) [20]. Unsupervised hierarkisk clustering av hovedbane profiler viste at prøver av ulike krefttyper ble blandet i stedet for å bli gruppert etter vev, noe som indikerer at pathway aktiviteter i kreft ble ikke regulert i en vev-spesifikk måte. Det ble observert at undergrupper preget av immunrelaterte biologi, inkludert claudin-low, C1, C2, HCC Chiang er betennelse, lunge SCC sekretorisk og type I NPC, var overrepresentert i gruppen K1. På den annen side ble luminal A, C5, S3, C3 og type II NPC over- representert i gruppe K2. En åpenbar forskjell i immunrelaterte pathway aktiviteter mellom disse to gruppene ble funnet.
Hver nettet representerer en score på vei aktivitet beregnes ved enkeltprøve GSEA. Ingen ytterligere justering av ssGSEA stillingen ble utført. Pathways ble bestilt etter kategori manuelt og atskilt fra andre ved hjelp av horisontale hvite linjer. Bare kategorier med mer enn fem trasé ble merket. Dendrogrammet ble delt i to grupper med gruppe K1 farget av blå og gruppe K2 farget av oransje. Den øvre horisontale fargelinjen merket subtyper overrepresentert i gruppen K1 mens den nedre horisontale fargelinjen merket subtyper overrepresentert i gruppen K2. De fleste undertypene ble betydelig anriket (p-verdi 0,05, Chi-squared test). Bortsett fra HCC Chiang sin spredning og CTNNB1 (p-verdi = 7.27e-02 og 7.86e-02, henholdsvis)
Vi fant at både Hoshida er S1 og Chiang sin spredning ble beriket i gruppe K1 mens Hoshida sin S3 og Chiang er CTNNB1 ble beriket i gruppe K2. Dette er konsistent med den observasjon at både Hoshida sin S1 ble betydelig beriket med genet signaturen til Chiang sin Proliferation mens Hoshida S3 ble betydelig beriket med genet signaturen til Chiang sin CTNNB1. Dermed undertyper med lignende genuttrykk signatur kan også være lik i det globale landskapet pathway aktiviteter.
Vi utførte også Gene Set Enrichment analyse for å identifisere veier som er knyttet til hver subtype. Som vår spesiell interesse i mesenchymale overgang, ble publisert EMT signaturer også tatt inn i analysen. På en FDR cutoff på 0,25, ble totalt 161 KEGG pathways funnet å være signifikant oppregulert /nedregulert i minst én subtype (tabell S2). 42 banene ble bare dysregulerte i en vev, og kan representere vevs-spesifikke prosesser. For eksempel ble 14 metabolisme-forbundet trasé funnet oppregulert /nedregulert bare i undertyper av leverkreft. På den annen side ble 22 reaksjonsveier dysregulerte i minst fem vev og kan derfor representere felles underliggende mekanismene for carcinogenesis. «Komp og koagulasjon kaskader «var den hyppigst perturbed vei, som det ble dysregulerte i elleve undergrupper.
GSEA av EMT underskrifter ble forenlig med mesenchymale fenotype av claudin-lav, Mes og hevdet at Hoshida er S1 og eggstokkreft kreft C1 kan også være mesenchymale undertyper (Tabell S2). Interessant nok ble nedregulert arm av to EMT underskrifter funnet signifikant nedregulert i C5. DAVID funksjonsanalyse viste at alle EMT signaturer vi brukte ikke overlapper med noen immun-forbundet pathway (tabell S3). Når du vurderer disse fem undergrupper bare ble elleve trasé downregulated bare i C5, men oppregulert i alle fire andre mesenchymale subtyper. «Komp og koagulasjon kaskader «ble nedregulert i både C5 og Hoshida er S1, men oppregulert i C1, Mes og claudin-lav.
Diskusjoner
Generelt biologiske egenskaper molekylære kreft subtyper kan være definert av sine genuttrykk signaturer. For eksempel ble mesenchymale undertyper vanligvis definert ved overekspresjon av mesenchymale markører og underexpression av epiteliale markører. Dermed kan det ikke bli overrasket over å finne felles signatur gener for kreft undergrupper med lignende biologi. I stedet for å sammenligne signatur gener, vår studie ga en systematisk analyse med fokus på genomewide transkripsjonen profil og sti profil. Våre resultater antydet at for subtyper er kjennetegnet ved tilsvarende biologiske egenskaper, kan deres felles påvises på et molekylært nivå, noe som indikerer at de biologiske prosess endringer kan spille i en genomewide måte i stedet for bare å begrense til et delsett av gener.
forskjellen mellom claudin-lav, glioma Mes og C5 ble avslørt av anti-korrelasjon av transcriptional profil og sti profil, tydelig mønster av EMT signatur berikelse og motsatt mønster av veien berikelse. En slik forskjell kan forklares ved det faktum at C5 hadde påfallende lav CD3 + og CD45 + celleinfiltrasjon i både tumor og stroma [18]. Immunrelaterte prosesser kan være relativt mindre involvert i oppkjøpet av en mesenchymale egenskap i C5. For to potensielle mesenchymale subtyper, ble C1 forbundet høy stromal respons og høyt antall stromal CD3
+ celler [18] mens S1 var preget av TGF-beta indusert Wnt aktivering og berikelse av en EMT-relatert gen set [20]. Den type, plassering og nivå av tumor infiltrerende lymfocytter forble uklart i Hoshida sin S1. Enten S1 og C1 var virkelig mesenchymale subtype nødvendig eksperimentell validering.
«Komp og koagulasjon kaskader «var en interessant prosess siden endringen av denne veien ble observert i elleve undergrupper inkludert oppregulering i C1, Mes, claudin-lav og nedregulering i C5, S1. Komplementaktivering kan potensielt være en svært viktig hendelse i anti-kreft immunitet og immunterapi [21] som det kunne ikke bare hjelp i tumor clearance men også fremme tumorvekst [22]. Tidligere studier har også involvert en sammenheng mellom EMT og komplementsystemet. For eksempel kan C5b-9 indusere ekspresjon av Response Gene til Komplement-32 (RGC-32) som kan i sin tur øke metastatisk fenotype ved å formidle TGF-β-indusert EMT i human bukspyttkjertelkreft celle [23,24]. I tillegg Tang Z et al viste at tubulære epitelceller utsatt for utfylle anaphylotoxin C3a vedtatt fenotypiske og funksjonelle egenskaper mesenchymale celler [25]. Koagulasjonsforstyrrelser er et vanlig problem i neoplastiske pasienter. En hyperkoagulasjonsreaksjonen stat kunne være forårsaket av ondartede celler i samspill direkte med hemostatic systemet og aktivering av koagulasjonskaskaden. Trombin ble dannet ved proteolytisk spaltning av koagulasjonsfaktor II i koaguleringskaskaden og handlet i sin tur som en serin protease som konverterer oppløselig fibrinogen til uoppløselige tråder av fibrin, så vel som katalyserer mange andre koagulerings-relaterte reaksjoner. Det ble allerede rapportert at trombin kunne støtte tumorcelle-kreft [26-28]. Tumorceller kunne uttrykke vev faktor som dermed samhandler med koagulasjonsfaktor VII (FVII) og koagulasjonsfaktor X (FX) til genererer trombin å forbedre tumorprogresjon [29].
I sammendraget, feilregulering av komplement og koagulasjon kaskader i totalt elleve undergrupper over fem vev innblandet at videre studier av denne prosessen kunne motivere roman immunitet-basert strategi for personlig terapi.
Konklusjon
Vårt arbeid oppdaget molekylære felles mellom kreft subtyper av korrelasjonsanalyse av transkripsjonen profil og sti profil. Molekylær klassifisering av menneskelig kreft er bare et tidlig skritt mot personlig medisin. Med flere og flere data (ikke begrenset til transkriptomet) blir tilgjengelige, kan vi forvente flere og flere kreftformer blir klassifisert i molekylære undergrupper. Vår metode, og selvfølgelig andre forbedrede og forbedrede fremgangsmåter, kan brukes for å konstruere en mer omfattende kart av kreft subtyper. Med et slikt kart, kan kunnskap for en bestemt kreft subtype gi ledetråder for en utvidet forståelse av sin «venn» undertyper i andre kreftformer og bringe potensielle nye terapeutiske muligheter.
Hjelpemiddel Informasjon
Figur S1.
Scatter tomt på korrelasjonskoeffisient. En lineær modell ble plass til de data ved hjelp av korrelasjonskoeffisientene av transkripsjonen profil som uavhengig variabel. Den resulterende p-verdi og koeffisienten var viste
doi:. 10,1371 /journal.pone.0069747.s001 plakater (TIF)
Figur S2. Host Sammenligning av eggstokkreft og annen kreft. Tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentesene
doi:. 10,1371 /journal.pone.0069747.s002 plakater (TIF)
Figur S3. Host Sammenligning av glioma og annen kreft. Tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentesene
doi:. 10,1371 /journal.pone.0069747.s003 plakater (TIF)
Figur S4. Host Sammenligning av leverkreft og andre kreft. Tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentesene
doi:. 10,1371 /journal.pone.0069747.s004 plakater (TIF)
Figur S5. Host Sammenligning av lunge plateepitel karsinom og annen kreft. Tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentesene
doi:. 10,1371 /journal.pone.0069747.s005 plakater (TIF)
Figur S6. Host Sammenligning av nasopharyngeal carcinoma og andre kreft. Tumorprøver ble gruppert etter subtype. Gule nett representert positiv korrelasjon mens blått rutenett representert negativ korrelasjon. Antall prøver per subtype var inne i parentesene
doi:. 10,1371 /journal.pone.0069747.s006 plakater (TIF)
Tabell S1. , En kort beskrivelse av alle microarray datasettet brukt i denne studien. En «*» i forskningen typen kolonne indikerte at den tilsvarende undersøkelsen definert de molekylære undergrupper
doi:. 10,1371 /journal.pone.0069747.s007 plakater (XLSX)
Tabell S2.
GSEA resultater for KEGG trasé og publisert EMT signatur. . Bare de med q-verdier mindre enn 0,25 ble inkludert
doi: 10,1371 /journal.pone.0069747.s008 plakater (XLSX)
tabell S3. Search Results av DAVID funksjonell analyse av publiserte EMT signaturer.
doi: 10,1371 /journal.pone.0069747.s009 plakater (XLSX)