PLoS ONE: Intra-Gene DNA Metylering Variasjon er en klinisk Uavhengig prognostisk markør i kvinner Cancers

Abstract

Vi introduserer en ny per-genet mål på intra-genet DNA metylering variasjon (IGV) basert på Illumina infinium HumanMethylation450 plattformen, som er prognostiske uavhengig av kjente prediktorer for klinisk utfall. Ved hjelp av IGV, vi utlede en robust gen-panel prognostisk signatur for eggstokkreft (OC,

n

= 221), som validerer i to uavhengige datasett fra Mayo Clinic (

n

= 198) og TCGA (

n

= 358), med betydningen av

p

= 0,004 i begge settene. OC prognostisk signatur gen-panel består av fire genet grupper, som representerer forskjellige biologiske prosesser. Vi viser IGV målinger av disse gener gruppene er mest sannsynlig en refleksjon av en blanding av intra-tumor heterogenitet og transkripsjonsfaktor (TF) binding /aktivitet. IGV kan brukes til å forutsi klinisk utfall hos pasienter individuelt, noe som gir en surrogat lese ut av vanskelige å måle sykdomsprosesser

Citation. Bartlett TE, Jones A, Goode EL, Fridley BL, Cunningham JM, Berns EMJJ, et al. (2015) Intra-Gene DNA Metylering Variasjon er en klinisk Uavhengig prognostisk markør i kvinner kreft. PLoS ONE 10 (12): e0143178. doi: 10,1371 /journal.pone.0143178

Redaktør: Dajun Deng, Peking University Cancer Hospital og Institute, KINA

mottatt: 5 oktober 2015; Godkjent: 30 oktober 2015; Publisert: 02.12.2015

Copyright: © 2015 Bartlett et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: DNA metylering data for hoved OC datasettet analysert her har blitt deponert i Gene Expression Omnibus (GEO) under tiltredelse antall GSE72021

Finansiering:. Dette arbeidet ble finansiert (MW, AJ) ved syvende rammeprogram EUs ( FP7 /2007-2013) under tilskuddsavtalenummer 305428 (Prosjekt EpiFemCare), ved National Institute for Health Research University College London Hospitals Biomedical Research Centre, og ved Eva Klage og European Network Translasjonell forskning i Gynekologisk onkologi (ENTRIGO) av European Society of Gynekologisk onkologi (ESGO). TEB fått støtte fra Storbritannia Engineering og Fysisk Sciences Research Council (ESPRC) og UK Medical Research Council (MRC) via UCL kompleks. ELG fått støtte fra Fred C. og Katherine B. Andersen Foundation, gir NIH R01-CA122443, P50-CA136393 (Mayo Clinic Eggstokkreft SPORE) og P30-CA15083. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Forkortelser : BRCA, brystkreft invasive carcinoma; DNAm, metylering DNA; EC, Endometriekreft; KODE, Encyclopedia of DNA-elementer; FDR, False funnrate; ITH, Intra-tumor heterogenitet; OC, Eggstokkreft; IGV, Intra-genet variasjon av DNA metylering; TCGA, The Cancer Genome Atlas; TF, transkripsjon faktor; UCEC, livmoren livmorkreft

Innledning

Forskjeller i DNA metylering (DNAm) nivåer er blant de tidligste endringer i menneskelig kreft [1], og er et kjennetegn på kreft [2], som tilbyr potensialet for nye strategier for å forutsi kreft biologi og utfall. De epigenetiske forskjeller som disse forandringene gir opphav til, er mer stabile enn forskjeller i genekspresjon nivå. Genuttrykk nivåer, målt ved RNA, er gjenstand for periodiske og forbigående variasjon (for eksempel døgnvariasjon og mRNA ustabilitet), som ikke gjelder for DNAm. Identifisere pålitelig indikator på forskjeller i DNAm mønstre kan gi en verdifull leder for utvikling av DNA-baserte kreft biomarkører i vev og kroppsvæsker.

Eggstokkreft (OC) og livmorkreft (EF) er den vanligste gynekologiske -kreft [3]. Kun én av tre pasienter med avansert stadium OC overleve i fem år etter deres første diagnosen [4]. Svært lite er kjent om OC biologi og hvordan du kan manipulere denne sykdommen terapeutisk. DNAm endringer som er viktige i kreft [5]; den epigenome er et grensesnitt mellom genomet og miljøet [6, 7], og følgelig DNAm endringer kan måle eksponering for miljømessige risikofaktorer for kreft. DNAm biomarkører som representerer et surrogat for mønstre av genet interaksjon har tidligere vært forbundet med klinisk utfall i et bredt spekter av kreftformer [8], samt spesielt i kvinnekreft [9].

Prøve å prøve variabilitet DNAm på bestemte genomiske steder er kjent for å være viktig i utviklingen av kreft [10, 11], og det er nylig vist at en økning i intra-genet variasjon av DNAm (IGV), et mål på i-prøven metylering variabilitet ( fig 1a), er sterkt assosiert med cancervev i forhold til friske [12]. Differensial metylering er vanlig brukte metoden som metylering nivåer sammenlignes mellom vev, fenotyper og eksperimentelle forhold (ekvivalent til differensial uttrykk av gener). Her utvikler vi en prognostisk signatur basert på IGV som er uavhengig av kjente kliniske prognostiske funksjoner, og viser at dette IGV prognostisk signatur er trolig en surrogat avlesning reflekterer en blanding av intra-tumor heterogenitet og transkripsjonsfaktor (TF) binding /aktivitet .

(a) gjennomsnittlig metylering nivå over en bestemt genomisk region beregnes separat for TSS200 (promoter) og genet kropps genomiske regioner. Den blå kurven viser den nye posisjonen til den røde kurven etter en additiv globale skift i metylering nivå, noe som kan skyldes tekniske eller andre eksperimentelle faktorer, og forskjellen mellom de horisontale røde og blå linjer (gjennomsnittsnivåer) illustrerer effekten av dette skift på det midlere nivå metylering. (B) Den intra-genet metylering variabilitet (IGV) beregnes fra den variasjon omkring den midlere metylering nivå, dvs. fra de stiplede vertikale linjer, og er på lignende måte beregnes separat for hvert TSS200 og genet kropps genomiske regioner. De vertikale grønne linjer endres svært lite i forhold til de vertikale røde linjer, viser at en slik global additiv skift i gjennomsnittlig metylering nivå har mye mindre effekt på IGV, som blir derfor referert til som en «selvkalibrerende måle «.

Resultater

Sammenligning av prediktiv robusthet per-genet metylering tiltak i data

for å vurdere effektiviteten og robusthet IGV i forhold til å bety metylering nivåer, vi sammenlignet fire per- genet metylering tiltak, basert på gjennomsnittlig metylering nivå og IGV (fig 1). For hvert gen, beregnet vi midlere metylering nivå og IGV, separat for promotoren (TSS200) og genet kroppsregioner, ved hjelp av Illumina infinium HumanMethylation450 plattform spesifikasjoner for CPGs i disse regioner for hvert gen. Vi vurderte ulike genomiske regioner separat, fordi metylering mønstre varierer sterkt fra en genomisk region til en annen, og effekten av metylering nivå på genregule varierer i henhold til genomisk region. De fire tiltakene vi sammenlignet, er som følger:

TSS200 bety metylering

TSS200 IGV

Gene kroppen bety metylering

Gene kroppen IGV

Vi har innhentet genom-wide DNAm profiler, via Illumina infinium HumanMethylation450 plattformen, fra 218 primær OC prøver. For hver av de fire målene er beskrevet, anvendte vi «elastisk nett» [13, 14] for å finne et prognostiske av genene. Elastisk nett er funnet å være en optimal lineær modellering Fremgangsmåte for å identifisere grupper av gener som virker sammen som en del av en felles biologisk prosess [15]. Det er en tilbakegang metode som «velger» settet av gener som modell data beste, prøver å inkludere så få gener i modellen som mulig, samtidig som det sikres at modellen predikerer utfallet av interesse så nøyaktig som mulig. Ved å gjøre det, forkaster det gener som ikke gir nyttig informasjon, eller som gir gjentatt informasjon. Som vårt mål å finne et minimalt sett av gener som kan brukes som en prognostisk signatur, er det viktig å merke seg at blant disse genene, vil det være grupper av gener som deres IGV inneholder overflødig eller overlappende informasjon, og det vil være grupper gener som IGV inneholder utfyllende informasjon om hvert gen. Derfor valgte vi å bruke Elastisk Net teknikken til nøyaktig skjelne en slik ikke-redundante gruppering av gener som en minimal prediktiv sett fra svært mange muligheter, genome wide. Vi merker oss at mens denne metoden kan virke kompleks i denne sammenheng, ville enklere metode ikke være i stand til å skjelne disse parsimonious grupperinger av gener i hvilket overlappende og overflødig informasjon blir holdt på et minimum.

Vi vurderte virkningen av per-genet metylering tiltak som prognostiske tiltak fra tilfeldig dele dataene inn i to deler: en «treningssett», og en «testsett». Elastisk Netto ble brukt til å velge gener og passer en modell for treningssettet, og evnen av dette gen utvalg og modell for å forutsi blindt pasientoverlevelse utfall (korrigert for kliniske kovariabler) ble vurdert ved hjelp av testsettet. Dette ble gjentatt 2001 ganger, og betydelig prediktiv utvalgte grupper av gener ble definert i henhold til falske funnrate (FDR) justert [16]

p

-verdi (dvs. FDR

q

-verdi) 0.1 (fig 2a). Som vist i figur 2b, bare gen legeme IGV forutsier også.

(a) Metodikk oversikt for sammenligning av de fire per-genet metylering tiltak. (b) Resultatene av denne sammenligning. (C) Metodikk oversikt for beregning av eggstokkreft IGV prognostisk poengsum.

Utledning av en eggstokkreft prognostisk signatur, og IGV prognostisk poengsum

Vi brukte IGV å utlede en OC DNAm prognostisk signatur (figur 2c), basert på gen-legeme IGV (herfra videre bare referert til som «IGV «). Vi gjorde dette ved å bestemme en enighet om et sett av gener som predikerer overlevelse, ved å følge samme prosedyre for å splitte data til test- og treningssett, og deretter vurdere genet utvalg og utstyrt modell for sin evne til å blindt forutsi pasientens overlevelse utfallet (justert for kliniske kovariater) i testsettet. For å sikre konvergens til et stabilt resultat, har vi gjort 10

5 slike skillevegger av dataene, som hver resulterer i en prediktiv av genene. Av disse 8281 ble funnet som signifikant (FDR

q

0,1), og betydning for hvert gen ble deretter beregnet ut fra antall signifikante modeller der det genet dukket opp. 679 gener ble valgt som dette for inkludering i OC prognostisk signatur på et signifikansnivå på FDR

q

0.05, med den minst signifikante-genet til stede i 1057 av 8281-modell passer. De 100 mest betydningsfulle av disse genene er vist i Utfyllende Bord (S1 File).

Gener ofte fungere sammen som en del av biologiske mekanismer og prosesser. Derfor kan vi forvente at disse 679 OC prognostiske signatur gener kan representeres ved et mindre antall underliggende biologiske prosesser som er viktige for utvikling av sykdommen. Gruppering gener med liknende eksperimentelle målingene ved hjelp av gruppering metodikken er godt etablert som en effektiv metode for å bestemme klinisk relevante prognostiske markører [17, 18]. Derfor, for å avdekke slike grupperinger i 679 gener av våre OC prognostisk signatur, gjennomførte vi konsensus clustering [19], for å identifisere grupper av gener med lignende mønstre av IGV over pasientene. Hver klynge er identifisert på denne måte viser en annen IGV trend, og derfor kan svare til en annen underliggende biologisk prosess, som gir opphav til mønsteret av IGV observert i den klyngen. Den clustering ble utført separat for gener som ble individuelt forbundet med dårligere overlevelses utfallet for økt IGV ( «hyper» gener) og for redusert IGV ( «hypo gener). Resultatet ble fire klynger: to fra hyper gener, kalt klynger «hyper 1 «og» hyper 2», og to fra hypo gener, kalt klynger «hypo 1 «og» hypo 2»; de er vist i Utfyllende Tables (S1 fil). Den midlere IGV av genene til hver av de fire grupper gir en IGV «klynge score «for hver klynge og for hver enkelt pasient, som er tatt for å være representative for de forskjellige IGV trender, og tilsvarende underliggende biologiske prosesser, innenfor OC prognostisk signatur.

Vi beregner deretter en IGV prognostisk poengsum, ved å montere en multivariat Cox-modell (regnskap også for kliniske kovariater) til de fire IGV klase score. Det var ikke mulig å montere en slik modell for hele settet med 10014 gener, fordi det finnes mange flere prediktor variable (gener) enn prøvene [20]. Imidlertid reduserer den prognostiske signaturen til 4 cluster resultater, dvs. 4 prediktorene, gjør det mulig for Cox-modellen som skal monteres. Dette resulterer i en modell koeffisient for hver klynge poengsum /prediktor; disse brukes til å beregne IGV prognostisk stillingen. Den IGV prognostisk score er et ett-tall prognostisk indikator for en enkelt prøve /pasient, og vi oppmerksom på at det må beregnes basert på alle fire klase score, til å være betydelig prognostisk.

median på dette IGV prognostisk resultatet ble brukt til å dele pasientene i hoved OC datasettet til bedre og dårligere prognostiske grupper, er vist på fig 3a og 3b. Den IGV prognostisk Poengsummen ble validert i to uavhengige sett med kreft som stammer fra Mullerian kanalen. En ny OC satt fra Mayo Clinic (

n

= 198) bekreftet prognostisk kapasiteten på IGV prognostisk score i både univariate (Fig 3c) og multivariate (fig 3d) analyser. For å teste om IGV prognostisk poengsum er bare begrenset til OC, eller om det er også logisk i andre krefttyper som oppstår fra samme embryologiske struktur (dvs. Mullerian duct), søkte vi vår prognostisk poengsum til en offentlig tilgjengelig livmoren endometrioid karsinom (UCEC) satt fra

The Cancer Genome Atlas plakater (TCGA) [21] (

n

= 358). Igjen, både i univariate (Fig 3e) og multivariate (Fig 3f) analyser, kunne vi validere den IGV prognostisk poengsum

(a), (c) og (e). Sammenligning av overlevelseskurver grupper definert av IGV prognostisk score, i: (a) hoved OC datasettet, (c) Mayo Clinic OC valideringssett, (e) i livmorkreft TCGA valideringssettet. Gruppene er delt av median IGV prognostisk poengsum utledet i hoved OC DNAm datasettet. Hazard ratio (

HR

) vises med 95% CI i parentes, med tilsvarende

p

-verdi beregnes ved univariate Cox regresjon. (D), (e) og (f). Multivariat Cox regresjon sammenligne de samme gruppene som er definert av IGV prognostisk poengsum

Vi registrerer at bruk av median prognostisk score fra hoved OC datasettet (treningssettet) til dichotomise pasientene av Mayo OC og TCGA UCEC validerings sett gjør dette til en sann vurdering av prognostisk evne til denne metodikken. Dette er fordi du ved denne metoden, blir pasientene av valideringssett klassifisert en etter en inn i en bedre eller verre prognostisk gruppe, når det gjelder deres DNAm bare målinger. Denne klassifiseringen er gjort i henhold til en terskel eller grense dele disse prognostiske grupper (dvs. medianen av den prognostiske score i treningsdatasettet), og denne terskelen er satt helt uavhengig av disse validerings datasett.

IGV og intra-tumor heterogenitet

Vi foreslår at IGV klase score er hver representant for ulike biologiske prosesser, viktig for sykdom utfallet. Men hva er disse prosessene? For å prøve å finne noen svar på dette spørsmålet, må vi først hypotese at intra-tumor heterogenitet kan være en refleksjon av IGV. Faget intra-tumor heterogenitet er for tiden mottar mye oppmerksomhet, avdekke mye romlig og tidsmessig mangfold i genomisk prosesser innenfor enkelte svulster [22]. Ideelt sett bør DNA methylome av individuelle celler fra samme tumor prøven bli analysert for å løse dette spørsmålet. Som en alternativ metode, bruker vi her på tvers av prøven metylering varians (dvs. bety metylering variansen av individuelle CPGs av et spesifikt gen-legeme-regionen), som et mål på intra-tumor metylering heterogenitet, for å vurdere hvordan denne varierer som en funksjon av IGV (fig 4a). Kryss prøven metylering variabiliteten er også et mål på hvor like metylering profiler er for genet, på tvers av prøvene. Hvis cross-prøven metylering variabilitet var en refleksjon av IGV, som IGV øker, ville vi forvente å se en stadig økende grense prøve metylering varians (figur 4b, forventet proporsjonal passform). Men i stedet ser vi et mønster der for lav IGV, cross-sample metylering variansen øker, mens for høy IGV, reduserer kryss prøve metylering varians igjen og er svært lav for de høyeste IGV verdier. For å validere dette videre, analyserte vi ytterligere to datasett, som flere prøver fra forskjellige regioner i samme kreft har blitt tatt. Den første tilleggsdata settet er hentet fra livmorkreft, der uavhengige prøver har blitt tatt fra 2 eller 3 primære kreft og metastaser, i hver av 10 pasienter (figur 4c, en kurve av beste passform er vist per pasient). Den andre er avledet fra prostata cancer, hvor 8 uavhengige prøver har blitt tatt fra samme tumor, fra hver av de fem kreftpasienter [23] (figur 4d, en kurve per pasient). Mønsteret av disse kurvene er nesten identisk til de intra-tumor heterogenitet studier, i hoved OC studie som vi benyttet til å identifisere den OC prognostisk signatur (figur 4b), og i basalprøver fra TCGA bryst-kreft-invasivt karsinom (BRCA) data-sett (figur 4e). Overlappingen av gener i alle regioner av disse tomter er også av stor betydning på tvers av datasett (Fig 4f-4h).

(a) Cross-sample variasjon av metylering (Intra-tumor heterogenitet) og IGV regnes i forskjellige og utfyllende retninger. Heatmap viser metylering profilen til et enkelt gen (horisontal akse), på tvers av flere prøver (vertikal akse). (B) – (e) En karakteristisk mønster av høy cross-prøve variabilitet (intra-tumor heterogenitet) når IGV er lav, og vice-versa, er konsekvent observert på tvers av ulike studier: (b) Hoved OC data-set, (c ) Endometriekreft intra-tumor heterogenitet data-set, (d) prostatakreft intra-tumor heterogenitet data-set, (e) BRCA basal datasettet. (F) – (h) Overlappingen av gener i hver region fra (b) med gener i tilsvarende områder av (c) – (e) er av stor betydning. I (c) og (d) vedrører hver linje til prøver fra en enkelt pasient, og er en best tilpassede kurve tilsvarende den som er vist i (b) og (e). I (b), odds-ratio og

p

-verdier på toppen av plottet viser anrikning av genene til hver klynge, på hver side av median IGV av prognostisk signatur. Forkortelser:. ITH (intra-tumor heterogenitet), OC (ovarialcancer), BRCA (brystkreft invasivt karsinom)

Genene til klyngen hyper en er noe overrepresentert i venstre halvdel av fig 4b, hvor IGV er lavere, og kryss-prøven metylering heterogenitet er vanligvis høyere. Dette tyder på at den økte IGV av disse genene er forbundet med intra-tumor heterogenitet. Imidlertid gener klynger hyper 2 og hypo to fall for det meste i området av høy IGV og lav kryss prøve metylering variabilitet (mot høyre i figur 4b). Dette betyr at for genene i disse klyngene, deres metylering profiler har en tendens til å være lik i forskjellige prøver fra den samme tumor, eller fra forskjellige tumorer. I tilfelle av klyngen hyper 2, svarer dette til høy metylering variasjonen innen et enkelt gen i fattige prognostiske tilfeller, og at denne variasjonen er gjennomgående lik over hele tumoren og mellom tumorer. Derfor gener klynge hyper 2 viser høy IGV i fattige prognostiske tilfeller, men ser ut til å være uavhengig av intra-tumor heterogenitet. Derfor spekulere vi at den økte IGV av disse genene er en tumorcelle iboende fenomen, uavhengig av intra-tumor heterogenitet. Dette betyr at IGV prognostisk signaturen kombinerer målinger av intra-tumor heterogenitet, med de av uavhengige, tumor-celle iboende fenomener. Vi merker oss at begrepene «hyper» og «hypo», her forholder seg til endring, snarere enn absolutte nivået. For eksempel viser S1 Fig at klyngen testet to har den høyeste IGV av noen klynge; imidlertid IGV av denne klyngen er faktisk lavere i dårlig sammenlignet med gode prognostiske tilfeller.

Genene som definerer klynge hypo 1 har høyest midlere tverr prøve metylering variasjon (figur 4), så vel som den høyeste midlere metylering nivå (S2 figur), og den lave IGV av hypo 1 genene er assosiert med dårlig prognose. I begynnelsen virker det vanskelig å forklare at fattige prognostiske kreftformer har lavere IGV i hypo1 gener, men disse hypo1 genene representerer også høy sample-prøven metylering heterogenitet. For å forklare dette, anvendte vi et mål på CpG-CpG metylering variabilitet, som vi kaller den midlere derivatet [12], som er beregnet som den gjennomsnittlige absolutte forskjell i metylering nivåer mellom tilstøtende CPGs av genet-legeme av et gen, i en enkelt prøve. Den Illumina HumanMethylation 450K rekke måler metylering nivåer av spesifikke CpG loci, i gjennomsnitt over en mixed-up prøve av mange celler. Fig 5a og 5b viser to eksempler på hvor høyt metylering variabilitet på enkeltcellenivå kan manifestere seg i målingene ervervet ved hjelp av denne teknologien.

450K utvalg gir metylering målinger fra en mixed-up prøve av flere celler. (A) Et eksempel på en metylering mønster som er svært variabel, på en lignende måte på tvers av celler. Dette fører til lav kryss-prøven heterogenitet, og høy IGV, som i klynge hyper 2. (b) Et eksempel på en metylering mønster som er meget varierende, men i en heterogen måte på tvers av celler. Dette fører til høy kryss-prøven heterogenitet, men nettoeffekten av gjennomsnittet av metylering profiler på tvers av blandet opp prøve av mange celler gir en måling med lav IGV, som i klynge hypo 1. (c) En måling av CpG-CpG metylering variabilitet , beregnet som den midlere derivat, eller den midlere absolutte forskjell i nivå mellom tilstøtende metylering CPGs. (D) variasjoner av den midlere-derivatet mål på tvers av prøvene kvantifiserer heterogenitet av CpG-CpG metylering variabilitet. Klynge hyper 2 er lav i henhold til (d), og dermed svarer til et mønster, for eksempel (a). Klynge hypo en er høy i henhold til (d), og dermed svarer til et mønster slik som (b).

I eksempelet på figur 5a, ser vi at det er liten celle-celle heterogenitet selv om det er mye variasjon innenfor et gen. Derfor, dette resulterer i målinger av høy IGV, og lav kryss-prøven metylering variabilitet, som vi ser i klynge hyper 2. Deretter Fig 5b viser et eksempel hvor det er mye celle-celle variasjon, samt mye variasjon innenfor et gen . Resultatet er at kryss prøven metylering variasjon av tabellen målingene er høy, men fordi de svært variable metylering profiler gjennomsnitts ut «over de blandede opp celler i prøven, er netto resultatet en måling med lav IGV. For å undersøke om denne hypotesen er sannsynlig, bruker vi den gjennomsnittlige derivat mål på CpG-CpG metylering variasjon (figur 5c). Ved å vurdere hvordan heterogen dette CpG-CpG variasjonen er over prøver (figur 5d), er vi i stand til å bekrefte at i genene av klyngen hypo en tendens til at CpG-CpG metylering variasjon å være mer forskjellig på tvers av ulike celler enn i noen annen klynge , som reflekteres av den høye variansen for de midlere-derivat målinger. Vi er også i stand til å bekrefte fra figur 5d som i genene i klynge hyper 2, har en tendens CpG-CpG metylering variabilitet til å være mindre forskjellig på forskjellige celler enn i noen annen klynge, som angitt ved lav varians av middelverdien derivatet. Således støtter disse dataene den modellen som er vist på figur 5a og 5b for gener i klynge hyper 2 og hypo 1, respektivt.

funksjonell rolle av transkripsjonsfaktor-aktivitet i IGV

genene omfattende klynge hyper 2 ser ut til å vise den samme IGV i de fleste cellene i svulsten, men den høye IGV av klyngen hyper 2 genene er assosiert med dårlig prognose, vi anser klyngen hyper 2 IGV å være en «konsekvent tumorceller iboende fenomen « , noe som sannsynligvis vil være regulert av differensial binding av transkripsjonsfaktorer (TF). Derfor, undersøkte vi TF-binding til genet kroppsregioner av OC prognostisk signatur gener, og testet korrelasjonen av TF uttrykk med den IGV av genene som de binder seg til (i en TCGA sett av basal brystkreft). Vi fant ut at hver prognostisk signatur klynge viser sin egen karakteristiske mønster av TF binding (figur 6a), som vi kan hypoteser er knyttet til de biologiske prosessene som er ansvarlig for den karakteristiske mønster av IGV observert i at klyngen.

(a ) False oppdagelse hastighet reguleres

p

-verdier og odds-ratio (OR) viser anrikning av binding av spesifikke transkripsjonsfaktorer (TFS), til genet kroppsregioner av genene i hver klynge. TFS hvor bindingen er betydelig over eller under beriket (Fishers eksakte test, FDR

q

0,05) er farget grønn og rød, henholdsvis. (B) TFS som viser signifikant mer positiv korrelasjon med IGV av genene som de binder seg til, sammenlignet med de genene de ikke binder seg til. (C) TFS som viser signifikant mer negativ korrelasjon med IGV av genene som de binder seg til, sammenlignet med de genene de ikke binder seg til. (D) TFS som har betydning i henhold til (a) og enten (b) eller (c); TFS med kjent relevans, er angitt med en henvisning til den aktuelle studie. Mangelen på anrikning av TF binding til gener klynge hypo2, er en refleksjon av det lave antallet (19) av gener i denne klyngen.

transkripsjon faktor bindende nettstedet informasjon, hentet fra KODE ( Encyclopedia of DNA Elementer) prosjektet [24], som var tilgjengelig for genet kroppsregioner for alle genene er representert i Illumina HumanMethylation 450K matrise, for 55 transkripsjonsfaktorer. Vi testet hver av disse 55 TFS, for betydelig økt eller redusert binding til genene til hver signatur prognostisk klynge. Cluster hypo 2 består bare av 19 gener, og dermed ville vi ikke forvente å se mange viktige sammenhenger, på grunn av liten utvalgsstørrelse. Men interessant for klynge hyper 2 (bestående av gener hvis metylering nivåene variere litt på tvers av svulster, men viser høyere IGV), ser vi at 20% (11/55) av TFS testet viser betydelig mer binding til disse genene enn forventet, mens 16 % viser betydelig mindre forpliktende enn forventet. For de gensamlingene som DNAm varierer over /inn i kreftsvulster og har generelt lave IGV (klynger hyper en og hypo 1), ikke en eneste TF viste høyere enn forventet binding, mens 27% og 38% av TFS viser lavere enn forventet binding til genene som omfatter klynge hyper 1 og hypo 1, henholdsvis. Dette er i overensstemmelse med ideen om at TF-binding som er involvert i distinkte og forskjellige prosesser knyttet til IGV og metylering heterogenitet innenfor en prøve.

Vi ønsket også å teste den faktiske korrelasjonen av ekspresjon av TFS med IGV av genene de binder seg til, og genene de ikke bindes til, genom-bred. For å gjøre dette, brukte vi en TCGA sett basal brystkreft, der 450 k metylering data samt expression data finnes. Vi har allerede etablert en høy grad av likhet i oppførsel av våre prognostiske signatur gener i OC og disse TCGA BRCA basalprøver (fig 4). Videre har det blitt grundig demonstrert av TCGA konsortium som høyverdig serøs eggstokkene og livmor og BRCA basal kreft er ekstremt molecularly lik [25]. Fig 6b og 6c viser TFS med betydelig mer positiv, og mer negativ, korrelasjon med IGV av genene som de binder seg til, sammenlignet med de genene de ikke gjør det. Det er interessant at de to mest høyt rangert transkripsjonsfaktorer i henhold til økt positiv korrelasjon av deres uttrykk med IGV i bundet gener,

Rad21 Hotell og

Brg1 product: (

SMARCA4

), er begge deler av kromatin modifiser komplekser med relevans til stamcelle identitet [26, 27]. Spesielt

Brg1 product: (

SMARCA4

) har nylig vist seg å ha særlig relevans for små-celle eggstokkreft [28-30]. Overlappingen mellom den TFS som viser signifikant forskjellige bindingsmønstre i forhold til OC prognostiske gener signatur, og TFS som oppviser signifikant endret korrelasjon av deres ekspresjon med IGV av gener som de binder seg til, er vist på figur 6d. Mye relevant detalj har allerede blitt rapportert om de fleste av disse TFS (referanser bemerket i figuren): enten deres bindende påvirkes av metylering (eller

vice-versa

), eller de er involvert med kromatin remodeling på stamceller . TFS vist i figur 6d er viktig for prosessene underliggende sykdomsprogresjon, som er forbundet med vår OC prognostisk signatur (TFS med kjent relevans, er angitt med en henvisning til den aktuelle studie [26, 31-40]). Derfor hypoteser vi at IGV, i vår OC prognostisk signatur gen panel, representerer et surrogat mål for sin virksomhet og rolle i sykdoms transformasjon.

Association of prognostiske signatur CPGs med CpG øyer og forsterker regioner

plasseringen av CPGs i forhold til CpG-øyer (CGIer) er kjent for å være en viktig bestemmende faktor for den funksjonelle rollen til disse CPGs [41]. Vi testet for anriking av sonder kommenterte til CGI regionenes øy «,» shore «og» hylle «blant alle gen kroppen kommenterte sonder, samt prober kommenterte til genet likene av genene våre prognostisk signatur, og av de fire klynger . Mens vi fant ut at genet kroppen prober ble samlet betydelig utarmet for sonder i disse CGI regioner, det motsatte var tilfelle for genet kroppene til våre prognostisk signatur (se Utfyllende Tabeller i S1-fil). Denne effekten ser ut til å være i stor grad drevet av andre klynge. Dette indikerer en fremtredende rolle for CpG øyer i de aktuelle områdene av genene våre prognostisk signatur.

Plassering av CPGs forhold til Enhancer regioner er også kjent for å være relevant for den funksjonelle rollen CPGs. Vi testet om det var berikelse av metylering nettstedene som er merket til forsterkere i genet organer generelt finne at det er, som ville være forventet. Deretter testet vi Enhancer berikelse på samme måte i de prognostiske signatur genet organer, og genet likene av de enkelte klynger.

Legg att eit svar