PLoS ONE: Korrupsjon av Intra-Gene DNA Metylering Arkitektur er et kjennetegn på Cancer

Abstract

epigenetiske prosesser – inkludert DNA metylering – i økende grad sett på som å ha en grunnleggende rolle i kroniske sykdommer som kreft. Det er velkjent at metylering nivåer ved spesielle gener eller loci skiller mellom normalt og sykt vev. Her undersøker vi hvorvidt den intra-genet metylering arkitekturen er skadet i kreft og om variasjon av nivået av metylering av de enkelte CPGs innen et gitt gen er i stand til å diskriminere kreft fra normalt vev, og er forbundet med heterogen tumor fenotype, som definert av genet uttrykk. Vi analyserte 270985 CPGs kommenterte til 18272 gener, i 3284 kreft og 681 normale prøver, tilsvarende 14 ulike krefttyper. Ved å gjøre det, fant vi nye forskjeller i intra-genet metylering mønster over fenotyper, særlig i de gener som er avgjørende for stamcellebiologi; våre tiltak av intra-genet metylering arkitektur er en bedre determinant av fenotype enn tiltak basert på gjennomsnittlig metylering nivå alene (K-S test i alle 14 sykdommer testet). Disse per-genet metylering tiltak utgjør også en betydelig reduksjon i kompleksiteten, sammenlignet med konvensjonelle per-CpG-beta-verdier. Våre funn støtter sterkt den oppfatning at intra-genet metylering arkitektur har stor klinisk potensial for utvikling av DNA-baserte kreft biomarkører

Citation. Bartlett TE, Zaikin A, Olhede SC, West J, Teschendorff AE, Widschwendter M (2013) Korrupsjon av Intra-Gene DNA Metylering Arkitektur er et kjennetegn på kreft. PLoS ONE 8 (7): e68285. doi: 10,1371 /journal.pone.0068285

Redaktør: Zoran Culig, Innsbruck Medical University, Østerrike

mottatt: 11 april 2013; Godkjent: 26 mai 2013; Publisert: 16.07.2013

Copyright: © 2013 Bartlett et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble finansiert av Engineering og Fysisk Sciences Research Council (Complex /ESPRC), EU-kommisjonen (FP7, EpiFemCare, prosjektnummer 305428) og et stipend fra UCLH /UCL Omfattende Biomedical Research Centre (prosjekt nr 152). De epigenetiske analyser ble foretatt på UCLH /UCL, som fikk en andel av sin finansiering fra Institutt for helsefag NIHR Biomedisinsk Forskningssentre (BRC) støtteordning. AZ erkjenner økonomisk støtte fra CR-NO prosjektet PROMISE-2016. AET er støttet av en Heller stipend. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

epigenetisk informasjon er lagret i genomet i form av arvelige modifikasjoner av den kjemiske strukturen til DNA, så som metylering av bestemte baser, samt en rekke kjemiske modifikasjoner av de histonproteinene hvilken pakke DNA. Epigenetisk informasjon kan moduleres løpet av levetiden til en organisme av miljømessige signaler [1] -. [3] og disse endringene vedvarer i senere mitoser, som fører til en ervervet endring av fenotype

DNA metylering er en epigenetisk merke bestående nesten utelukkende av metylering av CpG-dinukleotider [4], og det er mulig for en, begge eller ingen alleler ved et bestemt genomisk locus som skal metyleres [5]. Hypermethylation av CPGs i genpromoter (regionen nær transkripsjonsstartsetet, TSS) er incontrovertibly forbundet med stanse av det tilsvarende gen, og denne effekten er spesielt viktig i kreft, hvor avvikende genet Slå er assosiert med funksjonelle endringer viktige i alle trinn av tumorprogresjon [6].

det har vist seg tidligere at variasjon av metylering på bestemte genomiske steder er viktig i utviklingen av kreft [7]. Det har blitt bemerket særlig at det er en økning i stokastisk metylering variasjon i områder som allerede er kjent for å ha endrede nivåer av metylering i kreft, fører til avvikende og varierende genekspresjon, og å tilveiebringe et epigenetisk mekanisme for tumor heterogenitet [8]. Det har også vist seg nylig at statistikk basert på differensial variasjon av metylering kan føre til forbedret deteksjon av risikomarkører i pre-kreftsvulster [9], [10].

Polycomb gruppe proteiner (PCG) spiller en fundamental rolle i utviklingsprosesser, opprettholde en klasse av gener som er kjent som polycomb gruppemålene (PCGTs) i et undertrykt tilstand i ES (embryonale stamceller) celler, for å opprettholde pluripotency, og «klar for aktivering «under differensiering [11]. Koblingen mellom PCGTs og kreft har vært diskutert av mange forfattere [12] – [14]; Det ble nylig vist at DNA hypermethylation i kreftfortrinnsvis rettet mot PCGTs som er utviklings regulatorer [15], disse forfatterne hypothesising at dette kan bidra til stammen lignende karakteristikk av kreft; i ytterligere støtte av disse ideene det har blitt bemerket at svulster som er spesielt dårlig differensiert en tendens til å vise uttrykk mønstre som ligner på ES-celler, inkludert undertrykkelse av PCGTs [16].

Polycomb gruppe proteiner opprettholde trykt tilstand av gener via kromatin (DNA emballasje); DNA i sin kompakte tilstand er pakket rundt histonproteinene (en hovedkomponent av kromatin), og PRC2 (polycomb undertrykkende kompleks 2) er ansvarlig for trimethylation av lysin 27 av histon 3 (som fører til epigenetisk mark H3K27me3), som er forbundet med denne kompakte tilstand [17]. Gener okkupert av PRC2 i ES-celler stort sett bære toverdige kromatin merkene [15]; bivalency omfatter histone modifikasjon H3K4me3 (trimethylation av lysin 4 på histon 3), et merke som er forbundet med aktivering av det tilsvarende genet, i tillegg til det undertrykkende H3K27me3 mark. Det er antatt at det er denne bivalent tilstand som opprettholder stemness, holde genet trykt, men klar for aktivisering på differensiering. Som DNA-metylering er også forbundet med undertrykkelse og aktivering av gener, er det av interesse om metylering mønstre av gener som bærer kromatin markeringene H3K27me3 og /eller H3K4me3 i stamceller blir endret i cancer, som for eksempel avvikende endring av genregulering via DNA metylering kan være forbundet med en avkastning på eller betoning av stilk-lignende celleegenskaper.

rollen tidlige epigenetiske forandringer i onkogene transformasjon, inkludert forstyrrelse av sunn epigenotype av stamceller, opprettelsen av en epigenetisk tillatt miljø hvori genetiske avvik kan ha tumorigene effekter, og fenotypisk plastisitet som fører til tumor tilpasning og forbundet med intra-tumor heterogenitet, ble opprinnelig foreslått av Feinberg og medarbeidere [1]. Det er en hypotese at en måte som stokastisk feilregulering av stamcelle gener og tilhørende fenotypiske heterogenitet kan manifestere er i form av celle til celle variasjon av metylering; Dette vil i sin tur bli forventet å korrelere med intra-genet variasjon av metylering, som målt ved hjelp av akkumulerte blandinger av heterogene celler i et mikromatrise eksperiment.

Intra-genet metylering variasjoner anses for å være en forstyrrelse av den normale metylering profil, eller arkitektur, av et bestemt gen, og en slik endring kan være mer generelt knyttet til etableringen av en epigenetisk tillatt miljø for onkogene transformasjon, og til tumorgenesen. Slike endringer ville forventes å følge de tidlige stadiene, eller til og med gå forut for utbruddet av sykdommen, og følgelig identifisering pålitelig indikator på slike endringer kan gi en verdifull føre til utvikling av DNA-baserte kreft biomarkører i kroppsvæsker, særlig ettersom det har vært vist nylig at DNA metylering biomarkører knyttet til stamcelle genene er assosiert med klinisk utfall i kvinners kreft [18].

Tidligere studier [7], [9], [10] har fokusert på effekter av prøve med sample variasjon av metylering; her for første gang, analyserer vi foreningen av fenotype med intra-genet variasjon av metylering. Å gjøre bruk av data hentet fra Illumina infinium HumanMethylation450 plattformen, som interrogates CPGs genome-wide inkludert med kjente genet merknader (tilsvarer i gjennomsnitt 17 CPGs per genet), har vi undersøkt tiltak av intra-genet metylering arkitektur, og deres evne til å differensiere mellom friske og sykdoms fenotyper. For dette har vi utviklet nye tiltak, og tilpasset standard de

Resultater

For å undersøke intra-genet metylering arkitektur, er fire gen-sentriske tiltak vurderes, som følger:.

det midlere avvik av prøven metylering profil fra den midlere metylering profilen til friske fenotype kontrollprøver, for hvert gen. Denne midlere metylering profilen kan variere mye innen hvert gen, og slik at det ikke er det samme som det midlere nivå metylering av et gen. Fordi dette bety avvik normalisert ved hver sonde ved å dividere med sonden standardavvik over de sunne fenotype kontrollprøver, kalles det «betyr -score «mål; Dette er illustrert i figur 1 (a). Et eksempel på et av genene ble funnet å være av størst betydning i henhold til dette tiltaket er vist i figur 1 (b) og (c).

Den midlere derivat av metylering målinger for hvert gen. Den deriverte av metylering profil for et gitt gen, og prøven blir tilnærmet ved hjelp av forskjellene mellom de metylering-verdier, målt på påfølgende sonder tilordning til det genet. Middelverdien av de absolutte verdiene av disse forskjellene blir deretter beregnet som «bety derivatet «måle; Dette er det samme som summen av alle former for økning og reduksjon i metylering nivå fra en sonde til den neste over hele genet; Dette er illustrert i figur 1 (d). Dette er en selvkalibrerende mål for intra-genet metylering variabilitet, fordi det er beregnet for en gitt prøve fra forskjellene innenfor denne prøven, og uten referanse til en hvilken som helst annen prøve.

Gjennomsnittet av målingene for metylering en bestemt genomisk region for hvert gen; Dette er illustrert i figur 1 (e). Typiske middel metylering nivåene varierer sterkt fra en genomisk region til en annen; derav midlere metylering nivå for en bestemt genomisk region, ble anvendt som «betyr metylering måle «for et gen, og det samme region ble brukt for hvert gen.

varians for hvert gen av de metylering målingene for en særlig genomisk region; Dette er illustrert i figur 1 (f). Fordi variansen er beregnet i forhold til den midlere, ble dette tiltaket på lignende måte beregnes for hvert gen bare ved hjelp av sonder tilordning til et bestemt genomisk region, igjen ved å bruke den samme genomiske region for hvert gen. Dette kalles «metylering varians «mål; Det er en annen selvkalibrerende tiltak.

(a) Den midlere -score tiltaket er beregnet for tumorprøve (vist i rødt) for genet (som sonder kart), fra middelverdien, og standardavvik, av de sunne kontrollprøver i hver sonde (b) metylering profiler av 586 kreft (rød) og 98 friske (blå) prøver på tvers av et gen som finnes som vesentlig i henhold til den midlere -score mål, med prober adskilte (ujevnt ) i henhold til deres genomiske loci. Genomiske regioner er angitt under genet med fargekoden som vises i bunnen av figuren. (C) En varmekart som illustrerer det samme genet, med prober jevnt fordelt; verdier for hver prøve og hver sonde er indikert med fargekoden som vises øverst på figuren. Prøver som er plottet i rekkefølge av midlere -score, slik at tumorprøve med den minste midlere -score og den friske prøven med den minste midlere -score er tilstøtende. Genomiske regioner er angitt under genet med fargekoden som vises i bunnen av figuren. N.B., har dette genet to transkripsjonsstartsider (TSSs) på forskjellige steder. (D) Den midlere derivatet tiltaket er beregnet, for prøve, som gjennomsnittet av de absolutte forskjeller i de tilsvarende verdier mellom påfølgende sonder, over hele genet. (E) Den midlere metylering tiltaket er beregnet, for prøve, som gjennomsnittet av de tilsvarende verdier av prober som er merket på en bestemt genomisk region av. (F) metylering variansen tiltaket er beregnet, for prøve, som variansen av de tilsvarende verdier av prober som er merket på en bestemt genomisk region av. NB, (d) – (f) er beregnet uten referanse til friske prøver, mens (a) er beregnet med henvisning til friske prøver

Disse fire tiltakene hver søker å undersøke en annen karakteristikk av intra. -Gene metylering arkitektur, og alle er i stand til å klassifisere prøvene en-til-en, det vil si, de er intra-gen eller intra-prøve tiltak, snarere enn fra prøve til prøve tiltak som tidligere har vært undersøkt i sammenheng med metylering variabilitet.

som det midlere -score beregnes som en midlere mål på metylering forskjell fra de friske metylering profilen strengt tatt det er et mål for metylering ustabilitet. De gjennomsnittlige derivative og metylering avviks tiltak er både tiltak av intra-genet metylering variasjon; imidlertid, er den midlere derivatet beregnet i forhold til rekkefølgen av sondene (dvs. ville dette tiltaket returnere et annet nummer dersom rekkefølgen av sondene var randomisert), mens den metylering variansen ville ikke; den midlere derivatet anser i tillegg alle probene kartlegging for genet, mens metylering variansen tiltaket bare betrakter prober tilordning til et bestemt genomisk region. Den midlere metylering tiltaket er unik her i at den ikke måle forskjell i metylering nivå, og i stedet måler absolutt metylering nivå; det er inkludert her hovedsakelig for sammenligning.

De egenskapene til disse fire tiltakene ble først undersøkt i forbindelse med fjorten Illumina infinium Menneskelig metylering 450 datasett som ble lastet ned fra Kreft Genome Atlas (TCGA) [19] . Vi brukte disse fire tiltakene til fjorten TCGA datasett; i alt, analyserte vi 450 K DNAm data fra 3284 svulsten og 681 friske prøver; detaljer av antallet prøver av hver fenotype og i hvert datasett er vist i tabell 1 (for datasett forkortelser, se «metoder og modeller «). Vi har også gjennomført en meta-analyse av disse dataene som er så vidt vi vet den største meta-analyse utført på noen DNA metylering studie.

Sammenligning av Intra-genet metylering Tiltak

som en foreløpig vurdering av den relative verdien av disse fire tiltakene, vi så på deres evne til å skille mellom svulst og friskt vev. Korrelasjonen av vevsprøven fenotypen til de fire metylering tiltak ble vurdert i forhold til distribusjoner av AUC per-genet (areal under kurven, som er et mål for forutsigelse nøyaktighet, se «metoder og modeller «for detaljer). Disse fordelingene er vist i boks-plott i figur 2. For hvert datasett, er den gjennomsnittlige -score tiltaket betydelig bedre ved å skille tumor fra friskt vev bruke disse metylering data, enn at derivat tiltaket, metylering varians tiltaket, og den gjennomsnittlige metylering mål (visuell sammenligning av figur 2 ble bekreftet ved Kolmogorov-Smirnov-tester, data ikke vist); Dette er fordi den midlere -score Målet er definert i forhold til den friske middel metylering profil. Eksklusive mellom -score tiltaket er gjennomsnittlig metylering tiltaket betydelig bedre ved å skille tumor fra friskt vev enn de to øvrige tiltakene i ti av de resterende datasett, med gjennomsnitts derivatet diskriminerende betydelig bedre i to datasett (les og THCA), og ufullstendige resultater for de resterende datasett (KIRC og Paad, som har ustabile resultater på grunn av liten utvalgsstørrelse). Figur S3 viser, i spredningsplott, parvise sammenligninger av hver av de fire metylering tiltak for et gen som var blant de 1000 gener med den høyeste AUC i henhold til hvert av disse tiltakene.

Hver boks viser verdiene av AUC for de 1000 mest betydningsfulle gener for en bestemt tumortype og intra-genet metylering mål. Gjennomsnittlig -score spår fenotype bedre enn de tre andre tiltak i alle 14 krefttyper. Tumor typen forkortelser er som følger: Blære urothelial Carcinoma (BLCA), bryst invasivt karsinom (BRCA), Colon Adenocarcinoma (coad), Head and Neck plateepitelkreft (HNSC), Nyre Nedsatt Clear cell carcinoma (KIRC), Nyre renal papillær Cell karsinom (KIRP), lever (LIHC), Lung Adenocarcinoma (LUAD), Lung plateepitelkreft (LUSC), bukspyttkjertelen adenokarsinom (Paad), Prostate adenokarsinom (Prad), endetarm adenokarsinom (LES), Thyroid karsinom (THCA), og livmor Corpus endometrioid Carcinoma (UCEC).

for å direkte sammenligne effektiviteten av gjennomsnittet -score tiltaket til å forutsi fenotype (kreft /sunn) uavhengig av middel metylering nivå, en logistisk regresjonsmodell ble montert på hvert gen ved hjelp av midlere -score og bety metylering som kovarianter, fører til-verdiene for hvert gen for hver av gjennomsnitts -score og bety metylering. I hvert datasett unntatt to, for det store flertall (80-100%) av de gener med minst en av de to kovariabler signifikante, var gjennomsnittlig -score kovariat-verdien var større betydning enn den tilsvarende midlere metyleringen kovariat -verdi. I de resterende to datasettene, den midlere -score kovariat-verdien var større betydning for de fleste (50-80%) av gener med minst en signifikant (kovarianteffekter detaljerte resultater ikke vist). Derfor middelverdien -score er en bedre prediktor for fenotype enn gjennomsnittet metylering, selv etter justering for middel metylering nivå.

Meta-analyse og Gene-set Enrichment Analyse

En meta-analyse av de fjorten datasettene ble gjennomført. Gener ble tildelt betydning i henhold til deres midlere AUC (basert på den midlere -score måle) på tvers av alle datasett ved en permutasjon metode (se «metoder og modeller» for detaljer); Dette identifiserte over 4000 signifikante gener som var forbundet med en konsistent forskjell mellom kreft og friske fenotyper på tvers av vevstyper (FDR). Disse genene viser konsekvent de største forskjellene mellom friske og kreft fenotyper (som gjennomsnitt -score Målet er definert i forhold til friske kontrollprøver), og som middel -score er et mål på metylering ustabilitet, blir de betegnet som den mest ustabile meta-analyse gener. De gjennomsnittlige -scores for individuell svulst og sunne prøver for 50 viktigste av disse mest ustabile meta-analyse genene er vist i figur 3, og detaljer om 100 mest betydningsfulle av disse genene er vist i tabell S1. Spesielt, figur 3 viser i hvilken grad den ustabilitet er konsistent (høy bety -score, rød) på tvers av kreftpasienter sammenlignet med friske pasienter (lav midlere -score, blå). Gener med en gjennomsnittlig AUC nær 0,5 tvers av de fleste krefttyper ble også funnet; Dette er gener som har en tendens til å ha de minste forskjellene mellom sunne og kreft fenotyper tvers vevstyper og dermed er merket som minst ustabile meta-analyse gener. Over 2800 minst ustabile meta-analyse gener ble funnet å være signifikant ved denne permutasjon metode (FDR) og 100 viktigste av disse er vist i Tabell S2. Det er imidlertid mindre konsistens blant de minst ustabil meta-analyse gener på tvers av tumortyper, for eksempel, har den 100. legges vesentlig minst ustabil meta-analyse gen en AUC på mindre enn 0,6 for bare 10 av 14 tumortyper.

Mean -scores for tumor (T) og friske (H) prøver vises i en heatmap henhold til fargekode for de 50 beste meta-analyse gener (topp 50 mest konsekvent ustabile gener). Heatmap viser i hvilken grad ustabilitet er konsistent (høy bety -score, rød) over kreftpasienter sammenlignet med friske pasienter (lav gjennomsnitts -score, blå). For hver vevstype sunne prøver vises til høyre for tumorprøver; der ingen er ledig plass (H) Merket er utelatt. Forkortelser: R (LES), B (BLCA), K (KIRP), P (Paad)

For å bekrefte den biologiske betydningen av funnene i denne meta-analyse med referanse til gener som er. vel kjent for å være viktig i kreft biologi, ble de mest ustabile og minst ustabile meta-analyse gener testet for anriking av gener som i ES-celler bærer undertrykkende /aktivering kromatin markerer H3K27me3 (H3K27 ES gener), H3K4me3 (H3K4 ES gener) og toverdige (dvs. både H3K27me3 og H3K4me3 merker, Biv ES gener) og berikelse av PCGTs (ES cell polycomb gruppe mål). De mest ustabile meta-analyse gener høyanriket av BIV og H3K27 ES gener og PCGTs, og de minst ustabile meta-analyse gener høyanriket av H3K4 ES gener (tabell 2).

En mer generell gen-set berikelse analyse (GSEA) ble også utført testing berikelse av de mest ustabile og minst ustabile meta-analyse gener av medlemmer av over 6000 gensettene (se «metoder og modeller» seksjon for detaljer). Den 100 mest betydelig beriket av disse gensettene av de mest ustabile og minst ustabile meta-analyse gener vises i tabeller S3 og S4 hhv. Spesielt Tabell S3 (gensettene beriket av mest ustabile meta-analyse gener) viser mange utviklings og cellesignale gensettene.

De mest ustabile meta-analyse genene er assosiert med generelt høyere metylering nivåer enn gener som ikke er vesentlige i henhold til den meta-analyse (dvs. gener som verken er mest ustabile eller i det minste ustabile meta-analyse gener) for både tumor og friske prøver, for disse genomiske regioner som ligger nærmere til promoteren på tvers av alle typer vev, men den mest ustabile meta -analyse gener er også forbundet med en stor variasjon av metylering nivåer (figur S4). De minst ustabil meta-analyse gener omvendt er forbundet med gjennomgående meget lave nivåer av metylering i både tumorer og friske prøver for disse genomiske områder, og særlig for TSS200, 5’UTR og 1stExon, noe som tyder på at den lave metylering ustabilitet av disse genene er forbundet med en mangel på metylering i de funksjonelt viktige genomiske regioner både i syke og normale vev, og derfor at regulering av disse genene er av andre enn de som omfatter DNA-metylering, spesielt tilgjengeligheten av transkripsjonsfaktorer mekanismer.

korrelasjon av tumor Gene Expression med Intra-genet metylering Architecture

for å undersøke effekten av intra-genet metylering arkitektur på genekspresjon, de 217 BRCA tumorprøver med matchet genekspresjon og metylering data tilgjengelig fra TCGA ble ansett i mer detalj. For hvert gen ble utført et ikke-lineært multivariabelt regresjonsanalyse (se «metoder og modeller») av genekspresjon til intra-genet metylering arkitektur for disse passet tumorprøver, idet det genekspresjon som responsen, og å ta en middelverdi av -score , mener derivat og metylering varians som en kovariat prediktor, sammen med midlere metylering som andre kovariat prediktor. De relative andeler av gener som finnes som signifikant eller ikke, og vesentlig i henhold til en kovariat eller det andre, eller begge deler, er vist i figur 4; Spesielt er det mange gener med uttrykk ikke vesentlig forutsagt av midlere metylering men betydelig forutsagt av midlere -score, betyr derivat, eller metylering varians.

Ekspresjon ble tatt som responsvariabelen, med en av midlere -score, mener derivat og metylering varians som en kovariat prediktor, sammen med midlere metylering som andre kovariat prediktor. (A) Andelen av gener med minst en kovariat signifikant (FDR), og andelen av gener med verken kovariat signifikant. (B) Andelen av vesentlige gener (dvs. andelen av genene som er representert ved den venstre side av hvert par av stolpene i en) som har betydning på grunn av en, eller det andre, eller begge kovarianter. For de gener som er av betydning på grunn av bare en kovariat prediktor, er andelene av disse genene for hvilke betydning er på grunn av positiv eller negativ korrelasjon angitt på stolpene med /og \\ respektivt. Det er mange gener med uttrykket ikke signifikant spådd av middel metylering men betydelig spådd av middel -score, mener derivat, eller metylering varians.

berikelse av stamcelle gener av gener med uttrykket betydelig spådd av bare ett kovariat ble igjen undersøkt for å bekrefte den biologiske signifikans av resultatene med henvisning til gener som er vel kjent for å være viktig i kreft biologi. Det ble funnet at gener med uttrykk spådd av bare den gjennomsnittlige -score kovariat ble betydelig beriket av Biv ES gener og PCGTs (og henholdsvis Fishers eksakte test), et resultat som er konsistent med funnene her som Biv ES gener er beriket mellom mest ustabile meta-analyse gener, dvs. de gener som er mest konsekvent forbundet med den største forskjellen i metylering mønster mellom kreft og sunne fenotyper. Det ble også funnet at tilsvarende gener med ekspresjon forutsagt av bare den gjennomsnittlige metylering kovariat i den multivariate regresjon med den gjennomsnittlige -score kovariat var betydelig anriket (, Fishers eksakte test) ved H3K4 ES-genene, et resultat som er i overensstemmelse med våre funn at H3K4 ES gener er beriket blant minst ustabile meta-analyse gener, dvs. de gener som har konsekvent minst forskjell i metylering mønster mellom kreft og sunne fenotyper. Tilsvarende ble det funnet at gener med ekspresjon forutsagt av bare den midlere derivatet kovariat ble betraktelig beriket med Biv ES gener og PCGTs (og henholdsvis Fisher eksakte test), og at gener med ekspresjon forutsies bare ved den midlere metylering kovariat i samme multivariabel regresjon ble betydelig beriket av H3K4 ES gener (, Fishers eksakte test).

Disse funnene utvide til heterogen tumor fenotype, som definert av genuttrykk, ideen om at forskjeller i metylering mønstre i stamcelle gener er et kjennetegn på kreft , viser og at dette kan måles ved intra-genet metylering arkitektur i form av intra-genet metylering variabilitet (i henhold til de midlere derivat og metylering varians-måler) og ustabilitet (i henhold til den midlere -score måle) mer nøyaktig enn ved midlere metylering nivå alene.

Association of Genome-wide Mean -score med brystkreft Indre Subtyper

Forskjeller i intra-genet metylering arkitektur mellom heterogene tumor fenotyper (som definert av genekspresjon) ble videre utforsket , i sammenheng med brystkreft iboende subtyper. De samme 217 BRCA prøver med matchet genekspresjon og metylering data tilgjengelig var hver unikt tilordnet en av disse sykdoms subtyper, i henhold til etablerte molekylær definisjoner, bruker PAM50 klassifikator [20]. Dette ble gjort ved å korrelere genekspresjon profilen (Spearman korrelasjon) for hver prøve til PAM50 Klassifiserings kanoniske genekspresjonsprofiler til 5 forskjellige iboende subtyper, og for hver prøve å velge undertype med den største korrelasjonskoeffisient, som fører til 42 prøvene klassifisert som Basal , 24 som Her2, 81 Luminal A, 54 Luminal B, og 16 klassifisert som normal. For hver av disse prøvene, et genom-bredt bety -score ble også beregnet, som en per-prøve genom-bredt mål for intra-genet metylering arkitektur. Fordelinger av disse genomgjennomsnitts -scores for hvert indre undertype er vist i figur 5; det er klare forskjeller i de midler og fordeling mellom hver av de undertyper. En Kruskal-Wallis test ble utført for å sjekke betydningen av disse forskjellene, med en meget betydelig resultat. Fjerne prøvene klassifisert som Luminal B Normal (som fordelinger av genom-wide bety-z score har større og mindre avvik, henholdsvis for disse subtypene enn de andre), fortsatt resulterte i et betydelig resultat i Kruskal-Wallis test, . Denne evnen til å skille mellom heterogene tumor fenotyper, i sammenheng med etablerte molekylær definisjoner av sykdomsundertyper, indikerer at det kan være mulig å bruke intra-genet metylering arkitektur for å utvikle nye molekylære klassifiserere med kreft, eller gjøre etablerte de mer robust. Dette er spesielt interessant, siden metylering nivåene er vanligvis mer stabile enn genuttrykk nivåer.

Det gjennomsnittlige tvers av alle genene til de gjennomsnittlige -scores ble beregnet for 217 BRCA prøver med samsvarende uttrykk og metylering data tilgjengelig. Disse prøvene ble uavhengig er klassifisert ved korrelasjon av sine genekspresjonsprofiler (Spearman korrelasjons) med de av den PAM50 brystkreft indre subtype sorter [20]. Fordelinger av disse genom-wide middel -scores, for hver egenverdi subtype, er vist i boksplott. Indikert signifikans ble beregnet ved hjelp av Kruskal-Wallis test.

Diskusjoner

Vi har vist at omorganiseringen av intra-genet metylering arkitektur er et grunnleggende trekk ved kreftceller, og at det er mange måter å vurdere disse forskjellene, som kan gi gratis informasjon. Vi har utviklet tiltak for å oppdage noen av disse forskjeller, inkludert den første undersøkelse av intra-genet variasjon av metylering (i motsetning til prøve til prøve variasjon av metylering). Vi har vist at vår gjennomsnitts -score tiltaket er gjennomgående mer effektiv på å forutsi kreft i forhold til sunn fenotype enn bety metylering, selv etter justering for mellom metylering nivå.

Vi har gjennomført det som er, så vidt vi vet, den største meta-analyse utført på noen DNA metylering studien. Spesielt ble over 4000 genene syntes å være signifikant assosiert med en konsistent forskjell mellom kreft og sunne fenotyper, viser at, som en metode for å skille kreft fra friskt vev, er robust overfor forskjeller mellom tumortyper vår midlere -score måle. De 100 mest betydningsfulle gener i henhold til denne meta-analyse (tabell S1) kan betraktes som særlig karakteristisk for en generalisert og ikke vev-spesifikk kreft fenotype. Disse minst ustabile meta-analyse gener er også betydelig beriket (tabell 2) av gener bærer H3K27 og toverdige kromatin karakterer i ES-celler og ved PCGTs, i samsvar med ideen om at svulsten fenotype er forbundet med oppkjøpet av stilk-lignende cellekarakteristikker [ ,,,0],15].

Legg att eit svar