PLoS ONE: CMS: En web-basert system for visualisering og analyse av Genome-Wide Metylering Data om menneske Kreft

Abstract

Bakgrunn

DNA metylering av promoter CpG øyer er assosiert med genet undertrykkelse, og dens unike genom-wide-profiler har vært knyttet til tumorprogresjon. Sammen med high-throughput sekvense teknologier, kan det nå effektivt bestemme genom-wide metylering profiler i kreftceller. Også eksperimentelle og beregningsorientert teknologi gjør det mulig å finne den funksjonelle sammenhengen mellom kreftspesifikke metylering mønstre og deres clinicopathological parametere.

Metodikk /hovedfunnene

Kreft methylome system (CMS) er en web- basert database applikasjon designet for visualisering, sammenligning og statistisk analyse av menneskelig kreft-spesifikke DNA metylering. Metylering intensiteter ble oppnådd fra MBDCap-sekvensering, pre-prosessert og lagret i databasen. 191 pasientprøver (169 svulst og 22 normale prøven) og 41 brystkreftcellelinjer er deponert i databasen, omfattende ca. 6,6 mrd entydig tilordnet sekvens lyder. Dette gir omfattende og genom-wide epigenetiske portretter av menneskelig brystkreft og livmorkreft oppdatert. To riss er foreslått for brukerne å bedre forstå metylering struktur på det genomiske nivå eller systemisk metylering endring i genet nivå. I tillegg er en rekke merknader spor forutsatt å dekke genomisk informasjon. CMS inneholder viktige analytiske funksjoner for tolkning av metylering data, for eksempel påvisning av forskjellig metylert regioner, statistisk beregning av globale metylering intensiteter, flere gensettene av biologisk viktige kategorier, interaktivitet med UCSC via custom-spordata. Vi presenterer også eksempler på funn utnytte rammen.

Konklusjon /Betydning

CMS gir visualisering og analytiske funksjoner for kreft methylome datasett. En omfattende samling av datasett, en rekke innebygde analytiske funksjoner og omfattende programmer med biologisk og translasjonell betydning gjør dette systemet kraftige og unike i kreft metylering forskning. CMS er fritt tilgjengelig på: https://cbbiweb.uthscsa.edu/KMethylomes/

Citation. Gu F, Doderer MS, Huang Y-W, Roa JC, Goodfellow PJ, Kizer EL, et al. (2013) CMS: En web-basert system for visualisering og analyse av Genome-Wide Metylering Data om kreft hos mennesker. PLoS ONE 8 (4): e60980. doi: 10,1371 /journal.pone.0060980

Redaktør: Eric Y. Chuang, National Taiwan University, Taiwan

mottatt: 31 juli 2012; Godkjent: 05.03.2013; Publisert: 22 april 2013

Copyright: © 2013 Gu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av R01 CA069065, U54 CA113001 (Integrative Cancer Biology Program), P30 CA054174 (Cancer Center Support Grant), NCATS 8UL1TR000149 (CTSA) av det amerikanske National Institutes of Health, Texas CPRIT RP101195-C04, og med generøse gaver fra Kreft terapi og Research Center Foundation. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

DNA metylering av promotor CpG-øyer er forbundet med gensuppresjon i tumorprøver sammenligne med normal motstykke, og dens unike genom profiler har vært knyttet til tumorprogresjon og kan brukes til å forutsi pasientoverlevelse [1]. Globalt hypometylering ble påvist i bryst og tykktarm svulster sammenligner med tilsvarende normale vev [2], [3]. Mer spesifikt, i brystkreft, har det vist seg at genet legeme hypometylering er assosiert med genet Slå, mens hypermethylation av regioner som har en transkripsjonsstartsetet (TSS) har en tendens til å forårsake en tilsvarende effekt [4]. I tillegg samspill mellom DNA-metylering og transkripsjonsfaktorer (TFS) er viktig for regulering av humane celle fenotyper. Med fremme av sekvenseringsteknologi, blir storskala analyse av genom-wide metylering gjennomførbart. Flere eksperimentelle metoder har blitt utviklet for å fange denaturert DNA, inkludert MeDIP [5], MBD [6], MethylC [7], og RRBS [8]. Sammen med high-throughput sekvense teknologier, kan disse metodene nå effektivt bestemme genom-wide metylering profiler i cellene. Også ulike beregnings og statistiske metoder blitt foreslått for analyse av differensielt metylert regioner (DMR). Disse eksperimentelle og beregnings teknologi gjør det mulig å finne den funksjonelle sammenheng mellom kreftspesifikke metylering mønstre og gensuppresjon, og deres assosiasjon med clinicopathological parametre, som fører til identifisering av kandidat biomarkører for diagnose og prognose [9].

Her beskriver vi en roman kreft methylome system som systematisk samler inn, organiserer, visualiserer og analyserer et stort sett av DNA metylering data ved sekvensering fra menneskelige endometrial og brystkreft. De datasett blir oppnådd ved hjelp av MBDCap-seq protokollen, en teknikk som brukes til å fange denaturert DNA ved hjelp av en metyl-CpG-bindende domene (MBD) protein kolonnen, etterfulgt av neste generasjons sekvensering [10]. Den lave kostnader og objektiv visning av metylering profiler av både CpG og ikke-CpG øy regioner gjøre det egnet for genom-wide metylering profilanalyse. 191 pasientprøver (169 svulst og 21 normale prøven) og 41 brystkreftcellelinjer ble behandlet med MBDCap-seq protokoll, genererer til sammen ca 6,6 milliarder entydig kartlagt sekvens leser. Datasett ble pre-behandlet og lagret i en MySQL database. CMS tilbyr brukervennlige verktøy for rask identifisering av differensielt denaturert regioner (DMRs) blant ulike grupper av prøver (f.eks normale versus tumor), uavhengig av deres genet nærhet. Metylering intensiteter ble generert for både genom-wide (oppløsning på 100 bp) og genet (for hver RefSeq annotert genet) nivåer. Videre genet ontologi, biologiske pathways, og andre molekylær signatur genet sett databasene har blitt integrert i CMS, slik sammenligning (via metylering) av funksjonelle og biologiske korrelerte gener på tvers av ulike krefttyper, og undersøker systemisk endring i biologisk sti, funksjon og samhandling nettverk nivåer. Brukere kan laste opp sine metylering profiler (generert fra neste generasjons sekvensering teknologi i 100 bp oppløsning) eller genet satt til å observere differensial metylering ved å sammenligne med vår unike samling av svulster. I tillegg kan brukerne laste ned metylering intensiteter fra et område av interesse eller hele genomet for videre analyse (ved å klikke på linken i «Ressurser» side på nettsiden). Med CMS kan biologer få tilgang til en hvilken som helst aktuelt gen, undersøke og finne epigenetiske betydelig fenomen, slik som (men ikke begrenset til) metylering forskjell mellom tumortyper, gener med korrelerte metylering profiler og samstemmighet, differensielt denaturert gener innenfor en vei, sammenligning av DNA metylering og histone modifikasjon merkene.

Resultater

CMS integrerer database (fra genom-wide metylering sekvense data av kreft hos mennesker), web-grensesnitt teknologi og kraftige statistiske og analytiske funksjoner sammen, slik at genome- bred metylering profiler visualisering og meningsfylt biologisk fenomen oppdagelsen av kreft hos mennesker (figur S1 i File S1).

Genome-wide MBDCap-sekvensering av endometrial og brystkreft

totalt 232 kliniske prøver og cellelinjer avledet fra human bryst- og endometrial cancer kullene ble bearbeidet og satt inn i databasen. Blant dem, 77 er brystsvulster, 10 normale bryst prøver, 41 brystkreftcellelinjer (ICBP [11]), 92 endometrial svulster (71 engangsprøver og 21 tilbakevendende prøver) og 12 normale endometrial prøver. MBDCap-sekvensering teknologi ble brukt til å oppdage denaturert regioner. Denaturert fragmenter, bundet til en metyl-CpG bindende domene protein, ble eluert for sekvensering med Illumina /Solexa Genome Analyzer II. Omtrent 12,7 milliarder sekvens leser ble generert og 52% leser ble kartlagt til unike genom steder. Genome-wide sekvensering av DNA metylering av dette stort sett med kliniske prøver og cellelinjer gjort dette en unik studie av tumor methylome profiler (figur S1 i File S1). Data fra mer enn 1000 kliniske prøver, blant annet eggstokkene, oral, kolorektal, leverkreft, lungekreft og prostatakreft, vil etter hvert bli satt inn på denne databasen.

Design av web-grensesnitt og database

webgrensesnittet ble utviklet i Java ved hjelp av SideCache [12] rammeverk, støttet av en offentlig tilgjengelig Java grafisk bibliotek (https://www.walterzorn.de/) for grafisk og bildegjengivelse. CMB nettstedet er utplassert i en Apache Tomcat webserver (https://tomcat.apache.org/), og støttes av en MySQL database med metylering data (Figur S1 i File S1). Funksjons og analytiske metoder integrert i rammen ble skrevet i R script. I tillegg ble en webtjeneste API også iverksettes for å tillate integrasjon med andre genom nettsteder. Denne web-grensesnitt ble testet i Firefox, og er godt forenlig med Safari og Chrome. Det er også kompatibelt med IE med en deaktivert funksjon (se Visualisering av metylering datasett seksjon)

Visualisering av metylering datasett

CMS kan visualiseres i to forskjellige moduser. Genomisk utsikt og genet sentriske utsikt .

genomisk view.

genomisk visningen er for genom-wide visualisering og analyse av metylering intensitet (figur 1).

Denne nettsiden er laget for genome- bred visualisering og analyse av metylering intensitet (A, B, C). Metylering intensitet er forhånds beregnet for en 100 bp bin størrelse og er vist ved hjelp av en rød gradient heatmap. En rekke av genomisk merknader og funksjonelle verktøylinjer gi brukerne flere alternativer i surfer på nettsiden. Statistiske metoder ble innleiret, inkludert DMR analyse (A) og statistisk beregning (C). Lenker til UCSC genom nettleser (D) og genet view (E) er tilgjengelig for videre analyse

Ulike typer dataspor ble iverksatt for de genomiske visualiseringsfunksjoner (figur 1A, B). Genomisk koordinere spor (genomisk plasseringen av visualisert regionen, inkludert kromosom, region start- og sluttposisjoner); GC innhold spor (GC prosent på genomisk posisjon, beregnet på 100 bp oppløsning); h3k4me1 histone modifikasjon styr på GM12878 cellelinje (hentet fra UCSC genom bygge hg19, wgEncodeBroadHistoneGm12878H3k4me1StdSig.bigWig bord, liftover til hg18); sekvens bevaring spor fra UCSC (hentet fra UCSC genom bygge hg18); CpG island spor (hentet fra UCSC genom bygge hg18, https://genome.ucsc.edu); Gene merknad spor (inkludert gen start og sluttposisjonen, genet symbol og tiltredelse nummer); og metylering intensitet spor (s) (metylering intensitet er representert med fargedybde, mørk rød tilsvarer høy metylering verdi, hvitt betyr lave eller ingen metylering verdi, i 100 bp oppløsning). Detaljert anmerkningen er vist i flyt tips visning når en bruker beveger musen over GC innhold, CpG island og genet merknader spor. En enkelt-klikk i metylering profiler spor (e) kan generere en popup dialog med metylering intensitet (leser nummer for den aktuelle stillingen, denne funksjonen er deaktivert i IE). Metylering intensitet sporet er fleksibel med flere alternativer (valgt fra «Spor» drop-down-knappen på verktøylinjen). Vanligvis er det to typer metylering intensitet sporer som brukerne kan velge å vise –

individ

eller

sammendrag

spor. En enkeltsporet viser genom-wide metylering intensitet på 100 bp bin størrelsen på hver tumor /normal prøve valgt. Brukere kan velge å vise en svulst bare (f.eks bryst eller endometrial), eller alle svulster sammen. Oppsummering spor (figur 1C, se Innebygd statistiske metoder avsnittet nedenfor) inneholder globale statistikk over gjennomsnittlig, frekvens og forskjellen fra alle svulster.

En samling av veldesignede funksjonelle verktøy-barer er inkludert i denne nettsiden. Brukerne kan navigere rundt i genomet ved å zoome inn og ut, flytte seg til venstre eller høyre langs genomisk retning, eller flytte til nabo gener. Brukere kan søke gen /region av interesse ved direkte å skrive genet symboler eller region koordinater.

DMR-analyse (se Innebygd statistiske metoder avsnittet nedenfor) ble implementert i genomisk betrakteren. I DMR-funksjonen, kan brukerne velge kandidatprøver ved å merke avmerkingsboksene i metylering intensitet sporet (r), og deretter fylle ut de nødvendige parametrene (se Materialer og metoder). Standardverdier er forhåndsvalgt. DMR vil sende ut en fil i en tabulatordelt tekstformat (se Materialer og metoder). Alle output filene vil bli generert on-demand og effektivt, men kan være begrenset av nedlastingshastighet på brukerens nettverk.

Lenker til UCSC genom nettleser ble generert (figur 1D, se Visualisering av DNA metylering og histon modifikasjon data seksjon for eksempel på bruk). En liste av gener som inngår i dagens genomisk region vises nederst til venstre på genomisk visning nettsiden, og lenker er opprettet for å få tilgang til genet sentriske utsikt for de spesielle gener (figur 1E).

Gene Centric view.

en alternativ måte å visualisere metylering data er Gene-sentriske visning som viser metylering heatmap av utvalgte gensettene (figur 2).

Denne nettsiden er laget for visualisering og analyse av metylering intensitet på gennivå. I verktøylinjen fire lag alternativer er tilgjengelige for å aktivere bestemte valg gensettene. Metylering intensiteter for promoter regioner av gener (+/- 2 kb rundt TSS region) var pre-beregnet og ble vist ved hjelp av en rød gradient heatmap. En hvit /grønn boks på siden av genet symbol viser promotorområdene til denne spesielle gen med eller uten CpG øy (e). Ved å klikke på genet symbolet på venstre side av heatmap panelet vil bringe brukeren tilbake til genomisk betrakteren sentrert på den valgte gen, slik visualisering av detalj metylering mønstre.

I denne nettsiden, kan brukere skriv inn et gen symbol og visualisere metylering status for gitt gen på tvers av alle kreftprøver, sammen med de 40 beste mest korrelerte gener med liknende metylering mønstre beregnet av Pearson korrelasjon (se Materialer og metoder). Alternativt fire lag alternativer er tilgjengelige for å muliggjøre valg av spesiell biologisk funksjon, samhandling nettverk, og korrelerte gensettene (figur 2). Det er åtte hovedklasser gensettene (noen av dem kan inneholde undergrupper). Disse er forhåndsdefinert i det første laget, inkludert korrelerte gener (se Materialer og metoder), Kromosom, Gene Ontologi, forstyrrelse sett, biologiske mekanismer, microRNAs, transkripsjonsfaktorer og kreft genet nabolaget. De primære genet sett navn og deres kilder er oppført i Tabell 1. [13] – [19]. Metylering status for en valgt gen sett kan visualiseres for alle svulster i CMS, eller noen krefttyper brukerens valg. Store gensettene kan forsinke metylering heatmap gjengivelse tid, og dermed er det best å velge mindre gensettene å starte prosessen. Den «Filter Søk» alternativet lar brukeren finne alle gensettene (unntatt de blant de «korrelerte Genes»), som inneholder ordene i søkefeltet.

I heatmap panel, metylering intensiteter ble forhånds beregnet som gjennomsnittet av normaliserte (lineær normalisering, se Materialer og metoder) leser nummer innenfor +/- 2-kb av en transkripsjon start hotellet (TSS) og ble lagret i MySQL database. Forskjellig fra genomisk visningen, genet sentriske betrakteren er organisert som følger: tumor eller normale prøver er plassert i kolonner, og gener er rader, i likhet med vanlig microarray format. Heatmap fargeskala av genet sentrisk syn er den samme som for genomisk visning. Promoter regioner med eller uten CpG island (e) er merket med en hvit /grønn boks på siden av genet symbol. Heatmap panelet gjør det mulig å visualisere ulike /lignende /spesielle metylering profiler (Se Discovery ved bruk av CMS delen) mellom ulike tumortyper, eller blant de genene innenfor tilsvarende biologisk viktige kategorier.

Ved å klikke på genet symbol på venstre side av heatmap panelet vil bringe brukeren tilbake til genomisk betrakteren sentrert på den valgte gen, slik visualisering av detaljer metylering mønstre i promoter, exon, intron og naboregionene.

Input og output

i genomisk syn, kan brukere som ønsker å visualisere og analysere egne data gjør at en tilpasset spor. Dataene innsendt av brukerne er privat, session-basert (ikke lagres etter endt økt), og ikke synlig for andre. På den andre siden, for en region av interesse (mindre enn en MBP, vises nederst til høyre på nettsiden av genomisk visning), kan brukerne laste ned leser informasjonen (på BED format) for videre analyse.

i genet sentrisk syn, har vi også gitt en filopplasting muligheten til å tillate brukere å laste opp sine tilpassede gensettene (kun offisielle genet symboler). Skikken genet settet vil bli vist som «User Input» i drop-down-knappen av Gene Set lag. Brukere kan også laste ned metylering intensiteten av gjeldende heatmap panelet ved å klikke på knappen nederst til høyre på nettsiden.

Embedded statistiske metoder

Hypermethylation av CpG øyer av genet promoter er en av de mest hyppige endringer som fører til kreft, og en viktig epigenetisk mekanisme for genet demping. For å aktivere sporing av differensial metylering regionene mellom to prøvegrupper ble DMR identifikasjon funksjon innebygd i rammen. I CMS, individuelle methylome spor (inkludert bruker lastet opp custom-track) eller sammendrags spor kan tildeles en av to grupper, definert som «behandlet» og «kontroll» (se Visualisering av metylering datasett avsnitt). En DMR algoritme, basert på

t

-test, Wilcoxon test eller Pearson korrelasjon kan velges for å vurdere betydningen av differensial metylering opp til 1 mega basepar. Beskrivelsen av DMR algoritmen er gitt i Materialer og metoder.

I tillegg til DMR-funksjonen, har vi også utviklet oppsummering spor å visualisere gjennomsnitt metylering intensiteter og å avdekke iboende egenskapene til hver svulst gruppe. Tre typer av sammendragsspor vises sammen som vist i figur 1C, er de: (a) Gjennomsnittlig spor, som gir gjennomsnittlig metylering status over en bestemt gruppe av prøver. Foreløpig sammendrag statistikk evalueres i løpet av i) alle prøvene, ii) normaler, svulster og cellelinjer på brystet, og iii) endometrial engangs svulster, tilbakevendende svulster, og normal for livmor; (B) Metylering frekvens spor (se Materialer og metoder). Mener og frekvens spor gi innsikt i hvorvidt metylering endringen er fra majoritets prøver eller minoritets prøver med stor metylering intensitet; (C) Forskjell spor, som visualiserer differensial metylering av gjennomsnitt /frekvens forskjell mellom grupper av prøver i hvert bin størrelse, for eksempel svulst vs normal-middelverdien for brystkreft, og ikke-tilbakevendende /tilbakevendende vs normal-frekvens for livmor.

tumorspesifikke metylering profiler

tumorigenesis mekanismene er ulike blant kreftformer, derfor er det viktig å finne genetiske /epigenetisk forskjeller for videre analyse. Her har vi brukt HOXB2 (human homeobox B2) gen, et medlem av den Antphomeobox familien som koder for et kjerneprotein med en homeobox DNA-bindende domene, og et kjent gen i forbindelse med tumorvekst og invasivitet [20], [21] som et eksempel for å illustrere hvordan CMS er i stand til å fastslå kreftspesifikke metylering profiler for brystkreft og livmorkreft.

i genomisk visningen kan brukerne skrive HOXB2 i navigeringsboksen, og velg «Alle Svulster» i sporene rullegardin boksen, og klikk deretter på «Refresh View» -knappen. For en bedre visning av metylering profiler, kan brukere klikker på «zoom inn» knappen fire ganger. Klart hypermethylation ble funnet mellom brystsvulster og normal (figur 3A), inkludert fire regioner (

p

-verdi 0,01) beregnes ved DMR-funksjonen ved hjelp av standard parametere. Men hypometylering ble funnet mellom endometrial svulster og normalt vev (Figur 3B), inkludert en region med

p

-verdi 10

-4 (tabell S1 i File S1). I tillegg kan brukerne bla sammendraget spor ved å velge «Alle sammendrag» i sporene drop-down boks. Gjennomsnittlig spor, som representerer hundrevis av enkeltspor, forenkler visualisering av forskjellig metylert regioner som gir en mer intuitiv resultat. Foruten gener som hypermethylated bare i brystsvulster (sammenligne med bryst normaler), kan brukerne også finne gener som er hypermethylated bare i endometrial svulster (sammenligne med endometrial normaler) (for eksempel CCDC81, Figur S2 i File S1), og i begge svulster (for eksempel SOX11, Figur S3 i File S1).

HOXB2 ble hypermethylated i brystsvulster sammenlignet med brystkreft normal (A), mens hypomethylated i livmorkreftsvulster i forhold til livmor normal (B).

Lignende metylering profiler blant biologisk relaterte gener

homeodomain genene koder transkripsjonsfaktorer som påvirker differensiering og spredning under utvikling. I det menneskelige genom, er fire klynger av homeodomain gener (Hoxa, HOXB, HOXC og HOXD) fordelt på kromosomene 7p15, 17q21, 12q13 og 2q31, henholdsvis. Non-grupperte homeodomain gener er fordelt over hele genomet. En direkte spørsmål er «hva er de andre gener som viser det samme metylering mønster som for HOXB2, kanskje deler samme metylering mekanisme?» Fortsetter med den forrige prosessen på genomisk visningen kan brukerne klikke genet linken i venstre-bunn å få genet sentriske utsikt. De 40 beste korrelerte gener av HOXB2 er vist i figur 4. De fleste av dem har en lignende metylering profil som HOXB2, som er hypermethylated i brystsvulster (figur 4, blå strek boks), og er enten hypomethylated eller viser ingen forskjell i endometrial svulster sammenlignet med normalt vev (figur 4, grønn strek boks).

Gene satt med liknende metylering profiler av HOXB2 ble funnet ved å velge de «Korrelert gen» gensettene i genet sentriske utsikt. De fleste av genene er hypermethylated i brystsvulster (blå strek boks), og med ingen signifikant forskjell i livmorprøver (grønn strek boks).

I de 40 korrelerte gener, tre av dem tilhører HOXB genet familien (HOXB2, HOXB4 og HOXB7), tre gener inneholde homeodomain (DLX1, LHX4, og VAX2) og to av dem tilhører HIST genet familien (HIST1H3I og HIST1H4L). En lignende metylering profil av genene innenfor det samme genfamilien definerer metylering overensstemmelse, noe som kan føre til synkronisert genet demping. Videre kan brukerne også finne de genomiske naboer av HOXB2 ved å velge «kromosom» gen sett i lag en «chr17» i lag to, «q» arm i lag tre og «chr17q21» i lag fire. Dette cytoband dekker 287 gener, og havner på HOXB clusteret inkludert tre gener (HOXB2, HOXB4 og HOXB7) overlappet med 40 HOXB2 korrelerte gener. Legg merke til at de tre genene er begge i det samme genfamilie og det samme genomiske sted, noe som kan indikere sterk biologisk samstemmighet for disse gener. Brukere kan finne manglende verdier for flere gener i «Kromosom» gensettene, på grunn av mangel på karakterutskriften merknad innen NCBI Reference Sequence (RefSeq) slipper finnes i UCSC genom nettleser eller foreldet genet symboler. Dette fenomenet skjer også for de andre 7 klasser av kategorier.

Forskjellig denaturert gensettene innenfor en sti

For å undersøke systemisk endring av biologisk pathway aktivitet eller funksjoner som er relatert til HOXB2 eller annen HOX familie gener, undersøkte vi følgende genet setter for å illustrere den funksjonelle funn ved hjelp av CMS verktøy. HOXB13, ligger et HOX familiemedlem i klyngen av HOXB2 og viser en lignende metylering mønster som HOXB2. HOXB13, er også et medlem av «androgen-mediert bane», som vist i figur 5. Det viser en tydelig hypermethylation mønster mellom brystsvulster, men ikke brystcancercellelinjer og livmorkreft. Spesielt den distinkte hypermethylation mønster av BRCA1, SNURF, GMTM2, NROB1, CDK11B, LATS2, HRAS, MAPK3, RPS6KA3 og EGR1 avgrense klyngens metylering status for brystsvulst (ikke cellelinjer), sammen med HOXB13.

Den «androgen-mediert signale» gen sett som inneholder HOX cluster gener ble valgt som et eksempel. Flere gener innenfor den blå strek boksen er hypermethylated i brysttumorer sammenlignet med normale vev, mens andre viser ingen betydelig forskjell. For endometrial prøver, er det ingen signifikant forskjell funnet for noen av genet mellom svulster og normaler.

Vi har også sammenlignet metylering profiler for Tamoxifen resistente gener [22], og identifisert flere hypermethylation gener i brystsvulster, slik som ACTA1, ISG15, PTK6 og SEPHS2 (figur 1E). De fleste av dem viste ikke signifikant forskjell i livmorprøver.

Visualisering av DNA metylering sammen med histoner modifikasjon data

En praktisk URL-kobling til UCSC åpner dagens genomisk region i UCSC genom nettleser for brukere som ønsker å vise andre genomiske data (nederst til høyre på genomisk visning, figur 1D). Alternativt kan brukere velge opptil fire intensitet spor og vise disse sporene sammen med andre standard spor i UCSC genom nettleser.

For eksempel ble DLC1 genet rapportert å ha økt DNA metylering på sitt transkripsjon start hotellet (TSS ) region, mens redusert histone modifikasjon i H3K4me1, H3K4me3 og H3K27ac på TSS region [4]. Brukere kan skrive DLC1 i genomisk visning webside, og visualisert TSS region (Chr8: 13,033,864-13,035,942) ved å klikke på «zoom inn» og «flytte» knappene. Vi kan få det samlede inntrykk av at brystsvulster er hypermethylated forhold til bryst normaler, mens endometrial svulster viser ingen forskjell i forhold til endometrial normaler. Brukere kan plukke opp 4 prøver tilfeldig ved å merke av i boksen til høyre på nettsiden for brystkreft prøver (f.eks brn80, brt22, brt69 og brt37), og deretter klikker du på «Visualiser valgte radene i UCSC Genome Browser knapp» i nederst til høyre på nettsiden, for å åpne en UCSC webside. For å sammenligne med histonmodifikasjonene spor, brukere må velge «full» for hver egendefinerte spor og bred histon spor. De histone modifikasjon spor (figur 6) er i samsvar med tidligere rapport [4] Selv om disse dataene ikke kan komme fra brystkreft. Custom spor (DNA metylering) av brystkreft har økt metylering (tilsvarende tidligere funn) med et unntak (den 3. spor, brt22), som viser pasientspesifikke mønstre (Figur 6A). Ikke overraskende var det ingen økning metylering funnet for endometriale prøver (figur 6B).

TSS-regionen i DLC1 er brukt som et eksempel. 4 prøver ble tilfeldig valgt ved å merke av i boksen til høyre på nettsiden for brystkreft prøver (f.eks brn80, brt22, brt69 og brt37). Den «fulle» alternativet for hver egendefinerte spor og den brede Histone sporene ble valgt for sammenligning av DNA metylering og histone modifikasjon merker. Liknende resultater ble oppnådd som tidligere rapport [4]. Et unntak (3

rd spor, brt22) ble funnet som viser pasientspesifikke mønstre (A); og det var ingen økt metylering funnet for endometrial prøver (B).

Diskusjoner

I våre studier, ble HOXB2 brukt som et eksempel for å finne ut biologisk betydningsfull informasjon ved bruk av CMS . Dette er fordi HOXB2 ble funnet som en regulator av tumorvekst i brystkreft [23]. Interessant, fant vi HOXB2 ble hypermethylated i endometrial normalt vev sammenlignet med endometrial svulster (Figur 3B). I forrige undersøkelse, ble HOXB2 rapportert å være viktig i endometrial normale celler [24]. Videre HOXB2, HOXB4 og HOXB7 viste sammen nøkkelfunksjon i lunge kreft [25]. I vår studie, også identifisert vi at disse 3 gener er korrelert i sine metylering profiler. Dette kan tyde på at disse tre genene fungere sammen i bryst og livmorkreft. Videre HOXB13 og BRCA1 er alle fra «androgen-mediert bane» (figur 5), og er alle funnet å være hypermethylated i brystsvulster enn normalt vev i vår studie. Dette er også i samsvar med tidligere rapport som HOXB13 fungerer som undertrykker av androgen reseptor signalisering i prostatakreft, noe som kan påvirke BRCA1 (kofaktor forbundet med AR) [26].

Det har vært flere epigenetikk nettsteder tilgjengelig i tidligere publiserte rapporter. En av de mest kjente er Roadmap Epigenomics Project (REP) (https://www.roadmapepigenomics.org/). Dette prosjektet var sammensatt av en gruppe av ulike databaser, browser /visualiseringsverktøy, og bioinformatikk. Brukere kan enten se mange typer epigenetiske merker i sin nettleser (f.eks UCSC REP, https://www.epigenomebrowser.org/), eller laste ned data fra en av de dataregistre (http: //www.ncbi.nlm. nih.gov/epigenomics). Sammenlignet med CMS, er REP mer omfattende i både data variasjon og avledede verktøy. Imidlertid er CMS utformet for å gi kliniske kreftprøver, og vi har flere statistiske metoder spesielt for genom-wide analyse og sammenligning av disse prøvene (som DMR deteksjon og korrelerte gener funksjon).

Konklusjon

i denne studien foreslått vi CMS for visualisering og analyse av metylering datasett for kreft. Et stort antall datasett ble oppsamlet og behandlet i databasen. Flere statistiske verktøy ble integrert for dataanalyse. Visualisering ble utviklet gjennom en Java-basert webgrensesnitt. Nyttige funn ble gjort ved omfattende bruk av dette rammeverket. Et stort datasett, en rekke verktøy og omfattende program med biologisk og translasjonsforskning betydning gjør dette rammeverket kraftige og unike i kreft metylering forskning.

Materialer og metoder

vevsprøver, cellelinje og MBDCap- seq

Vevsprøver ble oppnådd som en del av vårt kontinuerlige arbeid med å karakterisere molekylære forandringer i endometriet og brystcarsinomer.

ICBP brystkreftcellelinjer genomisk DNA ble isolert ved QIAamp DNA Mini Kit ( Qiagen) ved å følge fremstilling protokoll.

Legg att eit svar