Abstract
Vi undersøkte rollen tumor kopiantall (CN) -altered genom (CN-AG) i kreftutvikling av livmorhalskreft (CC), spesielt dens effekt på genekspresjon, biologiske prosesser, og pasient overlevelse. Femti-ni humant papillomavirus 16 (HPV16) -positive CCs ble undersøkt med mikromatriser-31 for kartlegging CN-AG og 55 for global genekspresjon, med 27 CCs felles. Fem års overlevelse ble undersøkt hos 55 pasienter. Slettinger og presiseringer 2,5 Mb ble definert som CN endringer. Den% CN-AG variert mellom 0 og 32,2% (gjennomsnitt = 8,1 ± 8,9). Svulster ble klassifisert som lav (gjennomsnitt = 0,5 ± 0,6, n = 11), middels (gjennomsnitt = 5,4 ± 2,4, n = 10) eller høy (gjennomsnitt = 19,2 ± 6,6, n = 10) CN. Den høyeste% CN-AG ble funnet i 3. kvartal, noe som bidro i gjennomsnitt 55% av alle CN endringer. Genome-wide, ble bare 5,3% av CN-endrede gener deregulert direkte av genet dosering. I motsetning til dette, hastigheten i fullstendig duplisert 3q var to ganger så høy. Forsterkning av 3Q forklarte 23,2% av deregulerte gener i hele tumorer (r
2 = 0,232, p = 0,006, analyse av variansen), inkludert gener som ligger i 3. kvartal og andre kromosomer. Totalt 862 gener ble deregulert utelukkende i high-CN svulster, men bare 22,9% var CN endret. Dette tyder på at de resterende gener ikke er deregulert direkte av genet dosering, men etter mekanismer indusert
i trans
av CN-endrede gener. Anaphase fremmende kompleks /cyclosome (APC /C) -avhengig proteasome proteolyse, glykolyse, og apoptose ble oppregulert, mens celle adhesjon og angiogenese ble nedregulert utelukkende i high-CN svulster. Den høye% CN-AG og oppregulert genuttrykk profilen til APC /C-avhengige proteasome proteolyse var assosiert med dårlig pasient overlevelse (p 0,05, log-rank test). Sammen med glykolyse, ble de lineært assosiert med FIGO stadium (r 0,38, p 0,01, Spearman test). Derfor er inhibering av APC /C-avhengige proteasom-proteolyse og glykolyse kan være nyttig for behandling CC. Men om de er uunnværlige for tumorvekst gjenstår å bli demonstrert
Citation. Medina-Martinez I, Barrón V, romersk-Bassaure E, Juárez-Torres E, Guardado-Estrada M, Espinosa AM, et al . (2014) Effekt av Gene Dosering på Gene Expression, biologiske prosesser og overlevelse i Livmorhalskreft: En Genome-Wide oppfølgingsstudie. PLoS ONE 9 (5): e97842. doi: 10,1371 /journal.pone.0097842
Editor: Robert D. Burk, Albert Einstein College of Medicine, USA
mottatt: 06.12.2013; Godkjent: 25 april 2014; Publisert: 30 mai 2014
Copyright: © 2014 Medina-Martínez et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet av National Council of Science and Technology (CONACYT, www.conacyt.mx), gi tall 8135 /A1, 24341 (JB), 80680 (til SK) og 133273 (til FF) og National University of Mexico ( www.unam.mx), gi nummer SDI.PTID.05.2 (til JB). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
livmorhals~~POS=TRUNC kreft~~POS=HEADCOMP (CC) er den nest vanligste kreftformen hos kvinner over hele verden, og rammer 500.000 personer hvert år; det er den ledende årsak til kreft dødsfall blant kvinner i utviklingsland [1]. De virale oncoproteiner E6- og E7 av høyrisiko humant papillomavirus (HPV) spiller en viktig rolle i kreftutvikling. De inhiberer forskjellige cellulære mål, blant annet den tumor-suppressor-proteiner p53 og pRb, forstyrre viktige cellulære prosesser, for eksempel apoptose og cellesykluskontroll, og føre til genomisk instabilitet og neoplastisk utvikling [2]. Til tross for skader forårsaket av disse oncoviral proteiner, er CC en sjelden komplikasjon av virusinfeksjon; de fleste infeksjoner er forbigående, og ikke utvikle seg til neoplastiske lesjoner. I gjennomsnitt kan 12-15 år før et vedvarende HPV-infeksjon fører til CC via premaligne stadier av cervikal intraepitelial neoplastiske lesjoner [3]. Disse funnene antyder at HPV-infeksjon alene ikke forårsaker sykdommen, og at andre faktorer, slik som unormal vertsgener, er forbundet med utvikling av invasiv kreft.
Genomiske ubalanser kan bidra til deregulert ekspresjon av onkogener og tumor suppressor gener i kreftceller, og akkumuleringen av slike endrede gener har blitt korrelert med tumorprogresjon [4]. Flere kopitall (CN) -altered regioner (CNAS) har blitt identifisert i CC gjennom tumor genomanalyse ved anvendelse av metoder så som komparativ genomisk hybridisering, fluorescens in situ hybridisering, og microarrays (MAS). Gevinst av 3Q [5] – [11] og 5 p [5], [12] – [15] er de hyppigste kromosom endringer i CCs, og de har også blitt beskrevet i andre solide tumorer [16] – [18]. Den minste konsensus regionen 3Q forsterkning i CC maps til kromosom cytobands 3q26-27 [6] – [10], [19], noe som tyder på at gener som
TERC product: [20], [21],
PIK3CA product: [22], og
ECT2 product: [23], som regnes kandidat onkogener for CC, kan være involvert i livmorhalskreftutvikling. I hvilken grad disse tilbakevendende kromosom endringer er relevant for kreftutvikling er fortsatt i stor grad ukjent. På den annen side, blir hele forsterkningen av 5p godt dokumentert i tumorprøver og cellelinjer [12], [23] – [25]. Noen gener forsterket i denne regionen, og foreslått å være involvert i CC, slik som
SKP2
,
TERT
,
TRIO
,
RNASEN
, og
PRKAA1
er overexpressed i tumorprøver [15] og cellelinjer [12], [24].
bidraget av CN endringer til livmorhalskreftutvikling er uavklart på grunn av et genom-wide mangel på korrelasjonen mellom CNAs og genekspresjon [23], til og med i fullstendig amplifiserte kromosomarmer som 3q eller 5p [23] – [24], [26] – [27]. I en tidligere studie undersøkte vi om CNAs i cellelinjer Calo, CaSki, HeLa, og Siha er knyttet til endringer i genuttrykk [23]. Genome-wide, ble bare en liten prosentandel av gener som ligger i CNAs (15,6%) eller minimale tilbakevendende regioner (18,8%) deregulert. Men disse prosenter var, på det meste, 4% høyere enn i gruppen av gener uten forandringer CN (14,8%). Disse dataene tyder på at bare omtrent 4% av CN-endrede gener samlet er deregulert direkte av genet dosering i CC-avledede cellelinjer. Selv i genomiske segmenter bekreftet å være helt forsterkes, slik som 3Q og 5p, ble prosentandelen av deregulerte gener som ikke alltid er økt. I tilfelle av 5p, prosentandelen av deregulerte gener økes opp til 33% i de 4 cellelinjer. Selv 3Q ble nesten helt forsterket i Calo (93,5%) og HeLa (87,2%), andelen av deregulerte gener økte bare ca. 2 ganger i HeLa (23,4%), men ikke i Calo (12,7%) sammenlignet med det i CaSki ( 13,9%) og Siha (9,4%), som viste bare delvis forsterkning av 3q [23]. Interessant, ikke alle deregulerte gener fra duplisert 5p og 3Q ble overexpressed. I stedet, ca 20% av genene deregulert i 5p og mer enn 50% av genene deregulerte i 3. kvartal ble nedregulert. Derfor er andre enn gen dosering faktorer, slik som epigenetiske mekanismer, kan påvirke genekspresjon i løpet av helt amplifiserte genom segmenter. Det finnes ingen studier som utforsket den globale sammenhengen mellom CN endringer og genekspresjon i CC.
I denne studien har vi undersøkt 59 HPV16-positive CCs med mikromatriser-31 for kartlegging CN-AG og 55 for global genet uttrykk, med 27 CCs felles. Vi undersøkte genom-bred, på en gen-av-genet nivå, andelen av CN-endrede gener som deregulerte og omfanget av den totale endret transkriptomet i CC som er deregulert direkte eller indirekte av gen-dosering. Vi har også undersøkt de biologiske prosessene i livmorhalskreftutvikling som er knyttet til gener deregulerte av genet dosering og påvirkning av genet dosering på pasientene, overlevelse
Resultater
Generelt Tumor genomanalyse. Identifisering av kromosomer , regioner og Genes Endrede i CN
det er totalt 673 CNAs større enn 2,5 Mb ble identifisert basert på analyse med Genechip Menneskelig Mapping 500 K (500 K) microarray: 446 presiseringer og 227 strykninger. Disse områdene ble validert med en andre high-density microarray (CytoScan HD2.7) i 15 av de 31 svulster undersøkt med 500 K microarray. Den gjennomsnittlige sammentreff mellom de 2 arrays var 79,3%, men det økte lineært fra 70% i den CNAs 2,5-3 Mb til 93,4% i CNAs større enn 10 Mb (r = 0,93, p 0,001, Spearman korrelasjon, figur S1) . Faktisk, når de fullstendige kromosomarmer ble sammenlignet, korrelasjonen mellom de 2 mikromatriser var nær 100% (figur 1). I gjennomsnitt, svulster hadde 22 ± 19 CNAs (range 0-65). Fra størrelsen av haploide genom (3000 Mb), vi beregnet prosentandelen av CN-endrede genomet (CN-AG) for hver tumor. Prosentene varierer mye blant de svulster fra 0% til 32,2% (gjennomsnitt = 8,1 ± 8,9%) og fulgte en parametrisk fordeling (figur 2A, tabell 1). Tumorer ble delt inn i 3 grupper ifølge% CN-AG: lavt (gjennomsnitt = 0,5 ± 0,6, n 11 =), middels (gjennomsnitt = 5,4 ± 2,4, n = 10), og høy (gjennomsnitt = 19,2 ± 6,6, n = 10, figur 2B, grå boksene). Bare 5 kromosomarmer hadde en gjennomsnittlig% CN-AG høyere enn for genomet gjennomsnitt og nådde statistisk signifikans (p 0,05, chi-kvadrat, som er merket med en stjerne i figur 3A). Fire av disse armene viste hovedsakelig fått genomet (3Q, 5p, Xp, Xq), og bare 3p viste en hovedsakelig slettet genom. Den høyeste prosentvise ble funnet i 3Q (44,3%), etterfulgt av godt under Xq (26,8%), Xp (22,4%), og 5 p (21,2%, se figur 3A). Bare CN-forandringer i kromosomer 3Q, Xp og 5p viste en lineær sammenheng med de globale endringer i genomet (r = 0,88, p 0,0001, analyse av varians). Disse 3 kromosomer kan forklare 76% av variasjonen i CN (justerte r2 = 0,76), med 3Q rangering på toppen og utgjør 55% av alle CN endringer i tumoren genomet [multippel lineær regresjon (MLR)].
Intensitet signaler med enkle nukleotid (SNP) eller ikke-polymorfe prober er uttrykt som log
2-forhold fra kromosomer 3, 4 og 5 av tumoren R496 utforsket ved hjelp av 500 K microarray (øvre panel) og HD 2,7 microarray (nedre panel). I begge paneler, viser y-aksen en log
2-forhold skala fra -1,5 til 1,5, og x-aksen viser ideogrammet av de undersøkte kromosomer med genom stillinger. Den horisontale linje som krysser punktet y = 0 svarer til 2 kopier. Den gjennomsnittlige tettheten av utforskes stillinger er mer enn 5 ganger høyere i HD 2,7 microarray enn i 500 K microarray (se materialer og metoder).
Panel A viser boksplott med fordelingen av svulster (n = 31) i henhold til prosentandelen av total, slettet eller forsterket CN-forandret genom (CN-AG). Panel B viser fordelingen av tumorer, grupperes så lavt (n = 11), middels (n = 10), og høy (n = 10) i henhold til den prosentandel av global og 3Q CN-AG. De horisontale linjer inne i boksene representerer median (fast) og gjennomsnittlig (stiplet), og linjene representerer det minimale og maksimale verdier innenfor 1,56 interkvartile området fra enden av boksen. Verdier utenfor dette området er representert med svarte sirkler. Nedgangen i den akkumulerte hyppigheten av tilbakevend CN-endrede gener, som øker antallet tumorer som delt samme endret genet, er vist for hele genomet (panel C) eller for kromosomer med betydelig høy% CN-AG (panel D) . Kombinert gener er de som ble slettet i noen og forsterket i andre svulster.
Den venstre siden viser utforsket genomet (Mb) i hvert kromosom arm som ble undersøkt med 500 K microarray i 31 svulster. Den høyre siden viser antall gener på hver arm utforsket med Human Gene 1,0 ST microarray i 27 av svulstene som CN ble undersøkt. Hver søyle representerer prosentandelen av CN-AG (venstre) eller deregulerte gener (høyre) av kromosom arm indikert i midten. Røde linjer indikerer gevinst eller overekspresjon og blå søylene representerer tap eller subexpression. Den stiplede linje representerer den gjennomsnittlige prosentandelen av den globale CN-AG (8,1%, til venstre), eller prosentandelen av deregulerte gener (9,5%, til høyre) i tumoren genomet. Armene er merket med asterisker hadde en gjennomsnittlig andel av CN-AG eller prosentandel av deregulerte gener overlegen og statistisk signifikant sammenlignet med tallene som finnes i den komplette genomet tumor (p 0,05, chi-kvadrat)
for å identifisere gener med CN endringer, justert vi CNAs med menneskelige gener ifølge posisjon i genomet. Antallet endrede gener varierte fra 0 til 10 666 (gjennomsnitt = 2,754 gener; se tabell 1) mellom tumorene og korreleres positivt med% CN-AG (r = 0,99, p 0,0001, Pearsons korrelasjon). De fleste CN-endrede gener ble ikke delt mellom svulster. Den akkumulerte frekvens av tilbakevend CN-endrede gener drastisk redusert når antallet tumorer som delte samme endret gen øket (figur 2C). Faktisk ble det ikke gen endret på alle 31 svulster utforsket, og bare tre gener (
RPL21P39
,
NLGN1
,
GM2AP1
) ble endret på 20 svulster. 3Q-genene var den mest tilbakevend-opptil 10 tumorer viste endring av nesten 100% av den utforsket genes-, og 3Q kurve ble forskjøvet til høyre 6 svulster fra nærmeste kurve av de andre kromosomer (se figur 2D). Totalt 264 gener hadde gjentatte endringer, alt fra 3Q, i 16 (51,6%) eller flere svulster.
Vi valgte syv av de mest tilbakevendende gener som ligger på 3Q (
CLDN1
,
ECT2
,
NAALADL2
,
NLGN1
,
PLOD2
,
PLSCR1
, og
PLSCR4
) for å være validert med en real-time kvantitativ polymerase chain reaction (qPCR) teknikk i alle 31 svulster og 17 kontroller. Alle gener viste en signifikant positiv korrelasjon (r 0,6, s 0,0001, Pearsons korrelasjon) mellom den midlere intensitet (log2 forhold) av SNP er identifisert med microarray i CNAs, hvori genene ble plassert i hver tumor, og antallet kopier beregnet med qPCR (data ikke vist). Når antall kopier kalkulert med qPCR ble sammenlignet mellom gruppene, gjennomsnittlig CN av de 7 utforsket genene var signifikant høyere i svulster som hadde endringer enn i de uten endringer i disse 3Q gener (p 0,05, t test, figur 4A) .
det øverste panelet viser gjennomsnittlig antall kopier av 7 gener (
CLDN1
,
ECT2
,
NAALADL2
,
NLGN1
PLOD2
,
PLSCR1
, og
PLSCR4
) ligger i 3Q utforsket med qPCR kontroller (lymfocytter) og svulster med 2 eller 3-4 eksemplarer identifisert med 500 K microarray. Whiskers av hver stolpe representerer standardfeil av gjennomsnittet. Den stiplede røde linjen viser verdien for 2,5 kopier beregnet med qPCR (se Materiale og metode). Den nederste panelet viser korrelasjonen av genekspresjon av 8 gener (
MCM2
,
PLOD2
,
PLSCR1
,
SMC4
,
ECT2
,
NLGN1
,
RFC4
, og
CLDN1
) ligger i 3. kvartal utforsket i 27 svulster og 6 kontroller med både HG 1,0 ST microarray og QRT-PCR-teknikker . Logg
2 verdier av normalisert intensitet signaler oppnådd med microarray (robust flerbrikkegjennomsnittsverdier) og QRT-PCR ble plottet. Trendlinje (svart linje), korrelasjonskoeffisient (r), og p-verdi ble beregnet med Pearsons korrelasjon test.
Analyse av Global Gene Expression
Hvor mye budbringer-RNA (mRNA ) transkribert fra 21,034 gener ble undersøkt ved hjelp av microarray HG 1.0ST i 27 av de 31 svulster undersøkt med 500 K microarray og i 17 normale livmorhals epitel kontroller (Figur 5, Tabell 1 og Tabell 2). Vi identifiserte 2,006 endrede gener (9,5%), 57,6% nedregulert og 42,4% oppregulert (tabell S1). Når de 2 adenokarsinomer (ACC, R075 og R189 i tabell 1) og adenosquamous cellekreft (ASCC; R298 i tabell 1) ble ekskludert fra analysene, fant vi et tilsvarende antall gener og konkordans på 95% med listen over endret gener. Derfor, for å opprettholde størrelsen på utvalget vi har alle 27 CCs.
Figur viser analysen arbeidsflyten av de 59 CC tilfeller undersøkt i denne studien. Alle CC prøver var HPV16 positive og ble undersøkt med mikromatriser-31 for kartlegging CN-AG og 55 for global genekspresjon, med 27 CCs felles. Disse 27 CCs ble brukt til analysene av global genekspresjon og sammenhengen mellom CN-AG og genuttrykk. For den hierarkiske klyngeanalysen, ble ekspresjonsprofiler av de 55 CC prøver inkludert. Fem års overlevelse ble undersøkt hos 55 pasienter, 51 utforsket for genekspresjon og 28 for CN endringer, med 24 CCs felles. Se materiale og metodedelen for detaljer om prosedyrene.
Hyppigheten av deregulerte gener ble beregnet ved kromosom. Av de 42 undersøkte armene, bare 5 (3q, 4q, 6p, 15Q, og Xq) viste en høyere og statistisk signifikant andel av deregulerte gener i forhold til den totale prosentandel (9,5%, som er merket med en stjerne i figur 3B). Kromosomene som viste den høyeste andelen var 6p (16,0%, p 0,001) og 3. kvartal (15,9%, p 0,001), etterfulgt av 4Q (15,6%, p 0,001), Xq (13,0%, p 0,02), og 15Q (12,9%, p 0,04); chi-kvadrat test for alle sammenligninger. Oppregulert gener dominerte i 3. kvartal og 6p, mens downregulated gener var mest utbredt i 4. kvartal, 15Q, og Xq (se Figur 3B).
Vi evaluerte uttrykket av 28 gener som er valgt for validering med en QRT-PCR teknikk 27 CC prøver og 6 kontroller (tabell S2). Vi har funnet en signifikant positiv korrelasjon (gjennomsnitt r = 0,74, p 0,05; Pearsons korrelasjon) mellom de logaritmiske verdier (log2) av de data som oppnås med QRT-PCR og microarray i 27 av de 28 gener undersøkt (96,4%). Figur 4B viser korrelasjonen av de intensitetsverdier (log2) som oppnås med 2 metoder for 8-gener beliggende på 3Q. Disse data indikerte at uttrykket verdiene som er beregnet med microarray var ganske pålitelig fordi opptil 96,4% av godkjente gener hadde en signifikant sammenheng.
For å identifisere de biologiske prosessene knyttet til 2,006 ulikt uttrykte gener, vi brukte Database for kommentering, visualisering, og integrert Discovery verktøy (DAVID, https://david.abcc.ncifcrf.gov/). Sammenlignet med det humane genom database, de 5 mest anriket klynger med de laveste p-verdiene ved middels stringens var cellesyklus inkludert mitose, DNA metabolske prosesser, inkludert DNA-reparasjon, kromosom segregering, cytoskjelettet organisasjon, og utviklingsmessige prosesser (Tabell 3). Interessant, på det høyeste stringens, der mer tett knyttet gener i hver gruppe er forventet, de klynger inkludert mitose ble rangert første, tredje og femte (biologiske prosesser i kursiv i tabell 3).
totale gruppen av deregulerte gener ble også analysert med Oppfinnsomhet Pathway Analysis (IPA) programvare, og det samlede resultatet var svært lik de som ble oppnådd med DAVID verktøyet (data ikke vist). Av de 89 kanoniske trasé som IPA identifisert som endret (p 0,05, Fisher eksakt test), som er involvert i cellesyklus og DNA-reparasjon rangert på toppen av listen (Figur 6A)
Panel A viser. de 25 kanoniske trasé identifisert i sett av 2,006 deregulerte gener i hele settet av svulster. Panel B viser de 25 beste kanoniske trasé identifisert i sett av 862 gener deregulerte utelukkende i high-CN svulster. De kanoniske trasé ble identifisert med oppfinnsomhet Pathway Analysis programvare. Den -log (p-verdi), og forholdet ble beregnet ved å sammenligne antall gener som tilhører veien til stede i datasettene med det humane genom databasen. P-verdien ble beregnet ved anvendelse av chi-kvadrat eller Fisher eksakte test, som er hensiktsmessig, og verdier på -log (p-verdi) høyere enn 1,3 (rød linje) svarer til en verdi av p 0,05. Den kanoniske vei av hypoksi induserbar faktor (HIF1α) signale var statistisk signifikant i de deregulerte genene i hele settet (43. plass) og i high-CN sett svulster (26. plass).
korrelasjon mellom endringer i CN og Gene Expression
En enkel analyse av figur 3 tyder på at noen klar sammenheng mellom genuttrykk og CNAs. For eksempel, av de 5 kromosomer med høyest andel av CN-AG, bare 2 (3Q, Xq) viste en signifikant økning i andelen av deregulerte gener. Videre er de andre 3 kromosomene som viser en betydelig økning i deregulerte gener (4q, 6p, 15Q) manglet en høy prosentandel av CN-AG, selv 6p og 15Q hadde en prosentandel godt under den samlede gjennomsnittlige. Selv om overuttrykt gener dominerer i de fleste av de kromosomer med en høy andel av gevinster, er disse kromosomer har også en høy andel av downregulated gener, og i noen, slik som Xq, andelen av downregulated gener dominerer (figur 3). På den annen side, kromosomer som viste overveiende delesjoner (3p, 4p) hadde også en prosentandel av oppregulert gener, selv om prosentandelen av downregulated gener dominerte.
For å forstå mer grundig forholdet mellom CN endring og genekspresjon, vi analyserte disse variablene gen av genet i hver svulst. Uttrykket status (nedregulert, oppregulert, eller uforandret) for hver undersøkt gen (n = 21 034) ble identifisert i hver tumor ved bruk av cutoff verdier (se materialer og metoder). CN status for hver av disse genene ble også identifisert i hver tumor. Antallet gener med og uten forandringer i CN og genekspresjon er vist for hver tumor i tabell 1. Det gjennomsnittlige antall CN-endrede gener var 1673, og det gjennomsnittlige antall av 2 kopigener var 19 362 (se tabell 1). I gjennomsnitt ble 2,010 (9,6%) gener deregulert i tumorer, hvorav 241 ble CN endret og 1769 hadde 2 eksemplarer. Disse dataene betyr at i gjennomsnitt ble bare 14,4% (241/1673) av CN-endrede gener og 9,1% (1769/19362) for 2 kopimaskiner gener deregulert. Forskjellen mellom de 2 undergruppene var bare 5,3% (p 0,00001, chi-kvadrat) og tilsvarer gjennomsnittlig brøkdel av gener med CN endringer som kan deregulerte direkte av genet dosering. Spesielt, var bare 69% av de forsterkede og deregulerte gener overexpressed; resten ble nedregulert. Videre ble bare 82% av de slettede og deregulerte genene nedregulert; resten ble overexpressed (data ikke vist). Disse resultatene er enig med observasjoner på kromosomnivå.
For å undersøke om en lineær trend eksisterer mellom genuttrykk og mengden av CN endring (CN-AG), analyserte vi sammenhengen mellom 2 variabler, herunder den enkeltes data for alle svulster studert. Som forventet var det totale antall av deregulerte gener økte med% CN-AG (beregnet fra tabell 1, r = 0,5, p = 0,007, Pearsons korrelasjon; figur 7). Ifølge ligningen i figur 7 (y = 32x + 1734), i en tumor med 0% CN-AG (x = 0), antallet av deregulerte gener er tilnærmet 1734 og ville bli deregulert av andre enn gen dosering mekanismer. Derimot, vil svulsten med høyest% CN-AG (R365 = 32,2%, se tabell 1) har en ekstra 1,034 deregulerte gener (totalt = 2768). Dette antallet er meget nær det observerte antall deregulerte gener (se tabell 1) og inkludert brøkdel av deregulerte gener som kan bli deregulert direkte av genet dosering. I dette ekstreme tilfellet tilsvarer tallet til 37,4% av alle deregulerte gener (1034 /2,768). I hele settet av svulster, bare 12% (241/2010) av deregulerte gener i gjennomsnitt var CN forandret (beregnet fra tabell 1). Bare CN-endringer i 3. kvartal viste en klar lineær regresjon med global genekspresjon (r = 0,51, p = 0,006, variansanalyse), og det forklarte 23,2% (justert r
2 = 0,232, MLR) av alle endringer i genuttrykk.
utviklingen av antall deregulerte gener med økt% CN-AG i hele settet med 21,034 utforsket genene er vist. Linjen representerer den lineære korrelasjon trend for datasettet. Du får også se ligningen for linjen, korrelasjonskoeffisienten, og p-verdi beregnet med Pearsons korrelasjon test.
Identifikasjon av deregulert gener og biologiske prosesser knyttet til endringer i Gene Dosering
a) deregulert gener i lav- og høy-CN svulster.
for å identifisere differensielt uttrykte gener i tumorer med lave og høye prosenter av CN endringer (se figur 2B, grå boksene), sammenlignet vi hver gruppe tumorer med kontrollgruppen (n = 17) ved hjelp av SAM-metoden. Av de 21,034 utforsket gener, ble 1757 (8,4%) deregulert i svulster med høy CN, men bare 1104 gener (5,2%) ble deregulert i svulster med lav CN. Interessant, 895 (81,1%) av de deregulerte gener i lav-CN gruppe også ble deregulert i high-CN gruppe. Forskjellen i antall deregulerte gener mellom den høy-CN gruppe og de felles gener (n = 862) samsvarer med fraksjonen av gener deregulerte av genet dosering i høy-CN-gruppen (49,1%).
bemerkelsesverdig var bare 9,2% av genene deregulerte utelukkende i høy-CN tumorer (79 av 862) amplifisert (n = 76) eller slettet (n = 3) i 6 eller flere svulster. De resterende gener ble CN endret på 4-5 (n = 118), 1-3 (n = 370), eller ingen (n = 295) tumorer (Tabell S3). Basert på disse beregningene, konservativt antok vi at det i denne gruppen av gener utelukkende forbundet med høy CN tumorer (n = 862), har genet dosering en direkte innflytelse på genekspresjon i, på det meste, 22,9% av disse genene (CN endret på ≥4 svulster). De resterende gener (CN endret på ≤ 3 svulster, n = 665) ville ikke bli deregulert direkte av genet dosering, men av andre mekanismer, kanskje påvirket
i trans
av noen CN-endrede gener.
b) Identifikasjon av biologiske prosesser knyttet til svulster med høy og lav CN.
DAVID verktøyet ble brukt til å identifisere de biologiske prosessene beriket i undergruppe av felles gener (n = 895) og de deregulerte utelukkende i høy -CN (n = 862) og lav-CN (n = 209)-tumorer. Klynger av biologiske prosesser som finnes i gruppen av vanlige gener som var meget lik de som ble anriket i hele settet av tumorer (tabell 3 sammenlignet med Tabell S4). Men noen viktige biologiske prosesser anriket på hele settet av tumorer, slik som angiogenese, regulering av celleadhesjon, og den anafase-fremmende kompleks /cyclosome (APC /C) -avhengig proteasomal ubiquitin-avhengig protein katabolske fremgangsmåte (se tabell 3) ikke ble anriket i den undergruppe av gener som deles av begge grupper. Interessant, ble disse 3 prosessene beriket i høy-CN svulster; dessuten, rangert de første blant de biologiske prosesser (Tabell 4). Andre klynger beriket utelukkende i high-CN gruppe, men ikke identifisert i undergruppe av felles gener inkludert glykolyse, som rangeres andre, apoptose, og mRNA transport (se tabell 4). Disse dataene tyder på at disse prosessene er nært knyttet til genet dosering. Prosessene for cytoskjelettet organisasjon, cellesyklus, og DNA-pakking, selv om ikke utelukkende, var også anriket på gruppen av gener som er forbundet med høy-CN tumorer, noe som tyder på at noen gener som er involvert i disse prosessene kan bli deregulert av genet dosering. Alle disse biologiske prosesser, med unntak av celleadhesjon og angiogenese, var assosiert med overuttrykt gener. Interessant, på det høyeste stringens, prosesser av APC /C-avhengige proteasomal ubiquitin-avhengige protein katabolsk prosess rangert først, etterfulgt av glykolyse og DNA emballasje (biologiske prosesser i kursiv i tabell 4). Som kjent, de fleste av de som er involvert i de biologiske prosesser som er forbundet med høy-CN tumorer gener ble ikke endret CN (figur 8). På den annen side ble bare to klynger anriket i den undergruppe av gener utelukkende deregulerte i lav-CN tumorer: celledifferensiering og prosessering og presentasjon av peptidantigen via store histokompatibilitetskompleks klasse I (data ikke vist). Dette tyder på at de fleste av de som er involvert i disse 2 prosesser genene er deregulert gjennom andre enn genet dosering mekanismer.
Synlig er tallet på to-kopi eller CN-endrede gener i ≤ 3 svulster (grønne søyler) og CN -altered gener i ≥4 tumorer (blå søyler) blant de biologiske prosessene beriket i undergruppe av gener deregulert utelukkende i high-CN svulster.
for å undersøke om genuttrykk profiler av biologiske prosesser forbundet med høy-CN svulster tillater segregering av svulster enten ved CN eller ved biologiske prosesser selv, vi utførte en unsupervised hierarkisk clustering å klassifisere 55 svulster utforskes med HG 1.0 ST mikromatriser (tabell 2), inkludert de 27 svulster utforsket for CN analyse, og 17 friske kontroller cervical. Bare de ekspresjonsprofiler for glykolyse og APC-avhengig protein proteasomal katabolisk prosess tydelig adskilt svulstene i grupper med bestemte uttrykk profiler (figur 9). I analysen av glykolyse, viste dendrogram 3 hovedgrener: 1 med en sterkt oppregulert profil, en annen med en kombinasjon av svak opp- og downregulated signaler, og en tredje med en sterk nedregulering av profil. Disse resultater viser at heterogeniteten i genet signatur av denne biologisk prosess i hele settet av prøver. De fleste svulster (81,8%) gruppert jevnt i de første 2 grener, og et mindretall gruppert i den tredje grenen (18,2%). I motsetning til dette, ble alle men 3 kontroller gruppert i den tredje gren. Spesielt, ble høy-CN tumorer gruppert i sterk (60%) og kombinert (40%) oppregulert profiler, mens lav-CN tumorer hovedsakelig gruppert i nedregulert (50%) og kombinert (30%) profiler (p = 0,028 , Fisher eksakte test, figur 9A)
Unsupervised hierarkisk klynge analyse av 55 CCs og 17 friske cervikale epitel prøver ved hjelp av uttrykket verdiene av genene deregulerte fra glykolysen (panel A) og den anafase-fremmende kompleks /cyclosome. (APC /C) -avhengig proteasomal protein katabolsk prosess (panel B) oppnådd med HG 1,0 ST microarray. Hver rad representerer et gen, og hver kolonne representerer en prøve. Prøver navn som begynner med en «R» er CCs og med en «C» er kontroller; CCs slutter på 1, 2 eller 3 tilhører lav-, mellom- eller høy-CN grupper, henholdsvis, mens de som ender med noe nummer ikke ble undersøkt for CN. Lengden og inndelingen av grenene representerer forholdet mellom prøvene basert på intensiteten av genekspresjon. en. b. en. b. en.