PLoS ONE: Prediktiv Gener i tilknytning Normal vev Fortrinnsvis Endret ved sCNV under tumorigenesis i leverkreft og mai hastighetsbegrensende

Abstract

Bakgrunn

I leverkreft (HCC) gener som predikerer overlevelse har blitt funnet i både tilstøtende normalt (AN) og tumor (TU) vev. Forholdet mellom disse to sett med prediktiv gener og den generelle prosessen med tumordannelse og sykdomsutvikling er fortsatt uklar.

metodikk /hovedfunnene

Her har vi undersøkt HCC tumorigenesis ved å sammenligne genekspresjon, DNA-kopi antall variasjoner og overlevelse ved bruk av ~250 AN og TU prøver som representerer henholdsvis den pre-kreft tilstand, og resultatet av tumorigenesis. Gener som deltar i tumorigenesis ble definert ved hjelp av et gen-gen korrelasjon meta-analyse prosedyre som sammenlignet AN versus TU vev. Gener som predikerer overlevelse i AN (AN-overlevelse gener) ble funnet å være anriket i differensial gen-genet korrelasjon gen sett noe som indikerer at de direkte deltar i prosessen med tumorgenese. I tillegg til AN-overlevelses gener var for det meste ikke prediktiv etter tumorgenese i TU vev, og denne overgang ble forbundet med og kunne i stor grad bli forklart ved virkningen av somatiske DNA-kopi antall variasjoner (sCNV) i cis og trans. Dataene var i overensstemmelse med variasjonen av AN-overlevelse gener blir hastighetsbegrensende trinn i tumorgenese, og dette ble bekreftet ved hjelp av en behandling som fremmer HCC tumorigenesis som selektivt endret AN-overlevelse gener og gener differensielt korrelerte mellom AN og TU.

Konklusjoner /Betydning

Dette tyder på at prosessen med svulst evolusjon innebærer hastighetsbegrensende trinn i forbindelse med bakgrunn fra der svulsten utviklet seg hvor disse var ofte forutsigbare for klinisk utfall. I tillegg behandlinger som endrer sannsynligheten for tumorigenesis forekommende kan opptre ved endring av AN-overlevelse gener, noe som tyder på at prosessen kan manipuleres. Videre sCNV forklarer en betydelig del av tumor spesifikke uttrykk og kan derfor være en årsaks driver av svulst evolusjon i HCC og kanskje mange solide tumortyper

Citation. Lamb JR, Zhang C, Xie T, Wang K, Zhang B, Hao K, et al. (2011) Predictive Gener i tilknytning Normal vev Fortrinnsvis Endret ved sCNV under tumorigenesis i leverkreft og mai hastighetsbegrensende. PLoS ONE 6 (7): e20090. doi: 10,1371 /journal.pone.0020090

Redaktør: Xin Wei Wang, National Cancer Institute, USA

mottatt: 31 august 2010; Godkjent: 25 april 2011; Publisert: 05.07.2011

Copyright: © 2011 Lamb et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble i sin helhet finansiert av Merck Co og dets heleide datterselskap Rosetta Inpharmatics, Inc. Mange av forfatterne var eller er Merck ansatte. Manuskriptet ble anmeldt av Merck og godkjent for utgivelse i den offentlige sfæren uten endringer. Annet enn dette Rosetta Inpharmatics og Merck hadde ingen rolle i studiedesign, datainnsamling og analyse, eller utarbeidelse av manuskriptet

Konkurrerende interesser:. JRL, CZ, TX, KW, BZ, KH, EC, HF, JM, MF, CS, II, ZZ, JB, RS, DG, MC, JD, CM, VE, JZ, MM, HD og ES var alle Merck ansatte ved Rosetta nettstedet; MS, UP, DB, AL, JW, CB-D, SF og PS var Merck ansatte på andre områder; RP, CY, NL og JML var ansatt i Hong Kong University. Annet enn å finansiere denne studien og ansettelse av forfattere som beskrevet ovenfor, er det ingen andre konkurrerende økonomiske eller andre interesser som skal vises. Ovennevnte bevisn endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.

Innledning

En universell funksjon i kreftceller er genomisk ustabilitet [1], [2 ], [3], [4], [5], som antas å være nødvendig for å generere tilstrekkelig variasjon fra hvilken fordelaktige endringer for tumorvekst og overlevelse er valgt [6]. Etter dette paradigmet, er det nå enighet om at genomisk ustabilitet kan oppstå feil i DNA-syntese og reparasjon, kromosom segregering, kontrollposter, telomere tap og andre biologiske prosesser som resulterer i punktmutasjoner, kopiere nummer variasjon og gevinst /tap av biologiske funksjoner [2 ], [3], [4], [7], [8], [9], [10]. Leverkreft (HCC) er den nest vanligste kreftsykdommen av asiatiske populasjoner og den tredje største årsaken til kreftdød i verden. Foreløpig den eneste effektive behandlingen alternativet er kirurgi [11]. HCC som vanligvis oppstår i pasienter med viral hepatitt og /eller cirrhose hvor omfattende betennelse utsetter hepatocytter til mitogene stimuli [11]. Den pre-neoplastisk fase er karakterisert ved en rekke endringer, blant annet fremveksten av telomerer forkortes og utseendet av genomiske endringer [12]. Strukturelle endringer i genomet gradvis akkumuleres under overgangen til neoplasi og fra tidlig til sent stadium HCC [11]. Genomiske forandringer i HCC er heterogene i at mange loci har blitt rapportert å bli forandret, men generelt ved en lav prevalens [12]. Dette fører til hypotesen om at det finnes alternative forstyrrelsene som fremmer tumordannelse i HCC [11], [12].

Integrative genomanalyse har blitt brukt til mange ikke-kreftsykdommer [13], [14] og har beskrevet nettverk av genet variasjon ved å teste alle mulige sammenhenger på tvers av ulike populasjoner segregerende sykdommen av interesse. Dette arbeidet har fastslått at genene er vanligvis en del av sammenhengende nettverk, og at de mest betydningsfulle sammenslutninger av gener til sykdom ofte forekommer i sammenheng med nett delområder hvor mange eller alle medlemmer av disse undernettverk er forbundet med hverandre og med sykdomskaraktertrekk [13], [15], [16]. Slike under nettverk har videre vært forbundet med DNA variasjon og validert som årsaks kjører sykdom utfallet [13].

Her har vi undersøkt genet nettverksstrukturen ved hjelp av en samling av ~250 matchet tumor (TU) og tilstøtende normalt ( AN) prøver fjernet fra HCC pasienter i løpet av kirurgisk reseksjon og har vurdert hvorvidt disse nettverkene er assosiert med DNA og sykdom variasjon i HCC kohort. Tilnærmingen var i hovedsak å avdekke samspillet i og mellom datatyper målt i denne populasjonen (DNA, uttrykk, overlevelse) i AN og TU vev i et åpent, omfattende og fullstendig datadrevet måte. Interaksjonene karakteristisk for tumorer (TU) ble sammenlignet med normal (AN) vev for å vise tumorspesifikke endringer. Her presenterer vi resultatene av denne omfattende analyse og viser at sCNV robust endrer ekspresjonen av et stort antall gener og også forholdet mellom disse gener til overlevelse i enten en eller TU vev, og at tumorigenese i stor grad involverer ødeleggelse av normale funksjoner og aktivering av et mindre sett med funksjoner som kan være avgjørende for sykdomsprogresjon. Dataene antydet at gener som predikerer overlevelse i en vev kan være hastighetsbegrensende trinn for tumorigenesis. I samsvar med denne hypotesen en behandling som induserer HCC tumorigenesis i mus, MET onkogen overekspresjon, ble funnet å selektivt endre uttrykket av gener som predikerer overlevelse i en vev av mennesker.

Resultater

For å karakter genet nettverk i human lever svulsten og nærliggende normalt vev vi samlet en vev bestemt kohort bestående av levertumor (TU) og tilstøtende normale (AN) vev fra 272 asiatiske pasienter (inkludert 151 sammenkoblede TU og prøver, Supplerende Tabell S1 [17]) gått kirurgisk reseksjon for behandling av HCC. RNA ble isolert fra alle TU og prøver og profilert på en tilpasset Affymetrix microarray består av oligonukleotidprober rettet mot transkripsjoner representerer 37,585 kjente og spådd gener, inkludert høy grad av tillit ikke-kodende RNA-sekvenser. DNA ble isolert fra alle AN og TU vev og genotypet på Illumina 650Y SNP genotyping array. Kopier nummer aberrasjon markører (sCNV markører) ble deretter lagt til grunn for 32,711 steder i genomet fra denne high-density SNP panel (Methods).

Gene nettverk i levertumor og tilstøtende normale prøver

Gitt storskala genomisk endringer generelt kjent for å oppstå i tumorprøver, vår observasjon av store uttrykks forskjeller mellom AN og TU prøver i HCC kullet var ikke overraskende, med 28 233 ( 75%) av 37,585 gener som er representert i microarray anvendt i denne studien detektert som uttrykt forskjellig (p 0,05, 0,07 FDR, se Tabell S2), i samsvar med tidligere rapporter [18]. Hovedproblemet deretter i å tolke molekylære tilstandsendringer mellom AN og TU er å skille mellom de endringene som er relevante for utviklingen av svulsten fra de endringene som er rett og slett sporing med genomisk endringer, men ikke er relevante for tumorbiologi. Derfor søkte vi å karakterisere virkningen disse store endringene hadde på tilkobling strukturen i vevsspesifikke genet nettverk, noe som gir en vei til å identifisere de endringer som fører til endringer i de molekylære nettverk som definerer de biologiske prosessene som er utført av vev.

for å karakterisere endringer mellom AN og TU nettverk vi brukte en meta-analyse prosedyre [19], [20] for å teste om omfanget av sammenhengen mellom et gitt genpar i en vev var signifikant forskjellig fra foreningen observert det samme paret i andre vev (Methods). Signifikante forskjeller korrelasjon indikerer tilstedeværelse av tilkoblings forskjeller mellom AN og TU-nettverk (figur 1). På en Bonferroni justert, differensial tilkobling p = 7e-11 ( 1% familiemessig feilrate) identifiserte vi 1,156,638 differensielt korrelerte par (bare to ville ha vært forventet ved en tilfeldighet), eller om lag 12% av 9.976.814 korrelerte genet parene finnes i enten AN eller TU vev. Vi har også empirisk beregnet differensialtilkoblings null fordeling og observert noen differensielt koblede par med p 7e-11 (figur 1), noe som tyder på at denne graden av differensial tilkobling er av stor betydning

A Vist er tallene i forskjellig. korrelerte gener oppdaget ved hjelp av en meta-analyse prosedyre (Methods) mellom AN og TU vev. For sammenligning ble kjørt på samme analysen både i den virkelige data, og i en permutasjon av AN og TU oppdrag. Den øverste panelet viser antall differensial genpar (Y-akse) for de virkelige data (AN vs TU, i blått) i forhold til permutasjon (rød) som en funksjon av p-verdi (vist som negative log10 [P] , på X-aksen). Antallet differensielt koblede gener (midten panel) og falske funnrate (nederst panel) er også vist. B For å fastslå at de differensielt korrelerte par genet var et resultat av forskjellen mellom AN og TU vev og ikke for eksempel forskjeller mellom individer den samme analyse ble utført ved anvendelse av en vs AN i forhold til AN vs TU ved bruk av samme antall sampler (Metoder). Toppfeltet viser antall differensial gen parene (Y-aksen) for både en vs TU (blå) og AN AN vs (rød) som en funksjon av p-verdi (vist som negative log10 [P], på X- akser). Antallet differensielt koblede gener (midten panel) og falske funnrate (nederst panel) er også vist.

For å øke tilliten til at genet parene identifisert som forskjellig korrelert mellom AN og TU nettverk reflektert biologisk relevant endringer i nettverks tilstander knyttet til tumorigenesis og tumorprogresjon, begrenset vi hensyn til de differensielt korrelerte gen par som var svært lite sannsynlig å ha skjedd ved en tilfeldighet (p 1e-19, med en gjennomsnittlig endring i Spearman korrelasjonskoeffisient mellom vev av 0,73, ingen genet parene observert i de permuterte data, FDR 1e-6, se figur 1). På dette strenge cut-off, identifiserte vi 49,300 genpar dekker 8,736 gener hvis forhold signifikant forskjellig mellom TU og vev. Av de 49,300 differensielt koblede par er identifisert, ble 42 179 (86%) sterkt korrelert i AN-vev, men betydelig mindre korrelert i TU vev, mens bare 7121 parene (14%) hadde sterkere korrelasjoner i TU versus AN prøver, noe som indikerer at nettverks endringene som skjer i svulsten var mer sannsynlig å ødelegge fremfor å skape sterke assosiasjoner mellom uttrykk trekk.

for å skille mellom hvilke typer gener som er involvert i differensial tilkoblinger vi definerte gevinst på tilkobling (GOC) gener som de i hvorav mer enn 90% av sine differensial interaksjoner reflektert korrelasjoner som var sterkere i TU i forhold til AN. På samme måte vi definert tap av tilkoblings (LOC) gener som de der mer enn 90% av sine differensial interaksjoner reflektert korrelasjoner som var svakere i TU i forhold til AN (Supplementary tabell S2). Selv om disse er vilkårlige cut-offs de tjener til å markere den relative fordelingen av gevinst og tap av tilkoblingsmuligheter forbundet med tumordannelse, gitt mer enn 80% av de differensielt koblede gener falle i en av de to kategoriene. Under denne kategoriseringen var det 6,053 LOC gener og bare 1020 GOC gener. GO anrikning analyse etter Bonferroni korreksjon for antall kategorier avslørte at GOC gener ble anriket i cellesyklus (3,93-ganger anriket, p = 1.6e-20) og beslektede prosesser (f.eks, kromosom segregering, DNA-replikasjon, og spindelen organisasjon) , mens LOC gener ble stort sett beriket for metabolske prosesser (1,11 ganger beriket, p = 1.4e-20), spesielt de som er forbundet med mitokondrier (1,56-ganger beriket, p = 1.5e-20). Disse resultatene tyder på at prosessen med tumorgenese er i stor grad en av forstyrrelse av normal nettverk (LOC), og i mindre grad en av dannelsen av nye nettverk (GOC). I samsvar med dette ble LOC hendelser beriket for normale leverfunksjons gener, hvor som GOC hendelsene ble beriket for gener involvert i kreftsvulst av cellen. GOC hendelser, men mindre i antall, kan representere tumor spesifikke funksjoner som kreves for sykdomsprogresjon og som sådan kan være en interessant kilde til mål for HCC. For å illustrere arten av de differensielle koblinger toppen 5 genene og genene for de ble differensielt koblede er vist i figur 2. Eksempler på de enkelte gen-parene som ble differensielt koblede i TU eller en vev er vist i figur 3, inkludert inhibitoren av G1 til S fase overgang (CDKN2C med tap av tilkobling) og DNA replikasjon lisensiering faktor (CDT1 viser gevinst på tilkobling).

de 5 differensielt koblede gener og deres differensielt koblede partnere vises. Hvert gen er representert ved en blå oval og toppen 5 er angitt ved boksene. For hver av de 5 beste genene også indikert er antall differensial korrelasjoner mellom AN og TU totalt (DiffConn) og tallene for gevinst (GOC) og tap (LOC) av korrelasjon i hvert enkelt tilfelle. Linjer som kobler gener indikerer at paret ble ulikt korrelert mellom AN og TU hvor både LOC (blå linjer) og GOC (røde linjer) er angitt. Differensial forbindelser mellom de 5 beste genene og alle andre genet er vist, samt differensial sammenhenger mellom gener differensielt koblet til topp 5. De 5 genene ble funnet å være forskjellig korrelert til en svært overlappende sett med partnere. Vist i innsatsen tabellen (øverst til høyre) er den Fishers Exact Test p verdi for overlapping mellom forskjellig korrelerte gen partnere for hver av de 5 beste gener (nederst til venstre i tabellen). Også vist (øverst til høyre) er den fold berikelse for overlappinger i forhold til hva som forventes ved en tilfeldighet. Som vist et komplekst nett av differensial sammenhenger som følge av tumorigenesis er avslørt

For å illustrere både tap og gevinst på korrelasjons to cellesyklus gener ble valgt som har mange differensial tilkoblinger:. Den cyclin avhengig kinase inhibitor CDKN2C ( A, 149 tap og 11 gevinster på tilkobling) og kromatin lisensiering og DNA replikasjon faktor CDT1 (B, 0 tap og 38 gevinster på tilkobling). De uttrykk intensitetsverdiene for CDNK2C (X-aksen) og DCN (Y-aksen) er vist (A) i AN (blå, cc 0,548, p = 2E-20) og TU vev (rød, cc -0,358, p = 7,14 e-10). Intensitetsverdiene for CDT1 (X-aksen) og MCM3 (Y-aksen) er vist (B) i AN (blå, cc-0,153, p = 0,0166) og TU vev (rød, cc 0,673, p = 3.05e-38 ). Vist i C er graden fordelingen for de 8,736 differensielt koblede gener som beskrevet i teksten. Numrene på differensielle koblinger for hvert gen (log10, X-aksen) ble sammenlignet med tellingen (log10, Y-aksen). Som vist var fordelingen skala-fri, noe som indikerer at de identifiserte genene har en tendens til fortrinnsvis legge til et lite antall hub gener i enten svulst eller tilstøtende normalt vev, men ikke i begge.

For å vurdere om differensial korrelasjonene ble tilfeldig fordelt blant de betydelige gen-genet korrelasjoner eller om det var noe høyere nivå struktur, undersøkte vi fordelingen av antall differensial korrelasjoner for hvert gen. Vi observerte at mens de fleste genene deltok i et lite antall av differensial-korrelasjoner, var det en undergruppe av gener som har deltatt i mange differensial korrelasjoner. Faktisk, differensial sammenhenger tett fulgt en makt lov distribusjon som var ganske forskjellig fra hva som forventes ved en tilfeldighet (se figur 3). Dette indikerer at visse gener representerer hub noder i forskjellig tilkoblede matrise som oppsto fra tumorigenesis og som sådan kan være av særlig betydning.

sCNV forklarer en stor del av TU uttrykk variasjon

Gitt det store omfattende endringer i uttrykk og korrelasjons strukturer oppsto under prosessen med tumordannelse, forsøkte vi å identifisere de kausale driverne av disse endringene. Somatiske kopitallet variasjon er et felles trekk ved mange tumortyper, fast stoff og har vært forbundet med aggressivitet av sykdommen. For HCC spesielt sCNV har blitt observert på de tidligste stadiene av sykdommen og øker i utbredelse med sykdomsprogresjon [11]. Vi vurderte derfor utbredelsen av sCNV i HCC og i hvilken grad det var forbundet med genet variasjon i TU vev.

DNA variasjon ble vurdert i AN og TU prøver ved hjelp Illumina høy tetthet SNP mikromatriser. sCNV ble estimert ved hjelp glattet logR forholdet er av tilstøtende markører på 32711 jevnt fordelt loci gjennom genomet (Methods). I TU prøvene bevis for hyppig forsterkning eller sletting involverer store genomiske regioner ble sett (figur 4). I motsetning svært få slike hendelser ble observert i AN prøver med denne analysen (4 AN prøvene ble funnet å ha begrenset dokumentasjon av kopiantall variasjon). sCNV variasjon ble sammenlignet med genet variasjon i både AN og TU prøver.

Synlig er en varme kartet kopi antall avvik (sCNV) for svulst avledet prøver (Y-aksen) gruppert etter K betyr i 10 grupper, versus de lineære posisjoner gjennom kromosom 1 (X-aksen). sCNV ble beregnet som beskrevet i metodene og angis som et kontinuum av farge fra rødt (forsterkning) til svart (ingen endring) til grønn (sletting). En skala for sCNV data er angitt på høyre side av varme-kartet (logR forholdet 1 til -1). Som man kan se de fleste avvik syntes å involvere store kromosom seksjoner på omfanget av hele kromosomarmer.

I samsvar med tidligere studier av andre krefttyper og stråling hybrider [4], [21], [22], [23], sterke positive sammenhenger mellom gener og sCNV markører ble identifisert i tilfeller der de tilsvarende gener overlappet eller var nær sCNV markør som testes, referert til her som cis-virkende foreninger (figur 5A og tabell S2). Den mest sannsynlige forklaringen på denne observasjonen i TU vev er at sCNV indusere proporsjonale endringer i gener som var proksimale til stedet for at sCNV. I motsetning var det ingen cis-virkende assosiasjoner mellom en CNV markører og gener utover hva som forventes ved en tilfeldighet, noe som indikerer at cis-korrelasjoner mellom sCNV og uttrykk var tumor spesifikke. Gitt denne korrelasjoner kopiere nummer variasjon ble bare undersøkt ved hjelp av TU vev.

Distribusjon av korrelasjoner (X-akser) mellom gener (Y-aksen) og nærmeste sCNV markør (i cis) i TU (A) og AN (B) vev. Fordelingen av de virkelige data (blå heltrukne linjer) ble sammenlignet med permutasjon av genet som markør forbindelse (grønn stiplede linjer). Ingen signifikante assosiasjoner ble sett i en over hva som forventes ved en tilfeldighet. I TU var det en markant skjevhet til positive sammenhenger. C. Fordeling av sammenhenger mellom alle gener (Y-aksen) og alle sCNV markører, vist lineært ved kromosom plassering gjennom genomet (X-aksen). Kromosom grenser er angitt med de vertikale grønne linjer og er nummerert. Ved hjelp av en korrelasjon cut-off av 0,3 (p 4.7e-4, FDR 0,02), greven av alle genene (ikke inkludert cis gener, grønn), positivt korrelert transgener (rød), eller negativt korrelert trans gener (blå) er angitt for hver markør (trans her ble definert som gener og sCNV markører faller på egne kromosomer). Flere hotspots var tydelig i hvilken mange gener var assosiert med sCNV på et bestemt locus, særlig for områder på kromosomer 1, 2, 6, 7, 12, 14 og 20 (se tekst for ytterligere diskusjon). D. Gener forbundet med sCNV hotspots i HCC og cellelinjer i betydelig grad overlapper hverandre. Hotspot sCNV markører ble valgt ved å identifisere regioner forbundet med 500 gener (Pearson korrelasjonskoeffisient 0,3) og deretter velge enkel topp markør per kromosom. Genene knyttet til hver hotspot markør ble sammenlignet (blå sirkler, størrelse tilsvarende antall gener) og betydelig overlapping (Fishers Exact Test p 1e-6) er vist som kanter som forbinder par av noder. En lignende analyse ble utført på en samling av kreftcellelinjer (CCL, grønne sirkler). I dette tilfelle et mindre antall av de samlede gener ble målt (23404 vs 37 585), slik at en tilsvarende fraksjon av de totale gener ( 370) i ​​betydelig grad i forbindelse med en sCNV markør var nødvendig. Tykkelsen av kantene som forbinder nodene representerer anrikning av de overlappende gener i forhold til den som forventes ved en tilfeldighet (observert overlapping dividert med forventet; berikelse mindre enn 5 fold – tynn linje, 5 – tykke linjer). Som vist gener assosiert med hotspots ble delt i datasett. For eksempel genene i HCC knyttet til hotspots av kromosomer 2, 6, 12, 14 og 20 i betydelig grad overlapper hverandre. Hotspot lapper mellom KLL og HCC involverer de samme genomiske regioner er uthevet i rødt (kromosomene 1, 14 og 20).

Mer generelt foreningen tester mellom alle TU gener og TU sCNV markører avdekket mange svært signifikant foreninger, referert til her som trans-virkende foreninger (se figur 5C). Flere genomiske loci ble funnet å være assosiert med mange flere gener enn det som forventes ved en tilfeldighet, som det refereres til her som hotspot sCNV loci (se figur 5C). Vi identifiserte syv hotspot sCNV loci på 7 forskjellige kromosomer som ble hver forbundet med 500 transgener (korrelasjons 0,3; FDR 0,001). Genene knyttet til disse hotspots var svært overlappende, noe som tyder på at sCNV på flere loci coordinately kjøre nettverk av gener (Figur 5D og Tabell S3). For å vurdere om disse hotspot loci var spesifikke for HCC, gjennomførte vi en lignende forening analyse mellom sCNV markører og gener i en samling av ~130 kreftcellelinjer (CCL) fra flere typer vev [24] (metoder). Tre av de syv hotspot loci identifisert i HCC data lapper sCNV hotspots i CCL data. I alle tre tilfeller de samme genomiske steder var involvert. Disse dataene tyder på at sCNV hotspots er ikke unikt for HCC, men faktisk kan forekomme i mange krefttyper, og kan innebære tilsvarende par av genomisk loci og gener, kanskje kjører kjerne biologiske prosesser som er kritiske for tumordannelse og progresjon. I samsvar med dette har det nylig blitt rapportert at strukturen av sCNV ofte deles på tvers av flere krefttyper [25]. Dette kan tyde på at cis og trans sammenhenger som presenteres her i HCC og celler i kultur kan være relevant for mange svulster typer med delt sCNV struktur.

Å etablere andelen TU genet variasjon forklares med en kombinasjon av sCNV markører vi konstruerte genetiske modeller ved hjelp av en trinnvis regresjon prosedyre for hvert gen (Metoder og se tabell S2). Som en kontroll vi kjørte samme analyse ved hjelp av permut data hvor sammenhengen mellom gener og sCNV markører ble randomisert. Ved hjelp av den strenge cut-off av absolutt korrelasjon 0,3 (FDR 0,001), mengden av varians forklart ved sCNV var så høy som 80%. Påfallende, større enn 40% av genene som er representert på mikromatriser brukt i denne studien (15 993 av 37 585) var signifikant assosiert med sCNV markører, hvor den gjennomsnittlige variansen forklares blant disse genene av de sCNV markører var 21,8%. For 3031 av genene (8,1% av genene er representert i microarray) større enn 30% varians deres ble forklart av sCNV markører (Tabell 1 2). Også, mens cis-virkende forbindelser forklart fleste sCNV foreninger, 6,6% av gener (n = 2490) hadde varians forklart ved sCNV markører som var annet enn cis, og en undergruppe av gener (7,8%, n = 2974) var funnet å ha varians forklart med mer enn en og opp til fem sCNV markører på forskjellige kromosomer. Som vist ovenfor (se figur 5) de fleste av transgener forbinder med et begrenset antall hotspots som tyder på at variasjonen i disse begrenset antall loci var forårsaker en betydelig andel av TU-genet variasjon. Disse genetiske effekter på tumor genuttrykk er størrelsesordener større enn effekten indusert av germline DNA variasjon.

Forskjellig korrelerte gener fortrinnsvis knyttes sCNV markører i TU

For å utforske enten sCNV kjørte sammenhengende endringer i nettverk som i sin tur forårsaket fenotypiske endringer i svulsten, vi testet for relasjoner mellom sCNV markører og differentially korrelerte gener mellom AN og TU vev. De differensielt korrelerte genene ble betydelig anriket for gener assosiert med sCNV markører i cis (2,36-ganger anriket; p 1e-300), så vel som for mengden av varians forklart (2,12-ganger anriket, s 1e-300) og for antall markører (1,89 ganger beriket, p 1e-300) i regresjonsmodellen. Dette berikelse holdt for GOC gener (cis 1,49 ganger beriket, p = 1.03e-11, varians forklart i regresjonsmodellen 1,55 ganger beriket, p = 3.48e-25, antall markører 1,38 ganger beriket, p = 1.04e-18) som samt LOC gener (cis 2,17 ganger beriket, p 1e-300, varians forklart i regresjonsmodellen 1,91-ganger beriket, p = 1.1e-321, antall markører 1,81 ganger beriket, p = 2.5e-287). Utseendet til differensial sammenhenger i HCC derfor ut til å være i stor grad forklares med effekten av sCNV i TU vev.

Prediksjon av overlevelse i AN og TU vev

neste preget relevansen av den massive forandringer i gen-nettverk til det kliniske forløpet av sykdommen ved å sammenligne de nettverksendringer til den undergruppe av gener som predikerer overlevelse. Gener prediktive for å overleve ble identifisert i AN og TU vev ved hjelp av en Cox regresjonsmodell (Methods, se tabell S2). Omtrent tre ganger så mange prognostiske gener ble funnet i en (p 0,0112, n = 5387; FDR 0,1) versus TU (p 0,002, n = 1836; FDR 0,1). Selv om den prediktive gener i AN og TU overlapper mer enn det som forventes ved en tilfeldighet (1,52 gangers anrikning, p = 6.8e-19, som representerer 7,4% og 21,8%, henholdsvis, av AN og TU prediktive gener), var det mange tilfeller av gener svært prediktive i en vev, men ikke i den andre. For eksempel, på 5,387 gener prediktive i AN, 4987 (92,6%) var ikke prediktiv i TU, og av de 1.836 TU prediktive gener, 1436 (78,2%) var ikke prediktiv i AN, ved hjelp av over cut-off kriterier (se figur 6A). I begge tilfeller vårt statistisk styrke var 45% for å påvise gener prediktive i en vev som ble identifisert som prediktiv i den andre vev (Methods), som indikerer at den minimale overlappingen var ikke et resultat av lav statistisk styrke.

A . Vist er betydningen av foreningen (som negativ log10 av Cox regresjon p-verdi) funnet mellom alle 37,585 gener i AN (X-aksen) og TU (Y-aksen) og overlevelse. Gener funnet å være signifikant assosiert med overlevelse (FDR 0,1, Methods) er angitt i AN (grønne prikker), TU (røde prikker) eller både AN og TU (lilla prikker). Som beskrevet i teksten fleste genene prediktive i en vev var ikke prediktiv i den andre. B. Det er vist en representasjon av nettverket transformasjoner er forbundet med HCC tumorigenesis (overgang fra pre-tumor tilstand, øvre boks, til tumoren tilstand, lavere boks), hvor prediktive gener i AN (grønn) i stor grad mister sin tilknytning til overlevelse i TU følgende assosiasjon til ikke-prediktiv sCNV. I kontrast gener som predikerer overlevelse i TU (rød) er i stor grad ikke forutsigbare i AN, og ble fortrinnsvis i forbindelse med sCNV markører som også var forutsigbar. Ikke vist er gener prediktive i både AN og TU, og gener ikke forutsigbare i enten vev. C. vist skjematisk er «felt-effekt» hypotese som foreslått [26] (øvre boks), hvor tilstøtende normale gener forutse pasientens overlevelse fordi de reflekterer et miljø (felteffekt) hvori fremtidige svulster er mer eller mindre sannsynlighet for å oppstå . I denne modellen dagens svulster ikke har en stor innvirkning på utfallet mens fremtidige svulster gjøre. En modifikasjon av denne hypotesen er foreslått her (nederste boksen), hvor de tilstøtende normale gener representerer en stat som direkte påvirket sannsynligheten for dagens svulster som oppstår og utvikler seg. I denne modifiserte hypotesen overlevelse eller død er mediert av de nåværende svulster. Se teksten for ytterligere diskusjon

gener som predikerer utfallet i AN og TU ble beriket for differensial korrelasjoner og assosiasjon til sCNV markører

Bruk AN gener som predikerer overlevelse (heretter kalt AN-overlevelse gener), nesten halvparten (2646 av 5387, 49%) ble funnet å være differensielt korrelert i overgangen til tumoren, som er 2,11 ganger større enn det som ville være forventet ved tilfeldighet (p 1e-300). De AN-overlevelse gener var også mer sannsynlig å være korrelert til sCNV i cis (1.36-fold berikelse, p = 1.38e-47), og å ha en høyere andel av sin variansen forklares med sCNV (1.32-fold berikelse, p = 3.94e-50) og med et større antall sCNV markører (1.33-fold berikelse, p = 1.09e-53) i regresjonsmodellen.

Legg att eit svar