PLoS ONE: Gamma-Retrovirus Integration Marks celletype-spesifikke kreftgener: A Novel Profilering Tool i Cancer Genomics

Abstract

Retrovirus har vært grunnlegg i kreftforskning siden tidlig studier identifisert proto-onkogener som mål for insertional mutagenese. Integrering av murine gamma-retrovirus i vertsgenomet favoriserer promotere og enhancere og medfører interaksjon av viral integrase med verts BET /bromodomain faktorer. Vi rapporterer at denne integreringen mønsteret er bevart i feline leukemi virus (FeLV), en gamma-retrovirus som infiserer mange menneskelige celletyper. Analyse av FeLV innstikk i MCF-7 brystkreft cellelinjen viste sterk bias mot aktive kromatin merkene uten tegn til betydelig post-integrasjon vekst valg. De mest fremtredende FeLV integreringsmålene hadde lite overlapping med mest rikelig uttrykt transkripsjoner, men ble sterkt beriket for kommenterte kreftgener. En meta-analyse basert på flere gammaretrovirus integrering profilering (GRIP) studier i humane celler (CD34 +, K562, HepG2) avslørte en lignende kreft genet skjevhet, men også bemerkelsesverdig celletype spesifisitet, med fremtredende unntak, inkludert en universell integrering hotspot på lang ikke-kodende RNA

MALAT1

. Sammenligning av GRIP mål med databaser av super-forsterkere fra samme cellelinjer viste at disse har bare begrenset overlapping og at GRIP gir unik innsikt i oppstrøms driverne av cellevekst. Disse observasjonene belyse onkogene styrken av gammaretrovirus og støtte bredere anvendelse av GRIP å identifisere genene og vekst regulatoriske kretser som driver forskjellige krefttyper

Citation. Gilroy KL, Terry A, Naseer A, de Ridder J, Allahyar A, Wang W, et al. (2016) Gamma-Retrovirus Integration Marks celletype-spesifikke kreftgener: A Novel Profilering Tool i Cancer Genomics. PLoS ONE 11 (4): e0154070. doi: 10,1371 /journal.pone.0154070

Redaktør: Mary Bryk, Texas A M University, USA

mottatt: 15 februar 2016; Godkjent: 10 april 2016; Publisert: 20 april 2016

Copyright: © 2016 Gilroy et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. All relevant data er i avisen og dens saksdokumenter filer, eller har blitt gjort tilgjengelig tidligere via publisert manuskripter

Finansiering:. KLG, aT, AN, AK, ERC og JCN ble støttet av et felles program fra Cancer Research UK og Bloodwise (stipend tall A11951 (CRUK) og 13046 (Bloodwise), webadresser er https://www.cancerresearchuk.org/og https://bloodwise.org.uk/). JDR ble finansiert av en VENI stipend (639.021.233) fra NWO (Nederland Organisation for Scientific Research, https://www.nwo.nl/). AM ble finansiert av Canadian Institutes for Health Research (MOP 97798, https://www.cihr-irsc.gc.ca/~~number=plural). GK-SW ble finansiert av Alberta fornyer Teknologi Futures (AITF, https://www.albertatechfutures.ca/) og fornyer Senter for fremragende forskning (icore). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

muligheten av retrovirus å lede stabil integrering er iboende mutagene og kan forurolige vertscelle gener på førvirus innstikkstedet eller til og med på en betydelig avstand [1,2]. Selv om denne funksjonen har kommet til å bli betraktet hovedsakelig som en uønsket komplikasjon for bruk av retrovirale vektorer i genterapi [3,4], har det lenge vært et verdifullt i kreftforskning, som integrering områder av retrovirus i naturlig forekommende eller eksperimentelt induserte kreftformer fra fugler, mus og katter har gitt en rik avling av kreft driver gener og familier, inkludert

Myc

,

Myb

,

Pim

,

Runx

,

Bmi1

,

Gfi1 Hotell og

Notch product: [1]. Gjennomføringen av mus genomsekvens og bruk av høy gjennomstrømming kloning og sekvensering av innstikk utvidet omfanget av disse studiene massivt, avslører mange nye potensielle målgener [5-7]. Det ble antatt i tidlige studier som retroviral integrering er effektivt tilfeldig, og at kreftspesifikke felles integrasjonssider (Ciss) oppsto bare fra klonal ekspansjon etter sjeldne innsett på sensitive områder som falt sammen i uavhengige svulster ved en tilfeldighet. I kontrast, har det blitt klart de siste årene at retrovirus har betydelige integrerings preferanser som reflekterer deres særegne biologiske funksjoner og moduser av verts kolonisering.

forkjærlighet for lentivirus HIV å integrere i aktivt transkriberte gener er en viktig funksjon av sin patogenesen hvor det transporter mellom latent smitte og cytopatisk replikering. For HIV, innebærer denne prosessen samspillet mellom viral integrase protein og LEDGF, en transkripsjons co-aktivator som platformer integreringen komplisert å kromatin og muliggjør integrasjon [8,9]. I motsetning til dette er gamma-retrovirus replikasjon generelt ikke-cytopatisk og persistent infiserte verter kan vise høye nivåer av viremi, med tumorer indusert av insertional mutagenese en relativt vanlig resultat av infeksjon [10,11]. Den ikke-tilfeldigheten murine leukemi virus (MLV) integrering ble først verdsatt fra tidlige studier som markerte skjevheter mot DNaseI følsomme områder og Transkripsjonell starte nettsteder [12]. Grunnlaget for denne spesifisitet ble nylig belyst med demonstrasjonen at den MLV integrase samvirker med BET /bromodomain proteiner (Brd2, 3 og 4) som i sin tur binder til acetylert histon H3K27ac, merking noen av de mest aktive regioner av kromatin [13-15 ]. Betydningen av dette samspillet understrekes av den betydelige reduksjon i titer og /eller tap av TSS målretting av MLV dyrket i nærvær av BET-hemmere JQ1 og I-BET

in vitro product: [13-15]. Dette skaper en ytterligere forbindelse med kreftforskning som BET-hemmere blir nå undersøkt i kliniske studier for behandling av flere kreftformer [16].

Det fulle omfanget av avvik fra tilfeldig av MLV integrering har blitt klart bare med advent av store metoder for å fange opp og sekvens integrering steder i polyclonally infiserte celle populasjoner

in vitro

før noen vesentlig vekst valg. Storskala studier av MLV vektoren integreres i humane CD34-celler eller MLV pseudo infeksjon av humane kreftcellelinjer har avslørt en bemerkelsesverdig selektiv prosess hvor mer enn halvparten av integrasjonene target mindre enn 2% av det humane genom [17,18]. Dessuten oppstår det foretrukne genomiske sider aktive kromatin karakterer og inneholde sterke forsterkere samt arrangører.

I denne studien har vi utforsket integrering preferansene til en annen gamma-retrovirus, feline leukemi virus (FeLV). Vi brukte FeLV-B, er en vanlig naturlig forekommende variant av FeLV som er i stand til å infisere praktisk talt alle dyrkede humane celler uten tydelig cytopatologi [19] via interaksjon med vidt uttrykt fosfat transporter PIT1 [20]. Vi først analysert integrasjoner i MCF-7 human brystkreft cellelinje som er ettergivende for spredning, høy titer FeLV-B replikering, og er blant de beste karakteriserte kreftcellelinjer med hensyn til funksjonell genomforskning. FeLV-B vises en lignende preferanse for transkripsjonsstartsider og aktiv kromatin merker til MLV, i samsvar med bevaring av C-terminal sløyfe av integrase som binder seg til innsats /Brd [21]. Men FeLV integrering spesifisitet ble ikke først og fremst rettet mot de mest rikelig uttrykt gener, men ble sterkt forskjøvet mot brystkreft driver gener. Dette funnet inspirert en meta-analyse av gamma-retrovirus integrering preferanse fra flere studier som viste en høy grad av celle-typen spesifisitet, mens kreftgener var foretrekkes i alle tilfeller, også i normale celler. Disse funnene tyder på at gammaretroviral integrering profilering (GRIP) vil være et verdifullt verktøy for identifisering av avstamning-spesifikke kreft driver gener i et bredt spekter av menneskelige krefttyper.

Resultater

FeLV integrering i menneskelige brystkreft celler rettet transkripsjonsstartsider og aktive kromatin merker

Kloning av FeLV-B integrasjons steder i infiserte MCF-7 brystkreftceller av linker-mediert PCR og kartlegging for det menneskelige genom ga 20634 autentisk virus- vert krysset fragmenter, tilsvarende 8,052 unike innsett (fig 1A, S1 datasettet). Det relativt lave antallet kopier per unike innsetting antydet at ingen signifikant klonal seleksjon hadde skjedd i løpet av den korte perioden med vekst

in vitro

, og dette spørsmålet ble undersøkt videre ved analyse av førvirus orientering bias. Mens integrasjonsprosessen i seg selv er tilfeldig med hensyn til orientering, tilbøyelighet til gamma-retrovirus for å aktivere verts gener ved enhancer innsetting, en prosess som er sterkt påvirket av orientering, som fører til fremveksten av dominerende kloner med uttalt forspenningen på viktige integrerings hot-spots som kan påvises statistisk ved en «heads-haler «analyse [22]. Vi brukte denne testen til FeLV /MCF-7 datasett. Av de 100 genene som hyppigst blir angrepet, 8 viste tegn til orientering skjevhet (p-verdier 0,011 til 0,049 av Fishers eksakte test), men ingen av disse observasjonene levde Bonferroni eller Benjamini-Hockberg korreksjon for multippel testing (i alt 8 tilfeller p-verdi med Bonferroni korreksjon var 1, og p-verdi med Benjamini-Hockberg korreksjon var 0,612). Videre har ingen av de nærliggende gener ble kommentert kreft drivere, og ingen viste den klassiske «oppstrøms og bakover» clustering som oftest observert med denne modusen av onkogen aktivering [1]. I tillegg har innsettinger ved 100 mest målrettede gener viste ingen tegn til øket kopiantall i forhold til datasettet som helhet, med et gjennomsnitt på 2,7 og 2,6 kopier /innsetting henholdsvis (p = 0,44). Disse observasjonene tyder på at minimal klonal seleksjon har oppstått etter at integrering og at eventuelle observerte ikke-tilfeldig fordeling i genomet skyldes i hovedsak innstikkstedet preferanse. Clustering av FeLV innsett rundt transkripsjon starter sider (TSSs) var tydelig fra datasettet, med en dobbel topp på +/- 1,5 kb og et trau direkte på TSS skilles fra mønsteret rapportert for MLV [17] (figur 1B). Posisjonen til innsettinger innenfor den nærmeste genet ble bestemt og er vist i figur 1C. De fleste av innsett ligge inne i genet, med den nest største gruppen oppstrøms av genet, i samsvar med sin satsing på forsterkerelementer

A:. Experimental arbeidsflyt. B: Plassering av innsetninger i MCF-7-celler med hensyn til TSS, som viser en dobbelt topp med trau ved TSS. C:. Sektordiagram som viser plasseringen av innsettinger i MCF-7 celler med hensyn til nærmeste genet

For å finne ut av hvilke epigenetiske merker ble også angrepet av viruset, ble data fra KODE konsortium analysert. Chip-seq datasett for alle tilgjengelige histone merkene i MCF-7 celler ble behandlet og topper kommentert som beskrevet i materialer og metoder. Tilgjengelige histone merkene var H3K27ac, H3K9me3, H3K36me3, H3K27me3 og H3K4me3. Overlappingen av MCF-7 innsett med histone merkene ble bestemt og er oppsummert i figur 2. Først markører for aktive kromatin ble vurdert, disse blir H3K27ac (Enhancer mark), H3K4me3 (aktiv pådriver mark) og H3K36me3 (markør for forlengelse). Som oppsummert i figur 2A, er en stor andel av MCF-7 innsettinger overlapper med disse histon merker (41,8%); den største overlapping skjer med enten H3K4me3 alene (1119 innsettinger, 15,7%) eller med både H3K4me3 og H3K27ac (1508 innsettinger, 21%). Når du vurderer undertrykkende merkene H3K9me3 og H3K27me3, det var svært lite overlapp med MCF-7 innsett (bare 0,97% totalt, figur 2B). Tatt i betraktning viktigheten av parvis overlapping av MCF-7 innsettinger med hver av de fem histon merkene, var ingen statistisk signifikant med unntak av H3K27ac, som var meget signifikant med en p verdi av 4.96E-69 (p-verdier for alle andre parvise overlappinger var 1). Etter å ha undersøkt den globale sammenhengen mellom histon mark merknader og MCF-7 innsetting, ble forholdet til histone merker av de mest betydningsfulle innsetting klynger undersøkt. A «nærmeste gen» analyse ble utført som beskrevet i Materialer og metoder, tildele hver innsetting til et gen og vurdere betydningen av innsetting på det genet. Tilsvarende ble histone merkene merket og betydning score (p-score) innhentet ved hjelp av Galaxy /Cistrome suite som beskrevet i materialer og metoder. De 500 genet treff for hver histone mark (identifisert av p-score) ble sammenstilt og sammenlignet med de beste retroviral integrering mål og overlapper vurdert. Sannsynligheten for en slik overlapping forekommer ved en tilfeldighet ble vurdert ved hjelp av Monte Carlo-simulering, som beskrevet i Materialer og Metoder. Data er oppsummert i figur 2C og tabell 1. De tre aktive kromatin tegn vise betydelig overlapping når de viktigste genene klynger er vurdert, med p-verdier av 1.67E-8, 0,00236 og 0,0014 for H3K27ac, H3K4me3 og H3K36me3 hhv. Den undertrykkende kromatin markerer H3K9me3 og H3K27me3 viser ingen signifikant sammenheng med MCF-7 innsett (p = 1 og p = 0,97 henholdsvis). Samlet, sammenlignet med alle tilgjengelige histonmodifikasjonene viser konsekvent at innsett er rettet mot aktive kromatin merker og er fraværende fra undertrykkende merkene

A:. Global sammenslutning av innsett med aktive histone merkene som viser antall kryssende funksjoner. B: Global tilknytning undertrykkende histone merkene. C: Statistisk sammenslutning av de fleste betydelig beriket nærmeste gener for innsettinger og histone merker. Transformerte p-verdiene vises. Den stiplede linje representerer p = 0,05. D: Eksempel gensamlingene målrettet av FeLV i MCF-7 celler, som vist i UCSC Genome Browser. Innsett er vist i lilla på toppen, etterfulgt av skjematisk av genet struktur, og til slutt H3K27ac chip seq signal tetthet.

Antall overlappende gener fra toppen 500 er kjent, som er p verdiene for betydningen av overlapping. Merk at p-verdi for H3K27ac representerer en 1 i 60×10

6 sjanse for foreningen oppstår ved en tilfeldighet, men den sanne p-verdien blir lavere som dette nivået av overlapping ikke ble observert i 60×10

6 simuleringer.

FeLV integreringsmålene kreft driver gener i MCF-7 brystkreft celler

Tidligere store studier har fokusert på murine gamma-retrovirus og vektor integrering i normale og maligne celler, og det ble bemerket anecdotally at mange vektorinnsettinger i normale CD34 celler var på «farlig» områder med hensyn til risiko for malignitet, inkludert LMO2 locus som har vært med som et hyppig mål av vektor integrering i genterapi forbundet leukemi [3,4]. Første inspeksjon av de store klaser av FeLV innføring i MCF-7-celler viste en bemerkelsesverdig konsentrasjon på gener med rapportert over-ekspresjon eller forsterkning i brystkreft eller med et tap-av-funksjon knockdown fenotype i MCF-7-celler. Eksempel gensamlingene vist i figur 2D er det tre HOX gensamlingene, deriblant en lang ikke-kodende RNA

hotair

, sammen med chromobox

CBX2

og en lang ikke-kodende RNA

MALAT1

. I de fleste tilfeller innsett falt hovedsakelig med toppene i H3K27 acetylering, og i mindre grad med H3K4 trimethylation og H3K36 trimethylation merker, i samsvar med data over viser tilknytning aktive kromatin tegn (full histone annotering for disse genene er vist i S1 figur) .

Disse observasjonene oppfordret oss til å gjennomføre en mer systematisk analyse av de foretrukne innstikk. Nærmeste genet analyse identifisert 6926 gener. De 100 gener ble bestemt ved først å velge for statistisk signifikans (p 0,05 hjelp Fishers Exact test), og deretter vurdering etter ordre fra antall innsettinger. De 100 MCF-7 integrasjons mål etter disse kriteriene omfatter 773 innsett (6,7% av totalt antall innrykk), og er vist i S1 tabell. Disse ble kryssjekket mot kreft Gene Census [23], en streng, jevnlig oppdatert database av kreftgener basert på sterke bevis for sjåføren genet status (https://cancer.sanger.ac.uk/census/).

11 av de 100 MCF-7 integrasjons målene ble funnet å være kreft driver gener (se figur 3A og S2 tabell). Dette er en meget vesentlig berikelse over bakgrunnsnivået av kreft driver gener i genomet som en helhet, som er 2,2% (p = 2.01E-09). For å undersøke trasé målrettet av FeLV integrasjon, ble de 100 målgener avhørt av Qiagen Oppfinnsomhet Pathway Analysis (IPA) programvarepakke (IPA, QIAGEN Redwood City, www.qiagen.com/Ingenuity). Vi fant at den øverste biologiske prosessen definert for dette gen settet var «Cancer» (s verdiområde 1.95E-2-4.6E-6, median p = 0,00789), noe som gir ytterligere bevis på selektivitet for kreft genet programmer (figur 3B). Etter å ha etablert preferensiell målretting av kreft driver gener, ble celletypen spesifisiteten av målgener undersøkt. IPA «kreft» merknad for de beste MCF-7 treff ble undersøkt videre ved å se på kreft sub-prosesser. Påfallende, tre av de beste fem kreft sub-prosesser var knyttet til brystkreft, viser en sterk vev bestemt kreft genet signatur i de beste integrerings mål (figur 3C)

A:. Andel av de 100 innsetting gensamlingene som er kreft driver gener i forhold til genomet som en helhet. B: IPA topp prosesser grupperinger som viser omfanget av transformerte p-verdier, med median angitt med grått kors. C: Topp 5 «kreft» subtyper identifisert av IPA med forvandlet p-verdi vises. Stiplet linje representerer p = 0,05. D:. Andel av de 100 innsetting gensamlingene med kjent brystkreft merknad som bestemmes av systematisk litteraturgjennomgang i forhold til en tilfeldig sett av 100 gener

For å verifisere beriket brystkreft genet merknad i MCF -7 topp integrasjonssider, en skjerm av peer-reviewed vitenskapelige litteraturen ble utført for de 100 MCF-7 mål gener i forhold til 100 gener valgt tilfeldig. For å minimere bias, i hvert fall det samme søkeordet ble brukt ( genet navn + «brystkreft»), og de samme kriteriene for kjent brystkreft annotering (direkte tilknytning av genet med brystkreft med påfølgende verifisering av f.eks knockdown eller uttrykk studier). 29 av de 100 MCF-7 integreringsmålene hadde kjent brystkreft merknader, sammenlignet med 5 av de tilfeldige 100 gener, en forskjell som var svært signifikant (p = 3.35E-28, Fig 3D). Til sammen disse resultatene tyder på at integrering fortrinnsvis rettet mot en celletype-spesifikke genet sett som også er relevant for kreft fenotype.

Gener på foretrukne innstikk av FeLV vise heterogene nivåer av uttrykk

Forrige studier har vist at gamma-retrovirus integrere inn i regioner med aktiv genekspresjon, ofte i regulatoriske regioner som enhancer og promoter-regioner. For å bestemme hvorvidt FeLV er rettet mot de høyt uttrykte gener, ble de beste MCF-7 integrasjons mål i forhold til de høyt uttrykte gener i MCF-7-celler ved bruk av en tidligere publisert mikromatrisesettet [24]. MCF-7-genene ble rangert i henhold til intensitet og posisjon av de 100 GRIP målgener bemerkes (fig 4A). Denne analysen viste ingen tydelige favorisering av FeLV integrasjon for de høyest uttrykte gener. For å analysere dette forholdet statistisk, øke utvalgsstørrelsene ble brukt for å undersøke hvordan forholdet varierte når de vurderer bare de beste treff eller et bredere gen utvalg. Graden av overlapping ved hver prøvestørrelsen ble sammenlignet med det forutsagt å finne sted ved en tilfeldighet av Monte-Carlo-simulering, og p-verdier beregnet (se Materialer og metoder for detaljer)

A:. Rangordnet plott som viser intensiteten av alle microarray prober for MCF-7. Vises i rødt er de 100 gensamlingene målrettet med FeLV innsetting. B: Forvandlet p-verdiene av betydningen av sammenhengen mellom de beste innsetting målgener og de høyest uttrykte gener for ulike utvalgsstørrelser. Den stiplede linjen representerer p = 0.05 signifikansnivået. C: Tabellen viser de p-verdiene representert i B for de forskjellige utvalgsstørrelser

De 150 beste retrovirale målgener viste ingen større overlapp med de beste 150 høyt uttrykte gener enn forventet ved en tilfeldighet i MCF-7. celler (p-verdiene for de beste 50, 100 og 150 gener var henholdsvis 1, 0,22 og 0,43 (figur 4B og 4C)). Den lange ikke-kodende RNA

MALAT1

var den eneste genetisk element som overlappet de høyest uttrykte gener og de foretrukne retrovirale mål i denne analysen. Med det forbeholdet at transkripsjon priser og steady state-RNA-nivå er ikke synonymt Disse resultatene tyder på at de 150 beste retrovirale integreringsmålene blir valgt av en mer subtil prosess enn affinitet for de mest aktive områdene i verts kromatin. I motsetning til dette, som strekker seg analysen til et større antall foretrukne mål ( 200) som detekteres økende overlapping med de høyt uttrykte gener, som tyder på en bimodal utvelgelsesprosess

Gamma retroviral integrering preferanse.: En meta-analyse

Etter å ha vist at FeLV selektivt rettet mot kreft driver gener i en human brystkreft cellelinje, søkte vi den samme tilnærmingen til publiserte datasett av «uselekterte» gamma retrovirus integrerings steder i humane celler for å etablere det generelle innholdet i disse observasjonene. For denne meta-analysen brukte vi publiserte innsetting av data fra to humane kreftcellelinjer, K562 og HepG2 [18] og normale CD34 + celler [17]. Selv om disse studiene ble utført med murine gRVs og infeksjon av humane celler ble oppnådd ved pseudotyping av infeksiøs MLV virus med VSV-G konvolutt [18] eller amfotropisk vektor leveransen [17] i stedet for naturlig infeksjon, et histon-kode preferanse svært lik våre studien ble notert, noe som tyder på at den konserverte integrase funksjon er det viktig determinant for spesifisitet.

Detaljer av datasettene som brukes i meta-analysen er oppsummert i figur 5A. De publiserte sett er vesentlig større enn vår MCF7 satt og for å få et tilsvarende antall foretrukne innsetting språk genene vi sette en høyere betydning terskel før vurdering genene etter antall innsett som tidligere. For tre MLV datasett var det igjen en meget betydelig berikelse for kreft driver gener. For CD34 + celler, 15% av de beste målgener skåret som kreft drivere (anriket i forhold til total genom grunnlinjen, p = 2.69E-18), for K562 tallet var 11% (p = 2E-9) og for HepG2 6% . (p = 0,0096)

A: oppsummering av dataene brukes blant annet størrelsen på datasettene. B: Heatmap viser global sammenslutning av GAV innstikk med histone modifikasjon for alle cellelinjer. Blå representerer favoriserte tegn mens rød representerer disfavoured merker. Stjernene betegne signifikansnivå, med * være p 0,05, ** p 0,01 og *** p 0,001. C: Anriking av kreft driver gener med avgrensning av topp treff for alle cellelinjer. Den stiplede linjen representerer prosentandelen av kreft driver gener i genomet (2,2%) D: Plassering av innsettinger i forhold til transkripsjonstartsetet for alle cellelinjer. Omtrentlig antall totale innsett er vist under hvert diagram.

De epigenetiske merker målrettet av viruset i hver celle sammenheng ble undersøkt som beskrevet ovenfor ved hjelp av chip-seq data fra KODE (for K562 og HepG2 celler) eller human epigenetikk Roadmap (for CD34 celler). De samme histonmodifikasjonene ble ansett som for MCF-7 celler, disse blir H3K27ac, H3K4me3, H3K36me3, H3K9me3 og H3K27me3. I tråd med tidligere publiserte studier, var det en generell berikelse for virusinnsett på aktive kromatin tegn (H3K27ac, H3K4me3 og H3K36me3) mens undertrykkende merker (H3K9me3 og H3K27me3) ble disfavoured av viruset [17,18]. Det eneste unntaket til dette mønsteret var K562s som viste en berikelse av innsettinger på H3K27me3 mark, selv om dette ikke var statistisk signifikant. Resultatene er oppsummert i figur 5B.

Figur 5C viser en tydelig trend med økende anrikning for kreft driver gener mot de målrettede-gener i alle de fire cellelinjer. Dette mønsteret er minst klar for HepG2 datasettet, selv om det er grunn til å mistenke at de beste hits kan ha blitt skjult av metning i denne enorme datasettet (3 x 10

6), på grunn scoring av genuint uavhengige innsett på den store hotpots som duplikater. Bevis som støtter denne tolkningen er levert av inspeksjon av fordelingen av innsett rundt transkripsjonsstartsider. Når disse er normalisert ved topphøyde, viser HepG2 et mye større basal nivå av ikke-TSS innsett, i samsvar med metning hypotese (Fig 5D).

Fig 6A viser overlapping av genene i topp 100 for hver av cellelinjene som ble testet. Mens det er noen vanlige målgener som deles av flere enn én celletype, hva som er mest slående er at de fleste av de beste treff er unike for den aktuelle celletypen med relativt lite overlapping. Utvide datasettene til å omfatte de 500 genene forringer ikke dette vanligvis eksklusive mønster ifølge celletype, selv om dette mer avslappet cut-off avdekket en liten undergruppe av seks «universelt» målrettede elementer:

MALAT1

,

MIR7851

.

en

,

RCC1

,

VMP1

,

ZC3H4 Hotell og

ZMYND8 plakater (figur 6B).

A: Venn-diagram som viser graden av overlapping mellom de 100 genet mål i hver cellelinje testet. B:. As (A), men vurderer overlapping av de 500 genene i hver cellelinje

Gamma-retroviral integrering profilering er komplementær til super-Enhancer profilering

Den nylige funn at GAV integrasjon er mediert av binding til BET avdekket en overbevisende kobling til kreft, som BET binding til acetylerte histoner er en av de definerende trekk ved «super-forsterkere «, et begrep skapt for å beskrive store klynger av forsterkere som viser tett binding av mester regulatorer og spiller en rolle i vev-spesifikk celleidentitet [25]. Videre hemmere av BET binding kan forstyrre veksten av kreftceller [16], og dette fenomenet har blitt tilskrevet akutt følsomhet for BET forstyrrelse av super-forsterkere på onkogener som MYC og BCL2 [26,27].

For å undersøke parallell mellom GRIP og super-Forsterker definert av biokjemiske metoder, sammenlignet vi den nærmeste gener identifisert ved begge metodene. Lister over super-Enhancer forbundet gener ble hentet fra dbSUPER databasen [28] for MCF7-, K562, HepG2 og CD34 primære celler (RO01480, RO01536 og RO01549). For MCF-7 celler, ble bare 98 gener registrert i super-Enhancer liste, og av disse åtte var kreftdriver gener som er definert av de siste Cancer Gene census data, sammenlignet med 11 av de 100 beste GRIP mål (Fig 7A) . Lignende observasjoner ble notert for andre datasett, og bare K562 sett viste en sterkere berikelse for kreft driver gener i super-Enhancer forbundet gener enn de beste GRIP mål (23% vs. 11%, p = 0,004). Vanskeligheten med å definere en nøyaktig avskjæring mellom super-stimulerende midler og konvensjonelle forsterkere [29] er illustrert ved den store variasjon i antall super-forbedrere for en gitt celletype, med de tre primær CD34 + dbSUPER innlegg som har antall av superenhancers strekker fra 326 til 733.

A: Andel av de 100 genene identifisert for GRIP og superenhancers som er kreft driver gener for alle cellelinjer. B:. Overlapping mellom de 100 genene for GRIP og superenhancers i hver cellelinje

Til tross for de tilsvarende tallene for kreft driver gener identifisert ved hjelp av de to metodene, genene identifisert var for det meste tydelig, og bare to /11 kreft driver gener identifisert av GRIP ble også bemerket i super-enhancer database for MCF-7 celler (S2 Table). Ser vi på de bredere gensettene, var det også relativt lite overlapping mellom gener identifisert i de 100 GRIP og super-forsterker mål (figur 7B).

Pathway analyse avdekker forskjellige oppstrøms regulatorer av retrovirale mål og super-Enhancer tilknyttede gener

IPA programvarepakken inneholder en modul for å vurdere sannsynlige oppstrøms transkripsjons regulatorer av alle abstrahert gen sett, bidrar til å belyse biologiske aktiviteter i at mobilnettet. For å få en helhetlig og robust statistisk analyse, analyserte vi de 500 GRIP målgener for hver celletype (tabell 2). De sterk spådd oppstrøms drivere for MCF-7 GRIP datasett inkludert hovedsakelig kreft drivere (MYC, KMT2A) og kreft forbundet gener (ATF4). Spesielt disse genene ble selv svært målrettet med retroviral innsetting, gjenspeiler deres transkripsjonelt aktiv status og tilgjengelighet til integrering. Denne analysen tyder på at disse genene er involvert i orchestra ekspresjon av mål-GRIP settet og kan følgelig representere de kritiske driverne av kreft program. Lignende observasjoner ble notert for de andre kreftcellelinjer, og for normale CD34 + celler, selv om i sistnevnte tilfelle to av de sterkeste anslåtte oppstrøms driverne ble cytokiner (CSF, IL15) som ikke ble rettet ved retroviral integrasjon og var tilsynelatende ikke transkripsjonelt aktive i målcellene.

Denne analysen ble også utført for super-enhancer-forbundet gensettene, tar de 500 genene som bestemmes av «rang» på dbSUPER database oppføring, eller hele innstilt hvis det var færre enn 500 gener. Selv om super-Enhancer-forbundet gensettene var i noen tilfeller mindre (range 98-742 gener),, ga de spådde oppstrøms regulatorer med liknende statistiske score. Igjen disse oppstrøms regulatorer avdekket relativt lite overlapping mellom GRIP og super-Enhancer regulerte gener, som illustrerer de ulike perspektiver på underliggende vekst programmer avdekket ved disse tilnærmingene. En ytterligere forskjell er at retroviral integrering var betydelig større sannsynlighet for å målrette GRIP oppstrøms regulatorer i forhold til super-Enhancer sett (p = 0,005, Fishers eksakte test).

Diskusjoner

Denne studien viser at gamma-retrovirus integrering i humane celler er forskjøvet mot kreft driver gener i et høyt celletype-spesifikk måte. Mens gammaretrovirus har blitt mye brukt som kreft genet registreringsverktøy på grunn av deres insertional mutagent potensiale i deres naturlige verter, kreves denne tilnærmingen tung oppgave med å samle flere end-stage svulster fra dyremodeller og komparativ genomisk analyser for å bekrefte relevansen av funnene til kreft hos mennesker [5-7,11,30].

Legg att eit svar