Abstract
Arvbarhet er en av de sterkeste risikofaktorer for prostatakreft, understreker viktigheten av genetiske bidrag til prostata kreftrisiko. Hittil har 86 etablerte prostatakreft risikovariantene blitt identifisert av genom-wide assosiasjonsstudier (GWAS). For å finne ut om disse risikovariantene er lokalisert i nærheten gener som samhandler sammen i biologiske nettverk eller pathways som bidrar til prostata kreft initiering eller progresjon, genererte vi gensettene basert på nærhet til de 86 prostata kreft risiko varianter. Vi tok to tilnærminger til å generere genet lister. Den første strategien tatt med alle umiddelbare flankerer gener, opp- og nedstrøms av risikoen variant, uavhengig av avstand fra indeksen variant, og den andre strategien var gener nærmest indeksen GWAS markør og til varianter i høy LD (r
2 ≥0.8 i europeerne) med peke variant, innenfor en 100 kb vindu opp- og nedstrøms. Pathway kartlegging av de to gensettene understøttet betydningen av androgen-reseptor-mediert signalisering i sykdomsutviklingen. I tillegg ble pinnsvinet og Wnt /β-catenin signalveier identifisert i veien kartlegging for flanke genet sett. Vi har også brukt HaploReg ressurs for å undersøke 86 risiko loci og varianter høy LD (r
2 ≥0.8) for funksjonelle elementer. Vi fant at det var en 12,8 ganger (p = 2,9 x 10
-4) berikelse for enhancer motiver i en stamcellelinje og en 4,4 ganger (p = 1,1 x 10
-3) anrikning av DNase overfølsomhet i en prostata adenokarsinom-cellelinje, noe som indikerer at risikoen og korrelerte varianter er anriket for transkripsjonsregulerende motiver. Vår sti-basert funksjonell annotering av prostatakreft risikovarianter fremhever potensialet regulerende funksjon som GWAS risikomarkører, og deres høyt korrelerte varianter, øve på gener. Vår studie viser også at disse genene kan fungere i fellesskap i viktige signalveier i sykdomsutviklingen
Citation. Loo LWM, Fong ayw, Cheng jeg, Le Marchand L (2015)
I Silico
funksjonell Pathway Kommentar av 86 Etablert prostatakreft Risiko Varianter. PLoS ONE 10 (2): e0117873. doi: 10,1371 /journal.pone.0117873
Academic Redaktør: Allen Gao, UC Davis Comprehensive Cancer Center, UNITED STATES
mottatt: 26 september 2014; Godkjent: 23 desember 2014; Publisert: 06.02.2015
Copyright: © 2015 Loo et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet: All relevant data er innenfor papir og tilhørende informasjon filer
finansiering:.. forfatterne har ingen støtte eller finansiering for å rapportere
konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer
Introduksjon
Genome-wide assosiasjonsstudier (GWAS) har identifisert hundrevis av genetiske varianter assosiert med kreft [1] [2]; ennå, er mest risiko alleler forbundet med en beskjeden sykdomsrisiko (OR 1,5). Videre vil ytterligere resistens varianter kan identifiseres, med økende prøvestørrelser og anvendelse av high-throughput sekvenseringsteknologi. De viktige neste trinnene skal du fint kartlegging av foreningen signaler etterfulgt av funksjonell karakterisering av de antatte årsaks varianter. På denne tiden av omfattende karakterisering av det menneskelige genom med International HapMap og 1000 genomer prosjekt, data konservering av genomiske modifikasjoner involvert i genregulering av Encyclopedia of DNA Elements (KODE), og den høyoppløselige molekylær karakterisering av vanlige krefttyper av The Cancer Genome Atlas (TCGA), kan vi forsøke å integrere denne informasjonen til å karakterisere de biologiske mekanismene som påvirkes av kreftrisiko varianter.
Prostatakreft vil påvirke én av sju menn i sin levetid, og er den nest største årsaken av mannlige kreftrelaterte dødsfall i USA det er en heterogen sykdom med variabel klinisk forløp. Selv om de fleste prostatakreft er lat, noen er aggressive, sprer seg til blæren, rektum, og bein. Familiehistorie er en etablert risikofaktor for prostatakreft, støtter den observasjon at det er en sterk genetisk komponent for sykdommen [3-5]. Menn med en familie historie av prostatakreft er over 3 ganger større sannsynlighet for å utvikle prostatakreft, og deres risikoen øker med to eller flere berørte førstegradsslektninger [6]. Tvillingstudier viser at bidraget av arvefaktorer er så høy som 42% for å utvikle prostatakreft [4].
De fleste av de 86 prostata kreft risiko varianter som har blitt identifisert til nå er plassert i ikke-koding intronic eller intergeniske regioner [2]. Derfor kommentere de funksjonelle elementer som er knyttet til disse risiko varianter, korrelerte varianter i høy koblingsulikevekt sammen med nabo gener og funksjonelle nettverk, kan bidra til å forbedre vår forståelse av de biologiske mekanismene som er involvert i etiologien av prostatakreft.
Metoder
prostatakreft risiko alleler
åtti-seks prostatakreft risiko varianter ble abstrahert fra National human Genome Research Institute (NHGRI) GWAS katalogen (per april 2013) [1,2 ] og den internasjonale samarbeids Onkologisk Gene-miljø Study (iCOGs) konsortium [7] som møtte genom-wide signifikansnivå på p ≤ 5 x 10
-8 (S1 tabell).
prostata kreftrisiko allel forbundet genet lister
Vi tok to tilnærminger til å generere genet lister for å kartlegge biologiske mekanismer potensielt underliggende genetiske signaler representert ved prostata kreft risiko alleler. Ved den første fremgangsmåten, som er inkludert vi alle umiddelbare flankerende gener (nærmest gen på hver side av den risiko allelet), opp- og nedstrøms for den risiko allelet, uavhengig av avstanden fra indeksen varianten. Med andre tilnærmingen, analyserte vi alle genene nærmest indeksen markør og alle andre varianter i høy LD (r
2 ≥0.8 i europeere fra 1000 genomer Prosjekt) med indeksen markør, innenfor en 100 kb vindu opp- og nedstrøms av SNP, vurderer de fleste forsterkerelementer som ligger innenfor 100 kb av sine målgener.
HaploReg analyse
totalt 86 SNPs ble brukt for funksjonell annotering analyse av etablert prostata kreftrisiko alleler. Den HaploReg v2 (https://compbio.mit.edu/HaploReg) ressurs og databasen ble brukt til å identifisere biofeatures i sekvenser som inneholder prostatakreft risiko varianter og SNPs i i høy LD (r
2 ≥0.8 i europeere fra 1000 genomer Project) [9]. Funksjonelle elementer som ligger i de samme områdene som indeksen og korrelerte SNPs ble identifisert i KODE [8]. Den HaploReg verktøyet identifisert evolusjonært konserverte regioner basert på SiPhy (stedsspesifikk fylogenetisk analyse) [10]. Varianter ble merket med potensielle virkninger på regulatoriske motivene basert på eksisterende databaser som TRANSFAC, Jaspar, og PBM [9].
Protein Motif Tippe
PolyPhen og PROVEAN analyse ble brukt til koding SNPs til forutsi de strukturelle og funksjonelle effekter av aminosyresubstitusjoner [11,12]
Funksjonell Nettverk og Pathway Tippe
Oppfinnsomhet Pathway Analysis. (IPA; https://www.ingenuity.com/) ble brukt for å identifisere potensielle funksjonelle nettverk og veier. IPA Kjerneanalyse ble brukt til genet lister for å identifisere direkte og indirekte veksel basert på IPA Knowledge Base, et oppbevaringssted for de utvalgte biologiske interaksjoner og funksjonelle merknader basert på eksisterende litteratur.
TCGA analyse av prostatakreft svulstvev
The Cancer Genome Atlas (TCGA) database av prostata kreft kreftvevet genuttrykk profiler ble forespurt å bruke cBioPortal for Cancer Genomics analyse ressurs (https://www.cbioportal.org/public-portal/) [13, 14].
Resultater
Funksjonell Profiler av gener Flankerisiko SNPs
det er totalt 97 kommenterte gener ble identifisert til å være de mest umiddelbare nabo gener opp- og nedstrøms 86 prostata kreft risiko varianter (S2 tabell). IPA programvare ble anvendt for å karakterisere den funksjonelle sammensetning av de 97 gener. Av de 97 genene, 56 ble identifisert til å ha en funksjonell rolle i kreft, med berikelse for gener assosiert med prostatakreft som inkluderte: HNF1 homeobox B (
HNF1B)
, kallikrein-relaterte peptidase 2
(KLK2 )
, kallikrein relatert peptidase 3
(KLK3)
, lemur tyrosin kinase 2
(LMTK2)
, NK3 homeobox en
(NKX3-1)
, og oppløst stoff carrier familie 22 (organisk kation transporter), medlem 3 (
SLC22A3)
. IPA også identifisert mulige gen-gen-interaksjoner og nettverk som foreslo at genet listen ble komponert av gener som kan fungere kollektivt i bestemte biologiske mekanismer. Den øverste funksjonelle nettverk inkludert 20 fokus molekyler fra genet listen og har en rolle i
organisme Development
,
embryoutvikling
,
og orgel Development plakater (Fig. 1). Andre funksjonelle nettverk identifisert basert på 97 genet liste, var
Cell-To-Cell Signaling og Samhandling
,
bindevevssykdommer; Celledød og Survival
,
Kreft
,
organisme Skader og Unormalt
(tabell 1). Disse resultatene understøtter den observasjon at genene som flankerer prostata kreftrisiko alleler har potensial for funksjonell tilkobling til å danne biologiske nettverk som har en rolle i utviklingen, cellesignalisering, celledød og overlevelse, og kreft.
A total av 97 unike gener som finnes eller flankerer 86 prostatakreft risiko loci. Gene-genet interaksjoner ble identifisert ved hjelp av oppfinnsomhet Pathway Analysis programvare. Den mest betydelige funksjonelle nettverk demonstrere forbindelsen mellom gener ble identifisert som å ha en potensiell funksjon i
organisme Development
,
embryoutvikling
,
og orgel Development
. De representative genprodukter er oppført og mulige funksjoner oppført i legenden. Genprodukter markert med grått representerer gener som stammer fra genet listen.
Når disse 97 genene ble spørres for endringer i genuttrykk, kopiantall, og mutasjoner profiler i Kreft Genome Atlas (TCGA ) prostata adenokarsinom datasettet (n = 236), fant vi at mer enn halvparten av genene (65 av 97 gener) ble endret på minst 5% av svulstene i datasettet, inkludert 8 gener som ble endret i 10% av svulstene (S3 tabell).
IPA Upstream Regulator verktøyet ble brukt til å ytterligere identifisere kritiske signalveier som kan funksjonelt lenker sammen gener som kan ha en rolle i prostata kreft initiering og progresjon. Dette verktøyet identifiserer potensielle oppstrøms regulatorer basert på den statistiske signifikansen av gener fra genet listen som fungerer på nedstrømssiden av den identifiserte oppstrøms regulatoren. Eksempler på oppstrøms regulatorer inkluderer transkripsjonsfaktorer, cytokiner, microRNAs, reseptorer, kinaser, kjemikalier og legemidler. Av de 22 viktigste oppstrøms regulatorer (Fisher eksakt test p 1 x 10
-4), identifisert av IPA, de fem mest betydningsfulle oppstrøms regulatorer var androgen, androgen reseptor (
AR)
, lymfoid enhancer- bindende faktor 1 (
LEF1)
, pinnsvin
(HH)
, og kadmium klorid (S4 tabell). Disse oppstrøms regulatorer påpeke betydningen av gener som fungerer i androgen reseptoren, pinnsvin, og Wnt /β-catenin signalveier i sykdomsutviklingen. Sytten gener fra 97 genet liste ble identifisert til å fungere nedstrøms av disse topp 5 oppstrøms regulatorer. Videre disse resultatene støtte potensialet for crosstalk mellom disse banene i prostatakreft, da flere av de nedstrøms gener fra genet liste delte samme oppstrøms regulatorer (Fig. 2).
IPA Upstream Regulator verktøyet ble brukt for å identifisere potensielle oppstrøms regulatorer basert på den statistiske signifikansen av gener i genet listen som virker på nedstrømssiden av denne regulator. De 5 oppstrøms regulatorer identifiserte var androgen, androgen reseptor (AR), lymfoid Enhancer bindende faktor 1 (LEF1), pinnsvin (HH), og kadmium klorid. Oppstrøms regulatorer (rød); AR var både og oppstrøms regulator og på genet listen (lilla skygge); gener fra genet liste (blå).
Når vi spurte TCGA data med 17 gener assosiert med de fem oppstrøms regulatorer å finne ut om disse genene ble endret med hensyn til genekspresjon, kopiere nummer, og mutasjon i prostata adenokarsinom (n = 236). Vi har funnet at de fleste av gener fra denne undergruppe (11 av 17) ble endret på minst 5% av de 236 svulster. Den hyppigste endret genet var svulst suppressor,
NKX3-1
, som ble slettet eller mutert i 30 av de 236 prostatakreft (12,7%) inkludert i TCGA datasett. Andre oppstrøms nettverks gener som ble endret i TCGA svulster (i 5% av 236) var v-myc avian myelocytomatosis viral onkogen homolog (
MYC)
, Kruppel-lignende faktor 5
(KLF5 )
, inte, alpha 6
(ITGA6)
, microseminoprotein, beta
(MSMB)
, claudin 11
(CLDN11)
, fibroblast vekstfaktor-reseptor 2
(FGFR2)
, SRY (sex bestemme region Y) -boks 9
(SOX9)
, fibroblast vekstfaktor 10
(FGF10)
, GATA bindende protein 5
(GATA5)
, og kallikrein-relaterte peptidase 3
(KLK3) plakater (S3 tabell). Endringer i disse genene i prostatakreft er i samsvar med den potensielle regulerende rolle genetiske varianter gener involvert i viktige signalveier i sykdomsutviklingen å regulere.
Funksjonell profiler av gener nabo SNPs i høy LD med prostatakreft risiko alleler
i alt 1.594 individuelle SNPs (inkludert 86-indeksen SNPs) ble identifisert til å være i høy LD med indeks SNPs og 81 fokus molekyler (78 kommenterte enkeltgener og 3 microRNAs) var innenfor 100 kb av disse SNPs (S5 tabell). Nettverk analyse, med IPA, for å identifisere funksjonelle tilkobling mellom gener, indikerte at toppen funksjonelle nettverk var
Kreft
,
Cellular Vekst og spredning
,
og organisme Skade- og Unormalt
, med 16 av de 78 gener fra genet listen som inngår i dette nettverket (fig. 3). Andre tilknyttede nettverksfunksjoner, for eksempel
Arvelig lidelse; Organisme Skade og Unormalt; DNA Replication
,
rekombinasjon
,
og reparasjon; Cell morfologi; og Cellular Funksjon og vedlikehold
, ble identifisert basert på 78 genet listen og beskrevet i Tabell 2.
Det er totalt 78 unike gener som finnes eller ble plassert innenfor 100 Kb av SNPs i høy LD (r
2 0,80). Gene-genet interaksjoner ble identifisert ved hjelp av oppfinnsomhet Pathway Analysis programvare. Den mest betydelige funksjonelle nettverk demonstrere forbindelsen mellom gener ble identifisert som å ha en potensiell funksjon i
Kreft
,
Cellular Vekst og spredning
,
og organisme Skade- og Unormalt
. Genprodukter markert med grått representerer gener som stammer fra genet listen.
Når disse 81 fokus molekylene ble spørres for endringer i genuttrykk, kopiantall, og mutasjoner profiler i TCGA prostata adenokarsinom datasett ( n = 236), fant vi at mer enn halvparten av genene (52 av 81 gener) ble endret på minst 5% av svulstene i datasettet, inkludert 5 gener som ble endret i 10% av svulstene (S5 Tabell) .Vi har også analysert de 81 fokus molekyler for signale tilkobling ved hjelp av IPA oppstrøms regulator analyse tilnærming og identifisert 9 betydelige oppstrøms regulatorer (Fisher eksakt test p 1 x 10
-4) (S6 tabell). De 5 viktigste oppstrøms- regulatorer, flufenaminsyre,
AR
, kadmium klorid, prostata trans protein, androgen induserte en (
PMEPA1)
, og URI1, prefoldin lignende anstand (
URI1 )
demonstrert tilkobling ved å dele flere nedstrøms mål på tvers av genet listen (fig. 4). Den mest betydningsfulle oppstrøms regulatoren var den ikke-steroid antiinflammatorisk legemiddel, flufenaminsyre (FLF). Flufenaminsyre funksjoner oppstrøms av androgen receptor å inhibere
AR
genekspresjon og gjennom denne funksjonen har blitt brukt som et terapeutisk middel for prostatacancer [15]. Androgen reseptoren var den nest viktigste oppstrøms regulator med flere nedstrøms gener på genet liste, nemlig fibroblast vekstfaktor 10 (
FGFR10)
, inte, alpha 6
(ITGA6)
,
CLDN11
, nervevekstfaktor reseptor
(NGFR)
,
NKX3-1
,
MSMB
, og
KLK3
. Transkripsjonen regulator prefoldin lignende anstand (
URI1)
også regulerer uttrykket av
AR
, samt et felles nedstrøms genet på genet listen, for eksempel
NKX3-1 product: [16], en tumor suppressor ofte slettet i prostatakreft. Disse resultater indikerer at et delsett av genene identifisert som flankerer de prostatakreft indeks SNP’er, eller SNP’er i høy LD med dem, kan ha en nøkkel funksjonell rolle i regulering av gener som er involvert i den androgen reseptor-mediert signalveien for prostatakreft.
IPA Upstream regulator verktøyet ble brukt til å identifisere potensielle oppstrøms regulatorer basert på den statistiske betydningen av gener i genet liste som fungerer nedstrøms denne regulator. De 5 oppstrøms regulatorer identifiserte var flufenaminsyre, androgen reseptor (AR), kadmium klorid, prostata trans protein, androgen induserte en (PMEPA1), og prefoldin lignende anstand (URI1). Oppstrøms regulatorer (rød); oppstrøms regulator og på genet listen (lilla skygge); gener fra genet listen (blå).
Vi søkte TCGA for endringer i genekspresjon, kopiantall, og mutasjon i prostata adenokarsinom datasettet (n = 236) ved hjelp av genet listen undergruppe er forbundet med topp fem oppstrøms regulatorer og fant at flertallet av gener (6 av 9 gener) ble endret på minst 5% av de 236 svulster, med sletting hendelsene i
NKX3-1 plakater (frekvens: 12,7%) som den hyppigste endring. Andre oppstrøms nettverks gener fra våre genet liste som ble endret ( 5% av 236) var
ITGA6
,
MSMB
,
CLDN11
,
NGFR
,
FGF10
,
KLK3 plakater (S5 tabell).
Funksjonell merknad for prostatakreft Risiko Alleler og SNPs i High LD
Vi brukte den HaploReg verktøy for å identifisere potensielle mekanistiske funksjoner av ikke-koding risiko alleler ved å bestemme om SNP av interesse er sannsynlig å være innenfor eksoner, arrangører og forsterkere av gener ved loci av interesse. Den HaploReg verktøyet identifiserer potensielt funksjonelle SNPs basert på regulatoriske kommentarer av ikke-kodende sekvenser basert på informasjon fra KODE [17].
Vi først fokusert på karakterisering av potensielle regulerende funksjon for 86-indeksen SNPs (S7 tabell). To av de 86 SNP ble plassert i eksoner, genererer missense mutasjoner; var plassert i den 3′-UTR-regionen av et gen; 29 ble plassert i intronic regioner av gener; syv ble plassert i et evolusjonært konservert område spådd å være under funksjonell begrensning basert på SiPhy (stedsspesifikk fylogenetisk) analyse [10]; fem inneholdt promoter histone merkene; 37 inneholdt Enhancer histone merkene; 36 var i DNase overfølsom regioner; og 20 ble funnet å ha transkripsjonsfaktorer som er bundet (basert på chip-seq) for flere celletyper. Disse resultater antyder at mange av de 86 prostata kreftrisiko varianter ble plassert i regulatoriske sekvensene ved transkripsjonelt aktive seter. I tillegg ble flere risikovarianter funnet å ha flere regulatoriske funksjoner på sitt locus. Ett eksempel, rs11568818 på 11q21, ligger 182 bp 5 «fra matrisen metallopeptidase 7 (
MMP7
) genet. Dette SNP er innenfor et område med sekvenskonservering, enhancer histon merker og DNase hypersensitivitet i flere celletyper, og, basert på chip-Seq analyser, ble funnet å binde transkripsjonsfaktorer som bidrar til at sannsynligheten for at denne SNP er plassert i et område med transcriptional regulerende funksjon. I tillegg har det blitt vist av uttrykket kvantitativ egenskap loci (eQTL) som transkripsjonsregulerende funksjon finnes på denne risikoen locus for
MMP7
genet i leveren vev [18].
Når 1594 SNPs, inkludert de 86 indeks SNPs og SNPs i høy LD med dem, ble undersøkt ved hjelp av HaploReg verktøy, identifiserte vi ti SNPs som lå i eksoner av kommenterte gener, fire ligger i 5’UTR, 22 ligger i 3’UTR 15 ligger i potensielle promoter regioner ( 1,5 Kb av transkripsjons start stedet), 562 ligger i intronic regioner, og 936 ligger i intergeniske regioner (S8 tabell)
ser spesielt mot arrangører ( 1,5 Kb fra transkripsjonsstartsetet) og 5 «og 3» UTR regioner foreslått å være involvert i transkripsjonsregulering, har vi funnet at 15 SNP ble plassert i putative promotorområdene til 9 forskjellige kode gener (
MDM4
,
PIK3C2B
,
MLPH
,
VAMP8
,
NOTCH4
,
MSMB
,
MMP7
,
NGFR
,
VPS53
) og en ikke-kodende gen, kreft mottakelighet kandidat 8 (
CASC8
). Tre SNPs ble plassert i 5′-UTR av gener (
ZBTB38
,
VPS53
, og
PPP1R14A)
og 22 SNPs ble plassert i 3′-UTR av 11 ulike gener (
MDM4
,
GGCX
,
VAMP8
,
PDLIM5
,
ARMC2
,
SESN1
,
PSORS1C1
,
NKX3-1
,
ZNF652
,
KLK3
, og
LIME1
). SNP som ligger i den 5 «og 3»-UTR sekvenser av gener kan ha en viktig rolle i regulering av mekanismene som kontrollerer genekspresjon, mRNA-stabilitet, og translasjonelle effektivitet [20] .For å utforske andre reguleringsmekanismer for indeksen risiko og koblet SNP sett bruker vi HaploReg verktøy for å identifisere spådd forsterkere og arrangører på disse loci (S8 Table). Den HaploReg verktøy indikerte en samlet betydelig berikelse av forsterkere i stamcellelinje, H1, med en 12,8 ganger (p = 2,9 x 10
-4) anrikning av forsterker karakterer enn forventning for SNP sett (S9 tabell). DNase anrikning analyse viste en betydelig berikelse av transkripsjonelt aktive seter i SNP satt med en 4,4 gangers økning i forhold til forventet (p = 1,1 x 10
-3) i en cellelinje som stammer fra et prostata adenokarsinom (LNCaP-celler), og en 5,8 ganger økning over forventet (p = 1,8 x 10
-3) for en prostata epitel cellelinje (prec). Berikelse av enhancer merker og DNase overfølsomhetskarakterer i stamceller og prostata kreft celler gir sterke bevis for rollen som prostata kreft risiko SNPs og SNPs i høy LD med dem i å regulere genuttrykket.
For de ti knyttet SNPs lokalisert i exon av karakteriseres gener, fem SNP’er er synonyme varianter, og fem er missense varianter. En missense variant rs11765552, på 7q21, som ligger i ekson 11 (forårsaker L780M) av
LMTK2
er sterkt korrelert (r
2 = 0,99 i europeerne) med peke SNP, rs6465657. Vi brukte PolyPhen analyse for å forutsi den funksjonelle potensialet i dette aminosyresubstitusjon og fant at denne varianten kan resultere i en muligens ødeleggende effekt (skår 0,761 til 1,00) på protein funksjon av LMTK2. Denne varianten ligger svært nær myosin VI bindende domene (aa «s 567-773) av LMTK2 [19]. To av de 5 missense variantene er lokalisert i den melanophilin (
MLPH)
genet ved 2q37. En av SNP er en indeks risiko variant (rs2292884) lokalisert i exon 10 (forårsaker H347R) og den andre SNP (rs2271809) lokalisert i exon 11 (E407D) er i høy LD (R «> 2 = 0,82) med denne indeksen risikere SNP. Vi brukte PolyPhen og PROVEAN analyse for å forutsi den funksjonelle potensialet i disse aminosyresubstitusjoner, hadde begge variantene lav antatte proteinet funksjon avbrudd. Den missense variant på 6p21, rs130067, er en indeks risiko SNP ligger i ekson 7 (E275D) av coiled-spole alfa-heliks stang protein 1 (
CCHCR1)
genet. PolyPhen analyse spår svært lav, eller godartet, potensialet for protein funksjon avbrudd (skår 0,00 eller 1,00). En annen missense variant på 20q13, rs8957, er sterkt korrelert (r
2 = 0,83) med peke risiko SNP, rs6062509 og ligger i ekson 6 (E233D) av det oppløste bære familie 2,
SLC2A4
genet . PolyPhen analyse spådd en svært lav eller godartet (skår 0,02 av 1,00) potensial for protein funksjon avbrudd for denne varianten.
Diskusjoner
Vi gjennomførte en omfattende
i silico
funksjonell sti karakterisering av de 86 etablerte prostata kreft risiko alleler identifisert hittil. For å øke vår forståelse av de biologiske mekanismene som indeksen risiko varianter og nær-by gener kan ha innvirkning, tok vi to tilnærminger til å identifisere genet nettverk som kan fungere i prostata kreft initiering eller patogenesen. En tilnærming var å generere et gen liste bestående av kommenterte gener umiddelbart flankerer indeksen SNP, uavhengig av avstand til nærmeste genet. Den andre tilnærmingen var å vurdere sammenhengen struktur og omfatter nabo gener av SNPs i høy LD (r
2≥0.8) med peke SNP, innen 100 kb. Sammenligning av to gen listene, var det 58 gener som deles mellom de to listene, 39 gener som er unike for listen genereres ved å identifisere flankerer gener og 23 gener som er unike for en liste basert på bindingsstruktur. Samlet de fleste genene som ble identifisert ble vist å ha en biologisk rolle i tumorgenese, med mange av de gener som har en rolle i prostata cancer spesifikt.
I den første fremgangsmåten, ved hjelp av genet listen basert på genene flankerer indeks SNPs, identifiserte vi 97 unike gener og 56 av disse var kreftrelaterte gener. Sytten gener ble forbundet med prostatakreft, spesielt. Med andre tilnærmingen, evaluere nabo gener til SNPs i høy LD med risikovariantene, identifiserte vi 78 unike gener. Halvparten av disse 78 genene var kreftrelaterte gener, med 14 gener spesifikt assosiert med prostatakreft. Ikke alle genene for de to listene var overlappende, noe som reflekteres i forskjellige biologiske funksjoner av de to øverste nettverk for hvert gen liste Tabell 1 og 2. Begge gener listene identifisert androgen reseptoren som en betydelig oppstrøms regulator, i samsvar med den kjente sentral rollen til androgen reseptoren signalveien i prostatakreft [26,27]. Interessant, de fem viktigste oppstrøms- regulatorer (androgen,
AR
,
LEF1
,
HH
, og kadmium klorid) basert på flanke genet liste, støtter en ekstra rolle for pinnsvinet og Wnt /β-catenin signalveier veien. Gowda et al. har nylig rapportert at den synergistiske inhibering av både hedgehog og androgen reseptor signalveier undertrykket vekst av kastrering resistent prostatakreft, mens hemming av enten pinnsvin eller androgen-reseptor-trasé individuelt kunne ikke oppnå lignende nivåer av veksthemming [28], som tyder på at begge veier spille en avgjørende synergistisk rolle i biologi prostatakreft. I motsetning til de fem viktigste oppstrøms- regulatorer (flufenaminsyre,
AR
, kadmium klorid,
PMEPA1
, og
URI1)
generert, basert på 78-genet listen gener i høy LD med prostatakreft risiko varianter, først og fremst funksjon i androgen reseptor signalveien og ikke identifisere pinnsvin eller wnt /β-catenin signalveier [15,16,29,30]. Samlet er disse resultatene tyder på at indeks SNPs ligger i nærheten av gener som kan samhandle og har funksjonelle relasjoner i bestemte signalnettverk. Derfor antar at risikolene faktisk har regulerende effekt på sine nærliggende gener, når de vurderer den funksjonelle rollen risiko alleler, oppmerksom på muligheten for at flere varianter kan fungere for å påvirke en høyere orden nettverk av gener som regulerer bestemte veier. Andre biologiske analyser må bli utført for å bekrefte den rolle de risiko alleler og synergistiske interaksjoner mellom genene de potensielt regulerer.
Bruke HaploReg verktøy for analyse av SNPs og gener i høye LD med indeksen risiko varianter, utvidet vi vår analyse til å omfatte over 1500 flere SNPs. Dette utvidet analyse viste til regulatoriske funksjoner som ikke ble identifisert med de 86 indeks SNPs alene, potensielt forsterke liste av gener som er assosiert med indeks genetiske signaler. De fleste av disse 1500 SNPs ble plassert i intergeniske regioner, ble nesten en tredjedel av de koblede SNPs ligger i intronic regioner, ble et mindretall av de koblede SNPs ligger i regulerings domener (arrangører og 5 «og 3» UTR), og 10 SNPs ble plassert i eksoner.
Når vi har vurdert 86-indeksen SNPs for biologiske funksjoner som kan påvirke gen-funksjon, vises rs11568818 på 11q21 de sterkeste bevisene for å ha transkripsjonen regulerende funksjon. Denne varianten kan direkte påvirke uttrykk for
MMP7
genet. Det ligger i et evolusjonært konservert sekvens 182 bp 5 «til
MMP7
genet og inneholder egenskapene til transkripsjonsregulerende aktivitet, for eksempel histone merker (H3K27Ac) og DNase overfølsomhet. I tillegg har chip analyser identifisert transkripsjonsfaktorer (
TBP
,
FOS
,
juni
) binding til denne regionen og en eQTL analyse har vist interaksjon mellom denne SNP og
MMP7
genet i leveren vev [18]. Allel-spesifikk trans av MMP7 genet ved FOXA2 transkripsjonsfaktor ble observert i idiopatisk lungefibrose pasienter [21].
MMP7
har vist seg å være overuttrykt i prostata cancer vev sammenlignet med normalt vev og er nylig påvist å være regulert av ETV1 transkripsjonsfaktor [22]. Regulering av ETV1 er av spesiell interesse fordi det er et medlem av ETS transkripsjonsfaktorer. Trans av ETS transkripsjonsfaktorer, inkludert
ETV1
, forekommer i halvparten av all prostatakreft som resulterer i avvikende ETS transkripsjonsfaktor uttrykk som antas å være en tidlig, potensielt innledende hendelsen, for prostatakreft [23-25] . Samlet utgjør disse dataene sterkt en funksjonell rolle for rs11568818 i transkripsjonsregulering av
MMP7
genet for prostatakreft. Andre funksjonelle studier for å undersøke den potensielle rolle allel-spesifikk transkripsjonsregulering av
MMP7
av rs11568818 og ETV1 for prostatakreft bør gjennomføres.
Blant SNPs som er i høy LD med prostata kreft indeksen SNPs, våre resultater merke ett av missense SNPs rs11765552, i høy LD (r
2 = 0,99) med indeksrisiko SNP rs6465657, som blir plassert i
LMTK2
genet.
LMTK2
genet koder for et membranbundet kinase som er involvert i intracellulær trafficking og endosomal gjenvinning. Puri et al.