Abstract
Genome-wide assosiasjonsstudier (GWAS) av tykk- og endetarmskreft (CRC) har ført til identifisering av en rekke vanlige varianter assosiert med beskjeden risiko. Flere risikovarianter kartet i nærheten av TGFB /BMP signalveien gener, inkludert rs4939827 innenfor et intron av
SMAD7
18q21.1. En tidligere studie innblandet en roman SNP (roman en eller rs58920878) som en funksjonell variant i en enhancer element i
SMAD7
intron 4. I denne studien, viser vi at fire SNPs inkludert roman ett (rs6507874, rs6507875, rs8085824 og rs58920878) i koblingsulikevekt (LD) med indeks SNP rs4939827 demonstrere allel-spesifikk forsterkningseffekter i en stor, multi-komponent enhancer av
SMAD7
. Alle fire SNP’er demonstrere allel-spesifikk proteinbinding til nukleære ekstrakter av CRC-cellelinjer. Videre noen av risiko-forbundet alleler korrelerer med økt uttrykk av
SMAD7
i normale kolon vev. Til slutt viser vi at enhancer er mottakelig for BMP4 stimulering. Til sammen foreslår at forbundet CRC risikoen ved 18q21.1 skyldes fire funksjonelle varianter som regulerer
SMAD7
uttrykk og potensielt forstyrre en BMP negativ feedback loop i TGFB /BMP signalveier.
Citation: Fortini BK, Tring S, Plummer SJ, Edlund CK, Moreno V, Bresalier RS, et al. (2014) Flerfunksjons Risk varianter i en SMAD7 Enhancer implisere en Colorectal Cancer Risk haplotype. PLoS ONE 9 (11): e111914. doi: 10,1371 /journal.pone.0111914
Redaktør: Ludmila Prokunina-Olsson, National Cancer Institute, National Institutes of Health, USA
mottatt: May 16, 2014; Godkjent: 01.10.2014; Publisert: 06.11.2014
Copyright: © 2014 Fortini et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Data Tilgjengelighet:. Den forfatterne bekrefter at alle data som underbygger funnene er fullt tilgjengelig uten restriksjoner. Alle relevante data er i avisen og dens saksdokumenter filer
Finansiering:. Dette arbeidet ble støttet av National Institutes of Health (R01 CA143237, U19 CA148107 til GC). Den vitenskapelige utvikling og finansiering av dette prosjektet ble delvis støttet av den genetiske foreninger og mekanismer i onkologi (GAME-ON), en NCI Cancer Post-GWAS Initiative. Innholdet er utelukkende ansvaret til forfatterne og representerer ikke nødvendigvis de offisielle visningene av National Cancer Institute eller National Institutes of Health, som ikke hadde noen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskript
konkurrerende interesser:.. forfatterne hevder at ingen konkurrerende interesser eksisterer
Innledning
TGFB signalering har lenge vært assosiert med tykk- og endetarmskreft (CRC). I tillegg til kanoniske roller i reguleringen av apoptose, celledifferensiering, og cellevekst av tarm epitel, er TGFfi signale en viktig aktør i immunresponsen og inflammatorisk tarmsykdom, en risikofaktor for CRC (anmeldelser [1] – [3] ). TGFp og BMP signale definere de to store grener av TGFp pathway. Aktivering av enten gren fører til rekruttering av R-SMADs, SMAD2 /3 i tilfelle av TGFp eller SMAD1 /5/8 i tilfelle av BMP, som danner et kompleks med SMAD4. Dette komplekset deretter leder transkripsjon av mange målgener, inkludert
SMAD7
. SMAD7, en hemmende SMAD som SMAD6 på sin side tjener som en negativ feedback-regulator av TGFp og BMP-signalering, i tillegg til å fungere som et krysstale node med andre veier, inkludert TNF [4], [5].
SMAD7 spiller også andre viktige roller i etiologien av CRC, som i samspill med β-catenin å regulere
MYC
uttrykk og WNT signale [6].
SMAD7
overekspresjon har blitt sett i noen CRC celler, og reduksjon av
SMAD7
uttrykk ved hjelp av anti-sense RNA fører til redusert spredning i HCT-116 CRC cellelinje og menneske CRC neoplastiske explants, og redusert tumordannelse i APC
min /- mus [7]
CRC GWAS har ført til identifisering av flere genomiske regioner forbundet med risiko som inkluderer gener i TGFB signalveien inkludert
SMAD7.
,
BNIP2
,
BMP4
, og
GREM1 product: [8] – [14]. Dette inkluderer enkeltnukleotidpolymorfi (SNP) rs4939827, som ligger i
SMAD7
intron 4, som har blitt rapportert i flere studier. Pittman et al. rapportert at en ny SNP (kalt romanen en, senere omdøpt rs58920878) kartlagt til en enhancer element som kjørte GFP uttrykk i
Xenopus
rumpetroll muskler og colorectum i et allel bestemt måte, impliserer rs58920878 som en funksjonell variant innenfor denne regionen [15].
etter oppfordring fra våre funn av flere funksjonelle varianter innenfor 11q23 CRC GWAS region [16], vi grundig undersøkt genomisk region omgir CRC tagSNP rs4939827 på 18q21.1 for andre potensielle funksjonelle SNPs. Vi identifiserte 4 SNPs, rs6507874, rs6507875, rs8085824 og rs58920878 (roman 1), i en region av omtrent 2 kb, hver demonstrere allel-spesifikk forsterknings aktivitet. Vi har videre fastslått at alleler som svarer til den risiko haplotype korrelert med øket ekspresjon av
SMAD7
i normale tykktarm epitelvev. Sekvenser som omfatter alle fire SNP’er også bundet til kjerneproteiner fra CRC-cellelinjer i et allel-spesifikk måte i elektroforetisk mobilitet skift assays (EMSAs). Til slutt, vi viste at forsterkeren var lydhør overfor BMP4-indusert signalisering i luciferase analyser, mens verken haplotype var lydhør overfor TGFβ1. Til sammen foreslår at CRC risiko på kromosom 18q21.1 skyldes bidrag fra 4 funksjonelle varianter i en forsterker som påvirker uttrykket av
SMAD7
, som potensielt kan føre til opprørt regulering av BMP negativ feedback loop i BMP /TGFB signalveier.
Resultater
Region Analyse
indeksen SNP rs4939827 forbundet med CRC på kromosom 18q21.1 ligger innenfor intron 4 av
SMAD7
genet. Det er 20 SNPs i LD med rs4939827 med en r
2≥0.2 i CEU befolkningen (1000 genomer Prosjekt, juni 2011 release), vår valgte LD terskel for potensielle funksjonelle kandidater (figur 1A og 1C). Alle 21 SNPs ligger innenfor en 16 kb region av
SMAD7
intron 4. For å identifisere potensielle genomiske regulatoriske sekvenser fra denne regionen, SNPs i LD med rs4939827 ble justert med kromatin immunpresipitering og sekvensering (Chip-seq ) spor for histone metylering og acetylering merkene forbundet med Forsterker, H3K4me1 og H3K27ac (figur 1B). For denne studien refererte vi sigmoideum H3K27 acetylering fra Roadmap Epigenomics Consortium [17], og CRC cellelinjer SW480 og HCT-116 H3K4 monomethylation generert i vårt laboratorium og fra KODE prosjektet, henholdsvis [16], [18], [ ,,,0],19]. Flere potensielle enhancer topper inneholder SNPs i LD med rs4939827 ble identifisert i sigmoid colon, SW480, eller HCT-116 celler, inkludert en 2kb område som inneholder rs58920878 (grønn stripe, figur 1B). For å karakterisere regionen omfattende, ble mindre topper under terskelen for topp kalle programvaren også klonet og testet for aktivitet dersom de inneholdt en SNP møte vår LD cut-off. DNase hypersenstitivity spor fra KODE prosjektet ble også justert, men ingen topper overlappet med noen av kandidat SNPs i LD med rs4939827 [20], [21].
(A)
SMAD7
gen avbildet med genomiske koordinater (hg19) og posisjonen av SNP i LD (r «> 2≥0.2, CEU populasjon) med tagSNP rs4939827. (B) UCSC Genome Browser utsikt over SMAD7 med SNPs i LD med rs4939827 indikert. Chip-seq spor for forsterker histone merker er sigmoideum (SC) H3K27ac fra REMC /UCSD for Roadmap Epigenomics Consortium, SW480 (SW) H3K4me1, og HCT-116 (HCT) H3K4me1 fra KODE konsortiet. DNase overfølsomhet sporer HCT-116 (HCT) og CaCo-2 nedenfor er fra UW KODE datasett. Den grønne stripen representerer Enhancer fragment A. Røde striper indikerer klonede fragmenter B til G (venstre til høyre) som ble vist å mangle enhancer aktivitet. Koordinater for hvert fragment er gitt i File S1. (C) koblingsulikevekt tomt for rs4939827 inkludert alle SNPs i 1KG prosjekt med r
2≥0.2, skapt med Haploview. r
2 = 1- svart, 1 r
2 0,2 – grå skala. (D) Zoomet visning av fragment A Viser under fragmenter A1-A4. Den KODE Layered H3K4me1 styr på 7 cellelinjer er vist å identifisere celle-type spesifikke topper. (E) haplotyper og prosenter (CEU befolkningen) for de 4 SNPs i fragment A og rs4939827. Haplotyper knyttet til rs4939827 risiko allelet T er i lys lilla.
Enhancer aktivitetsanalyser
Sju antatte forsterker regioner ble klonet inn i en luciferase assay vektor for å bestemme Enhancer aktivitet i CRC cellelinjer HCT-116 og SW480. Bare de to kb-fragmentet (grønn stripe i figur 1B) ved 3′-enden av
SMAD7
intron 4 viste aktivitet i våre analyser, men bare i motsatt retning (figur 2A). Regioner testet, men mangler aktivitet i denne analysen er vist i røde striper på figur 1B (figur 2B). De 2 kb Enhancer regionen, vi kaller fragment A, inneholder 4 SNPs i LD med rs4939827: rs6507874, rs6507875, rs8085824, og rs58920878 (nye 1). Et utvidet syn på fragment A er vist i figur 1D. Som vist på figur 1C, disse fire SNPs er i LD (R «> 2 = 1 til 0,494) med hverandre og definerer 5 haplotyper i CEU populasjonen. Disse haplotyper er vist i forhold til rs4939827 variant (risiko allel T) i figur 1E [22], [23].
(A) Relativ luciferaseaktivitet for positiv kontroll, fragment A i den fremre, og fragment En i den motsatte retning. Lette søyler indikerer aktivitet i HCT-116, mørke søyler indikerer aktivitet i SW480. (B) Fragmenter B til G, vist i figur 1B som røde striper ikke viser enhancer aktivitet i begge orienteringer i HCT-116. Positive kontroller er vist for hver gruppe av konstruksjoner analysert på samme plate. Fragment E inneholder tagSNP rs4939827. (C) Aktivitet av A-fragmentet i motsatt orientering med alle SNP’er i fragmentet med sin C-allel, med hvert allel endres uavhengig til den alternative alleler, vist som gangers endring i forhold til den konstruksjon inneholdende de fire C-alleler. Alle fire alleler resultere i en statistisk signifikant reduksjon i aktivitet: rs6507874 T
p
= 8,25 × 10
-3 (HTC-116),
p
= 3.30 × 10
-2 (SW480); rs6507875 G
p
= 3.40 × 10
2 (HCT-116),
p =
6,79 × 10
-3 (SW480); rs8085824 T
p =
1,20 × 10
2 (HCT-116),
p =
3,12 × 10
-3 (SW480); rs58920878 G
p =
2,09 × 10
-3 (HCT-116),
p =
3,05 × 10
-3 (SW480).
Vi testet først hvorvidt det var noen allel-spesifikke forskjeller i enhancer aktivitet for hver av de individuelt SNP som starter med et 2 kb fragment med alle 4 SNP’er inneholdende C-alleler. Selv om dette haplotype ikke er sett i CEU befolkningen, dette allelkombinasjonen viste den høyeste Enhancer aktiviteten til alle fragmenter testet. Vi har observert allel-spesifikke forandringer i enhancer aktivitet for hver av de fire varianter når alleler ble endret ved stedrettet mutagenese (figur 2C). Alle 4 SNP’er viste en reduksjon i aktivitet når enhancer alleler ble endret til den alternative form. Den største nedgangen i aktivitet ble sett når rs58920878 ble endret fra C til G. Mens de mindre alleler for SNPs rs6507874 (T, mindre allel frekvens (MAF) = 0,44) og rs58920878 (G, MAF = 0,34) viste en lavere Enhancer aktivitet, de mindre alleler for SNP rs8085824 (C, MAF = 0,34) og rs6507875 (C, MAF = 0,49) viste en høyere enhancer aktivitet i disse analysene.
fragment A omfatter flere mindre tydelig HCT-116 H3K4me1 topper, med lengst til venstre topp spesifikke for HCT-116 sammenlignet med den lagdelte H3K4me1 super spor av 7 KODE Nivå 1-cellelinjer [19] (figur 1D). For å teste de relative bidragene fra disse regionene og SNPs individuelt på generelle Enhancer aktivitet, 4 mindre konstruksjoner, A1-A4, ble utformet (figur 1D). A1 fragmentet inneholder SNPs rs6507874 og rs6507875 og omfatter HCT-116 spesifikk topp. Disse to SNP’er er skilt ved 13 bp, og er i LD med hverandre med r
2 = 0,794, D «= 1. Som vist i figur 3A, A1-fragmentet viste enhancer aktivitet. Den store haplotype av rs6507874 og rs6507875 alleler i CEU populasjonen, CG, viste det laveste nivået av enhancer aktivitet sammenlignet med de tre andre mulige kombinasjoner allel (Figur 3B). TC og CC mindre haplotyper viste ca 1,3-1,5 ganger og 2-2,5 ganger høyere aktivitet i begge cellelinjene, HCT-116 og SW480, henholdsvis (figur 3B). TG allelkombinasjonen, mens ikke en kjent CEU haplotype, viste lavere aktivitet enn TC haplotype. Tatt sammen, konkluderer vi med at mens begge SNP’er, rs6507874 og rs6507875, bidra til den totale enhancer aktivitetsnivået for A1-fragmentet, rs6507875 alleler viser et større allel-spesifikk effekt enn rs6507874, i den retning i overensstemmelse med det 2 kb-fragment (figur 2C ). I motsetning til effekten av rs6507874 allel på forsterker aktiviteten var avhengig av hvilken rs6507875 allelet var til stede, noe som tyder på en kontekstuell effekt innenfor forsterkerkomponentene. Disse dataene innebærer en kompleks funksjonell sammenheng mellom tilstøtende SNPs.
(A) Fragment A ble delt inn i 4 mindre DNA-fragmenter, A1-A4, avbildet i figur 1D. Hver minste fragment demonstrerte Enhancer aktivitet både HCT-116 (lyse søyler) og SW480 (mørke søyler). For forsøket er vist, er alle SNP’er inneholdt de C-alleler. (B) Aktivitet av fragment A1 inneholder rs6507874 og rs6507875, vist som ganger endring i forhold til de store haplotype CG for HCT-116 (lyse søyler) og SW480 (mørke søyler). Den mindre haplotype TC (
p
= 2,25 × 10
2 (HCT-116),
p
= 8.59 × 10
2 (SW480)), og kombinasjonen CC (
p
= 5.06 × 10
-5 (HCT-116),
p
= 1,75 × 10
-5 (SW480)) ikke sett i CEU befolkningen viser høyere aktivitet enn de store haplotype. Kombinasjon TG (
p
= 0.450 (HCT-116),
p
= 0,287 (SW480)) viser aktiviteten ligner på CG. (C) Fragment A2 inneholder rs8085824 viser 2 ganger høyere enhancer aktivitet med mindre C-allelet av enn de store allelet T (
p =
4,75 × 10
-3 (HCT-116),
p =
3,61 × 10
-4 (SW480)). (D) Aktivitet av fragment A3 som inneholdt rs8085824 og rs58920878 i forhold til større haplotype TC. Den mindre haplotype CG viser høyere aktivitet enn TC (
p =
2,49 × 10
2 (HCT-116),
p =
6,32 × 10
-3 (SW480 )). T (major) allel av rs8085824 viser lavere aktivitet enn C (mindre) allel uansett rs58920878 allel. Den høyeste aktiviteten er sett i haplotype CC som ikke er rapportert i CEU befolkningen (
p =
6,35 × 10
-7 (HCT-116),
p =
1,47 × 10
-6 (SW480)). (E) Aktivitet av fragmentet A4 omfatter toppen som inneholdt rs58920878. Den mindre allelet G av rs58920878 viser dramatisk mindre aktivitet enn de store C-allelet (
p =
1,92 × 10
-4 (HCT-116),
p =
1,52 × 10
-5 (SW480)). (F) fragment A ble testet for aktivitet med de to mest vanlige haplotyper (figur 1E) i den CEU populasjonen. Den CGTC haplotype viser høyere aktivitet i HCT-116 (lys barer,
p
= 1,04 × 10
-11) og SW480 (mellom barer,
p
= 8,60 × 10
-11), men ingen signifikant forskjell i aktivitet i RKO (mørke søyler).
A2 fragmentet inneholder SNP rs8085824 og strekker området mellom de to mest fremtredende HCT-116 H3K4me1 topper i enhancer A (figur 1D). Mens fragment A2 hadde aktivitet på egen hånd, det viste den laveste aktivitet av de 4 delområder som ble testet (figur 3A). Når det rs8085824 allelet ble endret fra T (større allel) til C (moll-allel), aktivitet økte to ganger (figur 3C) var i overensstemmelse med resultatene for større fragment (figur 2C). A3 fragment omfatter A2 regionen (inkludert rs8085824) og ytterligere 160 bp å inkludere rs58920878. Dette fragmentet viste to ganger mer aktivitet enn A2 fragment. Den store haplotype av rs8085824 og rs58920878 (r
2 = 1, D «= 1, CEU) er TC. Den mindre haplotype CG demonstrert 01.03 til 01.06 ganger høyere aktivitet enn de store haplotype i HTC-116 og SW480 celler, henholdsvis. Den kunstig konstruerte CC allelkombinasjonen hadde den høyeste aktivitetsnivå testet for A3-fragmentet. Sammenligning av CC fragment til TC og CG haplotype fragmenter, observerte vi at en større nedgang i aktivitet resulterte i å endre rs8085824 allelet enn rs58920878. Omvendt, gjorde skiftende rs58920878 i TC haplotype til TG ikke resultere i en betydelig forskjell i Enhancer aktivitet. Som med A2-fragmentet, for SNP rs8085824 disse resultatene var i samsvar med allel-spesifikke effektene som ses med større fragment (figur 2C). Men for SNP rs58920878, effekten forutsagt av 2 kb-fragmentet var avhengig av hvilken rs8085824 allelet var til stede, på nytt, noe som tyder på at en sammensatt funksjonelt forhold eksisterer mellom tilstøtende SNP’er.
Endelig fragment A4, som omfatter den andre mindre HCT-116 H3K4me1 topp, inneholdt bare SNP rs58920878 og viste tilsvarende aktivitet som fragmenter A1 og A3 (figur 3A). Dette fragment viste forsterker aktiviteten ble redusert tre ganger når de store allelet C ble endret til mindre allelet G (figur 3E). A4 fragment som inneholder rs58920878 var den eneste av de mindre fragmenter der den mindreårige allelet eller haplotype viste lavere aktivitet enn de store allel /haplotype.
De to vanligste haplotyper i CEU for denne gruppen av 4 SNPs er CGTC (49,9%) og TCCG (33,4%) (figur 1E). Disse kombinasjonene ble undersøkt i sammenheng med 2 kb enhanceren A konstruksjon. Som vist i Figur 3F, samlet de store CGTC haplotype demonstrerte høyere enhancer aktivitet enn mindre TCCG haplotype i HCT-116 og SW480. Interessant, da vi testet de to haplotyper i CRC cellelinje RKO, CGTC var ikke betydelig mer aktive enn TCCG haplotype, indikerer det var noen spesifisitet å fragmentere A-aktivitet selv blant CRC cellelinjer. Verken haplotype av fragment A var aktiv i ikke-CRC HEK293-cellelinje som tjente som en negativ kontroll (figur S1A). Fragmenter inneholder haplotyper TCTC (9,5% av CEU befolkningen) og CCTC (5,9% av CEU befolkningen) viste aktivitetsnivå mellom at av haplotyper CGTC og TCCG (figur S1B).
Elektro Mobility Shift Analyser
for å bedre forstå disse allel-spesifikk forsterkningseffekter, vi neste undersøkt atomproteinbinding til sekvensene inneholder hver av de 4 SNPs, rs6507874, rs6507875, rs8085824, og rs58920878. Vi antok at transkripsjonsfaktorene vil selektivt bindes til C-allelene med høyere affinitet, som 2 kb-fragmentet og fragmenter A1-A4 med C-alleler viste den høyeste grad av enhancer aktivitet. Omvendt kan inhibitoriske proteiner som bindes til T eller G-alleler fortrinnsvis til negativt regulere enhancer aktivitet. For dette formål, 33 bp dobbelttrådete oligonukleotid sentrert på hver SNP, ble syntetisert. I hvert tilfelle ble den C-allelet merket med rød (700) IR fargestoff. De alternative alleler, enten T eller G ble merket med grønt (800) IR fargestoff (enkelte kanaler presenteres som svart-hvitt bilder i figurene S2-S5 for enkel reproduksjon og analyse). Nukleære ekstrakter ble fremstilt fra SW480, HCT-116 og RKO CRC-cellelinjer og inkubert med ikke-spesifikk og spesifikk umerket konkurrent DNA som vist i figur 4. De to alleler fra hver SNP er merket med forskjellige farger, slik at en direkte sammenligning av binding av hvert allel til kjerneproteiner i den samme reaksjon. Som vist i figur 4, for hver sonde sett testet, er det band som er spesifikke for en allel i forhold til den andre allel.
(A) Kjerne ekstrakter fra SW480, HCT-116, og RKO cellelinjer ble inkubert med IR- -dye merket 33mers sentrert på rs6507874 C (rød etikett) og T (grønne etiketter) før mors EMSA. Lanes 1 og 2 viser sonde uten kjerneekstrakt. Kolonnene 3, 4, 9, 10, 15 og 16 viser hver merket probe-binding til kjerneproteiner individuelt med cellelinje som er nevnt ovenfor. Lanes 5-8, 11-14 og 17-20 er en 01:01 konkurranse med merket C og T allel sonder. Lanes 6, 12 og 18 inneholde 200 ganger mer enn umerket C-allelet konkurrent. Baner 7, 13 og 19 inneholde 200-gangers overskudd av umerket t-allel konkurrent. Søyle 8, 14 og 20 inneholde 200-gangers overskudd av konkurrent en unmatching sekvens med tilsvarende nukleotid-innhold. Band som er spesifikke for en allel og tapte på konkurranse er merket med piler. Se figur S2 for rød (700) kanal bilde av C sonden og den grønne (800) kanal av T sonde i svart og hvitt. (B) Når det i panel A, med rs6507875 C-allelen (rød probe) og G allel (grønn). Se figur S3 for rød (700) kanal bilde av C sonden og den grønne (800) kanal av G sonde i svart og hvitt. (C) Som i panel A, med rs8085824 C allelet (rød) og T-allelet (grønn). Se figur S4 for rød (700) kanal bilde av C sonden og den grønne (800) kanal av T sonde i svart og hvitt. (D) Som i panel A, med rs58920878 C allelet (rød) og G allel (grønn). Se figur S5 for rød (700) kanal bilde av C sonden og den grønne (800) kanal av G sonde i svart og hvitt.
For hvert allel sett, baner 3, 4, 9 , 10, 15 og 16 viser et enkelt allel sonde inkuberes med atom ekstrakt. Baner 5-8, 11-14 og 17-20 inneholde reaksjoner med 1:1 mengder av hver merket allelet. For å bestemme spesifisiteten av de skiftet komplekser, ble umerkede konkurranse oligonukleotider for hver allel lagt i 200-fold overkant. Lanes 6, 12 og 18 inneholder de umerkede C lene og streder 7, 13 og 19 inneholder de umerkede T eller G alleler. I søyle 8, 14 og 20, et umerket konkurrent av lignende basesammensetning, men ikke samsvarer med hvilken som helst av sekvensene som ble tilsatt i en like stor mengde. Band som forsvant da konkurrerte med enten SNP allelet, men til stede med urelaterte (uspesifikke) konkurrent ble vurdert spesielt for SNP sekvens. Den mest fremtredende av de spesifikke bånd er merket i margen med piler.
Når det gjelder rs6507874 og rs58920878 (figur 4A, 4D), var det komplekser som finnes i HCT-116 og SW480, som ikke ble sett i RKO. Dette kan forklare hvorfor haplotype spesifikk aktivitet ikke ble sett i RKO luciferaseaktivitet eksperiment. På figurene 4A og S2, bandet markert med en pil var spesifikk for rs6507874 C-allelet probe. Merk at i HCT-116 og RKO ekstrakter, til og med 200-gangers overskudd av umerket t-allelet oligonukleotid kunne ikke utkonkurrere C-allel for binding. For rs6507875 sondene (figur 4B og S3), mens det var spesifikke bånd på begge allelene (piler), G-allelet bundet med mer affinitet enn den C-allelet. Interessant, rs6507875 prober sterkt bundet til komponentene i RKO ekstrakt, selv i nærvær av overskudd av umerket DNA (figur 4B).
For rs8085824 sonder, vi igjen funnet flere spesifikke komplekser for hvert allel. En fremstående kompleks, markert ved den nederste pil, viste at C-allele-proben ikke var fullstendig utkonkurrert med 200-gangers overskudd av T-allelet. Det ser ut til at de bundne proteiner av dette komplekset er funnet i større mengder i SW480 og HCT-116 enn RKO atom ekstrakter. I tilfelle av rs58920878 sonder, fant vi flere band som er spesifikke for C-allele, mens G allel ble funnet hovedsakelig i større komplekser (høyere bånd) enn C-allelen.
Å bestemme identiteten til disse allele- spesifikke bindingsproteiner vil være nødvendig for å forstå virkningen av SMAD7 enhancer. Protein binding prediksjon programvare Biobase Match, basert på TRANSFAC motiv database, ble brukt til å identifisere kandidater for hver SNP region [24]. Resultater av denne analysen presenteres som Tabeller S1, S2 og S3 i File S1. DNA bindende protein med toppen forskjell i spådd bindende score mellom alleler for rs6507874 /rs6507875 (analyseres sammen på grunn av nærhet) var NF-1A, for rs8085824 var Churchill, og for rs58920878 var ZF5. Men for hvert locus, ingen av proteiner med de største spådd allel forskjellene var proteiner med høyest kjerne eller matrise score for hver sekvens.
eQTL Analyse i Normal Colon Tissue
neste spurte om genotype på disse SNPs korrelert med genuttrykk nivå i normale kolon vev. Som forsterker ligger i intron 4 av
SMAD7
genet,
SMAD7
var en opplagt kandidat target genet. I tillegg til rs6507874, rs6507875 og rs8085824, vi også genotypet de tagSNP rs4939827 i patologisk normale menneskelige vevsprøver hentet fra koloskopioppfølging gjennom Aspirin /Folat Polyp Prevention Study [25] – [27]. Vi klarte ikke å utforme en TaqMan analysen for rs58920878, men SNPs rs8085824 og rs58920878 er i perfekt LD (r
2 = 1, D «= 1); derfor rs8085824 representerer også en proxy for rs58920878. Ingen statistisk signifikant sammenheng mellom uttrykk for de to andre gener innenfor 0,5 Mb rs4939827,
CTIF
eller
DYM
, og noen av de genotypede SNPs ble sett (data ikke vist).
Vi fant at tagSNP rs4939827 ikke viser en statistisk signifikant sammenheng med
SMAD7
uttrykk nivåer, selv om høyere uttrykk trend med T GWAS risiko allel (p = 0,1130) (figur 5). Men SNP rs8085824 C (mindre) allel viste en statistisk signifikant korrelasjon (
p
= 0,01197) med økt
SMAD7
uttrykk. Gitt at SNPs rs8085824 og rs58920878 er i perfekt LD, kan dette resultatet ekstrapoleres til å antyde en sammenheng mellom rs58920878 G (moll) allel og høyere nivåer av
SMAD7
uttrykk. Den rs6507874 T (mindre) allel (p = 0,07531) og rs6507875 C (mindre) allel (
p
= 0,1337) viste ingen statistisk signifikant sammenheng med økt
SMAD7
uttrykk. Legg merke til at den totale TCCG haplotype (moll haplotype) korrelert med høyere
SMAD7
ekspresjon i vev og i luciferase-analyser i forbindelse med fragmenter A1, A2 og A3, men er motsatt til den som kan ses for enhancer aktivitet av 2 kb-fragmentet i luciferase forsøk hvor fragmentet inneholdende TCCG haplotype (moll haplotype) korrelert med redusert enhancer aktivitet sammenlignet med fragment inneholdende CGTC haplotype.
Brett endring (FC) av SMAD7 ekspresjon ble målt ved normal kolon vevsprøver fra overvåkningskoloskopier. Rank baserte ikke-parametrisk analyse ble brukt for å estimere effekten av hver ekstra mindre allelet for rs6507874, rs6507875, rs8085824, og rs4939827 (additiv modell) på genuttrykk justert for kjønn, alder og rase. Tosidig
p
-verdier ble hentet fra en likelihood ratio test. Logg
2 (ΔΔCt) ble plottet som en funksjon av genotyper ved hjelp av et boksplott – prikkplott overlegg. Antall prøver er kjent under hver genotype. En statistisk signifikant sammenheng ble funnet for rs8085824.
Videre studier vil være nødvendig for å bestemme hvordan denne flerkomponent forsterkerkontrollene
SMAD7
genuttrykk under tykktarm utvikling og cellevekst, og til avgjøre hvorvidt de enkelte komponentene i forsterkeren handle uavhengig av hverandre.
Regulering av SMAD7 Enhancer
siden ønsket å bestemme forholdet mellom Enhancer aktivitet og BMP /TGFB signalering. Som nevnt i innledningen, SMAD7 fungerer som en viktig mediator av den negative tilbakekoblingssløyfe for både TGFp og BMP signalveier. Vi var interessert derfor å finne ut om enhancer A var en del av en tilbakekoblingssløyfe, blir mer aktiv som reaksjon på enten TGFβ1 eller BMP4 signalering. HCT-116 og SW480-celler ble serum-sultet over natten før 6 timer etter behandling med 100 pmol TGFβ1 eller BMP4, og 2 kb fragment A ble anvendt for å teste for luciferase-aktivitet. Etter behandling med TGFβ1, fragmenter inneholdende enten den CGTC (major) haplotype eller TCCG (moll) haplotype viste ingen statistisk signifikant endring i aktivitet i begge cellelinje (figur 6A). I motsetning til dette, ble etter behandling med BMP4, enhancer aktivitet av fragmentet inneholdende CGTC større haplotype øket 1,2 ganger i HCT-116 celler, og 1,5 ganger i SW480-celler (figur 6B). En økning i enhancer aktivitet ble også sett med fragmentet inneholdende det TCCG mindre haplotype i SW480-celler hvor BMP behandling resulterte i en 1,4 gangers økning i enhancer-aktivitet, men ikke i HCT-116-celler hvor ingen signifikant økning ble observert (
p
= 0,38) (figur 6B). Fordi DNA-fragmenter inneholdende begge haplotyper ble stimulert ved BMP4 i SW480 til en tilsvarende utstrekning (endring), postulerer vi at de 4 SNP i risiko haplotype ikke forstyrre selve BMP-responsive komponenter i enhancer. Men på grunn av underskudd i aktivitet med den mindre haplotypen, etter BMP4 stimulering, demonstrerer TCCG haplotype konstruksjonen fremdeles lavere enhancer aktivitet enn den CGTC haplotype uten BMP4 stimulering (figur 6C). Til sammen er disse dataene implisere at forsterkeren i en negativ tilbakekoblingssløyfe i respons til BMP aliserte, men ikke i den TGFp arm av signalkaskade.
(A) Enhancer-aktiviteten ble målt ved hjelp av luciferase-assay for fragment A som inneholdt den store (CGTC) og mindre (TCCG) haplotyper i serum sultet HCT-116 og SW480 celler inkubert med TGFβ1 i 6 timer. Prøvene blir plottet som et gangers endring i aktivitet i forhold til ikke-behandlede celler på samme plate. (B) Enhancer aktivitet ble stimulert av 6 timers BMP4 behandling for CGTC haplotype i HCT-116 (
p
= 4,14 × 10
-3) og SW480 celler (
p
= 1,22 × 10
-10). Den TCCG haplotype i fragment A viser lavere nivåer av stimulering, og bare i SW480 (
p
= 1,61 × 10
-6). (HCT-116
p
= 0,38). Effekt av BMP er plottet som gangers endring over ubehandlede prøver for hvert haplotype på samme plate. (C) Enhancer aktivitet sammenligning mellom CGTC og TCCG haplotyper følgende BMP4 behandling. Relativ luciferase aktivitet ble plottet for hver haplotype i HCT-116 og SW480 bruker samme eksperimentelle datasettet som (B).
Diskusjoner
Nylig har vår lab og andre begynt å vurdere virkningene av flere funksjonelle varianter i koblingsulikevekt (LD) som bidrar til sykdomsrisiko identifisert ved GWAS i stedet for en enkelt funksjonell variant [28]. For eksempel, på kromosom 11q23.1, vårt laboratorium identifisert to SNP’er i LD (R «> 2 = 1) forbundet med risiko CRC, en i en forsterker, og en i en toveis-promoteren, som viste allel-spesifikk aktivitet og korrelert med uttrykket nivåer av tre tidligere uncharacterized genet mål [16].