PLoS ONE: Identifisering av en potensiell Regulatory Variant for tykktarmskreft Risk Mapping til kromosom 5q31.1: En Post-GWAS Study

Abstract

Store genom-wide assosiasjonsstudier (GWAS) har etablert kromosom 5q31 0,1 som en mottakelighet locus for tykk- og endetarmskreft (CRC), som fortsatt var mangel på årsaks genetiske varianter. Vi søkte potensielt regulatoriske enkeltnukleotidpolymorfi (SNPs) i overlappingsområdet mellom koblingsulikevekt (LD) blokk av 5q31.1 og regulatoriske elementer spådd av histonmodifikasjonene, deretter testet deres tilknytning til CRC via en case-control studie. Blant tre kandidat vanligste variantene, fant vi rs17716310 tillagt betydelig (heterozygot modell: OR = 1,273, 95% konfidensintervall (95% KI) = 1,016 til 1,595,

P

= 0,036) og marginalt (dominerende modellen: OR = 1,238, 95% KI = 1,000 til 1,532,

P

= 0,050) øker risiko for CRC i en kinesisk befolkning inkludert 695 tilfeller og 709 kontroller. Denne varianten ble foreslått til å være regulerings endre aktiviteten til forsterker som styrer

PITX1

uttrykk. Bruke epigenetisk informasjon som kromatin immunoprecipitation-sekvensering (Chip-seq) data kan hjelpe forskere til å tolke resultatene av GWAS og finne årsaks varianter for sykdommer i post-GWAS æra

Citation. Ke J, Lou J, Chen X, Li J, Liu C, Gong Y, et al. (2015) Identifisering av en potensiell Regulatory Variant for tykktarmskreft Risk Mapping til kromosom 5q31.1: En Post-GWAS Study. PLoS ONE 10 (9): e0138478. doi: 10,1371 /journal.pone.0138478

Redaktør: Yifeng Zhou, Medical College of Suzhouuniversitetet, KINA

mottatt: 24 juni 2015; Godkjent: 29 august 2015; Publisert: 18.09.2015

Copyright: © 2015 Ke et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer

Finansiering:. National Natural Science Foundation of China (NSFC-81402744) for å JG. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

i Kina, tykktarmskreft (CRC) er den femte vanligste diagnosen kreft hos menn og den tredje hos kvinner, med anslagsvis 310,244 nye tilfeller og 149,722 dødsfall i 2011 [1]. Risikofaktorer for CRC inkluderer kosthold, fysisk inaktivitet, overvekt, røyking og drikking [2, 3], og det er godt etablert at genetiske faktorer spiller også en viktig rolle i etiologien av CRC [4, 5]. Nå har genom-wide assosiasjonsstudier (GWAS) og fine kartlegging forskere identifisert risiko varianter kartlegging til over 30 uavhengige mottakelighet loci av CRC i europeere og asiater [6-20]. Men aller fleste av disse variantene bor i intergeniske og intronic regioner, og den mest sannsynlige biologiske mekanismen som knytter dem til sykdommen er forskrifts [21].

Samler bevis viste at ikke-kodende genetiske varianter av risiko-forbundet loci kan utøve en virkning på genekspresjon ved å modulere aktiviteten av regulatoriske elementer [22], inkludert promotere, enhancere, isolatorer og lyddempere. Og forskjellige histoner i de flankerende nukleosomer på slike genomiske regioner har blitt oppdaget å bære karakteristiske post-translasjonelle modifikasjoner [23, 24]. For eksempel, er promotorer som regel markert ved H3K4me3 (histon H3 trimetylert ved lysin 4) og enhancere ved H3K4me1 (histon H3 monomethylated ved lysin 4), og enten er dessuten merket med H3K27ac (histon H3 acetylert ved lysin 27) ved aktivering [25- 28]. I dag er genome-wide kartlegging av histonmodifikasjonene oppnås ved kromatin immunoprecipitation-sekvensering (Chip-seq) mye brukt til å forutsi arrangører og forsterkere [29-32].

5q31.1 ble først kartlagt som en CRC mottakelighet locus av Jia et al [17] i både øst asiatiske og europeiske befolkninger, støttes videre av en annen større skala genetisk studie av Zhang et al [20] i Østasiater. Den mest sannsynlige involvert gen

PITX1

(paret lignende homeodomain 1) har blitt ansett for å være et tumorsuppressorgen knyttet til kreftutvikling av CRC [33, 34] og andre kreftformer [33, 35-38]. Imidlertid er den rapporterte sterkeste risiko polymorfisme rs647161 av uklar funksjon og ikke i noen kjente transkribert eller regulatoriske sekvenser. Så tenkte vi at rs647161 er ikke årsaks enkeltnukleotidpolymorfi (SNP) og de virkelige funksjonelle SNPs gjenstår å bli utvunnet i denne regionen. Samtidig, identifisere funksjonelle SNPs som overlapper vevsspesifikke regulatoriske elementer spådd av kromatin status som histonmodifikasjonene, har representert en kraftig tilnærming for å gå videre fra statistisk assosiasjon til funksjonalitet og kausalitet i etter GWAS genetiske undersøkelser [39-42].

i denne studien analyserte vi ChIP-Seq data for histonmodifikasjonene fra Encode prosjektet [29], utforsket potensielt regulatoriske varianter innenfor mottakelighet locus 5q31.1, og undersøkt kandidat vanlige SNPs foreningen med CRC risiko via en case-control studie i kinesiske befolkningen.

Materiale og metode

deltagerne

Det er totalt 695 CRC tilfeller og 709 kreftfrie kontroller ble rekruttert fra Tongji Hospital of Huazhong university of Science and Technology (Hust) mellom 2008 og 2011. Alle fag var urelaterte etniske Han-kinesere som bor i Wuhan City og områdene rundt. Inklusjonskriteriene for saker ble histopathologically bekreftet CRC uten tidligere kjemoterapi eller strålebehandling, og ingen begrensning til kjønn og alder. Kontrollene ble valgt tilfeldig fra en fysisk undersøkelse programmer på samme sykehus i samme tidsperiode som pasienter ble inkludert, var en del av, som også er involvert i våre gjennomtrengelige studier [43, 44], og ble tilstrekkelig tilpasset tilfeller i form av kjønn og alder (± 5 år). Heri, røykere ble definert som de som hadde røykt minst én sigarett per dag i 12 måneder eller lenger til enhver tid av sitt liv, mens ikke-røykerne ble definert som de som ikke hadde. Ved rekruttering, ble 5 ml perifer venøs blod fra hver gjenstand etter et skriftlig informert samtykke ble innhentet. Denne studien ble godkjent av etniske komité av Tongji Hospital of Huazhong University of Science and Technology

Valg av søker SNPs

Kandidat SNPs i denne studien er identifisert som vanlig (mindre allel frekvens, MAF 0.05) genetiske varianter finne i overlappingsområdet mellom 5q31.1 locus og CRC-spesifikke regulatoriske elementer som er merket med riktig epigenetiske merker. Det første vi lastet ned genotype informasjon av Han-kinesere i Beijing, Kina (CHB) som var 500kb oppstrøms og nedstrøms av tagSNP rs647161 fra HapMap database, og innspill som data i programvaren HaploView å oppnå koblingsulikevekt (LD) blokk rs647161 med kriteriene for

r

2

0.8, som ble definert som grensen for GWAS locus 5q31.1. For det andre kjøpte vi ChIP-Seq data av forskjellige histonmodifikasjonene produsert i to CRC cellelinjer HCT116 og Caco2 fra UCSC database integrere med kode data (S1 Table), deretter ekstrahert omfanget av sine signaltopper står for regulatoriske elementer, hvor vi krysses to replikering versjoner av samme datasett (kryss) og forent alle forskjellige datasett (union). For det tredje, basert på dbSNP database, vi plukket ut SNPs med MAF 0,05 i CHB som ligger i det overlappende området mellom nevnte LD blokk og topper. Til slutt, tre SNPs, rs2193941, rs17716310 og rs7703385 ble valgt som kandidat SNPs for neste trinn genotyping.

Genotyping

Genomisk DNA ble ekstrahert fra perifert blod leukocytter ved hjelp RelaxGene Blood System DP319-02 (Tiangen, Beijing, Kina) med henvisning til produsentens instruksjoner. Alle SNPs ble genotypet med TaqMan SNP genotyping analyse (Applied Biosystems, Foster City, CA, USA) på en 7900HT Fast Real-Time PCR System (Applied Biosystems, Foster City, CA, USA). 5% dupliseres prøvene ble tilfeldig valgt å vurdere reproduserbarheten for kvalitetskontroll, med en konkordans hastighet på 100%.

Statistical Analysis

t-test og χ

2 test ble brukt til anslå forskjeller i variabler og utdeling av genotyper mellom saker og kontroller. Hardy-Weinberg likevekt (HWE) ble evaluert ved bruk av godhet-of-fit χ

2 test i kontroller. Styrken i sammenhengen mellom hver SNP og CRC risiko ble målt ved odds ratio (OR) og den tilsvarende 95% konfidensintervall (95% KI). For å unngå antakelsen av genetiske modeller, heterozygot, homozygote, dominante, recessive og additive modeller ble analysert. Den statistiske testen makt hver SNP ble beregnet ved POWER v3.0 (https://www.mds.qmw.ac.uk/stat-gen/dcurtis/software.html). Og ORS og tilsvarende 95% CIS, justert etter kjønn, alder og røykestatus ble beregnet ved ubetinget multivariate logistisk regresjon. Statistiske analyser ble utført ved anvendelse av SPSS Software v20.0 (SPSS, Chicago, Illinois, USA). Potensialet gen-miljø og SNP-SNP interaksjoner ble evaluert av et par-klok analyse i henhold multiplikative [45] og additive samhandlingsmodeller [46].

P

verdier for multiplikativ interaksjon ble beregnet ved hjelp av en multiplikativ interaksjonsledd under multivariate logistisk regresjonsmodell i SPSS programvare. Og

P

verdier for additiv interaksjon ble vurdert av en bootstrapping test av godhet-of-fit bruker Stata v11.0 (Stata Corporation, College Station, TX). Alle

P

verdiene var tosidig med statistisk signifikans kriteriene for

P

0,05

Resultater

Valg av søker SNPs

Området GWAS mottakelighet loci 5q31.1 vi definert av LD var kromosom 5. 134467220-134518445. Etter en tre-trinns bioinformatikk analyse, tre vanlige polymorfismer, rs2193941, rs17716310 og rs7703385 som ligger innenfor toppene histone modifisering chip-Seq data generert fra HCT116 eller Caco2, ble funnet i over loci (tabell 1).

Befolknings Kjennetegn

695 nye situasjoner og 709 frekvens-matchet kontroller ble inkludert i studien. Som vist i tabell 2, andelen menn var 58,42% i saker sammenlignet med 56,42% i kontrollgruppen (

P

= 0,449, Pearson χ

2 = 0,570). Gjennomsnittsalder og tilhørende standardavvik var 60.16 ± 12,26 år for saker og 59.80 ± 13,18 år for kontroller (

P

= 0,598 av t-test), og det var ingen statistisk signifikante forskjeller mellom saker og kontroller i forhold til alder distribusjon (

P

= 0,305, Pearson χ

2 = 3,625) blant fire kategorier (≤50, 51-60, 61-70 og ≥71). Som forventet ble det flere røykere presentert i de tilfeller enn i kontrollene (35,25% versus 29,62%;

P

= 0,022, Pearson χ

2 = 5,257), med tanke på at røyking var en veletablert risikofaktor for CRC (2).

Association Analysis

Alle tre SNPs, rs2193941, rs17716310 og rs7703385, var i HWE (

P

HWE = 0,55, 0,17 og 0,55), og den statistiske testen kraft var 95,9%, henholdsvis 95,3% og 95,5%. Genotypen distribusjoner av undersøkte polymorfismer ble vist i Tabell 3. I tilknytning analyse, bare rs17716310 viste signifikant sammenheng med CRC henhold heterozygote modell, mens de andre to SNPs rs2193941 og rs7703385 ga ikke noe statistisk bevis for forhold til CRC risiko.

Under multivariate logistisk regresjonsmodell justert for kjønn og alder, personer med AC genotype av rs17716310 hadde en signifikant økt risiko for CRC (OR = 1,273, 95% KI = 1,016 til 1,595,

P

= 0,036 ) sammenlignet med de med AA homozygot. En dominerende modellen ble utført for å forbedre statistisk styrke ved å kombinere AC med CC til en C-carrier gruppe (AC pluss CC), og det viste at allelet C bærere fikk en marginal effekt på CRC følsomhet (OR = 1,238, 95% KI = 1,000 til 1,532,

P

= 0,050). Imidlertid ble ingen vesentlig risiko for at varianten C-allelet sett i homozygot, recessive eller additiv modell. Som for rs2193941 og rs7703385, var det ingen positive resultater under alle genetiske modellene vi studerte.

Analyse av koblingsulikevekt

Vist i figur 1, tre undersøkte SNPs var i høy LD med hverandre ( rs2193941 og rs17716310,

r

2

= 0,89; rs17716310 og rs7703385,

r

2

= 0,97; rs2193941 og rs7703385,

r

2

= 0,90) i vår studie. På den annen side ble rs2193941, rs17716310 og rs7703385 oppdaget å være i høy LD med tagSNP rs647161 (

r

2

= 0,83,

r

2

= 0,88,

r

2

= 0,88, henholdsvis) i CHB befolkning på 1000 genomer Prosjekt fase 3.

Interaction Analysis

Tabell 4 detaljerte resultatene av interaksjonsanalyse mellom lovende SNP rs17716310 og røyking, hvor vi observerte en signifikant interaksjon (

P

mult = 0,013) i multiplikativ betingelser. Når vi undersøkte parvise samspill mellom tre søker variasjoner, fant vi ingen positive resultater i henhold til både multiplikativ og additiv modell (S2 tabell).

Diskusjoner

I post-GWAS era , identifisere spesifikke funksjonelle genetiske varianter som faktisk står for fenotype er hovedhensikten og utfordring, og regulatoriske elementer av genomet kan hjelpe. Ved hjelp av epigenetiske merker innhentet fra relevante celletyper, vi søkte potensielt funksjonelle SNPs som ble plassert i putatively regulatoriske elementer, og validert deres tilknytning til CRC i en uavhengig befolkningen.

I denne studien, gjennom å kombinere GWAS locus 5q31.1 og lovende regulatoriske regioner spådd av histonmodifikasjonene i CRC cellelinjer, vi vist ut tre vanligste variantene, rs2193941, rs17716310 og rs7703385, i deres overlapper hverandre. Etter at vi gjennomførte en forening studie i en kinesisk befolkning som inneholder 695 CRC tilfeller og 709 helsekontroller, fant vi betydelig og marginal effekt av rs17716310, som var i LD med tagSNP rs647161 og kanskje interaksjon med røyking.

Funnene førte oss å anta rs17716310 påvirket CRC risikoen ved å endre aktiviteten til regulatoriske elementer som styrer

PITX1

uttrykk. Ligger innenfor et område av genomet som viser kromatin modifikasjoner H3k4me1 og H3k27ac, er rs17716310 svært foreslått å være en regulerende varianter som tilhører en aktiv forsterker [47, 48]. Det er ca 107 kb oppstrøms av det nærmeste genet

PITX1

, som har blitt rapportert som en tumor suppressor downregulating RAS vei [33], aktivere

TP53 product: [49] og tuning telomerase aktivitet [ ,,,0],50]. I tillegg er lavere

PITX1

ekspresjon ble funnet i humane kreft vevsprøver og cellelinjer [35-37], og assosiert med dårlig overlevelse i CRC-pasienter [51]. På den andre siden, i en elektronisk database HaploReg [52], ble rs17716310 angitt for å endre bindingsmotiv av p300 som fungerer som en transkripsjonen coactivator og histon acetyltransferase regulering av gen-ekspresjon ved ombygging kromatin [53]. Varianten kan endre bindingssete på noen transkripsjonsfaktor (e), og påvirker interaksjonen mellom denne aktive enhancer og nedstrøms promotoren av

PITX1

derfor svekke transkripsjon og ekspresjon av det undertrykkende gen, og følgelig lette CRC tumorigenicity og mottakelighet. Som for interaksjon med røyking funnet i multiplikativ modell, kan det være på grunn av forholdet mellom røyk status og RAS vei,

TP53 Hotell og telomerase aktivitet [54-57] der

PITX1

var involvert. Imidlertid må forutsetningen ytterligere funksjonelle eksperimenter som skal verifiseres.

Bruk av epigenetisk biofeature informasjon som histone modifisering Chip-seq data for å identifisere kandidatforsterkere har representert et nyttig verktøy for å identifisere kandidat funksjonelle SNPs i regulatoriske regioner [ ,,,0],58, 59], og databaser som UCSC og Encode har gitt enkel tilgang til enorme mengder relevante data. Integrering nylig oppstått epigentics og tradisjonell molekylær epidemiologi kan være en effektiv metode for å hjelpe tolke GWAS resluts og oppdage årsaks varianter for sykdommer i post-GWAS studier. Bruk av lignende strategi med andre CRC GWAS regioner skal bidra til dypere forståelse av CRC risiko.

Likevel bør flere begrensninger bli anerkjent her. Først strategien for å hente kandidat polymorfismer avhengig prediksjon fra Chip-seq data for to CRC cellelinjer, som ikke var strenge nok til å definere eksakte regulatoriske elementer, og ikke omfattende nok til å oppdage alle funksjonelle SNPs inne. For det andre utvalgsstørrelsen av våre case-control studien var relativt liten. Tredje, utilstrekkelig miljø og klinisk informasjon begrenset oss til å undersøke samspillet mellom genet og andre faktorer. Forth, mangler av funksjonelle eksperimenter, er biologisk realitet under statistisk signifikant sammenheng vi rapporterte usikker.

I sammendraget, oppdaget vi en trolig regulatorisk SNP i høy LD med GWAS tagSNP som er forbundet med CRC risiko i kinesiske befolkningen . Systematiske undersøkelser på mer mottakelighet loci med større utvalgsstørrelser og oppfølgings funksjonelle analyser er garantert å identifisere årsaks varianter og utdype den biologiske mekanismen av genetisk etiologi.

Hjelpemiddel Informasjon

S1 Table. Chip-seq datasett ned fra UCSC integrere kode data

doi:. 10,1371 /journal.pone.0138478.s001 plakater (DOC)

S2 Table. Interaksjonsanalyse mellom rs17716310 og rs2193941, rs17716310 og rs7703385, rs2193941 og rs7703385

doi:. 10,1371 /journal.pone.0138478.s002 plakater (docx)

Legg att eit svar