PLoS ONE: genetisk polymorfisme av TGFB1, TGFBR1, SNAI1 og TWIST1 er forbundet med livmorkreft Følsomhet i kinesiske Han Women

Abstract

Endometriekreft (EC) er en kompleks sykdom som involverer flere gen-gen og generer miljø interaksjoner. TGF-β signale spiller sentrale roller i EC utvikling. Denne studien hadde som mål å undersøke om genetisk polymorfisme av TGF-β signale beslektede gener

TGFB1

,

TGFBR1

,

SNAI1 Hotell og

TWIST1

bidra til EC mottakelighet. Bruke TaqMan Genotyping analysen, ble 19 tagging-SNPs av disse fire genene genotypet i 516 EC tilfeller og 707 kontroller blant kinesiske Han kvinner. Logistisk regresjon (LR) viste at de genetiske varianter av

TGFB1

rs1800469,

TGFBR1

rs6478974 og rs10733710,

TWIST1

rs4721745 ble assosiert med redusert EC risiko, og disse fire loci viste en doseavhengig effekt (

P

trend 0,0001). Klassifisering og regresjon treet (CART) viste at kvinner som bærer både genotyper av

TGFBR1

rs6478974 TT og rs10512263 TC /CC hadde høyest risiko for EF (AOR = 7,86, 95% CI = 3,42 til 18,07,

P

0,0001). Multifaktor dimensionality reduksjon (MDR) viste at

TGFB1

rs1800469 pluss

TGFBR1

rs6478974 var den beste interactional modellen for å oppdage EC risiko. LR, CART og MDR alt avslørt at

TGFBR1

rs6478974 var den viktigste beskyttende locus for EC. I haplotype forening studie,

TGFBR1

haplotype CACGA bærer viste den laveste EC risiko blant kvinner med lengre menarche-første full sikt graviditet intervaller (11 år) og BMI˂24 (AOR = 0,39, 95% CI = 0,17 -0,90,

P

= 0,0275). Disse resultatene tyder på at polymorfismer i

TGFB1

,

TGFBR1

,

SNAI1 Hotell og

TWIST1

kan modulere EC mottakelighet, både hver for seg og selskapsmessig.

Citation: Yang L, Wang YJ, Zheng LY, Jia YM, Chen YL, Chen L, et al. (2016) genetisk polymorfisme av

TGFB1

,

TGFBR1

,

SNAI1 Hotell og

TWIST1

er forbundet med livmorkreft Følsomhet i kinesiske Han kvinner. PLoS ONE 11 (5): e0155270. doi: 10,1371 /journal.pone.0155270

Redaktør: Joseph Devaney, Barnas National Medical Center, Washington, USA

mottatt: 20 november 2015; Godkjent: 26 april 2016; Publisert: 12. mai 2016

Copyright: © 2016 Yang et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. All relevant data er i avisen og dens saksdokumenter fil

Finansiering:. Denne studien ble støttet av Natural Science Foundation National of China (nr 81171961 og nr 81321003) og Open prosjekt Key Laboratory of Genomic og Precision Medicine, Chinese Academy of Sciences

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Endometriekreft (EC) er en av de mest. vanligste gynekologiske kreftformer over hele verden. Ifølge National Central Kreftregisteret i Kina, var forekomsten av EF var ca 18,5 per 100.000 urbane kvinner i 2011 [1]. Lengre levetid østrogen eksponering som tidlig menarche, sen overgangsalder, nulliparity og postmenopausal østrogenbruk, har sammenheng med økt EC risiko, noe som indikerer at østrogen kan kjøre livmorkreftutvikling. Tradisjonelt er det tre undertyper av EC preget av biologiske og kliniske kurs: hormonelt drevet Type I med endometrioid histologi, Type II med ikke-endometrioid serøs eller klare celler, og familiær aggregert EC [2]. Den økende EC utbredelsen de siste årene fremhever viktigheten for å utvikle strategier for risikoestimering og forebygging [1].

Det er velkjent at genetiske varianter som enkeltnukleotidpolymorfi (SNPs) spiller viktige roller i kreft mottakelighet . Bidragene fra genetiske variasjoner eller mutasjoner til kreftrisiko i en befolkning er avhengig av sin frekvens og pene [3]. Selv om høy penetrant og lav hyppige mutasjoner som

TP53

,

PTEN

gi høy risiko for sjelden familiær aggregert EC [4, 5], det store flertallet av EU er sporadisk og involvere polygenes, noe som indikerer at vanlige polymorfismer spille dominerende rolle i kreftutvikling på grunn av sin høye frekvens [4].

Genome-wide forening studie (GWAS) er fremdeles dyre, så mange assosiasjonsstudier på SNPs med EC risiko har vært utført i sammenheng med kandidat gener, inkludert gener som regulerer DNA-skade reparasjon, steroid og kreftfremkallende metabolisme, cellesykluskontroll og apoptose [2]. Den epiteliale-til-mesenchymale overgang (EMT), en viktig prosess i tumorprogresjon, fremmer tumorcelle-invasjon fra det primære brennpunktene til omgivende vev. Hittil har mange molekyler er validert for å utløse epithelial dedifferentiation og EMT, slik som de som er involvert i TGF-β signalering samt EMT-relaterte transkripsjonsfaktorer sneglen og Twist [6, 7]. Canonical formidling av TGF-β1 (kodet av

TGFB1

) signalering er via TβRI (kodet av

TGFBR1

) og TβRII å danne SMAD transkripsjons komplekser, og dermed fører til rask aktivering av transkripsjonsfaktorer Snail og Twist (kodet av

SNAI1 Hotell og

TWIST1

) [8, 9].

kimcellelinje mutasjoner i signale komponenter av TGF-β familie har blitt beskrevet å resultere i maligniteter sammen med andre arvelige lidelser. Polymorfisme assosiasjonsstudier i genene til denne signalveien er i hovedsak fokusert på risikoen for brystkreft [10-12], eggstokkreft [13] eller tykktarmskreft [14]. Inntil nå har det vært få studier for å utforske sammenslutning av germline varianter i TGF-β relaterte gener med EC blant kinesiske Han befolkningen. Vi antok at felles genetisk polymorfisme av

TGFB1

,

TGFBR1

,

SNAI1 Hotell og

TWIST1

kan påvirke EC mottakelighet kinesiske Han kvinner.

Materialer og metoder

Etikk uttalelse

Denne studien ble godkjent av Peking University IRB (referansenummer. IRB00001052-11029). Skriftlig samtykke ble innhentet fra alle kontrollprøver. EC pasientens genomisk DNA ble ekstrahert fra arkivformalinfiksert parafin-embedded normal egglederen vev. Fordi kontaktinformasjon med EC pasienter som ble behandlet i sykehusene før 2011 var ikke klart, PKU IRB godkjent vår søknad om å frafalle informert samtykke for de arkiverte EU-prøver samlet før april 2011. Denne studien bare brukt denne delen av prøvene. Alle data /prøvene ble brukt anonymt.

Study befolkningen

I alt 516 tilfeller med patologiske diagnosen livmor adenokarsinom ble rekruttert fra Peking University Third Hospital, Beijing Cancer Hospital og Beijing sykehus mellom 1999 og 2011. Pasienter med historie av kreft, spredning kreft fra andre organer, og strålebehandling eller cellegift historie ble ekskludert fra studien. Den epidemiologisk informasjon inkludert alder, kroppsmasseindeks (BMI), alder ved menarke /overgangsalder /primiparity, røyking historie og familiehistorie med kreft i førstegradsslektninger ble samlet inn. De støtteberettigede 707 kontroller ble tilfeldig valgt fra kvinner som deltok i en community-baserte screeningprogram for ikke-smittsomme sykdommer gjennomført i Beijing mellom 2011 og 2012. Utvalgskriteriene inkluderte ingen historie av kreft, kinesiske Han etnisk bakgrunn og frekvens-tilpasset tilfeller ved 5 års alder. Alle kontroller gitt samme epidemiologisk informasjon som vi samlet inn fra sakene. Egenskapene til de 707 kontrollene og de 516 tilfellene er oppsummert i tabell S1. Denne studien ble godkjent av etikkomiteen av Peking University Health Science Center.

SNPs utvalg

Vi valgte merking-SNPs (tSNPs) ved hjelp Haploview v.4.2 program basert på kinesisk Beijing befolkning (CHB) data fra HapMap Prosjekt fase I, II og III fusjonert database (https://hapmap.ncbi.nlm.nih.gov/). Alle tSNPs med en mindre allel frekvens (MAF) ≥5% ble identifisert og delt i binger i henhold til r

2 koblingsulikevekt (LD) statistikk (terskel ≥0.8). En maksimalt informativ tSNP ble deretter valgt fra hver kasse, og disse tSNPs kunne fange opp alle kjente vanlige genetiske varianter innen hele genet [15]. For

TGFB1

, syv tSNPs spenner 5 kb til hver flanke ble identifisert, disse blir rs1800469, rs2241716, rs4803455, rs747857, rs12983047, rs10417924 og rs12981053. For

TGFBR1

, minimum sett av fem tSNPs, rs10988706, rs6478974, rs10512263, rs10733710 og rs334348, alt fra 5 kb oppstrøms til 5 kb nedstrøms, ble valgt. For

SNAI1

, tre tSNPs spenner 2kb til hver flanke ble valgt, disse blir rs6125849, rs4647959 og rs6020178. For

TWIST1

, fire vanlige tSNPs dekker 2kb flankerende sekvens ble identifisert, disse blir rs2285682, rs2285681, rs4721746 og rs4721745.

DNA og genotyping analysen

Genomisk DNA for kontroller ble isolert fra perifere blod leukocytter, mens tilfeller «genomisk DNA ble ekstrahert fra formalin-fikserte parafininnstøpte normal egglederen vev. Genotyping ble utført med ABI 7900HT

® Real-Time PCR System (Applied Biosystems, Foster City, California) med TaqMan

® analysen i samsvar med produsentens anvisninger. Primere og prober (fami- og VIC–merket) ble levert av ABI inkorporering og PCR-reaksjonssystemet var den samme som tidligere beskrevet [16]. Kort sagt ble alle analysene utført i 384-brønns plater med negative og positive kontroller. Platene ble forseglet og oppvarmet ved 95 ° C i 5 min, deretter underkastet 45-50 cykler av 92 ° C i 15 s og 60 ° C i 1 min. Data fra platene mislykkes i mer enn 15% prøver ble ekskludert fra analysen. Minst 1% av prøvene ble duplisert tilfeldig i hver SNP genotyping analyse, og samsvar mellom duplikater var mer enn 99%.

Statistisk analyse

Forskjeller i fordelingen av demografiske karakteristika og valgt variabler mellom kontroller og saker ble beregnet ved tosidig Pearsons χ

2 test eller Student t test, der det er hensiktsmessig. Hardy-Weinberg likevekt (HWE) ble evaluert i kontrollene ved hjelp av godhet-of-fit χ

2 test innenfor hver tSNPs. The D «verdier av LD tomter ble produsert ved hjelp av Haploview programmet. Den forventning-maksimering (EM) algoritme ble anvendt for å evaluere den mest sannsynlige haplotype med maksimal sannsynlighet estimering blant strøm befolkningen. En tosidig χ

2 test ble brukt for å sammenligne forskjeller i fordelingen av genotyper og alleler mellom saker og kontroller. Hver genotype ble vurdert i forhold til additiv (co-dominant), dominant og recessive modeller av arv. Dessuten ble Cochran-Armitage trend test utført for å estimere sammenhengen mellom EF risiko og allel dose i hver tSNP (

P

trend). Odds ratio (OR) og 95% konfidensintervall (KI) ble vurdert ved hjelp av univariat og multivariat ubetinget logistisk regresjon (LR), med justering for BMI, alder menarche /primiparity, menopause status, antall barnefødsler og familiehistorie med kreft. Statistisk signifikans ble definert som

P

0,05. En Bonferroni-korrigert

P

verdi ble gjennomført i enkelt tSNPs og haplotype /diplotype forening analyse. De potensielle gen-miljø interaksjoner mellom

TGFBR1

haplotype CACGA og kliniske risikofaktorer (østrogen eksponering, familiehistorie med kreft og BMI) ble vurdert av LR i lagdelt befolkningen. All statistikk ble analysert ved SAS programvare (v.9.1, SAS Institute, Cary, NC).

Klassifisering og regresjon treet (CART) analyse ble utført for høy ordre gen-gen-interaksjoner ved bruk av SPSS programvare (v. 19,0, SPSS Inc., Chicago, IL, USA) for å bygge et beslutningstre via rekursiv partisjonering. Beslutningen tre startet med en rot node som inneholdt det totale utvalget og delt inn i to underordnede noder. Kløyving fortsatte til terminalen nodene hadde ingen påfølgende statistisk signifikante splittelse eller nådd et forhånds antatt minimumsstørrelse, og deretter terminal undergruppene ble videre analysert. Saken ble beregnet for hver terminal node og foreningen av undergrupper med EC risikoen ble evaluert ved LR-analyse, ved hjelp av undergruppen med minst andel av tilfellene som referanse. ORS og 95% KI ble justert som nevnt ovenfor.

Multifaktor dimensionality reduksjon (MDR) analyse ble utført for å identifisere høy ordresamhandlingsmodeller som var knyttet til EF risikoen ved hjelp av open-source MDR-programvare (v.2.0 beta 8.4, https://www.epistasis.org) [17]. Statistisk signifikans ble bestemt ved bruk permutasjon testing i MDRpt (v.1.0 beta 2.0). MDR analyse kollapset multi-dimensjonale data i et enkelt uavhengig dimensjonal variabel med to nivåer (høy og lav risiko) ved hjelp av forholdet mellom antall tilfeller til antall kontroller, og derved reduseres multiple dimensjonale data inn i en dimensjon og tillatt påvisning av vekselvirkninger i relativt små utvalgsstørrelser. Den nye en-dimensjonal fler locus genotype variabel ble evaluert for sin evne til å klassifisere og undersøke sykdomsstatus ved kryssvalidering og permutasjon test. Den beste kandidaten samhandlingsmodell ble ansett som den med maksimal testing nøyaktighet og kryssvalidering konsistens (CVC). For bedre å bekrefte og visualisere samhandlingsmodeller, videre bygde vi en entropi-basert samhandling dendrogram. Dette vil gjøre det mulig loci som sterkt samhandle med hverandre på nett tett sammen på grenene på treet, og de med svak samhandling på nett fjernt fra hverandre. MDR 1000 ganger permutasjon resultater ble ansett som statistisk signifikant på

P

0,05. Den Conjoint effekten av variablene i den beste modellen ble vurdert av LR analyse.

Resultater

Kjennetegn på studiepopulasjonen

Det som kjennetegner befolkningen ble her beskrevet i S1 tabell. Kontrollene og saker syntes å være tilstrekkelig matchet på alder (

P

= 0,7528). Sakene, som forventet, hadde høyere BMI (

P

0,0001), tidligere alder av menarche (

P

0,0001) og senere alder av menopause (

P

= 0,0002) sammenlignet med kontrollene. I tillegg er andelen førstegangsfødende kvinnene pasienter var betydelig høyere enn i kontrollgruppen (

P

0,0001). EC pasienter var mer sannsynlig å ha familiehistorie med kreft i førstegradsslektninger (

P

= 0,0464). Disse variabler med signifikante forskjeller mellom saker og kontroller ble brukt i multivariate LR modeller for å ytterligere justere for eventuelle konfunderende effekt på foreningen av utvalgte genetiske varianter med risiko for EF.

LD grad mellom tSNPs

genotypefrekvensene for utvalgte 19 tSNPs var konsekvent i samsvar med de forventet av HWE kontroller (

P

˃0.05, S2 tabell). For vår studie ble haplotype blokker rekonstruert i saker og kontroller, samt i HapMap CHB befolkningen basert på D «verdi (fig 1). Det var noen forskjeller i SNPs «parvise LD mellom kontroller og saker. For

TGFB1

ble tre LD blokker rekonstruert i sykdomsfrie deltakere. For

TGFBR1

samt

SNAI1

, alle valgte tSNPs ble rekonstruert i en high-LD blokk i kontroller. For

TWIST1

, bare en haplotype blokken ble rekonstruert, der rs4721746 og rs4721745 ble ekskludert fra analysen fordi deres MAFs var lavere enn 5%.

Verdien i hver rute indikerer parvise LD mellom tSNPs (målt som D «× 100, 10 betyr 0,10, 1 betyr 0,01). Den skyggelegging med en mørk grå til hvit gradient reflekterer høyere til lavere LD verdier.

Association of enkelte tSNPs i

TGFB1

,

TGFBR1

,

SNAI1

,

TWIST1

med EC risiko ved LR analyse

Som vist i tabell 1, tosidige χ

2 test indikerte statistisk forskjeller genotypefrekvensene mellom saker og kontroller i polymorfismer

TGFB1

rs1800469 (CT),

TGFBR1

rs6478974 (TA),

TGFBR1

rs10512263 (TC),

TGFBR1

rs10733710 (GA),

TWIST1

rs4721746 (CA) og

TWIST1

rs4721745 (CG) (

P

0,0001, 0,0001

P

= 0,0059, 0,0016, 0,0045 og 0,0430, henholdsvis). Også multivariat LR viste at

TGFB1

rs1800469,

TGFBR1

rs6478974 og rs10733710, og

TWIST1

rs4721745 var beskyttende loci for EC mottakelighet henhold dominante eller recessive modeller, mens

TWIST1

rs4721746 var en risiko locus (tabell 1).

TGFBR1

rs6478974 fortsatt betydelig under en additiv og dominerende modellene etter påføring av strenge Bonferroni korreksjon (Bonferroni-korrigert

P

0,05). Andre tSNPs viste ikke statistisk signifikans i multivariat analyse (S3 tabell).

Vi har utforsket ytterligere kombinasjonseffekter mellom de nevnte fire beskyttende polymorfismer ved å sette opp to binære (1, 0) dummyvariabler. Først vurderte vi den relative betydningen av de fire verne tSNPs i deres utpekte modeller. Den justerte OR verdi indikerte at disse fire beskyttende tSNPs påvirket EC mottakelighet på et tilsvarende nivå (S4 tabell). Deretter personer ble kategorisert i fem grupper basert på antall verne genotyper de bar, og de uten beskyttende genotyper ble definert som referansegruppe. Analysen av kombinasjonseffekter indikerte at justert OR av EC for personer som bærer to beskyttende genotyper var 0,41 (95% CI = 0,23 til 0,74,

P

= 0,0029). Ko-eksisterende tre eller fire beskyttelses genotyper vesentlig redusert mottakelighet av EC i en nesten tilsvarende grad (tabell 2). Også de beskyttende genotyper trådte i kraft på en doseavhengig måte (

P

trend 0,0001). (Tabell 2)

Association of high-ordens samspill mellom genetiske varianter med EC risiko ved KJØP analyse

CART er en binær rekursiv partisjonering metode som gir et beslutningstre for å identifisere undergrupper av fagene høyere risiko [18]. Fig 2 viste trestrukturen. Treet initiert fra den totale studiepopulasjonen (node ​​0) og inneholdt fem terminalnodene i finalen trestrukturen.

TGFBR1

ble identifisert i den første splitting node, og

TGFBR1

rs6478974 TA /AA genotype bærere hadde minst andel av EU-saker (35,7%), noe som indikerer at rs6478974 locus var sterkest utsatt faktor for EF risiko blant de undersøkte polymorfismer. Da treet kommet sammen node 1 med de store allel homozygote av SNP rs6478974. Vi utpekt node 2 som referanse node, fordi kvinner i denne noden (med

TGFBR1

rs6478974 TA /AA genotyper) hadde lavest EC risiko. Dette trestruktur avdekket at personer huse

TGFBR1

rs6478974 TT,

TGFBR1

rs10512263 TT,

TGFB1

rs4803455 CC og

TGFBR1

rs10733710 GG genotyper (node ​​7 ) hadde signifikant høyere risiko beregnes ved multivariate LR analyse (AOR = 3,71, 95% CI = 2,14 til 6,43,

P

0,0001), og kvinner med både genotyper av

TGFBR1

rs6478974 TT og

TGFBR1

rs10512263 TC /CC (node ​​4) formidlet den høyeste predisposisjon for EC risiko i vår befolkning (AOR = 7,86, 95% CI = 3,42 til 18,07,

P

0,0001 tabell 3).

Association of high-ordens samspill mellom genetiske varianter med EC risiko av MDR analyse

Vi søkte MDR-metoden, en parametrisk og genetisk modell- gratis analyse, for å identifisere samhandlingsmodeller. Det beste en-faktor modellen genereres av MDR for å undersøke EC risikoen var

TGFBR1

rs6478974 (testing nøyaktighet 0,561, CVC 9/10, tabell 4), som var i samsvar med den første splitting node av CART analyse. De to-faktor modell inkludert både

TGFB1

rs1800469 og

TGFBR1

rs6478974 var den beste samhandlingsmodell, som ga maksimal CVC på 10/10 og det høyeste testing nøyaktigheten av 0,589. Den beste tre-faktor modell inkludert

TGFB1

rs1800469,

TGFBR1

rs6478974 og

TGFBR1

rs10733710 og de fire-faktor modell bestående av

TGFB1

rs1800469,

TGFBR1

rs6478974,

TGFBR1

rs10512263 og

TGFBR1

rs10733710 hadde høyere testing nøyaktighet sammenlignet med en-faktor modellen (0,584, 0,575, henholdsvis), men SVK ble redusert (7/10, 6/10, henholdsvis). All interaksjon permutasjon

P

verdien var mindre enn 0,05. Samspillet Dendrogrammet viste at

TGFB1

rs1800469 og

TGFBR1

rs6478974 hadde den sterkeste synergistisk interaksjon (svart linje), som også samhandlet med

TGFBR1

rs10733710 (mørk grå linje). Videre

TGFBR1

rs10512263 hadde svak interaksjon med

TGFBR1

rs10733710,

TGFB1

rs1800469 og

TGFBR1

rs6478974 (lys grå linje, figur 3). For den kombinerte effekten av

TGFB1

rs1800469 og

TGFBR1

rs6478974 i beste samhandlingsmodell identifisert ovenfor, LR analyse viste at justert OR av EF var 0,43 (95% CI = 0,27 til 0,69,

P =

0,0003, data ikke vist). Oppsummeringen av disse tre tilnærminger for single-locus analyse ble vist i S5 tabell.

loci som sterkt samhandle med hverandre vises tett sammen på grenene på treet (svart linje), mens loci med svak interaksjon synes fjernt fra hverandre (grå linje).

Association of haplotyper og diplotypes i

TGFB1

,

TGFBR1

,

SNAI1

,

TWIST1

med EC risiko ved LR analyse

for ytterligere å utforske den beskjedne etiologiske effektene av polymorfismer på EC følsomhet, ble haplotype rekonstruert som surrogat for å gi høyere oppløsning og potensielt større statistikk makt [ ,,,0],16]. I vår studie,

TGFB1

haplotyper (rs1800469 og rs2241716) med over 1% frekvens ble testet separat mot de vanligste haplotyper, og de resterende sjeldne haplotyper i blokken (frekvens 1%) ble ikke analysert. Den haplotype CG i blokk 1 var assosiert med økt EC risiko i forhold til haplotype TG ved univariate LR algoritme (OR = 1,60, 95% CI = 1,32 til 1,95,

P

˂0.0001, tabell 5), og diplotype CA-CG, som bærer risiko haplotype CG, økt ca 62% av EC risiko i forhold til den vanligste diplotype TG-CA (AOR = 1,62, 95% CI = 1,08 til 2,43,

P

= 0,0187) . De forble ikke signifikant etter Bonferroni korreksjon. For

TGFBR1

, CACGA, husing en beskyttende locus rs6478974, kan redusere ca 42% av EC risiko (AOR = 0,58, 95% CI = 0,43 til 0,77,

P

= 0,0003). Selv etter justering for Bonferroni-korrigert multippel testing, haplotype var fremdeles signifikant assosiert med EC risiko (Bonferroni-korrigert

P

0,05). Videre diplotype CACGA-CTTAA, som inneholder en beskyttende haplotype CACGA var også assosiert med redusert EC risiko sammenlignet med de mest vanlige diplotype TTTGG-CACGA (AOR = 0,35, 95% CI = 0,18 til 0,66,

P

= 0,0012), med en Bonferroni korrigert

P

0,05 (tabell 5). Haplotyper i

SNAI1 Hotell og

TWIST1

var ikke forbundet med EC mottakelighet (S6 tabell).

Association of samspill mellom genetiske varianter og miljøfaktorer med EC risiko

Gitt at langvarig eksponering for østrogen, kreft historie i førstegradsslektninger og overvekt er kliniske EF risikofaktorer [19], vi gjennomførte analyser stratifisert befolkningen å utforske om sammenslutninger av genetiske varianter med EC risiko var modifisert ved disse kliniske risikofaktorer. Tabell 6 viser at kvinner skjuler

TGFBR1

beskyttende haplotype CACGA hadde en enda lavere EC risiko blant de med lengre menarche-FFTP intervaller (11 år [20], AOR = 0,49, 95% CI = 0,31 til 0,75,

P

= 0,0012) og uten familiehistorie med kreft (AOR = 0,49, 95% CI = 0,30 til 0,80,

P

= 0,0044). Også CACGA bærere hadde litt lavere EC risiko i BMI˂24 undergruppe enn i BMI≥24 undergruppe (BMI˂24, AOR = 0,62, 95% CI = 0,40 til 0,96,

P

= 0,0323; BMI≥ 24, AOR = 0,70, 95% CI = 0,51 til 0,96,

P

= 0,0255). Videre bærere av dette haplotype viste den laveste EC risiko blant kvinner med lengre menarche-FFTP intervaller og BMI˂24 (AOR = 0,39, 95% CI = 0,17 til 0,90,

P

= 0,0275) (Tabell 6) .

Diskusjoner

i denne studien har vi brukt flere strategier, inkludert LR, CART og MDR tilnærminger til systematisk evaluere foreningen av EF følsomhet med germline varianter i TGF-β signale beslektede gener

TGFB1

,

TGFBR1

,

SNAI1 Hotell og

TWIST1

blant kinesiske Han kvinner.

I enkelt locus analyse ved hjelp av multivariate LR fem polymorfismer, rs1800469 i

TGFB1

, rs6478974 og rs10733710 i

TGFBR1

, rs4721746 og rs4721745 i

TWIST1

viste signifikant sammenheng med EF mottakelighet. Selv om LR har vært mye brukt i multivariat-gen-gen eller gen-miljø interaksjoner, kan det ikke fullstendig karakterisere dem på grunn av lav dataene i høye dimensjoner. Dessuten ville det statistikk makt reduseres og type II feil ville øke i relativt liten utvalgsstørrelse [21]. Så den ikke-parametrisk CART og MDR-analyse ble ansatt i høy ordre gen-gen-interaksjoner for å undersøke spesielle kombinasjonseffekter av genetiske varianter. I denne studien CART analyse indikerte at det viktigste splitting variabel var

TGFBR1

rs6478974, etterfulgt av

TGFBR1

rs10512263. MDR-metoden, noe som reduserer genotypen parametere fra multi- dimensjon til en dimensjon, viste at

TGFB1

rs1800469 og

TGFBR1

rs6478974 sammen var de beste interaksjon polymorfismer å undersøke EC risiko.

Alle de tre tilnærminger i single-locus analyse konsekvent indikerte at genotypen

TGFBR1

rs6478974 TA /AA (ligger i intron 1) hadde den sterkeste beskyttende effekt på EC mottakelighet. Inntil nå, var vanligste variantene sjelden rapportert i eksoner eller funksjonelle regioner i

TGFBR1

å ha klar funksjonell betydning. Selv om de aller fleste av SNP er plassert i de genomiske, ikke-kodende områder, tyder nye bevis som SNP, som ligger i genpromoteren eller regulatoriske områder, spiller avgjørende roller i regulering av typen og tidspunktet for genekspresjon [22]. Chen J

et al

fant at rs6478974 var assosiert med økt risiko for magekreft i kinesiske befolkningen (i dominerende modellen: AOR = 1,36, 95% CI = 1,14 til 1,63, i additiv modell: AOR = 1,23, 95 % CI = 1,08 til 1,40) [23]. De oppdaget at rs6478974 var i moderat LD med rs334348 og rs1590 (i 3′-UTR, både r

2 = 0,504) ved hjelp av online programvare SNPinfo (https://manticore.niehs.nih.gov/cgi-bin/snpinfo /snpfunc.cgi), og disse to loci trolig regulert mirnas bindende og påvirket magekreft utvikling. Fordi TβRI hemmer cellevekst under tidlig tumorigenesis [9, 24], spekulerer vi at personer som bærer

TGFBR1

rs6478974 TA /AA uttrykke høyere nivåer av TβRI enn TT genotypen bærere, og derfor har lavere følsomhet overfor EF. Vi har også funnet at personer med både genotyper av

TGFBR1

rs6478974 TT og

TGFBR1

rs10512263 TC /CC hadde høyere følsomhet sammenlignet med de skjuler genotypen

TGFBR1

rs6478974 TA /AA med KJØP analyse, noe som indikerer at rs10512263 kan være en risiko locus. En to-trinns case-control studie av magekreft (den første fasen av saker /kontroller = 650/683, den andre fasen av saker /kontroller = 484/348) viste at rs10512263 i dominerende modeller (CT /CC vs TT) var signifikant assosiert med økt risiko for magekreft i kinesiske befolkningen [23], som er konsistent med våre resultater. Men Scollen S

et al

oppdaget at mindre allelet C av rs10512263 hadde en beskyttende effekt på brystkreft mottakelighet (OR = 0,87, 95% CI = 0,81 til 0,95,

P

= 0,001) i meta-analyse av SØK og PBCS studier [25]. Avvikene mellom disse resultatene kan være på grunn av etnisk mangfold av populasjoner og kompliserte miljøfaktorer.

I

TGFB1

, observerte vi at T-allelet av rs1800469 (CT ved 5 « UTR region) ble assosiert med redusert EC mottakelighet henhold dominerende modellen, som var i samsvar med resultatet i magekreft blant de samme etniske befolkningen (saker /kontroller = 675/704, AOR = 0,65, 95% CI = 0,52 til 0,82) [26 ]. Vår MDR-analyse viste at de kombinerte genetiske varianter av

TGFB1

rs1800469 og

TGFBR1

rs6478974, best interaksjonen modellen, reduserte EF-risiko, som var i overensstemmelse med resultatene analysert ved LR. Det ble rapportert at T-allelet av rs1800469 kunne øke affiniteten av dens promoter med noen transkripsjonsfaktorer som Yin Yang 1 (YY1), og øker ekspresjon av TGF-β1 [27, 28]. Videre Grainger DJ

et al

viste at konsentrasjonen av TGF-β1 i plasma var ekstremt høyere i T-allel bærere enn C-allel bærere blant NO befolkning [29]. Den polymorfisme

TGFB1

rs1800469 kan utføre sin beskyttende funksjon under tidlig tumorigenesis ved å endre uttrykket av TGF-β1.

I

TWIST1

, oppdaget vi at variant genotyper av rs4721746 og rs4721745, både å finne i de 3 «flankerende områder, hadde motsatt effekt på EC risiko i vår befolkning. Ved bruk av web-basert funksjonell annotering verktøy F-SNP (https://compbio.cs.queensu.ca/F-SNP/) [30], disse to polymorfismer var begge spådd å påvirke transkripsjonen regulering av TFSearch og Consite verktøy (funksjonell betydningen score = 0,239, 0,208, henholdsvis). Videre studier i andre befolknings for å bekrefte våre funn.

haplotype basert tilnærming kan ha større makt enn single-locus analyse når SNPs er i sterk LD og vil gi ytterligere statistisk styrke til å påvise gener som er involvert i komplekse trekk sykdommer [31, 32]. I vår haplotype-rekonstruksjon forening studie fant vi at

TGFB1

haplotype CG og diplotype CA-CG ble begge assosiert med økt EC mottakelighet. I

TGFBR1

, haplotype CACGA og diplotype CACGA-CTTAA redusert EC risiko. Dessuten observerte vi betydelige felles effekter av haplotype CACGA, familiehistorie med kreft, BMI status og østrogen eksponering i stratifisert analyse. Haplotype CACGA, husing en beskyttende allel A av rs6478974, redusert risiko for EC uavhengig av hva de miljømessige faktorene var, noe som ytterligere indikerer at en allele av rs6478974 kan være den viktigste beskyttende locus i populasjonen. Hvis disse haplotyper og diplotypes kunne bevises i andre populasjoner, kan de brukes som molekylære beslutningstakere for estimering av EF risiko, og kan også gi noen ledetråder for å finne årsaks SNPs.

Det er tre hoved styrker i vår studere.

Legg att eit svar