PLoS ONE: Flere analytiske tilnærminger Avslør Klare Gene-miljø interaksjoner i Røykere og ikke-røykere i Lung Cancer

Abstract

Complex sykdom som kreft resultater fra interaksjoner av flere genetiske og miljømessige faktorer. Ved å studere disse faktorer ner kan ikke forklare den underliggende patogenetisk mekanisme av sykdommen. Multi-analytisk tilnærming, herunder logistisk regresjon (LR), klassifisering og regresjon tre (CART) og multifactor dimensjonalitet reduksjon (MDR), ble brukt i 188 lungekreft tilfeller og 290 kontroller for å utforske høyere ordens samspill mellom xenobiotiske metabolizing gener og miljørisikofaktorer . Røyking ble identifisert som den dominerende risikofaktor ved alle tre analytiske metoder. Individuelt,

CYP1A1 * 2A

polymorfisme var signifikant assosiert med økt risiko for lungekreft (OR = 1,69; 95% CI = 1,11 til 2,59, p = 0,01), mens

EPHX1

Tyr113His og

SULT1A1

Arg213His konferert redusert risiko (OR = 0,40; 95% CI = 0,25 til 0,65, p 0,001 og OR = 0,51; 95% CI = 0,33 til 0,78, p = 0,002 henholdsvis). I røykere,

EPHX1

Tyr113His og

SULT1A1

Arg213His polymorfismer reduserte risikoen for lungekreft, mens

CYP1A1 * 2A, CYP1A1 * 2C Hotell og

GSTP1

Ile105Val formidles økt risiko i ikke-røykere. Mens du utforsker ikke-lineære interaksjoner gjennom KJØP analyse, røykere bærer kombinasjonen av

EPHX1

113TC (Tyr /Hans),

SULT1A1

213GG (Arg /Arg) eller AA (Hans /Hans) og

GSTM1

null genotyper viste høyest risiko for lungekreft (OR = 3,73; 95% CI = 1,33 til 10,55, p = 0,006), mens kombinerte effekten av

CYP1A1 * 2A

6235CC eller TC

SULT1A1

213GG (Arg /Arg) og betel pund tygge viste maksimal risiko hos ikke-røykere (OR = 2,93; 95% CI = 1,15 til 7,51, p = 0,01). MDR analyse identifisert to forskjellige Predictor modeller for risikoen for lungekreft hos røykere (tobakk tygging,

EPHX1

Tyr113His, og

SULT1A1

Arg213His) og ikke-røykere (

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1

Arg213His) med testing balanse nøyaktighet (TBA) på henholdsvis 0,6436 og 0,6677. Interaksjon entropi tolkninger av MDR Resultatene viste ikke-additive interaksjoner av tobakk tygging med

SULT1A1

Arg213His og

EPHX1

Tyr113His hos røykere og

SULT1A1

Arg213His med

GSTP1

Ile105Val og

CYP1A1 * 2C

i røykere. Disse resultatene identifisert forskjellige gen-gen og gen miljø interaksjoner hos røykere og ikke-røykere, som bekrefter viktigheten av multifaktorielle samhandling i risikovurdering av lungekreft

Citation. Ihsan R, Chauhan PS, Mishra AK, Yadav DS, Kaushal M, Sharma JD, et al. (2011) flere analytiske tilnærminger Avslør Klare Gene-miljø interaksjoner i Røykere og ikke-røykere i lungekreft. PLoS ONE 6 (12): e29431. doi: 10,1371 /journal.pone.0029431

Redaktør: Courtney G. Montgomery, Oklahoma Medical Research Foundation, United States of America

mottatt: 04.07.2011; Godkjent: 28 november 2011; Publisert: 19.12.2011

Copyright: © 2011 Ihsan et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet med tilskudd fra indiske rådet for medisinsk forskning (ICMR), New Delhi, India (49/4 /RMRC /NE /2005-NCD-II /III). Rakhshan Ihsan er en mottaker av en seniorforsker Brorskap Universitetet Grants Commission (UGC), New Delhi, India (Ref. Nr 10-2 (5) /2005 (ii) -E.U.II). Pradeep Singh Chauhan er en mottaker av en seniorforsker Brorskap Council of Scientific and Industrial Research (CSIR), New Delhi, India (Ref. Nr 09/630 (0014) /2006-EPJ-1). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft er den vanligste diagnosen kreft og den ledende årsak til kreft dødsfall globalt [1]. I India utgjør det 6,2% av alle krefttilfeller med ca 58000 hendelsen tilfeller rapportert i 2008 og er den hyppigste kreft hos menn [2]. Nord østlige (NE) del av India viser en jevn økning i kreft forekomst og lungekreft er blant de ti ledende nettsteder, med den høyeste aldersjusterte insidensraten (AAR) i Mizoram state (24,5 hos menn og 26,3 hos kvinner). Aizwal distriktet alene viser en AAR på 36,0 hos menn og 38,7 hos kvinner som er nesten tre til ti ganger høyere enn Delhi [3]. Forekomsten av lungekreft er også høy blant menn i Silchar og Imphal distrikter. Høye insidensrater foreslår rollen som både genetiske og miljømessige faktorer som røyking, bruk av tobakk og kosttilskudd kreftfremkallende forbruk.

Personer som innehar endret evne til å forbrenne karsinogener som polysykliske aromatiske hydrokarboner (PAH), som er allestedsnærværende miljø , kosttilskudd og tobakk kreftfremkallende har økt risiko for å utvikle kreft. Dermed genetiske varianter i xenobiotiske metabolizing gener kan påvirke deres klaring fra sirkulasjon og bestemme respons på slike kreftfremkallende. Fase I xenobiotiske enzymer som cytokrom P-450s (

CYP

s), alkohol dehydrogenase (

ALDH

) og epoksid hydroksylase (

EPHX

) vanligvis aktivere procarcinogens gjennom oksydasjon og dehydrogenering for derved å omdanne dem til reaktive metabolitter. Fase II metabolske enzymer som glutation S-transferaser (

GST

), sulfotransferaseaktivitet (

SULT

) og N-acetyltransferase (

NAT

) vanligvis resultere i inaktivering eller avgiftning av disse reaktive metabolitter. Likevekt mellom uttrykk og aktivitet av disse xenobiotiske-metaboliserende enzymer av både fase I og II bestemme den relative nivået på avgiftning av kreftfremkallende. Imidlertid er disse reaksjonsveier også kjent for å aktivere toksiske og karsinogene kjemikalier til elektrofile former som reagerer irreversibelt med makromolekyler slik som proteiner og nukleinsyrer som fører til kreftutvikling.

enkeltnukleotidpolymorfi (SNPs) i xenobiotiske metaboliserende gener har blitt studert mye med risiko for lungekreft. Et flertall av disse molekylære epidemiologiske studier vurdere bare de viktigste effektene av disse SNPs og deres observerte styrke foreninger kan bli utfordret av pene av den genetiske varianten. Videre kan en enkelt locus ikke hensyn til genetisk mottakelighet i en kompleks sykdom som kreft som involverer flere genetiske variasjoner og gen-miljø interaksjoner. Nåværende bevis tyder på at høyere ordens interaksjoner i multigenic tilnærming tillater mer presis avgrensning av risikogruppene [4], [5].

I denne studien, to data mining tilnærminger, CART og MDR ble brukt sammen med LR til oppdage høy ordre gen-gen og genet miljø interaksjoner. Både CART og MDR anta modell gratis og ikke-parametriske metoder for å estimere ikke-lineære interaksjoner med lave falske-positive selv om relativt små utvalgsstørrelser. Modell validering gjennom permutasjon testing og falske positive rapport sannsynligheter ble også gjort for å overvinne unøyaktig estimering. Interaksjon entropi grafer ble konstruert for å tolke kombinasjonseffekter identifisert av MDR. For ytterligere å analysere mulige effekter av

EPHX1 Hotell og

CYP1A1

SNPs, beregnet vi deres haplotype frekvenser og risiko formidles mot lungekreft.

Materialer og metoder

forsøkspersonene

Denne studien besto av 188 histopathologically diagnostisert lungekreft tilfellene som er registrert ved Dr. Bhubaneswar Borooah Cancer Institute, Gauhati, Civil Hospital, Aizawl, og Sir Thutob Namgyal Memorial Hospital, Gangtok, de samarbeidende sentre i nord øst India. Incident tilfeller i perioden fra desember 2006 til 2009, og er villige til å delta i studien ble inkludert. 290 frivillige, alder (± 5 år) og sex matchet personer ble valgt ut fra de urelaterte deltagere som fulgte kreftpasienter. Dette ga en lett tilgjengelig og samarbeidende kilde til kontroller fra samme sosioøkonomiske bakgrunn som de tilfeller redusere konfunderende skjevheter. Som våre samarbeidssentre var offentlige sykehus et stort flertall av pasientene tilhørte lavere til midten sosioøkonomisk bakgrunn. Demografiske data og egenskaper som alder, kjønn, røyking vane, bruk av tobakk, betel pund og alkohol, ble hentet fra fagene i et standard spørreskjema som brukes for alle sentrene, i et personlig intervju av en utdannet datainnsamling. Et flertall av saker og kontroller var kyndige med full grunnskoleutdanning og noen opp til høgskolenivå. Tjenestepensjons historie av deltagerne viste at de fleste av dem var gården arbeidere eller engasjert i smålig jobber og arten av slike jobber ikke utsatt dem for eventuelle yrkesrisiko. Enhver historie tidligere eller nåværende sykdom var adspurte eller hvis du gjennomgår noen medisiner på tidspunktet for registrering. Pasienter med bare lunge som sitt primære stedet for kreft ble inkludert. Enhver gjenstand med historie familiær malignitet eller lunge smittsom sykdom ble ekskludert både fra sak og kontroll. Endelige valgte kontroller ble inkludert på basis av ikke hadde hatt noen åpenbar sykdom og de som ikke tar noen medisiner ved rekruttering. Alle fag gitt skriftlig informert samtykke til deltakelse i denne forskningen som ble gjort under en protokoll godkjent av institusjonelle etiske komité for Regional Medical Research Centre, North East Region (indiske rådet for medisinsk forskning). Røykere, tygger og drikker ble klassifisert i to kategorier noensinne og aldri. For å røyke, ble en person som aldri hadde røykt eller røykt mindre enn 100 sigaretter i løpet av livet, og var ikke røyking på tidspunktet for rapportering anses aldri røyker eller ikke-røykere. Helt røykere eller røykere kategorien skal inkluderes nåværende røykere og de som hadde sluttet i løpet av 1 års rapportering [6]. 5 ml blod ble oppsamlet i EDTA-medisinglass og lagret under -70 ° C inntil behandling.

genotyping

Genomisk DNA ble isolert ved anvendelse av Qiagen Blod-DNA Isolation Kit (Qiagen GmbH, Tyskland) og lagret ved -30 ° C inntil videre analyse. Detaljer for SNP’er valgt for studiet er oppsummert i tabell S1. Slettingen varianter i

GSTM1 Hotell og

GSTT1

ble bestemt ved multiplex PCR protokoll og SNPs i

CYP1A1

,

EPHX1, GSTP1, SULT1A1

var bestemt ved polymerasekjedereaksjon-rflp assays som beskrevet tidligere [7] – [12]. 10% av de tilfeldig utvalgte tilfeller og kontroller ble genotypet to ganger for hver SNP, men ingen avvik ble observert.

Statistical Analysis

Cases ble individuelt matchet med kontroller på grunnlag av alder (± 5 år), kjønn og etnisitet, i et forhold på ca. 1:1.5. Forskjell i fordelingen av demografiske karakteristika og genotypefrekvensene mellom saker og kontroller ble evaluert ved bruk av Chi Square (χ

2) og Fishers Exact test der det er hensiktsmessig. Hardy-Weinberg likevekt (HWE) ble vurdert ved hjelp av χ

2-test. Beregninger av risiko for kreft, formidles av genotyper og andre kovariater som tobakksrøyking, tobakk tygging, betel pund tygging og alkoholforbruk ble bestemt ved å utlede den odds ratio (OR) og den tilsvarende 95% konfidensintervall (95% CIS) ved hjelp av multivariabel betinget logistisk regresjon. For alle testene en tosidig p 0,05 ble ansett som statistisk signifikant. Dataanalysen ble utført på intercooler Stata 8.0 statistisk programpakke (Stata Co, College Station, TX).

haplotype Analyse

haplotyper ble konstruert fra de unphased diploide genotypen data ved hjelp av forventning maksimering basert algoritme. Individuelle haplotyper og deres estimerte befolknings frekvensene ble inferred og estimater av koblingsulikevekt (D «) mellom SNPs ble beregnet ved hjelp Haploview programvare ver.4.1.

Identifikasjon av høy Bestill Interaksjoner

Høy ordre interaksjoner ble bestemmes ved hjelp av CART, MDR og samhandling entropi grafer.

CART.

en binær rekursiv partisjonering metoden ble brukt til å produsere et beslutningstre som identifiserte spesifikke kombinasjoner av medvirkende faktorer knyttet til risikoen for lungekreft med kommersielt tilgjengelig CART programvaren (versjon 6.6, Salford Systems) [13]. Tre splitting ble gjort til terminalnodene nådd et forhånds spesifisert minimumsstørrelse på 10 fag. Optimal tre ble valgt ved hjelp av en standard feil (en-SE) regelen og 10 fold kryssvalidering. Undergrupper av personer med risiko differensial mønstre ble identifisert i forskjellig rekkefølge av noder, som indikerer tilstedeværelse av gen-genet og genet-miljø interaksjoner. Fischer Exact test ble brukt for å beregne relativ risiko i hver terminal node i treet.

MDR.

MDR programvaren ble utviklet av Ritchie et. al. i 2001 [4] og gjennomgått av Moore et al [14]. Genotype og miljøfaktorer ble samlet inn i høy og lav risiko gruppe, effektivt redusere multifaktor spådommen fra n dimensjon til en dimensjon ved hjelp av MDR-programvaren (versjon 2.0 beta) (https://www.epistasis.org). Vi søkte Tuned relieff (torv) filter algoritme for å fjerne støyende SNPs og unngå overtilpassing av data. Beste modeller for hvert locus ble utvalgt ved å gjenta analysen i opptil 10 frø og påføring av 10 folder kryssvaliderings hver gang. Statistisk signifikans av de beste modellene som er valgt for hvert locus ble fastsatt ved bruk av 1000 fold permutasjon testing. p-verdier dermed oppnådd for TBA og kryssvalidering konsistens (CVC), ble ansett som statistisk signifikant på 0,05 nivå.

False Positive Rapporter sannsynlighet (FPRP)

Rapporter om gen-miljø interaksjonsstudier er ofte utfordret av falske positive funn spesielt når resultatene er generert av multiple sammenligninger. For å estimere FPRP og å vurdere robustheten av funnene fra MDR analyse vi brukte bayesiansk tilnærming beskrevet av Wacholder et. al. [15]. Metoden krever tidligere sannsynlighetene for at den genetiske varianten og sykdom foreningen er reell. Som tidligere sannsynlighet kan være et subjektivt mål og kan påvirkes av flere faktorer, som regel et stort utvalg er rapportert av studier. Vurderer fattige epidemiologiske data fra studiepopulasjonen og inkonsekvent sammenslutning av SNPs med lungekreft vi satt en ganske bredere spekter av tidligere sannsynligheter (10

-6 til 10

-1) med en beregnet statistisk styrke til å påvise en OR på 1,5 og 2,0 og α nivå som tilsvarer den observerte p-verdi. FPRP cutoff punktet ble strengt holdt til 0,2.

Interaksjon entropi grafer

Interaksjons grafer ble bygget for å visualisere og tolke resultatene fra MDR hjelp Orange maskinlæring programvarepakke [16]. Interaksjons grafer bruker entropi estimater som beskrevet av Jakulin et al. [17] for fastsettelse av gevinst i informasjon om en klassevariabel (f.eks case-control status) fra å slå sammen to variabler sammen enn det som tilbys av variablene uavhengig. Dette tiltaket entropi er nyttig for å bygge interaksjons grafer som letter tolkningen av forholdet mellom variablene. Interaksjons grafer består av et knutepunkt for hver variabel med parvise forbindelser mellom dem. Prosentandelen av entropi fjernes (dvs. informasjon gevinst) ved hver variabel visualiseres for hver node. Prosentandelen av entropi fjernet for hver parvise kartesisk produkt av variabler ble visualisert for hver tilkobling. Således kan de uavhengige viktigste effekten fra hver SNP være i forhold til interaksjonen virkning. Positiv entropi (plottet i grønt) viser ikke-lineær interaksjon mens negativ entropi (plottet i rødt) indikerer redundans. Entropy verdi lik null indikerer uavhengighet eller en blanding av synergi og redundans.

Resultater

Kjennetegn på forsøkspersonene

Fordelingen av kjønn og etnisitet var lik for saker og kontroller . Frekvensfordelingen av hanner og hunner var henholdsvis 77,1% og 22,9% i de tilfeller og 76,2% og 23,85 i kontrollene. Gjennomsnittlig alder av saker og kontroller var 60,41 ± 10,58 (range 30-82 år) og 57,19 ± 10,75 (range 32-85 år) henholdsvis. Fordelingen av alle SNPs i kontrollen var i overensstemmelse med HWE (p 0,05), men alleler av

EPHX1

Tyr113His og

SULT1A1

Arg213His polymorfismer i tilfeller ikke følger HWE (p 0,001 og p = 0,004 henholdsvis).

Association av genetiske og miljømessige faktorer med lungekreft av LR analyse

distribusjon og viktigste effektene av genetiske og miljømessige faktorer er oppsummert i tabell 1. risiko~~POS=TRUNC vaner slike som røyking, tobakk tygging og betel pund tygging var dominerende blant sakene. Men bare røyking og betel pund tygging var signifikant assosiert med økt risiko for lungekreft (OR = 3,06; 95% CI = 1,94 til 4,83; p 0,001 og OR = 1,86; 95% CI = 1,21 til 2,84; p = 0,004 henholdsvis) . Genotype distribusjon av

CYP1A1 * 2A

,

EPHX1

Tyr113His,

SULT1A1

Arg213His og

GSTT1

null polymorfisme var signifikant forskjellig i saker fra kontroller (p = 0,014, p 0,001, p = 0,01 og p = henholdsvis 0,04). Viktigste effektene av genotyper i lungekreft mottakelighet ble evaluert ved hjelp av betinget multivariabel logistisk regresjon. Heterozygot genotype i

CYP1A1 * 2A

var assosiert med økt risiko (OR = 1.69,95% CI = 1,11 til 2,59; p = 0,01), mens heterozygote genotyper i

EPHX1

Tyr113His og

SULT1A1

Arg213His formidles redusert risiko mot lungekreft (OR = 0,40; 95% CI = 0,25 til 0,65, p 0,001 og OR = 0,51; p = 0.33x-0,78, p = 0,002 henholdsvis).

CYP1A1 * 2A Hotell og

EPHX1

His139Arg polymorfismer var assosiert med økt risiko for lungekreft i dominant genetisk modell, mens

EPHX1

Tyr113His og

SULT1A1

Arg213His meddelt redusert risiko i recessive genetiske modellen (tabell S2).

haplotype analyse

Tabell 2 oppsummerer assosiasjoner mellom frekvensfordelingene av haplotyper i

CYP1A1 Hotell og

EPHX1

gener og risiko for lungekreft. De odds ratio ble beregnet ved hjelp av den vanligste haplotype som referansegruppen. I

CYP1A1

, «TA» haplotype var den hyppigste blant begge tilfeller og kontroller og viste signifikant sammenheng. Bare

CYP1A1

^ -Cg haplotype formidles økt risiko for lungekreft (OR = 1,49; 95% CI = 1,00 til 2,21, p = 0,04). I

EPHX1

, «TA» haplotype var det mest vanlig med frekvenser på 44,79% og 45,04% i saker og kontroller hhv. Ingen haplotype ble funnet å være signifikant assosiert med risikoen for lungekreft.

Risiko knyttet til SNPs stratifisert etter røyke

Siden røyking er en veletablert risikofaktor for lungekreft og var den sterkeste uavhengig risikofaktor i LR, vi videre stratifisert dataene etter røykestatus. Distribusjon og risiko knyttet til genetiske faktorer etter stratifisering er vist i Tabell 3. Heterozygote og homozygot variant genotyper av

CYP1A1 * 2A

polymorfisme formidles betydelig risiko hos ikke-røykere (OR = 2,88; 95% CI = 1,22 til 6,81 , p = 0,016 og OR = 4,35; 95% CI = 1,47 til 12,84, p = 0,008). Også,

CYP1A1 * 2C

variant genotype og

GSTP1

Ile105Val heterozygot genotype var signifikant assosiert med økt risiko hos ikke-røykere (OR = 11,81; 95% CI = 1,24 til 111,98, p = 0,03 og OR = 2,40; 95% CI = 01.15 til 05.03, p = 0,01). Heterozygote genotyper i

EPHX1

Tyr113His og

SULT1A1

Arg213His var assosiert med 66% og 55% redusert risiko hos røykere (OR = 0,34; 95% CI = 0,18 til 0,63, p = 0,001 og OR = 0,45; 95% CI = 0,25 til 0,80, p = 0,007 henholdsvis). Men heterozygot genotype i

EPHX1

His139Arg konferert betydelig risiko hos røykere (OR = 1,92; 95% CI = 1,07 til 3,45, p = 0,02).

KJØP analyse

Figur 1 viser den valgte CART modell bygget på alle undersøkte genetiske varianter og miljømessige risikofaktorer. Den endelige treet inneholdt åtte terminalnodene. Den første splitt av rotnoden var på røyking vane, noe som indikerer at røyking er den sterkeste risikofaktoren for lungekreft. Blant røykerne, de påfølgende splitt viste interaksjoner mellom

EPHX1

Tyr113His,

SULT1A1

Arg213His og

GSTM1

. Hos ikke-røykere første delingen var på

CYP1A1 * 2A

status, noe som var i samsvar med LR analyse der

CYP1A1 * 2A

viste sterk assosiasjon til risiko bare i røykere. Ytterligere interaksjoner ble spådd av

SULT1A1

Arg213His polymorfisme og betel pund status. Terminal noden 7, som består av minst en andel av tilfellene hos ikke-røykere, ble tatt som referanse for å beregne eller for andre terminal noder. Blant røykerne ble observert maksimal risiko for terminal node1 består av

EPHX1

113TT (Tyr /Tyr) eller -113CC (Hans /Hans) genotyper (OR = 4,38; 95% CI = 02.12 til 09.15) og for terminal node 2 med kombinasjon av

EPHX1

113TC (Tyr /Hans),

SULT1A1

213GG (Arg /Arg) eller AA (Hans /Hans) og

GSTM1

null genotyper (OR = 3,73; 95% CI = 1,33 til 10,55, p = 0,006). Hos ikke-røykere høy risiko ble sett for terminal node 5 bestående av

CYP1A1 * 2A

6235CC eller TC,

SULT1A1

213GG (Arg /Arg) og betel quid tygging (OR = 2,93; 95 % CI = 1,15 til 7,51, p = 0,01). Parallelt med ovennevnte, CART analyse på separate datasett av røykere og ikke-røykere ble også utført. Vi har imidlertid ikke oppdage noen høy orden samhandling i disse analysene (data ikke vist).

Terminal noder er tykk grenser.

* W: Wild typen genotype; V: Variant genotype, TN: Terminal Node,

#p verdi 0,05

MDR Analyse

MDR-analyse ble brukt for å utforske videre gen-gen og gen-miljø interaksjoner. Beste prediktive modeller opp til 4 bestillinger av samhandling, sammen med sin CVC og TBA er oppsummert i tabell 4. Analysen ble kjørt separat for totalt datasett og datasett stratifisert på røykestatus. For total datasettet, røyking var den beste locus modellen med høyest CVC (10/10) og teste nøyaktigheten av 0,6114 som var statistisk signifikant (p 0,001) bestemmes av 1000 fold permutasjon testing. For en to-locus interaksjon, kombinasjonen av røyking og

EPHX1

Tyr113His var mest betydnings med CVC på 10/10 og TBA av 0,6407 (p 0,001). Den 3 locus modell besto av røyking,

EPHX1

Tyr113His og

EPHX1

His139Arg med TBA av 0,6497 (p 0,001) og CVC på 10/10. Den fire loci samhandlingsmodell av røyking,

EPHX1

Tyr113His,

EPHX1

His139Arg og

SULT1A1

Arg213His, ble den beste modellen identifisert, med maksimal CVC (10/10) og TBA (0,6503, p 0,001). Denne modellen hadde en chi-kvadrat verdien av 66,31 (p 0,0001) og en OR på 4,93 (95% CI = 3,32 til 7,33). I røykere best samhandlingsmodell var tre loci modell bestående av tobakk tygging,

EPHX1

Tyr113His og

SULT1A1

Arg213His ha maksimal CVC (10/10) og TBA (0,6436, p 0,001) blant alle modellene som er identifisert. Modellen formidles 3,5 ganger økt risiko for lungekreft (95% CI = 2,69 til 7,69). I ikke-røykere den beste modellen var tre loci modell bestående av

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1

Arg213His med CVC på 10/10 og TBA av 0,6677 (p 0,005). og en OR på 7,32 (95% CI = 3,24 til 16,53)

Falsk positiv rapport sannsynlighet (FPRP)

Tabell 5 viser FPRPs for 3 beste modeller hentet fra MDR analyse. Den 4-loci prediktor modell på totalt datasett og 3-loci modell hos røykere viste utmerket pålitelighet selv når antar svært lave tidligere sannsynligheter (fra 10

-3 til 10

-6) for å påvise ORS på 1,5 og 2,0 . Men den beste modellen som er valgt i ikke-røyker kategorien viste sann forening kun ved høy sannsynlighet for 10

-1 for å oppdage eller = 1,5 og inntil 10

-2 for å oppdage OR = 2,0.

interaksjon entropi grafer

Etter å identifisere høyrisikokombinasjoner ved hjelp av MDR tilnærming, ble samspillet entropi algoritme brukes til å tolke forholdet mellom variablene. Grafer ble bygget på MDR resultatene fra analysen av den samlede datasettet (figur S1) og på datasett stratifisert etter røyke (figur 2). I røykere,

EPHX1

Tyr113His hadde et stort selvstendig effekt (4,64%) og en ikke-additiv interaksjon med tobakk tygging (entropi 1,79%). Betydelig entropi var assosiert med

SULT1A1

Arg213His (1,88%) og dets interaksjon med tobakk tygge videre fjernet 1,49% av entropi fra case-control-gruppen. Men vi gjorde ikke oppdage eventuelle ikke-lineær interaksjon mellom de to SNPs i modellen. Vi fant små prosenter av entropien i case-kontroll status forklares med alkoholforbruk (0,56%) og tobakk tygging (0,70%) uavhengig av hverandre, men en stor andel av entropi forklart av samspillet mellom disse to miljøfaktorer (2,47%). I ikke-røykere,

CYP1A1 * 2A

viste sterkest viktigste effekten med entropi fjerning av 4,7%.

GSTP1

Ile105Val hadde også en sterk selvstendig effekt (entropi fjerning = 3,28%) og dets interaksjon med

SULT1A1

Arg213His videre fjernet 3,02% av entropi. Det ble observert en sterk synergistisk interaksjon mellom

SULT1A1

Arg213His og

CYP1A1 * 2C

som kombinasjonen fjernet ytterligere 2,61% av den totale entropi.

Samspillet Modellen beskriver den prosent av entropi (informasjon gevinst) fjernet av hver variabel (viktigste effekten: representert ved noder) og etter hvert parvis kombinasjon av attributter (interaksjonseffekt: representert ved tilkoblinger). Attributter er valgt på grunnlag av MDR resultater som ble oppnådd i tilfelle av (A) Røkere og (B) ikke-røykere. Etiketter: EX3:

EPHX1

Tyr113His, Alc: alkoholforbruk, Tbc: Tobakk tygging, Sult:

SULT1A1

Arg213His, 2A:

CYP1A1 * 2A, etter 2C:

CYP1A1 * 2C

, P1:

GSTP1

Ile105Val

Diskusjoner

i denne studien brukes flere analytiske metoder for å først vurdere foreninger og deretter utforske mulig. interaksjoner av xenobiotiske metabolizing gener med miljøfaktorer i fare for lungekreft. De anvendte data mining tilnærminger har evnen til å søke og finne interaksjoner uavhengig av betydningen av hovedeffektene. Den mest betydelige funn i denne studien er de konsekvent identifisert genet-genet og genet miljø interaksjoner av alle de tre statistiske tilnærminger.

Røyking er den viktigste årsaksfaktoren i lungekreft. Det samme ble reflektert i denne studien som røyking viste sterk sammenheng i LR, best en faktor modellen i MDR og dannet først delt i CART. Samspill

EPHX1

Tyr113His og

SULT1A1

Arg213His var konsekvent identifisert hos røykere. Begge

EPHX1

Tyr113His og

SULT1A1

Arg213His konferert redusert risiko i røyker undergruppe i LR. De to polymorfismer sammen med

EPHX1

His139Arg dannet den beste prediktor modellen i MDR analyse hos røykere og også dannet senere splittelser innen røykere i CART. EPHX1 enzym catabolizes epoksyder fra PAH i dihydrodiols, som innebærer generering av flere reaktive karsinogene metabolitter. Substitusjon av en variant His allele ved kodon 113 (

EPHX1

Tyr113His) reduserer aktiviteten av dette enzym [18] og derved reduserer risikoen for kreft. Studier av lungekreft foreslår beskyttende virkning for

His

113 (langsom type), sammenlignet med

Tyr

113 (hurtig type) som bibringer økt lunge caner risiko [19] – [21]. Varianten allelet er også blitt foreslått for å redusere risikoen for ovariekreft [22]. Vi har tidligere rapportert tilsvarende resultater fra samme populasjon i spiserørskreft viser

Hans

113 allelet å være forbundet med en betydelig redusert risiko i røykere [23]. Reflekterer det samme, i CART analyse Terminal node 1 av formidler enn 4 ganger høy risiko til røykere muligens på grunn av høy andel av vill

Tyr

113 homozygot genotype. Sulfonering reaksjon av

SULT1A1

er en avgiftning reaksjon, men det innebærer også bioaktive av visse procarcinogens, inkludert heterosykliske aminer og PAH å danne kreftfremkallende-DNA addukt [24], [25]. In vitro modellstudier viser at substitusjon av histidin i posisjon 213 i aminosyresekvensen som er forbundet med redusert affinitet substrat og et lavere nivå av protein [26] som kan beskytte mot kjemisk karsinogenese av PAH i lungekreft [27]. Resultater på sammenslutning av

SULT1A1

Arg213His og risiko for kreft er inkonsekvent, fra null sammenheng med risikoen for tykktarmskreft [28] og prostata kreft [29] for å øke risiko for brystkreft assosiert med

Hans

213 allel [30]. En annen studie på tykktarmskreft viste en betydelig redusert risiko for personer som frakter

Hans

213 allel [31]. En meta-analyse av Kotnis et al [32] viste en signifikant beskyttende effekt av polymorfisme i sju studier av urin kreft.

Blant ikke-røykerne

CYP1A1 * 2A Hotell og

GSTP1

Ile105Val var de viktigste polymorfismer identifisert for lungekreft utvikling. Varianten allel av både polymorfismer konferert betydelig risiko i røykfritt undergruppe i LR analyse. Tilsvarende MDR tre loci modell av

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1Arg213His

polymorfismer var den beste prediktor for risiko hos ikke-røykere.

CYP1A1

6235T C MspI (

CYP1A1 * 2A

) polymorfisme, er assosiert med høyere enzymatisk aktivitet mot bensapyren [33], [34]. Undersøkelser på sammenhengen mellom

CYP1A1

polymorfismer og lungekreft har gitt tvetydige resultater [35], [36]. I likhet med våre funn, en studie av Taioli et. al. [37] rapporterte sammenslutning av

CYP1A1 * 2A

variant allel med lungekreft, men etter stratifisering av røyking foreningen forble begrenset til ikke-røykere. Videre, i en samlet analyse av 11 studier på

CYP1A1 * 2C

polymorfisme i lungekreft, Le Marchand et al [38] fant det å være forbundet med risiko hos ikke-røykere, et funn som bekrefter våre resultater. En annen studie av Jose et al [39] på lungekreft fant ingen sammenslutning av noen

CYP1A1

polymorfisme med røykere. Lignende resultater ble rapportert i tykktarmskreft hvor heterozygote og variant genotyper av både CYP1A1 * 2A og CYP1A1 * 2C konferert risiko i kombinasjoner med NAT2 bare blant ikke-røykerne [40]. al.

Legg att eit svar