Abstract
Bakgrunn
Epidemiologiske og rase studier tyder på at lungekreft resultatene fra den kombinerte effekten av alder, røyking, nedsatt lungefunksjon og genetiske faktorer. I et tilfelle kontroll forening studie med friske røykere og lungekreft tilfellene vi identifisert genetiske markører assosiert med enten mottakelighet eller beskyttelse til lungekreft.
Metodikk /hovedfunnene
Vi screenet 157 kandidat enkelt nukleotid polymorfismer (SNP) i et funn kohort av 439 pasienter (200 kontroller og 239 lungekreft tilfeller) og identifiserte 30 SNPs assosiert med enten friske røykere (beskyttende) eller lungekreft (mottakelighet) fenotype. Etter genotyping denne 30 SNP panel i en validering kohort av 491 pasienter (248 kontroller og 207 lungekrefttilfellene) og, med de samme beskyttende og resistens genotyper fra våre funn årsklasse, ble en 20 SNP panel valgt basert på replikering av SNP foreninger i valideringen kohort. Etter multivariate logistisk regresjonsanalyse, inkludert de valgte SNPs fra forsøk 1 og 2, fant vi alder og familiehistorie med lungekreft for å være betydelig og uavhengig assosiert med lungekreft. Tall score ble tildelt både SNP og demografiske data, og kombinert for å danne en enkel algoritme av risiko.
Konklusjon /Betydning
Vesentlige forskjeller i fordelingen av lungekreft mottakelighet Poengsummen ble funnet mellom normale kontroller og lunge krefttilfeller, som forble etter at regnskap for forskjeller i lungefunksjon. Validering i andre case-control og potensielle kullene er i gang for å definere den potensielle kliniske nytteverdien av denne modellen
Citation. Young RP, Hopkins RJ, Hay BA, Epton MJ, Mills GD, Black PN, et al . (2009) Lungekreft Følsomhet modell basert på alder, slektstre og genetiske varianter. PLoS ONE 4 (4): e5302. doi: 10,1371 /journal.pone.0005302
Redaktør: Iris Schrijver, Stanford University, USA
mottatt: 13 november 2008; Godkjent: 19 mars 2009; Publisert: 23 april 2009
Copyright: © 2009 Young et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Denne studien ble delvis finansiert av Helseforskningsrådets New Zealand (Grant 9101-3602829), Medical Foundation of New Zealand Auckland Forskning og University of Auckland (ansatte forskningsfond), New Zealand. Denne studien ble også delvis finansiert av Synergenz biovitenskap gjennom University of Auckland. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:. Dr. Robert Young er en vitenskapelig rådgiver til Synergenz biovitenskap som har, gjennom University av Auckland, hjalp sponse denne studien.
Innledning
Mens 90% av personer med lungekreft har en smoking historie, bare 10-15% av kroniske røykere utvikle lungekreft tyder faktorer i tillegg til røyking eksponering er relevant [1]. Alder, røyking eksponering, nedsatt lungefunksjon og familiens historie har blitt identifisert som uavhengige risikofaktorer for lungekreft [2]. Genetiske faktorer har også vist seg å spille en rolle i å bestemme mottakeligheten til lungekreft [3]. Disse genetiske faktorer antas å gi en iboende følsomhet (overdrevet eller mistilpasset respons) til kronisk betennelse fra sigarettrøyking [4], [5]. I samsvar med mange kreft modeller, dette inflammatorisk stimulus i lungene resultater i vev-omdanning, DNA-skade og nedsatt cellesykluskontroll [3] – [5]. Denne vevsremodelleringen resulterer i nedsatt lungefunksjon (dvs. kronisk obstruktiv lungesykdom eller KOLS) som, til tross for at det påvirker mindretall av røykerne [6], er til stede i 50% eller mer av lungekreft tilfellene [7] og anerkjent som en av de mest viktige markører for risiko lungekreft [8].
Genetisk predisposisjon for lungekreft er sannsynlig å være både polygenic og heterogen, gitt av en variabel kombinasjon av relativt vanlige polymorfismer med lav penetrans og beskjedne effektstørrelser [9], [10]. Videre er det sannsynlig at viktig å røyke-gen-interaksjoner ligger til grunn for lungekreft [11] som sett i andre røyke-relatert kreft (for eksempel blære- og mage). Genetiske varianter assosiert med både kols og lungekreft har blitt identifisert, senest kromosomet 15q25 genet locus [12], [13]. Derfor å unngå mulige konfunderende vi foreslår at det er viktig å måle lungefunksjonen i deltakerne i case-kontroll studier av lungekreft [13]. For både epidemiologiske og biostatistiske årsaker vil spirometrisk screening av sammenlign utsatte kontroller øke kraften i studien å identifisere relevante genetiske varianter (skille lav fra høyrisiko personer) sammenlignet med studier der kontrollgruppe er uskjermede [14].
det er vel kjent at ikke-genetiske risikofaktorer som alder, tidligere lungesykdom og røyking historie er svært viktig og kan kombineres for å utvikle risikobaserte verktøy for lungekreft mottakelighet for eksempel lungekreft Assessment Tool utviklet av Bach ( www.mskcc.org) [15]. Nylig ble genotype data fra tidligere innblandet prostatakreftfølsomhets SNPs kombinert med familiens historie å utlede risikoestimater for prostatakreft [16]. I det sistnevnte studie ble kontroller screenet ved anvendelse av prostata spesifikt antigen og bare de med normale nivåer ble rekruttert som kontroller. Denne tilnærmingen reduserer feilklassifisering av kontroller (dvs. menn med udiagnostisert prostatakreft eller økt risiko for prostatakreft). Vi har brukt en lignende tilnærming i vårt tilfelle kontroll studie design og analyse, og viser hvordan genetiske varianter tidligere viser små effekter på risikoen for lungekreft kan kombineres i en algoritme med andre kjente risikofaktorer for å utlede en risikomodell for lungekreft.
Metoder
studie~~POS=TRUNC
Denne studien var en totrinns tilfelle kontroll design utført i 3 sentre følge samme rekrutterings protokollen. Lungekrefttilfeller kaukasisk herkomst (alle 4 besteforeldre av kaukasisk avstamming) ble identifisert gjennom sykehusklinikker mellom 2004 og 2007 som følger: 40 år gammel, tidligere historie med røyking (minimum 15 pakke år), diagnose bekreftet på histologisk eller cytologisk begrunnelse og begrenset til følgende fire histologiske subtypes- adenokarsinom, plateepitelkreft, småcellet lungekreft og ikke-småcellet lungekreft (vanligvis stor celle eller bronchoalveolar subtyper). Median tidsintervallet mellom diagnose og rekruttering var 3 måneder. Lungekreft tilfeller gjennomgikk blodprøver for DNA-ekstraksjon, en etterforsker spørreskjema og spirometri bruker en bærbar spirometer (Easy-One ™, NDD Medizintechnik AG, Sveits) etter American Thoracic Society (ATS) kriterier. For de lungekreft tilfellene som allerede hadde gjennomgått kirurgi, ble preoperativ lungefunksjon utført ved sykehuset laboratorium (ved hjelp av ATS-kriterier) hentet fra medisinske poster.
Kontrollpersonene ble rekruttert fra de samme miljøene som sakene som følger: kaukasisk opphav (som definert ovenfor), i alderen 45-80 år gammel og hadde en tidligere eller nåværende røyking historie av minimum 15 pakke år. Kontrollene var frivillige som møtte kriteriene ovenfor, og ble identifisert gjennom enten et fellesskap mail ut eller mens han deltok i samfunnet basert sosiale klubber. Alle røykere kontroller gikk blodprøvetaking, spirometri og samme etterforsker spørreskjema gitt til lungekreft tilfellene. Kontroll røykere rekruttert fra lokalsamfunnet som ble funnet å ha kols, basert på screening spirometri (FEV1 /FVC 70% og FEV1% 80%), ble analysert separat. Alle fag som tilbys informert skriftlig samtykke. Studien ble godkjent av etikkomiteen Multi-Region, Wellington, New Zealand (AKX /03/08/207). Spørreskjemaet (modifisert fra ATS Respiratory Questionnaire) inkludert data om demografiske variabler som alder, kjønn, medisinsk historie, familiehistorie med lungesykdom, aktiv og passiv tobakk eksponering og yrkes aero-forurensende eksponeringer.
Utvalg og genotyping av enkeltnukleotidpolymorfi
Etter litteraturgjennomgang, polymorfismer tidligere innblandet i enten KOLS eller lungekreft med følgende attributter ble valgt: (a) enkeltnukleotidpolymorfi (SNPs) i gener som koder for proteiner i veier av cellesyklus kontroll, oksidasjonsmiddel respons, apoptose og inflammasjon i luftveiene, og (b) SNP som var kjent for å ha enten funksjonelle effekter på in vitro-testing, eller var ikke-synonyme eller regulatoriske regioner. I et funn kohort av 439 røykere (løp 1 rekruttert i årene 2003-2005: 239 lungekreft tilfeller og 200 kontroll røykere), ble 157 kandidat SNPs skjermet (se utfyllende data S1) og de hvor forskjellen i genotypefrekvensene mellom saker og kontroller (ved hjelp av recessiv eller co-dominerende modellen) oversteg 20% størrelse forskjell og P-verdi 0,20 ble identifisert som en del av vår modell forming tilnærming [17]. SNPs med samtalepriser 95% etter retesting, ikke ble inkludert i videre analyse. SNPs ble tildelt som «beskyttende» eller utsatt når homozygot og /eller heterozygot genotype for enten allel ble funnet i overkant i henholdsvis kontroll røykere eller lungekreft tilfellene (i en recessiv eller co-dominerende modellen).
Genotyping
Genomisk DNA ble ekstrahert fra fullblod ved å bruke standard salt-baserte metoder. Renset genomisk DNA ble porsjonert (10 ng /ul konsentrasjon) i 96 brønners plater og genotypet på en Sequenom ™ -system (Sequenom ™ Autoflex Mass Spectrometer og Samsung 24-pin nanodispenser) av den australske Genome Research Facility (www.agrf.com.au) ved hjelp av sekvenser utformet i huset (tilgjengelig på forespørsel) og anbefalt forsterker og separasjonsmetoder (iPLEX ™, www.sequenom.com) [16].
Fra 157 kandidat SNPs vist i vår oppdagelse kohort (se utfyllende data S1), 30 SNPs møtte kriteriene ovenfor i løp 1. Disse 30 SNPs ble genotypet i en andre validering kohort av 491 røykere (run 2 rekruttert i årene 2006-2007: 207 lungekreft tilfeller og 284 kontroll røykere) rekruttert i samme vei. For alle SNP analyser, igjen minimum 95% takst var nødvendig. Denne andre kohort av lungekreft tilfellene og friske kontroll røykere var sammenlignbare med de første gruppene med hensyn til demografiske faktorer og lungekreft egenskaper (upubliserte data). Basert på uavhengige replikasjon av foreningene (univariate analyser med liknende ELLER og P-verdier) i løp 2 som er observert i forsøk 1 (ie. Konsistens, retning og betydningen av forening), en avsluttende panel av de 20 mest diskriminerende SNPs (12 mottakelighet SNPs og 8 beskyttende SNPs fra testpanelet av 30) ble valgt (se utfyllende data S1).
algoritme
Tildelingen av en beskyttende eller utsatt SNP genotype /s ble gjort fra test kohorten data (drevne 1) og er strengt anvendt på data fra forsøk 2. for hvert individ ble en numerisk verdi på -1 tildelt for hver av de beskyttende genotyper er tilstede blant de beskyttende SNP’er og en for hver av de følsomme genotyper tilstede. Hvor en person ikke har et beskyttelses eller mottakelighet genotype for at SNP den stillingen 0 (ie. Ikke bidra til den genetiske score). Denne fremgangsmåten er i samsvar med en nylig publisert studie i prostata kreft [16]. Vekting tilstedeværelse av spesifikke mottakelige eller beskyttende genotyper i henhold til sine individuelle odds ratio (OR fra univariate regresjon eller punktestimater fra multivariat regresjon) ikke signifikant bedre diskriminerende ytelsen til rå SNP score (upubliserte data).
lungekreft mottakelighet poengsum
Ved hjelp av multivariate logis og trinnvis regresjonsanalyse fra forsøk 1, ble det SNPs undersøkt sammen med relevante ikke-genetiske faktorer som identifiserte alder og familiehistorie med lungekreft som vesentlige bidragsytere til lungekreft mottakelighet. I samsvar med andre tilfelle kontroll studier, tidligere diagnostisert KOLS og kvinnelige kjønn i vår studie var også forbundet med økt risiko for lungekreft (p 0,001 og p 0,01 henholdsvis). Vi gjorde ikke inkludere kjønn i den endelige risikomodellen som dens betydning i prospektive studier mangler [18]. Vi inkluderte ikke KOLS i modellen, da dette var grunnlaget for å velge våre kontroller. Basert på multivariat analyse i forsøk 1, ble en poengsum tildelt i henhold til alder og familiens historie og testet i forsøk 1 og kjøre to separat i en mottaker operatør kurve analyse (ROC, se resultatene nedenfor). Disse to variablene har blitt identifisert i andre risikovurderingsverktøy for lungekreft mottakelighet [15] og forbedret diskriminerende effekt av SNP poengsum data alene. Som røyking eksponering (pakke år) var en rekrutterings kriterier for denne studien og sammenlignbar mellom saker og kontroller, det var ikke overraskende å finne det gjort lite bidrag til dette scoring system stammer fra våre kohorter. Den lungekreft mottakelighet score for de kombinerte lunge krefttilfeller og kontroller (n = 930) ble plottet med (a) hyppigheten av lungekreft, og (b) den flytende absolutt risiko (tilsvarende odds ratio) over den kombinerte røyker /ex -smoker kohort [19], [20].
Statistisk analyse
Pasient egenskaper i de tilfeller og kontroller ble sammenlignet med uparede t-test på kontinuerlige variabler og chi-kvadrat test for diskrete variabler . Genotype og allelfrekvenser ble sjekket for hver SNP av Hardy Weinberg Equilibrium (HWE). Befolknings blanding ble ekskludert av befolkningen struktur analyse på genotyping data fra 40 ubeslektede SNPs [21]. Skjevheter i genotypefrekvensene ble identifisert mellom saker og kontroller ved hjelp av to av 3 krysstabeller. Genotype data (20 SNP panel) og de mest relevante ikke-genetiske variabler ble kombinert i en trinnvis måte å vurdere deres kombinerte effekter på diskriminerende lav og høy risiko (ved odds ratio og ROC) etter karakter kvintil. Frekvensfordelingen av de optimaliserte lungekreft følsomhet resultatet ble sammenlignet på tvers av tilfellene og kontroller. Det er potensial klinisk nytte som en risiko verktøyet ble vurdert ved hjelp av mottaker-operatør kurve analyse.
Resultater
demografiske variabler og genotyping
Kjennetegn på de friske kontroll røykere og lungekreft tilfellene er oppsummert i tabell 1. 446 lungekreft tilfeller (kjøre 1 = 239 og kjøre 2 = 207) var sammenlignbare med en nylig publisert serie [22]. Gitt den lille forskjellen i alder, de 482 friske kontroll røykere (løp 1 = 200 løp 2 = 282) ble forholdsvis utsatt med hensyn til røyking og andre aero-forurensende stoffer. Den lavere frekvens av dagens røykere i lungekreft konsernet reflekterer sannsynligvis co-eksisterende KOLS (høyere slutte priser), mens lengre varighet av røyking i lungekreft tilfellene gjenspeiler deres eldre alder. I et gen av røyking samhandlingsmodell som dette, forskjeller i røyking eksponering er mer sannsynlig å skjule effekter (skjevhet til null) enn generere effekter. I samsvar med funnene til andre, lungekreft kohorten hadde høyere forekomst av en familiehistorie med lungekreft (19% vs. 9%) og historie av kols (29% vs. 5%). Sistnevnte (5%) gjenspeiler mest sannsynlig en klinisk diagnose av kols, basert på symptomer, men ikke spirometri, i røykere med astma og /eller kronisk bronkitt. Som forventet, lungefunksjon var verre i lungekreft kohorten sammenlignet med friske røyker kontroller. Testing lungefunksjon i lunge krefttilfeller (utført innen 3 måneder etter diagnose, i fravær av plevravæske og før operasjonen) tillater oss å teste for confounding av KOLS (se nedenfor).
Basert på replikering av foreningen i løp 1 og uavhengig i løp 2, ble de 20 mest konsekvent forbundet SNPs valgt. De observerte genotyper for de 20 SNPs i denne studien var i Hardy-Weinberg likevekt (se tabell 2) og dermed utelukke betydnings genotyping feil. Genotypefrekvensene for kontrollene var sammenlignbare med de fra International Hapmap Project (www.hapmap.org). Utviklingen av lungekreft mottakelighet score er beskrevet i metodene ovenfor og en oppsummering av 20 SNP panel univariate analysen er presentert i tabell 3. Selv om seks av de 20 beste SNPs ikke når tradisjonelle nivåer av betydning de har blitt tatt med i panelet fordi (a) i tidligere studier at de har vist seg å ha funksjonelle effekter (b) de har tidligere blitt assosiert med COPD og /eller lungekreft (se diskusjon), (c) i kombinasjon utgjør de et bidrag til utførelsen av følsomhet scorer (AUC for modellen med bare 14 betydelige SNPs P≤0.05, se nedenfor), og (d) deres inkludering gir mulighet for genetisk heterogenitet som kommer ut i lungekreft tilfelle kontroll studier.
Risk modellutvikling
i en multivariat logistisk regresjonsanalyse som inkluderte den valgte SNPs (individuelt), alder ( 60 år), kjønn og historie av kols familiehistorie med lungekreft (første grad relative) ble funnet å være uavhengig assosiert med lungekreft mottakelighet i løp 1, kjører to og kombinert. For det kombinerte datasettet, OR for mottakelighet og beskyttende SNPs varierte mellom 01.01 til 03.02 og 0,20 til 0,80 henholdsvis (den kombinerte SNP resultatet er uavhengig relatert til lungekreft, P 0,001). OR for alder 60 år og familiehistorie med lungekreft var 3.5 (2.5 til 4.9, p 0,001) og 2,5 (1,6 til 4,0, p 0,001) henholdsvis (total AUC = 0,75 hvor SNPs ble inkludert individuelt mens du justerer for ikke-genetiske variabler). Basert på disse funnene, og de fra tidligere publiserte studier [3], [6], [7], vi tildelt score til ikke-genetiske variabler som følger; +4 For de i alderen 60 år gamle og 3 for de med en familie historie av lungekreft. En slik tilnærming er i samsvar med eksisterende risiko score [15], [16] og plasserer SNP data i egnet klinisk sammenheng [15]. Kjønn og diagnosen KOLS ble ikke inkludert i denne risikomodellen av de grunner som er beskrevet ovenfor.
Model ytelse
I kombinert 20 SNP-modellen ble lungekreft mottakelighet poengsum sammenlignet med hyppigheten av lungekreft og en lineær sammenheng ble funnet på tvers av lungekreft mottakelighet score ≤1 til 8 + med lungekreft frekvens som spenner over 18% til 81% (figur 1a). Størrelsen av denne effekt ble også undersøkt ved anvendelse av den flytende absolutt risiko [19], [20] plottet på en log skala (tilsvarer en Odds forhold, OR), som refererer til den laveste frekvensen gruppen som SV = 1 (referent gruppe, lunge poengsum kreft ≤1) og sammenligner hver lungekreft poengsum i forhold til referent gruppen (Figur 1b). Den OR spente 1 til 19,1 tvers av lungekreft score når motivet ble gruppert omtrent som kvintilene (p 0,001). Den lungekreft mottakelighet score for lungekreft tilfellene og kontroller viser en bimodal fordeling på frekvensfordelingen (figur 2) som indikerer potensielle nytten som en screening test av risiko [23].
1a. Hyppigheten av lungekreft i henhold til lungekreft mottakelighet (risiko) score. 1b. Odds ratio for lungekreft henhold til lungekreft mottakelighet (risiko) score.
Model sensitivitetsanalyse
For å korrigere for de små forskjeller i alder, røykestatus og kjønn blande mellom saker og kontroller, ble en undergruppe (følsomhet) analyse gjort (a) begrenset til de over 60 år (alder vekting like brukes på alle) og (b) hvor gjennomsnittsalder, pakke år og kjønn ble tett matchet mellom saker og kontroller (n = 450: 72 vs 69 år, 45 vs 43 pakke år og 70% mot 70% menn henholdsvis). En lineær økning i eller på tvers kvintilene av lungekreft mottakelighet poengsum (range 1-28, p 0,01) forble tydelig med konfidensintervall konsistente med de som stammer bruker hele datasettet (figur 1b) (dvs. overlappende.). Den potensielle confounding effekten av KOLS ble også undersøkt av (a) å sammenligne fordelingen av lungekreft mottakelighet score i lunge krefttilfeller i henhold til spirometriske kriterier (% av forventet FEV1, figur 3a) og (b) unntatt lungekreft tilfellene med co-eksisterende KOLS (basert på tidligere beskrevet spiro kriterier n = 227, figur 3b). Fordelingen av resultatet mellom krefttilfellene sub-gruppert etter lungefunksjon eller kols ikke er annerledes enn den totale lungekreft kohorten (3a og 3b) og inkluderer betydelig confounding av KOLS.
3a Frekvens fordeling av poengsum lungekreft blant kontroller og lunge krefttilfeller fordelt i henhold til lav (KOLS) og normal lungefunksjon. 3b Frekvens fordeling av lungekreft poengsum blant kontroller og lungekreft tilfeller med normal lungefunksjon (kols ekskludert).
ROC analyse
I en mottaker operatør buet analyse (n = 930 ) av den kombinerte 20 SNP-modellen, har vi funnet arealet under kurven (AUC eller C statistikk) for kjøre en, løpe to og kjøre 1 + 2 var 0,82, 0,75 og 0,77 kroner. AUC i samlet gruppe for 20 SNP panel, alder, og familiehistorie med lungekreft på egen hånd var henholdsvis 0,68, 0,70 og 0,55. Når «genetiske faktorer» bare benyttes i risikomodellen (SNPs + FHX av lungekreft), sett i Prostatakreft studie [16] den, spenner OR 1-10 tvers kvintilene og AUC = 0,70 (uten bidrag fra alder). På trinnvis analyse, alder og SNP-panelet gjør det største bidraget til AUC (SNPs = 0,68, alder + SNPs = 0,76 og alder + SNPs + FHX = 0,77). Når SNP panelet er begrenset til de 14 betydelige SNPs, AUC for SNPs alene er 0.66 og kombinert med alder og familiens historie er 0.75. Når kjønn ble inkludert i 20 SNP kombinert modell AUC ble ikke bedre. Når forhistorie KOLS ble også lagt til den kombinerte modellen (score 4 basert på multivariat regresjon), økte AUC til 0,79. Som nevnt ovenfor, når alder og pakke årene ble strengt matchet og mulig konfunderende av KOLS analysert, var det ingen forskjell i våre funn.
Diskusjoner
Ved hjelp av en kandidat genet tilnærming i en totrinns utvalg behandle et panel av verne- og mottakelighet SNPs ble identifisert som individuelt konferere bare små effekter på risikoen for lungekreft (OR 0.3 til 2.6). Dette er svært mye i tråd med erfaringene fra sak control assosiasjonsstudier oppdatert [11], [12], [16], [24]. I samsvar med eksisterende risikomodeller, ble relevante faktorer sammen ved hjelp av en algoritme (i denne studien inkludert SNP data) for å utlede en mottakelighet score på en enkel lineær skala. Denne studien design, og algoritmisk tilnærming som ligger til grunn for denne lungekreft mottakelighet score, kan sammenlignes med en fersk undersøkelse i prostatakreft. Dessuten tar det i betraktning viktige epidemiologiske observasjoner som er relevante for genetisk predisposisjon for lungekreft. For det første at selv om røyking eksponering er hovedsakelig en forutsetning for å få lungekreft, økende alder og dårlig lungefunksjon har viktige uavhengige virkninger på lungekreft følsomhet. For det andre genetiske faktorer som ligger til grunn risikoen for lungekreft er sannsynlig å være både polygenic og heterogen, gitt av en variabel kombinasjon av genetiske varianter (dvs. SNPs med lav penetrans og små effektstørrelser). Tredje, genetiske faktorer kan gi enten en beskyttende [24] eller mottakelighet [13] fenotype til lungekreft. Fjerde, potensielle konfunderende effekt av KOLS [13] har blitt redegjort for i modellen. Her rapporterer vi en 20 SNP panel som kombinert med familiens historie [16] definerer risiko (OR) over kvintilene spenner 1-10 med en AUC på 0,70. En risiko verktøy med større klinisk anvendelse kan utledes ved å ta med alder for å identifisere dem som har størst følsomhet for lungekreft (OR strekker 1-19 og AUC = 0,77).
Dette studium forsøkte å minimalisere falske positive resultater i en rekke måter. Den viktigste av disse var til internt validere SNP foreninger som bruker en to-trinns design med en innledende oppdagelse kohort (løp 1) for å identifisere SNPs være av interesse. Bare disse SNPs ble testet i en andre (validering) kohort av saker og kontroller (kjøre 2) og ved hjelp av univariat analyse fra de to løper uavhengig å velge SNPs basert på replikering. For det andre ble befolkningen stratifisering ekskludert og tredje ble forekomsten av genotyping feil minimeres gjennom HWE analyse og ved å utelukke SNPs med 95% takst (mislykkes på genotyping er alltid genotypespesifikke, og dermed generere falske positive assosiasjoner). Med hensyn til mulig forvirrende, i en sensitivitetsanalyse hvor lungekreft tilfellene og sunne røyking kontroller ble matchet for røyking eksponering (pakke år), alder, kjønn og tilstedeværelse av KOLS, ble resultatene av lungekreft scorer ikke redusert.
Svakheter i denne studien omfatter den beskjedne størrelsen på gruppene, border betydningen av noen SNPs i fravær av korreksjon, cross-sectional design og rekruttering begrenset til kaukasiere med minimum 15 pakke år. Videre valgte vi å rekruttere røykere med i hovedsak normal lungefunksjon som kontroller for å forbedre strøm [14] og best representerer de minst utsatt for de negative virkningene av røyking (KOLS og lungekreft), men mest representative for røykere generelt som opprettholder normal lungefunksjon [6]. Av denne grunn ble KOLS ikke inkludert i modellen, selv om det er en viktig risikofaktor og lagt til poengsummen nytte i en post-hoc analyse. En ytterligere begrensning i studien er at selv om sakene og kontrollene var uten tvil representant, ikke alle variabler ble nøyaktig tilpasset i den innledende analyse (f.eks alder, kjønn og røykemønstre). Det skal bemerkes at selv om nøyaktig tilpassing av alle demografiske faktorer reduserer potensialet for uforståelige, er det også potensielt tilslører viktige effekter av variablene i en risikomodell. Selv om bare 14 av de 20 SNPs nådd tradisjonelle nivåer av betydning i de kombinerte kohorter, og tillegg av de resterende seks SNPs bidro kun beskjedent til modellen, dette var en to scenografi der replikering av foreninger (i denne og andre studier) og biologisk plausibilitet [23] – [42] var på grunnlag av SNP utvalg. Videre studier må gjøres for å ytterligere bekrefte dette SNP panel og risikomodellen i uselekterte populasjoner.
I denne studien en kandidat genet (dvs. hypotesedrevet) tilnærming ble brukt til å identifisere potensielt funksjonelle SNPs assosiert med utvikling av både kols og lungekreft. Selv om SNPs identifisert i denne studien kan bare reflektere koblingsulikevekt med funksjonelle varianter i nærheten, disse SNPs er sannsynlig å ha funksjonelle effekter og engasjement direkte med mottakelighet for lungekreft. Den 20 SNP Panelet består av genetiske varianter som er kjent for å kode proteiner underliggende viktige veier innblandet i lunge kreftutvikling, spesielt; metabolisme av røyke-avledet kreftfremkallende (N-acetyl transferase 2 og Cytokrom P450 2E1) [25], [26], inflammatoriske cytokiner (Interleukiner 1, 8 og 18, Tissue nekrosefaktor alfa-1-reseptoren, Toll-like receptor 9) [27] – [30], røyking avhengighet (dopamin D2-reseptoren og dopamin transporter 1) [31], [32], antioksidant respons til røyking (α1 anti-chymotrypsin og ekstracellulære superoksid dismutase) [24], [33], cellesyklus kontroll, DNA-reparasjon og apoptose (Xeroderma pigmentosum utfyllende gruppe D, p73, BCL-2, Fasl, Cerb1 og REV1) [34] – [39] og inte innblandet i apoptose [40] – [42]. En av SNPs (α5 nAChR) har nylig blitt assosiert med både lungekreft og kols i kandidat-genet [13] og genom brede assosiasjonsstudier [43], [44]. Denne reseptoren ser ut til å de direkte relatert til nikotin effekter på luftveisinflammasjon [45]. Som det kan ses, blir SNP panelet (tabell III) består av en rekke av SNP fra gener involvert i mange inter-relaterte veier. Tolv av disse SNPs har blitt assosiert med lungecancer i andre kullene. Det er sannsynlig andre SNPs fra foreløpig uidentifiserte gener vil bli identifisert i fremtiden. For å vurdere ytterligere nytten av lungekreft mottakelighet stillingen, er en prospektiv studie som pågår. Hittil lungekreft tilfellene (n = 43) har samme gjennomsnitt og fordeling som lungekreft tilfeller rapportert i denne studien (upubliserte data). Videre tilfelle kontroll og funksjonelle studier vil være nødvendig å ytterligere undersøke hvilken rolle disse SNPs i lungekreft mottakelighet.
Forfatterne foreslår at klinisk nytte av genotype data krever at mange SNPs er analysert og deres effekter kombinert med andre epidemiologiske faktorer av betydning [16]. Algoritmen tilnærming brukt i denne studien forutsetter en enkel additiv modell sammenlignbar med den som nylig er publisert i Prostatakreft [16] og innebærer minimal forutsetninger (ikke hierarkisk eller baneanalyse basert). Pasientens poengsum kan sammenlignes med resultatet hos røykere med minst mottakelighet for lungekreft (aller laveste) på en enkel lineær måte. En slik tilnærming er sammenlignbare med de risiko verktøy utviklet av andre, [15], [16]. Den potensielle kliniske nytten av lungekreft følsomhet resultatet ble bedømt ved mottageroperatøren kurve analyse. Dette viste c statistikken til å være 0,77 og, på en avstenging av ≥3, anslagsvis sensitivitet på 89% og en tilsvarende spesifisitet på 45%. Disse resultater er sammenlignbare med ROC utførelsen av Framingham stillingen (c-statistikken = 0,74). Den c statistikken for de 20 SNP panel på egen hånd var 0,68 (og 0,70 når den kombineres med familiehistorie) som indikerer dens nytte i den aktuelle kohorten. Det er bevis, selv om begrenset, at genetisk testing positivt endre oppførselen til røykere i sammenheng med røykeslutt (øke hensikt og muligens forbedre slutteraten [46], [47]) eller ved å senke forekomsten smoking [48]. Selv om flere valideringsstudier er nødvendig, antyder denne studien at genetiske data kan kombineres med andre risikovariabler fra røykere eller eks-røykere å identifisere enkeltpersoner som er mest utsatt for å utvikle lungekreft. Videre studier er planlagt i større kohorter av uselekterte saker og kontroller.
Hjelpemiddel Informasjon
Supplerende data S1.
doi: 10,1371 /journal.pone.0005302.s001 plakater (0,03 MB DOC)
Takk
Vi erkjenner takknemlig deltakelse av fagene i denne studien spesielt pasienter med lungekreft.