Abstract
Formål
Forekomst og dødelighet av tykk- og endetarmskreft er raskt økende i Korea i løpet av siste par tiår. Utvikling av risiko prediksjonsmodeller for tykktarmskreft i koreanske menn og kvinner er stort behov for å forbedre forebygging og tidlig oppdagelse.
Metoder
Kjønn bestemt fem års risiko prediksjonsmodeller ble utviklet for generelle kolorektal kreft, proksimal tykktarmskreft, distal tykktarmskreft, tykktarmskreft og kreft i endetarmen. Modellen ble utviklet ved hjelp av data fra en befolkning på 846,559 menn og 479,449 kvinner som deltok i helseundersøkelser av National Health Insurance Corporation. Kandidater var 30-80 år gammel og fri for kreft i referanse år 1996 og 1997. En uavhengig befolkning på 547,874 menn og 415,875 kvinner som deltok i 1998 og 1999 undersøkelser ble brukt til å validere modellen. Modellvalidering ble gjort ved å evaluere ytelsen i form av diskriminering og kalibrering evne å bruke C-statistikken og Hosmer-Lemeshow-type chi-kvadrat statistikk.
Resultater
Age, kroppsmasseindeks, serum kolesterol, familiehistorie med kreft, og alkoholforbruket ble inkludert i alle modeller for menn, mens alder, høyde og kjøtt inntak frekvens ble inkludert i alle modeller for kvinner. Modeller viste moderat god diskriminering evne med
C
-statistics mellom 0,69 og 0,78. C-statistikken var generelt høyere i modeller for menn, mens kalibrerings evner var generelt bedre i modellene for kvinner.
Konklusjoner
Tykktarmskreft risiko prediksjonsmodeller ble utviklet fra storskala , populasjonsbaserte data. Disse modellene kan brukes til å identifisere høyrisikogrupper og utvikle forebyggende intervensjon strategier for tykktarmskreft
Citation. Shin A, Joo J Yang H-R, Bak J, Park Y, Kim J et al. (2014) Risiko prognosemodell for tykktarmskreft: National Health Insurance Corporation Study, Korea. PLoS ONE 9 (2): e88079. doi: 10,1371 /journal.pone.0088079
Redaktør: Zhengdong Zhang, Nanjing Medical University, Kina
mottatt: 14 juli 2013; Godkjent: 05.01.2014; Publisert: 12 februar 2014
Copyright: © 2014 Shin et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Forfatterne har ingen støtte eller finansiering for å rapportere
konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP er en av de raskest økende kreft. i den koreanske befolkningen, med årlige prosent endring av 6,2% hos menn og 6,8% hos kvinner mellom 1999 og 2009 [1]. Selv om dødeligheten av tykktarmskreft begynte å avta i yngre generasjoner og kvinner [2], er tykktarmskreft fortsatt rangert som den fjerde vanligste årsaken til kreftdød [3].
Flere risiko prediksjonsmodeller for kolorektal kreft har blitt utviklet og validert i ulike populasjoner [4] – [11]. De viktigste rollene risiko prediksjonsmodeller er: 1) for å identifisere personer med høy risiko for å utvikle sykdommen som så kan bli tilbudt individuelt tilpasset klinisk ledelse, målrettet screening og tiltak for å redusere sykdomsbyrden og 2) å identifisere nye risikofaktorer for sykdommen gjennom forskning [11].
Nyere litteratur tyder på at fordelingen av molekylære undergrupper av tykktarmskreft variere fra sekundære områder [12], [13]. I vår forrige undersøkelse, rapporterte vi at risikofaktor profiler varierte på bakgrunn av kjønn, og av de anatomiske områder av kolorektal kreft [14]. Derfor er fokus for denne studien var å utvikle kolorektal kreftrisiko prediksjonsmodeller for overordnet tykktarmskreft, proksimale tykktarmskreft, distal tykktarmskreft, og endetarmskreft for den koreanske befolkningen; utnytte et stort sett av helseundersøkelsen data.
Metoder
Study befolkningen
Denne studien ble godkjent av Institutional Review Board of National Cancer Center, Korea (IRB no. NCCNCS 09-305). Behovet for deltakernes samtykke ble frafalt av etisk komité fordi denne studien involverte rutinemessig samlet medisinsk data som ble anonymt klarte i alle stadier, inkludert data rengjøring og statistiske analyser.
To uavhengige sett av befolkningen ble innlemmet i denne studere. Det første datasettet ble brukt til modellutvikling, som besto av menn og kvinner som deltok i en helseundersøkelse som tilbys av National Health Insurance Corporation (NHIC) mellom 1996 og 1997. Nærmere opplysninger om studiedesign har blitt beskrevet andre steder [14]. Deltakerne ble bedt om å fylle ut spørreskjemaer om alkoholforbruk, røyking vaner, regelmessig mosjon, familiehistorie med kreft, kosttilskudd preferanser, og hyppigheten av kjøttforbruket. Ytterligere informasjon om kvinnelige reproduktive faktorer (dvs. alder ved menarke, alder ved første fødsel, menopausal status og alder ved menopause) ble også samlet inn. Høyde og vekt ble målt direkte, og kroppsmasseindeks (BMI) ble beregnet som vekten i kilo delt på høyde i meter kvadrat.
Det andre datasettet ble brukt til modellvalidering, som besto av de som deltok i noen medisinske undersøkelser i 1998 og 1999. de som var med i den endelige analysen var mellom 30 og 80 år gammel, uten tidligere historie av kreft, og med ingen manglende informasjon til noen av de viktigste risikofaktoren variabler (dvs. høyde, vekt , fastende serum glukose, total serum kolesterol, familiehistorie med kreft, røyking status (Current /ex- /ikke-røykere), og alkoholforbruket frekvens). Antallet forsøkspersonene inkludert var 1,326,058 (846 559 menn og 479,499 kvinner) for utvikling sett, og 963 749 (547,874 menn og 415,875 kvinner) for validering sett.
Kreft Konstatering
Forekomsten av kreft ble konstatert fra Korean Central kreft~~POS=TRUNC (KCCR) database, og døden informasjon fra den koreanske National Statistical Office frem til desember 2007. sekundære områder av tykktarmskreft ble kategorisert av International Classification of Disease 10. utgave (ICD-10) koden som følger : proksimale colon (C180-C185), distal kolon (C186-C187), og endetarmen (C19-C20). Kreft med en overlappende svulst i tykktarmen (C188), og de var ikke annet er spesifisert (C189) ble ekskludert fra under nettstedet analyse.
Statistisk analyse
Fem modeller ble utviklet for generelle tykktarmskreft, tykktarmskreft, rett tykktarmskreft, venstre tykktarmskreft, og endetarmskreft, separat for menn og kvinner. Den Cox proporsjonal-hazard regresjonsmodeller ble brukt for å utvikle prediksjon ligninger i utvikling sett. Kolorektal kreft forekomster ble regnet som en hendelse på dato for innleggelse registrert i Kreftregistreringsdata. Forsøkspersonene ble sensurert på tidspunktet for døds konstatert fra dødsattesten database, eller på sluttdato etter åtte års oppfølging.
Crude og aldersjusterte analyser ble utført for hver risikofaktor. Alder og de kvadratiske gjelder alder ble sentralisert ved å trekke gjennomsnittsalderen på deltagerne. Risikofaktorer vurderes for modellene var alder, alder-squared, høyde, BMI, familiehistorie for kreft, fastende glukose, serum kolesterol, røyking vane, alkoholinntak, og kjøttforbruket frekvens. Alle risikofaktorer bortsett fra alder ble inkludert som kategoriske variabler i modellen. BMI ble kategorisert i henhold til WHOs kriterier for den asiatiske befolkningen ( 25,0
vs
≥25.0.). Høyden ble delt i kvartiler og den første kvartil ble anvendt som referanse. Variable utvalg (forover, bakover og trinnvis) metoder med utvalgs og eksklusjonskriteriene for type I feil 0,15 ble vurdert i den multivariate modellen å bygge risikoen prediksjon modell.
baseline overlevelse estimat for middelverdiene av risiko faktorer for tidspunkt t (t = 5 år) ble beregnet ved den følgende ligning:. hvor
Her er de regresjon koeffisientestimatet, er risikofaktorer for hvert individ, og er gjennomsnittsverdiene for hver risikofaktor i studiepopulasjonen. S (t) er den grunnlinje overlevelse anslaget ved tiden t (t = 5 år) når alle risikofaktorer er ved deres middelverdier.
diskriminering ble kvantifisert ved å beregne C-statistikken for overlevelsen modell [15 ]. Den C-statistikken er en konkordans tiltak analog til Receiver Operating Characteristic (ROC) kurve område for den logistiske modellen [16]. Verdien angir sannsynligheten for at en modell gir høyere risiko for de som utvikler brystkreft i løpet av fem år med oppfølging, sammenlignet med de som ikke utvikle kolorektal kreft [16].
En Hosmer-Lemeshow (HL ) Type statistikk ble anvendt for kalibrering [15]. Statistikken ble beregnet ved først å dele data i 10 grupper (desiler) etter stigende rekkefølge av predikerte sannsynligheter produsert av modellen. Så, i hvert desil, spådde den gjennomsnittlige sannsynlig ble sammenlignet med den faktiske hendelsesrate anslått av Kaplan-Meier tilnærming. Verdier over 20 kan betraktes som en betydelig mangel på kalibrering [17].
I tillegg er forventet (E) og de observerte (O) antall krefttilfeller ble sammenlignet for generelle tykktarmskreft, og hver sekundære områder. Alle statistiske analyser ble utført ved hjelp av SAS versjon 9.1 (SAS Institute, Cary, NC).
Resultater
I løpet av oppfølgingsperioden, 6,492 menn og 2.655 kvinner ble utviklet kolorektal kreft i utviklingen sett. Blant mennene var det 1143 proksimale tykktarm kreft, 1,725 distale tykktarm kreft, og 3,146 endetarms kreft. Blant kvinnene var det 604 proksimale tykktarm kreft, 606 distale tykktarm kreft, og 1,252 endetarms kreft. Saker med overlappende lesjoner i tykktarmen eller som har kreft var ikke annet er spesifisert lesjoner ble ekskludert (478 menn og 193 kvinner).
I valideringen, 3,555 menn og 1,969 kvinner ble diagnostisert med tykktarmskreft. Blant mennene var det 605 proksimale tykktarm kreft, 909 distale tykktarm kreft, og 1,764 endetarms kreft. Blant kvinnene var det 433 proksimale tykktarm kreft, 448 distale tykktarm kreft, og 958 endetarms kreft.
De risikofaktorene som inngår i modellene
De risikofaktorene som inngår i risiko prediksjonsmodeller var oppført i tabell 1 (menn) og Tabell 2 (kvinner). Alder, høyde, familiehistorie for kreft, og mengden alkohol ble inkludert i alle modeller for menn. Body mass index er inkludert i alle modeller bortsett fra en for høyre tykktarmskreft.
I kvinner, alder og høyde ble inkludert i alle modellene. Fastende glukose og familiehistorie med kreft ble inkludert i alle modeller bortsett fra at for endetarmskreft, og kjøttforbruket frekvens ble inkludert i alle modeller bortsett fra at for riktig kolon. BMI ble inkludert i modellen for riktig kolon bare, og hyppigheten av alkoholforbruket ble inkludert i modellen for endetarmskreft bare.
Modell ytelse
Diskriminering.
diskriminerende evnen til modellen ble målt ved bruk av C-statistikken i både utvikling og valideringssett (tabell 3). C-statistikk for modeller for menn varierte 0.762~0.786 og statistikken for modeller for kvinner var 0.678~0.763. Modeller for colorectum (0.762 for utvikling sett og 0.779 for validering sett), venstre kolon (0,786 for utvikling sett og 0.779 for validering sett), samt endetarmen (0,753 for utvikling sett og 0.779 for validering sett) viste de høyeste C-statistikk hos menn, mens modeller for riktig kolon viste de høyeste verdiene hos kvinner (0,745 for utvikling sett og 0,763 for validering sett).
Kalibrering.
figurer 1-A, 2- En 3-A, 4-A, og 5-A viser kalibrerings tomter for den samlede tykktarmskreft modell samt E /O prosenter av valideringssett for mannlige colorectal, høyre kolon, venstre kolon, rektal, og tykktarm kreft, henholdsvis, og tallene 1-B, 2-B, 3-B, 4-B og 5-B viser de for kvinner, respektivt. Tabell 3 presenterte Hosmer-Lemeshow-type chi-kvadrat verdier. Generelt arrangement priser spådd av modellene var veldig nær den faktiske hendelsen priser i mannlige modeller. Kun modeller for venstre tykktarmskreft hos menn viste ingen signifikant prediksjon makt. Hos kvinner, men ingen av modellene viste betydelig prediksjonsevne.
Diskusjoner
Nyere epidemiologiske og kliniske opplysninger tyder på at kolon kreft og endetarmskreft er forskjellige sykdommer [12], [13], [18]. I tillegg har proksimale og distale kolon er forskjellige i embryologic opprinnelse, morfologisk utseende av slimhinner, fysiologiske funksjon, og gallesyre komposisjon [19], [20]. Blant flere tykktarmskreft prediksjonsmodeller utviklet og validert [11], bare én studie gir separate modeller for proksimale og distale colon og rectum [6]. En studie gitt separate modeller for tykktarmskreft og endetarmskreft [7]. Tidligere publiserte vi en artikkel om risikofaktor profiler for ulike kolorektal kreft sekundære områder [14]. De prediksjonsmodeller ble utviklet ved hjelp av den samme datasettet for modellutvikling med en lengre oppfølgingsperiode. I tillegg ble en uavhengig befolkning brukes til modellvalidering.
Modellene viste moderat god diskriminering evne. Modellen for generelle tykktarmskreft viste best kalibrering evne. Blant de modeller for kvinner, som for rett tykktarmskreft viste den høyeste diskriminering evne og at for venstre tykktarmskreft viste de laveste C-statistikk. Dessverre ingen av modellene viste noen meningsfull kalibrering evne. Likevel, våre modeller viste C-statistikk som var sammenlignbare med, eller enda høyere enn, andre kolorektal kreftrisiko prediksjonsmodeller [11]. C-statistikk for tre tidligere modeller 0.67-0.71 for Harvard Cancer Risk Index, 0,61 for den amerikanske studien, og 0,62 til 0,66 for japansk studie, henholdsvis, mens de for modellene våre var 0,68 til 0,78 [11]. Faktisk modell for venstre tykktarmskreft hos kvinner nådde ikke C-statistikk over 0,7. To studier som tilbys kalibrerings statistikk som forholdet mellom observerte vs. forventede kolorektal kreft hendelser (O /E) [7], [8]. O /E forhold varierte avhenge risikofaktor profil [7], [8]. I en japansk modell for menn, den Hosmer-Lemeshow chi-kvadrat p-verdien var 0,08 [7].
Insidensraten for tykktarmskreft hos kvinner er to tredjedeler at hos menn for den koreanske befolkningen [21] . Relativt lave kreft forekomst for kvinner, sammenlignet med menn, kan begrense den statistiske kraften av modeller for kvinner. Mangel på detaljert informasjon om kvinnespesifikke risikofaktorer som reproduksjons- og hormonelle faktorer kan være en annen årsak til den begrensede makt kalibrering [22].
De nåværende risiko prediksjonsmodeller tar sikte på å vurdere sannsynligheten for sporadisk kolorektal kreft fare. Arvelige kolorektal kreft syndromer som arvelig nonpolyposis tykktarmskreft og familiær adenomatøs polypose er kjent for å stå for opptil 2% av samlede kolorektal kreft [23], [24]. Blanding arvelige krefttilfeller i vår studie kohort kan ha utvannet den relative risikoen skyldes miljøfaktorer.
De sterke studien inkluderer en stor utvalgsstørrelse og fullstendigheten av kreft oppfølging av data kobling til kreft registrering og dødsattester. Begrensninger inkluderer begrenset informasjon om kosttilskudd risiko eller beskyttende faktorer som kalsium og fiber inntaket [25], eller ikke-kostholdsfaktorer som ikke-steroide antiinflammatoriske legemidler [26]. Forrige koloskopi som kan redusere forekomsten av kreft ble ikke vurdert i modellen.
I konklusjonen, risiko prediksjonsmodeller for kolorektal kreft utviklet ved å utnytte store forsikringsbaserte datasett fra den koreanske befolkningen, viser rimelig diskriminering evne. Disse modellene bidra til å definere grupper med høy risiko for tykktarmskreft og hjelpe dem til å endre risikoatferd samt å gjennomgå cancer screening.