PLoS ONE: En heuristisk Løsning av Identifiability Problem of Age-periode-kohort Analyse av kreft Forekomst: Lung Cancer Eksempel

Abstract

Bakgrunn

The Age-periode-kohort (APC) analyse er rettet mot å estimere følgende effekt på sykdom forekomst: (i) en alder av faget på det tidspunktet sykdom diagnose; (Ii) den tidsperioden, da sykdommen inntraff; og (iii) fødselsdato av faget. Disse effektene kan hjelpe med å vurdere de biologiske hendelser som fører til sykdommen, i estimering av påvirkning av ulike risikofaktorer på sykdom forekomst, og i utviklingen av nye strategier for forebygging av sykdom og behandling.

Metodikk /hovedfunnene

Vi har utviklet en ny tilnærming for å estimere APC effekt på sykdomsforekomst i rammen av Log-lineær Age-periode-kohort (LLAPC) modell. Siden APC effektene er lineært avhengige av hverandre, og kan ikke være entydig anslått, løse dette identifiability problemet krever å sette fire redundante parametre innenfor et sett av ukjente parametre. Ved å sette tre parametere (en av de tidsrom og fødsel-kohort effekter og den tilsvarende alder virkning) til null, vi redusert dette problem på problemet med å bestemme en parameter overflødig, og anvendes som sådan, virkningen av tid- periode som grenser til den forankrede tidsperioden. Ved å variere dette identifikasjonsparameter, kan oppnås en familie av estimater av APC effekter. Ved hjelp av en heuristisk antagelse at forskjellene mellom de tilstøtende fødsel-kohort effekter er små, har vi utviklet en numerisk metode for å bestemme den optimale verdi av identifikasjonsparameter, ved hvilken et unikt sett av alle APC effekter er bestemt og den identifiability problemet er løst.

Konklusjon /Betydning

Vi testet denne tilnærmingen mens estimering av APC virkninger på lungekreft forekomst i hvite menn og kvinner som bruker seeren data som er innhentet i 1975-2004. Vi viste at LLAPC modeller med tilsvarende unike sett av APC effekter anslått av den foreslåtte tilnærmingen passer veldig godt med observasjonsdata

Citation. Mdzinarishvili T, Sherman S (2012) En heuristisk Løsning av Identifiability problem av Age-periode-kohort Analyse av kreft Forekomst: Lung Cancer Eksempel. PLoS ONE 7 (4): e34362. doi: 10,1371 /journal.pone.0034362

Redaktør: Giuseppe Biondi-Zoccai, Sapienza Universitetet i Roma, Italia

mottatt: 18 oktober 2011; Godkjent: 27 februar 2012; Publisert: 04.04.2012

Copyright: © 2012 Mdzinarishvili, Sherman. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Forfatterne har ingen støtte eller finansiering for å rapportere

konkurrerende interesser:. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

for mer enn 50 år, viktigheten av nøyaktig. regnskap for Age-periode-kohort (APC) effekter har blitt godt anerkjent av epidemiologer og matematikere i sykdomsforekomst og dødelighet studier. I slike studier er insidensraten definert som forholdet mellom antall hendelser delt på det totale årsverk erfaring. Det antas at telleren i dette forholdet har en Poisson-fordeling og standardfeil () av ​​forekomsten blir beregnet ved forholdet mellom den kvadrerte roten av antallet av hendelser dividert med det totale person-år [1]. Ofte er det også antatt at logaritmen til forekomsten kan modelleres som en lineær funksjon av spesifiserte regressors: APC effekter. Slike modeller av insidensen tilhører de såkalte generaliserte lineære modeller [2]. Spesielt i Log-lineær Age-periode-kohort (LLAPC) modell, er den observerte variable logaritmen av forekomsten, som er tilnærmet ved summen av APC effekter [2]. Problemet er å finne ut hvordan å anslå disse effektene fra de observerte forekomst.

APC analyse

I dette arbeidet bruker de langsiktige observasjonsdata, bestemmer vi APC virkninger i ramme av den LLAPC modellen [2]. Per definisjon [1], er den rå insidensraten for gitt alder, tidsperioden (TP) og fødsel-kohorten (BC) intervaller, forholdet mellom antall kreftforekomster, delt på det totale årsverk i fare ,: (1) hvor alderstrinn er indeksert som; tidsperioder kreftforekomster som; fødselskullene av kreftforekomster som; og, og er antall aldersintervaller, tidsperioder, og fødselskohorter, tilsvarende.

La oss se at de timeintervaller, indeksert av, og har samme størrelse (for eksempel fem år lange intervaller som vanligvis brukes i APC-studier). I dette tilfellet er disse indeksene og de, og tall er relatert på følgende måte [2] 🙁 2) og. Det bør bemerkes at i henhold til (2), blir indeksen entydig definert av indekser, og. Derfor i (1), kan indeksen utelates, mens husk at insidensen er også avhengig av BC effekter

LLAPC modellen presenteres vanligvis av følgende system av betingede ligninger:. (3) og (4) der er en logaritme av den observerte insidensraten, betegner alderseffekten, – TP effekt, – BC effekt, og konstantleddet, er skjærings [2]. I denne modellen vekter for de observerte data, blir valgt til å være omvendt proporsjonal med sine samplings varianser, 🙁 5) hvor (6) Formel (6) oppnås under forutsetning av at antall kreftforekomster i hver gruppe er uavhengig tilfeldige variabler preget av en Poisson fordeling. Det antas også at avvikene av insidensen, er helt på grunn av variasjoner i lite antall kreftforekomster, sammenlignet med den totale årsverk i fare, [3]. Fra (5) og (6) følger det at: (7) APC problemet er å bestemme fra systemet for betinget ligningene (3) med vekter (7) følgende: (i) estimater av alders effekter,; (Ii) estimatene for TP effekter ,; (Iii) estimatene for BC effekter,; og (iv) skjærings,. Ytterligere begrensninger på parametrene må gjøres for å oppnå en løsning. En tilnærming er å sette tre virkninger (en av de TP effekter,, en av BC-effekter, og den tilsvarende alder effekt, der) til null, og deretter å bruke disse innstillinger som referansenivåene. En annen tilnærming er å angi summen av disse effektene til null, [2]. I dette arbeidet bruker vi den første tilnærmingen

Fra de nevnte innstillinger og fra (1-7), følger det at:.

presenterer modellert forekomsten av å få kreft, når de forankrede parametere er:, og Selge

presenterer den modellert Age spesifikke forekomsten av å få kreft i en gitt aldersintervall, da TP og BC effekter er fraværende

presenterer modellert.. TP-spesifikke forekomsten av å få kreft for et gitt TP intervall, når alder og BC effekter er fraværende.

presenterer modellert BC spesifikke forekomsten av å få kreft for en BC intervall, når Age og TP effekter er fraværende.

viser den modellerte forekomsten av å få en bestemt type av kreft i en gitt alder intervall, en TP intervall, og en BC intervall, da alle disse effektene er til stede.

I 2), 3) og 4), alder effekter ,, TP effekter ,, og BC effekter, kan bli presentert som logaritmer av forekomsten forholdstall:,, og, tilsvarende. Dermed ,, og parametre er dimensjonsløse og deres variasjoner (i forhold til den tilsvarende påfølgende Age, TP og BC intervaller) viser timelige trender av disse effektene.

Identifiability problem

Systemet (3) ikke kan løses direkte ved metoder for multiple lineære regresjoner på grunn av det faktum at utformingen matrise av systemet (3) av den LLAPC er rang mangelfull. (Dette faktum kan være direkte sjekket i praksis, for eksempel ved hjelp av MATLAB funksjon,

rang

). Dette er fordi APC effektene er lineært henger sammen. Følgelig er det disse effektene kan ikke være entydig og samtidig estimerte (flere estimatorer for disse parametrene gir tilsvarende løsninger). Matematisk, faller dette problemet i en kategori av

identifiability

problemer som i sin tur er en spesiell undergruppe av en mer generell klasse av

dårlig stilt

eller

er feilslått

matematiske problemer. Løse identifiability problem, spesielt, og de dårlig stilte problemer, generelt, krever bruk av flere forutsetninger og /eller

a priori

kunnskap om sine løsninger [4].

tilnærminger som har vært brukt i APC-analyse for å løse problemet identifiability er gjennomgått i flere aviser (se, for eksempel, [2], [5], [6] og referanser deri). I disse metodene, er enten tre effekter (en av de TP effekter, en av de BP effekter, og den tilsvarende alderseffekten) settes til null og brukt som referansenivå, eller summen av disse effektene er likestilles til null. Men disse innstillingene er fortsatt utilstrekkelig for å løse identifiability problemet [2] og kreves bruk av ytterligere begrensninger på et sett av parameterestimater som skal avgjøres. Selv om en rekke ytterligere begrensninger og nytten av estimable funksjoner (som er invariant for et bestemt sett med modellparametere) har allerede blitt foreslått, forblir identifiability problemet fremdeles stort sett uløst [2], [5], [6].

i dette arbeidet utvidet vi den kjente tilnærming benyttes i APC-analyse for å løse identifiability problemet [2], [3], [7], [8], hvor fire redundante parametre innenfor et sett av ukjente parametre som skal bestemmes stilles til null. I vår tilnærming, fikset vi (satt til null) bare tre redundante parametere og brukte dem som referansenivå. I motsetning til de «tradisjonelle» tilnærminger, hvor alle de fire parametrene er likestilles til null, bestemt vi en optimal verdi av den fjerde parameter ved hjelp av en ytterligere heuristisk antagelse (se nedenfor). Vi brukte en effekt av den tidsperioden som grenser til det forankrede tidsperioden som sådan en parameter. Vi har vist at ved å variere parameteren fra -∞ til ∞, kan alle mulige løsninger av APC problemet oppnås. Til vår beste kunnskap, er en slik generell løsning av APC problem (en komplett familie av estimater av APC effekter) som kun er avhengig av en «identifiability» parameter gitt for første gang i dette arbeidet.

en heuristisk forutsetning

for å få en optimal verdi av identifikasjonsparameter, brukte vi en heuristisk forutsetning at effekten av de tilstøtende kullene er i nærheten. Denne antakelsen er motivert av det faktum at de flerårige tilstøtende fødselskullene er overlappende i tidsintervaller. Ved hjelp av denne antagelse, har vi utviklet en numerisk metode for å bestemme den optimale verdi av identifikasjonsparameteren. Med den optimale verdien av denne parameteren, kan et unikt sett av APC effekter bestemmes og dermed identifiability problemet er overvunnet. Fremgangsmåten for å oppnå den optimale verdi av den parameter identifiability foreslått i dette arbeidet gir mulighet for å oppnå en klar oppløsning (er) av APC identifiability problem avhengig av en

priori

antagelse (e).

Proof-of-concept

Vi testet den foreslåtte numeriske metoden mens estimering APC virkninger på lungekreft (LC) forekomst i hvite menn og kvinner, ved hjelp av data samlet inn i seer 9 databasen under 1975-2004.

Materialer og metoder

data~~POS=TRUNC forberedelse

for å teste den foreslåtte tilnærming, vi brukte seeren databaser som inkluderer antall forekomster av ulike typer kreft og informasjon om befolkningen i fare hentet fra US Census Bureau. I vår studie data på LC forekomst i hvite menn og kvinner samles i SEER 9 under 1975-2004 [9] ble benyttet. Vi brukte data fra de ni registrene i stedet for data fra de tilgjengelige 17 registre, fordi lengde natur i vår studie er nødvendig utnyttelse av data helt tilbake tre tiår når det var bare ni registre.

Fra seer 9, vi hentet den første primær, mikroskopisk bekreftet LC tilfeller stratifisert etter kjønn og rase. Antallet LC forekomster i hvite menn og kvinner og de tilsvarende årsverk i fare hentet fra seer 9 ble gruppert i seks femårige tverrsnitts TP grupper: 1975-1979, …, 2000-04; 18 fem-års aldersgrupper: 17 grupper, som strekker seg fra 0 til 84 år, og den 18. gruppen inkludert alle tilfeller for aldre 85+; og 17 BC grupper som svarer til fødselsår grupper av 1890-1894, …, 1970-1974. I vår studie, brukte vi bare 12 fem-års aldersgrupper fra 30-34 år opp til 85+, fordi de observerte numrene til LC kreftforekomster i yngre aldersgrupper var ubetydelig. De grupperte data, ordnet etter alder og tidsperioden indekser, er presentert i tabell 1, 2, 3, 4.

Statistiske metoder og programvare som brukes

for data som presenteres i tabellene 1, 2, 3, 4, den LLAPC modellen ble brukt, og de tilsvarende utforming matriser av systemer for betingede ligninger for hvite menn og kvinner ble oppnådd. Disse design matriser ble sjekket for rang mangler ved hjelp av MATLAB funksjon,

rang

. For å løse disse systemene av betingede ligninger, søkte vi en ny tilnærming (se nedenfor) ved bruk av vektet minste kvadraters metode og utnyttet MATLAB funksjon,

regress

. For å bestemme de optimale verdier av identifikasjonsparametere, brukte vi et program utviklet in-house,

inpar

, og skrevet i Matlab, versjon 7.10.0 (R2010a). Gyldigheten av de brukte LLAPC modeller for å vurdere APC effekter i LC forekomster i hvite menn og kvinner ble sjekket av tre diagnostiske plott [10]: (i) den normale sannsynlighetsplott av de standardiserte residualene, (ii) residualene

vs.

modellert verdier plottet; og (iii) den observerte

vs.

modellert verdier plottet.

En løsning av identifiability problem

La oss løse en av TP effekter, en av de BC effekter, og den tilsvarende alder virkning, der (se (2)). Ved å flytte disse effektene til venstre side av systemet (3), er antallet ukjente i et nytt system redusert med tre. . I praksis blir disse effektene brukt som referansenivåer som vanligvis settes til null

I et slikt tilfelle, blir oppløsningen av APC problemet redusert til bestemmelse av en parameter – identifikasjonsparameteren. La oss bruke effekten, (eller) av TP, som grenser til det forankrede TP, som identifikasjonsparameter betegnet med. Når den eksakte verdien av er

a priori

kjent, systemet (3) kan i tillegg bli korrigert for denne virkning ved å flytte denne parameteren til den venstre side av (3). Da den venstre side av den korrigerte systemet vil være: (8) Note, da den eksakte verdien av er

a priori

kjent, den korrigerte systemet (3) har de samme vektene (7) som systemet (3) og utformingen matrise av denne vektet systemet ikke har en rangering mangel (dette kan være direkte kontrolleres ved hjelp av MATLAB funksjon,

rang

). For vurdering av de ukjente i den korrigerte systemet (3), kan anvendes en standard vektet minste kvadraters metode. Dermed estimater av skjærings ,, numrene av alder effekter, var antall estimatene for TP effekter,, og tallet på de estimatene for BC effekter,, og deres konfidensintervall () kan oppnås. Her og under, stjernetegn betegne estimater eller angi verdier for de ukjente parametre. Det bør bemerkes at generelt disse estimatene avhenge av gitte verdier for de fire parametre: overflødige., Og

Ved å variere identifikasjonsparameter,, innenfor intervallet av sin forventede variasjon, en familie av estimater av APC effekter kan oppnås. Faktisk, la oss anta verdiene av den forventede variasjon av identifikasjonsparameter ligge innenfor et intervall,, hvor. I dette intervallet, la oss velge følgende netto punkter: (9) der er et naturlig tall større enn for eksempel,

, dvs.

.. De påfølgende verdier av disse netto punktene kan brukes som de variable verdier av identifikasjonsparameter: (10) For hver verdi, kan man oppnå estimater av APC-effekter (,,, og) og deres s, som ble beskrevet tidligere

Således kan fås den tilsvarende familie av estimater av APC effekter. Teoretisk, ved å variere fra til, kan man få alle mulige anslag på APC effekter (,,, og) og deres s.

Den optimale verdien av identifikasjonsparameter ,, kan avgjøres innen intervallet av sin forventet variasjon ved hjelp av en ekstra forutsetning. Som sådan kan den heuristiske antagelse at forskjeller mellom virkningene av de tilstøtende fødselskullene er små anvendes. Denne antakelsen er basert på det faktum at de flerårige tilstøtende fødselskullene er overlappende i tidsintervaller, og identifiseringen av en kohort tilknyttet et bestemt utvalg for perioden og alder er liksom tvetydig [11] – [13].

ved hjelp av denne heuristisk antakelsen, kan en numerisk bestemme den optimale verdien av identifikasjonsparameter ved å minimere (med hensyn til) det veide gjennomsnittet av de kvadrerte forskjeller mellom estimater av de tilstøtende BC effekter,. Denne minimalisering problem kan formuleres som følger: (11) hvor vektene, er resiproke verdiene av avvik av forskjellene mellom estimater av de tilstøtende BC effekter,. Dette problemet kan løses numerisk ved å få de nettoverdier (10), og beregning for hver den tilsvarende vektet gjennomsnitt (11). Derfor, fra disse nettoverdiene, den optimale verdien ,, som minimerer denne vektet gjennomsnitt kan skaffes.

Vurdere modell dekningen

For å sjekke godhet tilpasning av de modellerte verdier oppnådd ved en multippel lineær regresjonsanalyse av de observerte verdiene, statistikken samt statistikk og dens verdi, blir vanligvis brukt. Imidlertid, for å beregne disse statistikk, utformingen matrise av systemet av de betingede ligninger, presentere modellen under vurdering, er å inkludere en kolonne med «1». Ellers kan de oppnådde numeriske verdiene av denne statistikken være feil og selv feilaktig [14], [15]. I vårt tilfelle er den konstruert slik matrise av systemet av de veide betingede likninger av korrigerte systemet (3) med en vekt (7) inkluderer ikke kolonne med «1». Derfor, for å vurdere gyldigheten av resultatene som oppnås ved den foreslåtte metode, benyttet vi de følgende diagnostiske plott [10]: (i) den normale sannsynlighetsplott av de standardiserte restene; (Ii) residualene

vs

modellert verdier plottet.; og (iii) den observerte

vs.

modellert verdier plottet. Plot (i) gjør det mulig å vurdere troverdigheten i antakelsen om at standardiserte residualene, (de observerte vektede verdier, mindre de modellerte vektede verdier, delt på antatt), har en normalfordeling. Dersom forutsetningen om normalfordelte rest er riktig, bør handlingen være tilstrekkelig rett. Plot (ii) kontrollerer den egnethet av modellen. Når modellen er hensiktsmessig bør restene være tilfeldig fordelt rundt 0, så det hele tatt, men et meget få (ca. 95% av det totale antall rester) bør ligge mellom verdiene -2 og 2. Plott (iii) skal fremvise punkter som ligger nær linje med en helning på 1 går gjennom punktet (0, 0). Denne tomten gir en visuell vurdering av effektiviteten av modellen i å gjøre forutsigelser.

Resultater

I denne delen presenterer vi resultatene av testingen av denne tilnærmingen, mens estimere APC effekter på lungekreft (LC) forekomst i hvite menn og kvinner, ved hjelp seer 9 data, samlet inn over en 30-års periode.

Testing av tilnærming

seer 9 data samlet inn i løpet av 1975 -2004 for LC i hvite menn og kvinner ble brukt til testing av den foreslåtte tilnærmingen. I denne testingen, var fremstillingen av seeren-baserte data utført som beskrevet i avsnittet Materialer og metoder. Den oppnådde antallet kreft forekomster og de totale person-år utsatt for de gitte alderstrinn og tidsperioder er presentert i tabellene 1, 2, 3, 4.

Data presentert i tabellene 1, 2, 3, 4 ble brukt for å oppnå de insidensen og deres avvik. Den tabell presentasjon av logaritmer av disse insidensen er vist i tabell 5. I denne tabellen er LC insidensraten data porsjon i seks tidsperioder (1975-79, …, 2000-04 de modellerte Aldersspesifikke forekomst, ),; 17 BC grupper (1890-94, …, 1970-74),; og 12 aldersgrupper (30-34, …, 80-84,85 +),. Her er tverrsnitts forekomst vist i kolonnene. Radene av denne tabellen viser insidensen for 12 aldersgrupper. Insidensen for 17 BC grupper (longitudinelle data) blir presentert sammen øverst til venstre til nederst til høyre diagonaler. Logaritmen av forekomsten av forankrede celle () er merket med et «+» symbol. Problemet er å beregne: 12 Alder effekter (); seks TP effekter (); 17 BC effekter (); og skjærings (). Totalt 36 ukjente parametre som skal bestemmes fra 72 observerte verdier av (;).

Ved hjelp av tabell 5 og formler (3) og (7), design matriser for LLAPC modellen av LC i hvite menn og kvinner ble bygget og deres rang mangler ble sjekket (se Materialer og metoder). De oppnådde rang mangler av disse design matriser var lik 4. Derfor fire parametere måtte være løst for å bestemme APC effekter for LC i hvite menn og kvinner ved hjelp av de aktuelle systemer av de betingede ligningene (3) med vekter (7) . Dette ble gjort i to trinn: (i) ved å velge ett av Age effekter, en av TP effekter, og en av de BC effekter som anker og sette dem til 0; og (ii) ved å bestemme den optimale verdien av identifikasjons parameter -. effekten av TP, ved siden av forankrede TP

For å utføre det første skrittet, vi valgte cellen med indekser 9 og 6 (ie og) som det forankrede celle i tabell 5. Dette betyr at Age intervall, 70-74, og TP av 2000-04 () ble valgt som ankrene. Siden indeksene, og er lineært henger sammen med formel (3), den forankrede BC indeksen var. Denne indeksen tilsvarer BC gruppen av 1925-1929. For å utføre det andre trinnet, valgte vi TP virkning, som grenser til det forankrede TP, det vil si. Da flyttet vi dette identifikasjonsparameter, så vel som de forankrede parametrene til venstre side av systemet (3). For det forankrede cellen, (,,), setter vi de tilsvarende APC-effekter til null og brukte disse effekter som referansenivåene.

for de oppnådde betingede systemer av ligninger (8) med vekter (7), vi bygget tilsvarende utforming matriser og sjekket rang mangler av disse matriser ved hjelp av Matlab-funksjonen,

rang

. Vi fant ut at disse matriser ikke har en rangering mangel og deres fulle rekker ble lik 32. Vi søkte den nevnte numeriske prosedyren for å få fra de nettoverdier (11), når og.

For å finne optimal verdi av identifikasjonsparameter, brukte vi vårt program,

inpar

, og fått verdiene av ~0.14 og ~0.03, for menn og kvinner, tilsvarende. Disse optimale verdier av identifikasjonsparameter ble brukt for å estimere APC effekter (,,, og), samt lavere () og øvre () grensene av sine 95% konfidensintervall for LC i hvite menn og kvinner. For menn, de oppnådde estimater av skjærings ,, og dens 95% med lavere () og øvre () grensene er: = -7,34, = -7,36, og = -7,31. For kvinner, de analoge estimatene er: = -7,71, = -7,76, og = -7,67. Anslagene ,, og, og deres 95% med den nedre () og øvre () grenser er presentert i tabellene 6, 7 og 8, tilsvarende. I disse tabeller er verdiene for de forankret effekter presentert i fet skrift. I tabell 5 er verdiene av identifikasjonsparametere presentert i fet kursiv.

Figur 1 utstillinger resultatene av APC analyse av LC forekomst i hvite menn og kvinner, forankret til 2000-04 TP og til 1930-1934 BC. De ankret effektene er presentert av åpne sirkler. Identifikasjonsparametrene er vist med stjerner. De feilfelt viser 95% konfidensintervall.

Paneler A og B presentere trender av TP effekter for hvite menn og kvinner, tilsvarende. Data er presentert i seks tidsperioder (1975-1979, 1980-1994, …, 2000-04 år) indeksert som. Paneler C og D presentere de oppnådde trender av BC effekter for hvite menn og kvinner, tilsvarende. Data er presentert i 17 BC grupper (1890-1894, 1895-1899, …, 1970-74 år) indeksert som. Paneler E og F presentere de oppnådde trender av Age effekter

vs.

Alder intervaller (30-34, 35-39, …, 80-84, 85+ år), indeksert som for hvite menn og kvinner , tilsvarende. De ankret effektene er presentert av åpne sirkler. Identifikasjonsparametrene er vist med stjerner. De feilfelt viser 95% konfidensintervall.

Paneler 1A og 1B dagens trender av TP effekter på LC forekomst i hvite menn og kvinner, tilsvarende. For menn, disse faktorene er redusert fra 1975 til 2004, mens det for kvinner, disse faktorene økte 1975-1990 og deretter holdt seg nesten konstant.

Paneler 1C og 1D presentere de oppnådde trender av BC effekter på LC forekomst i hvite menn og kvinner, tilsvarende. For både menn og kvinner, disse trendene økning fra BC for 1890-1894 til BC fra 1925 til 1929, og deretter avta til BC fra 1950 til 1954 og deretter forblir nesten uendret.

Paneler 1E og 1F stede de oppnådde trender av alder effekter på LC forekomst i hvite menn og kvinner, tilsvarende. Disse trendene økning fra alder 30 til alder 70-75 og da avta mot eldre aldersgrupper.

Figur 2 viser APC effekter på LC forekomst i hvite menn og kvinner, forankret til Age intervall på 70- 74, TP fra 2000-04, og BC av 1930-1934. Satsene for forankret Age, TP og BC blir presentert av åpne sirkler. De feilfelt viser 95% konfidensintervall.

Paneler A og B presentere TP-spesifikk forekomst i hvite menn og kvinner, tilsvarende. Data er presentert i seks tidsperioder (1975-1979, 1980-1994, …, 2000-04) indeksert som. Paneler C og D presentere de oppnådde BC-spesifikk forekomst i hvite menn og kvinner, tilsvarende. Data er presentert for 17 kohort grupper (1890-1894, 1895-1899, …, 1970-74) indeksert som. Paneler E og F presentere de oppnådde Aldersspesifikke insidensrater

vs.

Alderstrinn (30-34, 35-39, …, 80-84, 85+), indeksert som, i hvite menn og kvinner, tilsvarende. Tverrsnittsaldersspesifikke insidensrater, observert i 2000-04 tidsperiode vises med stiplede linjer. De ankret effektene er presentert av åpne sirkler. De feilfelt viser 95% konfidensintervall.

Paneler A og B i denne figuren presentere trender av de modellerte TP-spesifikk forekomst

vs

. TP intervall indekser ,, av LC hos menn og kvinner, tilsvarende. Anslagene for de modellerte TP-spesifikk forekomst, og deres avvik ble oppnådd ved formler: (12) (13) For menn, TP-spesifikk forekomst av LC redusert fra 1975 til 2004, mens det for kvinner økte disse fra 1975 til 1990 og deretter holdt seg nesten konstant.

paneler C og D i figur 2 stede trender av de modellerte BC-spesifikk forekomst

vs

. BC intervall indekser ,, for menn og kvinner, tilsvarende. Anslagene for de modellerte BC-spesifikke forekomst, og deres avvik ble oppnådd ved formler: (14) (15) For både menn og kvinner, BC-spesifikke forekomst av LC økning fra kohort av 1890 til 1894 til kohort av 1925-1929, dårligere helt til kohort av 1950 til 1954 og deretter forblir nesten uendret.

paneler E og F i figur 2 stede tverrsnittsAldersSpesifikke spesifikke~~POS=HEADCOMP insidensrater, observert i 2000-04 tidsperiode (stiplede linjer), og estimatene for de modellerte Aldersspesifikke spesifikke~~POS=HEADCOMP insidensrater forankret til 2000-04 tidsperiode og til 1930-1934 fødselskohorten (heltrukne linjer) av LC i hvite menn og kvinner, tilsvarende. Anslagene for de modellerte Aldersspesifikke insidensrater, og deres avvik ble oppnådd ved formler: (16) (17) modellerte Aldersspesifikke insidensrater ved forankrede aldre er vist med åpne sirkler. Feilsøylene viser 95% konfidensintervall. Som man kan se, de modellerte Aldersspesifikke forekomst av LC hos menn og kvinner har «omvendt badekar» figurer som øker med alder, og nådde maksimum (i en alder intervallet 75-79) og deretter faller mot eldre aldersgrupper. Det er viktig å legge merke til at verdiene av de modellerte Aldersspesifikke insidensen og de tilsvarende verdiene av de observerte tverrsnittsAldersSpesifikke insidensrater er vesentlig forskjellige. Dette er fordi estimatene for de modellerte Aldersspesifikke insidensrater er «renset opp» fra TP og BC effekter, mens de observerte snitt Alder spesifikke forekomsten er betydelig påvirket av disse effektene.

Figur 3 utstillinger resultatene av vurderingen av gyldigheten av å bruke LLAPC modellen for fastsettelse av APC effekter i LC forekomster i hvite menn og kvinner. Paneler 3A og 3B utstillingssannsynlighetsfordelingen tomten av de standardiserte residualene,. De vertikale akser presentere de oppnådde kvintilene av de standardiserte residualene og de horisontale aksen viser de tilsvarende kvintilene av standard normalfordeling. For både menn og kvinner, tomter er tilstrekkelig rett, bortsett fra flere punkter som har svært små eller store kvintilene.

Paneler A og B utstillingssannsynlighetsfordelingen tomten av de standardiserte residualene, for hvite menn og kvinner , tilsvarende. De vertikale akser presentere de oppnådde kvintilene av de standardiserte residualene og de horisontale aksen viser de tilsvarende kvintilene av standard normalfordeling. De vertikale aksene panelene C (for hvite menn) og D (for hvite kvinner) utviser de standardiserte residualene, og de horisontale aksene vise de modellerte vektede verdier ,. Paneler E (for hvite menn) og F (for hvite kvinner) utviser de observerte vektede verdier, på de vertikale aksene

vs

. de modellerte vektede verdier, på den horisontale aksen.

De vertikale akser i paneler 3C og 3D utstillings de standardiserte residualene, og de horisontale akser vise de modellerte vektede verdier ,. Som det sees fra Panel 3C for menn, alle unntatt to verdier av de standardiserte restene, og falle ned i [-2,2] intervall, mens for kvinner, alle av disse verdiene er fordelt innenfor intervallet. Dette indikerer at modellene av flere regresjoner vi brukte som er aktuelle for å presentere de tilsvarende observasjonsdata.

Paneler 3E og 3F utstillingen de observerte vektede verdier, på de vertikale aksene

vs

.

Legg att eit svar