Abstract
Bakgrunn
I tilfelle kontroll studier sykdomsrisiko ikke forklares med vesentlige risikofaktorer er uforklarlig risiko. Vurderer uforklarlig risiko for bestemte pasientgrupper, steder og tider kan avsløre signatur av uidentifiserte risikofaktorer og risikofaktorer ikke fullt ut redegjort for i case-control studie. Dette kan potensielt føre til nye hypoteser om sykdommen årsakssammenheng.
Metoder
Utland, lokale og fokusert Q-statistikk brukes på data fra en populasjonsbasert case-control studie av 11 sørøst Michigan fylker . Analysene ble utført ved hjelp av både utgangen og aldersbaserte tiltak av gangen. Analysene ble justert for arsen eksponering, utdanning, røyking, familiehistorie med blærekreft, yrkesmessig eksponering for blærekreftkreftfremkallende, alder, kjønn og rase.
Resultater
Betydelig global gruppering av tilfellene var ikke funnet. Et slikt funn ville indikere storskala clustering av saker i forhold til kontroller gjennom tiden. Det ble imidlertid svært store lokale klynger funnet i Ingham County nær Lansing, i Oakland County, og i byen Jackson, Michigan. The Jackson by klyngen ble observert i arbeids-alderen, og er dermed i tråd med yrkes årsaker. The Ingham County klynge vedvarer over tid, noe som tyder på en bred geografisk definert eksponering. Fokusert klynger ble funnet for 20 industristeder som driver produksjon aktiviteter forbundet med kjente eller mistenkte blærekreftkreftfremkallende. Set-baserte tester som justert for multippel testing var ikke signifikant, selv om lokale klynger vedvarte gjennom tid og tidsmessige trender i sannsynligheten for lokale tester ble observert.
Konklusjon
Q analyser gir et kraftig verktøy for utpakking uforklarlig sykdomsrisiko fra case-kontrollstudier. Dette er spesielt nyttig når virkningen av risikofaktorer varierer romlig, gjennom tid, eller gjennom både rom og tid. For blærekreft i Michigan, er neste skritt å undersøke årsaks hypoteser som kan forklare det overskytende blærekreft risiko lokalisert til områder i Oakland og Ingham fylker, og til City of Jackson
Citation. Jacquez GM, Shi C, Meliker JR (2015) Lokal blærekreft Clusters i Sørøst Michigan regnskap for risikofaktorer, kovariater og Residential Mobility. PLoS ONE 10 (4): e0124516. doi: 10,1371 /journal.pone.0124516
Academic Redaktør: Suminori Akiba, Kagoshima Universitetet Graduate School of Medical and Dental Sciences, JAPAN
mottatt: 21 november 2013; Godkjent: 15 mars 2015; Publisert: 09.04.2015
Copyright: © 2015 Jacquez et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering: Denne forskningen ble finansiert med tilskudd fra National Cancer Institute R44CA117171 og R44CA135818. Den Funder hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:. Forfatterne bekrefter at medforfatter Dr. Jaymie Meliker er en PLoS ONE Editorial Board medlem. Dette forholdet endrer ikke forfatternes tilslutning til PLoS ONE redaksjonelle retningslinjer og kriterier. Dr. Jacquez utviklet SpaceStat programvare som markedsføres gjennom BioMedware og som ble brukt i denne forskningen. Han er president i BioMedware. Dette forholdet endrer ikke forfatternes tilslutning til PLoS ONE politikk på deling av data og materialer.
Innledning
Med over 350 000 nye tilfeller hvert år, rangerer blærekreft niende globalt i forekomsten blant alle kreft [1]. Bestander bosatt i industrialiserte områder i USA og Vest-Europa har den høyeste forekomsten, med de fleste tilfeller diagnostisert som blærekreft overgangscellekreft (TCC) [2]. Yrkesmessig eksponering og sigarettrøyking er de viktigste risikofaktorene for blærekreft, med noen bevis implicating eksponering for uorganisk arsen som en blære kreft kreftfremkallende [3]. Men mange tilfeller forblir uforklart.
exposome har blitt definert som totaliteten av eksponeringer over en persons livsløp, og kvantifisering av aspekter ved exposome relevant for spesifikke helseutfall, slik som blærekreft, er vanskelig [4 ]. En tilnærming er å vurdere risiko uforklarlig. For eksempel, kasus-kontrollstudier søke å finne ut om visse faktorer er assosiert med økt risiko sykdom blant et designet utvalg av saker og kontroller. Den sykdomsrisiko ikke forklares av disse faktorene funnet betydelig i kasus-kontrollstudie er uforklarlig risiko. Tildeling av at risiko for spesifikke lokale bestander, steder og tider kan avsløre utskeielser som kan være signaturen til uidentifiserte risikofaktorer eller risikofaktorer som ikke var fullt redegjort for i den opprinnelige studien design. Dette kan avsløre lokaliserte eksponeringer og atferd, som kan føre til nye hypoteser om sykdommen årsakssammenheng.
Q-statistikken er utviklet som en metode for å oppnå en nedbrytning av uforklarlig risiko i lokale bestander, steder og tider [5, 6]. Denne tilnærmingen har blitt evaluert i simuleringsstudier [7], og har blitt brukt til testikkelkreft kreft [8], diabetes og leukemi [9], non-Hodgkins lymfom [10], og brystkreft [11]. I denne studien vurderer vi space-time mønstre av blærekreft i det sørøstlige Michigan regnskap for bolig mobilitet og kjente risikofaktorer og kovariater. Denne forskningen bygger på en nylig publisert populasjonsbasert kasus-kontrollstudie av blærekreft som brukte boliger historier og informasjon om foretakspensjon og livsstil eksponeringer for å vurdere blæren kreftrisiko (Den «forelder studie») [12].
mål og strategi
Det overordnede målet med denne studien er å vurdere fokusert gruppering av blæren krefttilfeller i det sørøstlige Michigan. Denne studien er motivert av flere udekket metodisk og anvendt utfordringer i geospatiale metoder og epidemiologi av blærekreft. Først space-time mønstre i blærekreft regnskap for bolig mobilitet og justert for risikofaktorer og kovariatene har ennå å bli studert og er i stor grad udokumentert. Disse mønstrene kan gi viktige bevis som kan føre til nye etiologiske hypoteser. For det andre har den metoden for fokuserte Q-statistikken aldri blitt brukt på en komplett case-control datasett for noen sykdom eller helseutfall. Opp dette behovet vil være et viktig fremskritt i anvendt metodikk. Til slutt, en tilnærming som kombinerer informasjon om timelige trender og utholdenhet i sannsynligheten for Q-statistikken har ennå ikke utviklet, men vil gi en viktig mekanisme for å vurdere potensielle falske positiver. Denne studien tar sikte på å håndtere hver av disse behovene bruker det eksisterende Q-statistikk, ved å utvikle nye metoder for å vurdere timelige trender og utholdenhet, og ved å bruke disse til en populasjonsbasert case-control studie av blærekreft.
Materialer og metoder
Etikk erklæringen
The University of Michigan IRB godkjent den overordnede case control studie med deltakerne, samlet biologisk og drikkevannsprøver, utført undersøkelser, og fått den nødvendige skriftlig samtykke fra deltagerne . Western IRB godkjent analyse av sekundærdata fra den overordnede studien, som ikke involverer kontakt med deltagerne.
Data
Dataene kommer fra en populasjonsbasert blærekreft case-control studie utført i en 11 fylke område av sørøstlige Michigan. Dette overordnede studie designet for å evaluere eksponering for lave nivåer av arsen i drikkevann som en risikofaktor for blærekreft, evaluert en rekke yrkes- og atferdsmessige risikofaktorer og kovariater. Vi oppsummerer studiedesign og eksempel karakteristikker av den overordnede studier, for detaljer ta kontakt med de opprinnelige studiene [12,13,14].
Hendelses tilfeller av kreft i urinblæren diagnostisert mellom 2000-2004 (411 tilfeller) ble rekruttert fra staten kreftregister i Michigan Cancer Surveillance Program. Så langt vi kjenner til, skjedde ikke mer enn ett tilfelle i en enkelt familie. Den Michigan Public Health Institute (MPHI) rekruttert 566 kontroller som ble frekvens-matchet til de rekruttert tilfeller av kjønn, alder (± fem år), og løp ved hjelp av tilfeldig sifret oppringing av aldersvektet lister. Alder vektet lister kjøpt fra Genesys prøvetaking systemer ble vektet for å være representativt for aldersfordeling av saker i studieområdet og ble samlet inn telefonkataloger, Auto registre, eiendomsmegling oppføringer, førerkort data. Dette prøvetaking ramme ikke inkluderer muligheten for celle-telefonen brukere. Tilfeldige samtaler ble gjort til 11,463 potensielle kontroller, og valgbarhet ble fastsatt basert på svar på screening spørsmål (minst 5 års botid i studieområdet, ingen historie av kreft, bortsett fra ikke-melanom hudkreft, og aktuelle case-matchet frekvenser av alder , rase og kjønn). Av de oppringte numrene, 3341 var ikke-arbeidende /yrkesbygg eller ble aldri besvart, 3333 resulterte i hang-ups før screening, og 4748 resulterte i vellykket screening. Av de screenet, 2616 ble funnet å være kvalifisert. Blant de 2,132 kvalifiserte kontroller, 69% nektet å delta, 4% ikke klarte å fullføre alle krav for deltakelse, og 27% fullført alle faser av deltakelse inkludert telefonintervju, personlig intervju, og gir miljømessige og biologiske prøver, noe som resulterer i 566 deltakende kontroller.
Det var 1,634 potensielt kvalifiserte tilfeller. Omtrent 22% døde før kontakt; registeret ble ikke tillatt av sykehus eller lege for å ta kontakt med en annen 5% av tilfellene. De resterende sakene ble sendt et brev av registeret ber om tillatelse til å slippe sitt navn og kontaktinformasjon til forskerteamet. Av disse 1,178 tilfellene enige om 50% å ha navnet sitt løslatt. Blant de 584 sakene senere kontaktet av forskerteamet, 411 tilfeller (70%) fullførte alle faser av deltakelse. Dermed av 1,634 potensielt kvalifiserte tilfeller, 25% fullført alle faser av deltakelse, noe som resulterer i 411 deltagende tilfeller.
En 30-45 minutters dataassistert telefonintervju innhentet informasjon om røyking, medisinsk historie, kosthold, vann og annen væske forbruk. Bolig- og yrkes historier ble innhentet gjennom spørreskjemaer anmeldt hjemme med hver enkelt deltaker. Pleie- og adresser ble geokodes bruker ArcGIS (versjon 9.0, ESRI, Redlands, CA, USA) med geokoding parametere minimum kamp scorer 60, minimum kandidat scorer 10, og staving følsomhet 70. Geokoding nøyaktighet var lik for saker og kontroller. 54% av kontrollorganenes årsverk ble geokodes til nøyaktig adresse eller nærmeste tverrgater, og 11% geokodes til sentrum. For tilfeller, ble 53% geokodes til nøyaktig adresse eller nærmeste tverrgater, og 14% geokodes til sentrum. Resterende boliger ble plassert utenfor studieområdet og ble ikke geokodes.
Utdeling av bolig historier skilte seg ikke for saker og kontroller. Tilfeller gjennomsnitt 9,1 boliger per person, kontroller gjennomsnitt 9,0 boliger. Totalt 8,823 boliger utgjør 64,040 årsverk ble rapportert i samlet, med et gjennomsnitt på 65 års bolig historie per person. Deltakerne brukte 66% av sine årsverk innenfor studieområdet.
case-control studie ble opprinnelig utviklet for å undersøke sammenhengen mellom eksponering for arsen i drikkevann og blærekreft. Omfattende innsats gikk inn estimering arsen eksponering over livsløpet for hver deltaker, sto for boligmobilitetsmønstre og endringer i arsen nivåer i private og offentlige vannforsyninger. For flere detaljer, se Meliker et al (2007) [15]. Tidsvektet gjennomsnittlig levetid eksponering for arsen ble beregnet og behandlet både som en kontinuerlig variabel, og kategorisert a priori inn 1 mg /L, 1-10 ug /l, og . 10 ug /L [12]
Ujusterte logistisk regresjon ble utført, som ble analyser justert for kovariatene alder, rase (hvit, svart, annet), og sex, og for blærekreftrisikofaktorer funnet betydelig eller border betydelig: røyking (aldri røyker, tidligere 20 pack-årene, tidligere ≥ 20 stk-årene, aktuelle 20 stk-årene, nåværende ≥ 20 stk-år), utdanning (høyeste nivå oppnådd), historien om kreft i urinblæren er en nær slektning (foreldre, søsken, eller barn), arsen i drikkevann, og minst fem års ansettelse i en høy risiko okkupasjon (fargestoff arbeidstakere og brukere, aromatisk amin produksjon, lær arbeidere, maleri, kjører lastebiler eller andre kjøretøyer, aluminium arbeidere, maskinister og bildeler montører). Som grupper, saker og kontroller ikke forskjell på kjønn, rase og alder, og heller ikke ved gjennomsnittsalder på 65 år. Tilfeller røykt flere sigaretter over deres levetid, gjennomført færre års skolegang, og var mer sannsynlig å ha jobbet i minst fem år i et yrke med høy risiko for blærekreft; de var også mer sannsynlig å ha et familiemedlem diagnostisert med blærekreft. de tilsvarende logistiske regresjonsmodeller fra den overordnede studien variablene funnet å være vesentlige blærekreftrisikofaktorer, og ble brukt i vår forskning. Nærmere om saken konstatering, rekruttering, tilfeldig oppringing, odds ratio, og studiedesign er publisert i mors studier [12,13,14,15].
Modeller og statistiske metoder
Q statistikk.
Jacquez et al. [5,6] utvikle globale og lokale tester for case-control clustering av bolig historier, ved hjelp av en algebraisk diskret tid representasjon. Her bruker vi kontinuerlig tid representasjon [7] og flere korreksjonsteknikker som støtter identifisering av etiologiske hypoteser [11].
Q-statistikken er basert på en space-time skritt funksjon som dokumenterer en persons bolig mobilitet i løpet av livsløpet. Dette er kvantifisert ved hjelp av en matrise representasjon som måler hvor geografiske nærmeste nabo relasjoner endret seg gjennom tidene. Q-statistikk for å vurdere ulike typer rom-tid clustering er tilgjengelig, for en samlet global clustering, for romlig og tidsmessig lokal gruppering, for clustering ved bestemte tidsintervaller, og for å vurdere fokusert clustering om punktkilder. Disse har flere ønskelige egenskaper, den første er at de globale testene kan deles opp i lokale tester slik at summen av de lokale testene gir den global test statistikken. Her bruker vi lokale, globale og fokuserte tester oppsummert nedenfor, ved hjelp av notasjon utviklet og anvendt i tidligere publikasjoner. For nærmere opplysninger om metoder referere til disse tidligere publikasjoner [6,7,11,16].
Den lokale statistikken som alle andre tester er avledet kalles «Q
det» og er
1
Dette er tellingen, på tidspunktet
t
, av antall
k
nærmeste naboer av deltaker
i
som er tilfeller, og ikke kontrollerer. Variablene
c
i
og
c
j
er case-control identifikatorer, og er en nærmeste nabo indikator. Simuleringsstudier vist god statistisk styrke når en
k
av 15 blir brukt [7], parameterverdien benyttet i denne studien.
En livsløps, fagspesifikke statistikk som integrerer gjennom tid er «Q
i» og er beregnet som:
2
Denne statistikken vurderer en tendens til å ha andre tilfeller, snarere enn kontroller, i nærheten i løpet av livsløpet til deltaker
i
. En tidsspesifikk statistikk som gir en samlet mål på saken clustering når alle deltakerne vurderes sammen er «Q
t»:
3
Q
t er summen på tidspunktet
t
, over alle tilfeller av Q
det (fagspesifikk og tidsspesifikke mål på saken clustering i ligning 1). evaluerer global romlig gruppering av tilfellene ved
t
. En global clustering statistikk som vurderer clustering av saker for alle tilfeller og kontroller over hele studieperioden, er «Q» og er:
4
Fokusert statistikk kvantifisere gruppering rundt et bestemt sted eller fokus. Lawson (1989) [17] og Waller
et al
. (1995) [18] foreslått fokusert tester som ikke står for menneskelig mobilitet, heller ikke for mobilitet av fokus selv.
En fokusert Q statistikk for clustering av saker om fokus på tidspunktet
t
er:
5
Den nærmeste nabo hovedside
η
F
,
j
,
k
,
t
viser om
j
th individ er en
k
th romlig nærmeste nabo av fokus u
F
,
t
på tidspunktet
t
. Statistikken
Q
F
,
k
,
t
er tellingen, på tidspunktet
t
, av antall
k
-nearest naboer av fokus som er tilfeller. En test for fokusert clustering gjennom er:
6
Over T ganger, dette er telling av antall saker som er
k
nærmeste naboene til fokus på hvert tidspunkt
i denne artikkelen bruker vi likning 1 () for å identifisere når og hvor en person er et senter for en lokal klynge. Vi bruker Eq 2 () for å identifisere hvilke individer har en tendens til å være sentre for klynger enn livet-kurs. Vi bruker Eq 3 (), og plott av denne sannsynligheten for gjennom tiden, for å identifisere tidsperioder med betydelig fall clustering. Vi bruker ligning 4 (global
Q
(
k
)) for å vurdere om global clustering eksisterer når bolig historier av alle deltakerne anses over hele varigheten av studien . Vi bruker Eq 5 (
Q
F
,
k
,
t
) for å vurdere opphopning av saker om fokus F ved
t
, og Eq 6 (
Q
F
,
k
) for å kvantifisere clustering om fokus
F
løpet tid. Til slutt bruker vi en global Q
F som beregnes som summen av
Q
F
,
k
over
F
brennpunktene for å vurdere global fokusert clustering når alle foci anses over hele tidsperioden av studien. Henvis til tidligere publikasjoner for gjennomføring detaljer om Q-statistikk [6,11,16].
Resten av dette papiret faller «
k
» notasjon, skriver Q
det
for den lokale statistikken; Q
i
for fagspesifikk livsløps statistikken; Q
t
for tiden spesifikke storskala romlig klynge statistikk og så videre slippe «
k
» notasjon for de fokuserte statistikk i en lignende måte.
slutnings-rammeverket og multippel testing korreksjon.
Space-time mønstergjenkjenning teknikker kan gi innsikt i spesifikke etiologiske hypoteser [7]. Videre vurderer sett med betydelige Q-statistikk begge kontoene for multippel testing og støtter prosessbasert slutning [11]. Denne studien benytter sett av betydelige Q-statistikken for både flere test rettelser og å konstruere slutninger om årsaks hypoteser, se tidligere publikasjoner referert ovenfor for mer informasjon.
«rå» Q-statistikk, spesielt den lokale statistikken
Q
det
, er ganske nyttig for å identifisere lokale risiko utskeielser. Imidlertid er det mange slike lokale statistikk og en må korrigere for multiple testing. Tradisjonelle tilnærminger som Bonferronikorreksjon og sekvensielle metoder som Simes-Hochberg [19,20] og Hommel metode [21] er anerkjent som for konservative [22] Vi bruker en tilnærming som er sykdomsprosessen og mønster orientert [7,11] . Vi benytter betydningen av antallet elementer (en kardinalitet statistikk) i hvert av settene klyngen. Når betydningen av antall elementer i en klynge sett er demonstrert en så inspiserer p-verdier på konstituerende lokale tester for å identifisere de lokale statistikker som bidro mest til den samlede betydning.
slutning fra trender og vedvarende lokale klynger
Tidstrender trender~~POS=HEADCOMP for sannsynligheten for klase statistikk kan brukes til å vurdere (1) generelle tidsmessige mønstre i romlige tiltak av clustering, da disse kan indikere langsiktig påvirkning av årsaksfaktorer.; og (2) utholdenhet av lokale romlige klynger av tilfellene. Logikken bak dette kan sees fra en Gedanken eksperiment. Anta at det ikke er plass-tid mønster i de tilfeller og kontroller, og deretter innføre, på et eller annet tidspunkt t
1, en lokal eller fokusert klynge liten nok til at, mens det fører til betydelig lokal gruppering, ikke fører til betydelig global gruppering. Per definisjon er den globale klynge statistikken summen av de lokale klase statistikk; den globale statistikken dermed må øke etter tiden t
1, og tilhørende sannsynlighet må avta. Derfor utholdenhet er nøkkelen som vi forventer falske positiver å være flyktig. Til slutt krever lyden slutning evaluering av en biologisk plausibel mekanisme. For eksempel vil vedvarende clustering om et fokus krever en plausibel eksponering fra industrielle aktiviteter knyttet til det fokuset. Derfor inspeksjon av tidsmessige utviklingen i sannsynligheten for lokal statistikk, kombinert med vurdering av lokale klase kart, gir et verktøy for å vurdere signaturen til lokale overflødig sykdomsrisiko.
Randomisering og nullhypotese.
betydningen av Q-statistikken vurderes gjennom randomisering av case-control identifikatorer over mobilitet historier. Vi bruker to nullhypotese. Den første er ingen sammenheng mellom bosted og case-control status-vi kaller dette «ikke justert». Under «ikke justert», har hver gjenstand en sannsynlighet for å bli kalt et «case» i forhold til forholdet mellom tilfeller med kontroller i studien. Den andre null-hypotesen, kalt «justert» inneholder informasjon om blærekreft kovariater og risikofaktorer, og syssels spådd sannsynlighetene for å være en sak beregnet fra logistisk regresjon [6]. Her har hver gjenstand en sannsynlighet for å bli kalt et «case» i forhold til deres sannsynlighet under logistisk regresjon. Vi brukte enten 999 eller 9999 randomizations; 999 først som en skjerm og 9999 for å bedre retter opp p-verdier funnet i nærheten av alfa nivået av den gitte prøve. 999 randomizations tillatt oss å løse p-verdier så liten som 0,001; 9999 tillot oss å løse p = 0,0001.
Studiedesign.
Vi kjørte både «ikke justert» og «justert» Q-analyser ved hjelp av logistisk modell for dette datasettet, som beskrevet i [12] for justering av modellen. Denne modellen inkluderte variabler funnet signifikant (for både statistiske og etiologiske årsaker) og inkludert arsen eksponeringer, utdanningsnivå, røyking aktiviteter, familiehistorie med blærekreft, yrkesmessig eksponering for blærekreftkreftfremkallende, alder, kjønn og rase. Modellen er uttrykt i forhold til sannsynligheten for å være en sak gitt risikofaktorer og kovariabler for hvert individ. Alle variabler som inngår i modellen og deres tilsvarende koeffisienter er oppført i Tabell 1. Derfor noen clustering funnet etter justering er altså utover det forklart av disse variablene i den logistiske modellen.
Vi ansatt to temp orienteringer, dato og alder. Datoen temporal orientering brukes datoene på hvilke hendelser som transpired (f.eks diagnose, bosted flytting) i vurderingen av rom-tid mønstre. Alderen orientering brukt en alder av den enkelte deltaker til å spille inn når disse hendelsene skjedde. Alderen orientering er nyttig for å vurdere clustering forbundet med kritiske aldre i livsløpet, for eksempel yrkes klynger som oppstår i arbeids år, og de som er forbundet med kritiske perioder av sårbarhet. Dato orientering er følsom for clustering skyldes eksponeringer, for eksempel knyttet til bestemte tidsperioder, for eksempel driften av forurensende industri.
For fokusert analyserer vi brukte forretningsadresse historier og års drift av bransjer i sør øst Michigan hvis aktiviteter som brukes eller produseres forbindelser som er kjent eller mistanke om blærekreft kreftfremkallende. Vi bygget en database med 268 bransjer bruker Toxics Slipp Lager [23] og den Directory of Michigan Produsenter for år 1946, 1953, 1960, 1969, 1977, og 1982. Startdatoen var ikke tidligere enn 1943 for alle bransjer (forutsatt at de i 1946 katalogen begynte ikke i 1946). For næringer som åpnet opp etter 1946 ble startdato definert som midtpunktet mellom den første katalogen der de var til stede, og den foregående katalog (for eksempel 1965 som en startdato for de næringer som ikke var tilstede i 1960, men var til stede i 1969). Lignende metoder ble brukt for å definere den sluttdato.
Validering av Q fremgangsmåter ble utført ved å bruke Cuzick og Edwards test [24], som er analog til Q
t statistisk ved at den gir en statistikk kvantifisere global romlig tilfelle clustering på et fast tidspunkt. Vi validert Q
den bruker nøyaktig permutasjon for små datasett. Vi har også sammenlignet klase resultater til søket statistikken Bernoulli modell [25,26], og bemerker denne metoden ikke er følsom for små klynger som kan oppdages ved hjelp av enten Q eller Cuzick og Edwards test [27].
Vi løp Q statistikk ved hjelp av justering for kovariatene og risikofaktorer funnet betydelig ved Meliker
et al
. (2010) [12], inkludert arsenikk. Vi kjørte ikke fokusert og målrettet Q statistikk, som gir globale klasetester (f.eks Q og Q
F), tester til saks clustering på bestemte tidspunkter (f.eks Q
t og Q
Ft), sak clustering om konkrete saker og næringer over tid (Q
i og Q
Fi), og lokale clustering om bestemte personer eller bransjer på tidspunkt t (Q
det og Q
Fit). Vi brukte sett skjærings statistikk over Jacquez et al (2014) [11] for å ta høyde for flere tester og for den slutnings rammeverk. Vi foretok disse analysene ved hjelp år og aldersbasert orientering. Vi inspisert også tids tomter som viser trender i sannsynligheten for antallet betydelig Q
t og Q
FT sammen med klase kart over p (Q
det) og p (Q
Tilpass) for å identifisere betydelige lokale klynger som kanskje ikke har vært store nok til å føre til global betydning. Alle analyser ble foretatt i SpaceStat [28].
Resultater
Analyseresultatene justert for multippel testing med telling av antall signifikante tester med 999 randomizations er oppsummert i tabell 2.
Totalt sett er det lite forslag av vesentlig clustering ved inspeksjon de statistiske resultatene i tabell 2. Disse er basert på de innstilte skjærings statistikk som justerer for multippel testing og er alle globale tester basert på betydningen av antall av lokal statistikk. Vi forventer nå disse til å være følsom for «store signaler» som vil ha globale konsekvenser i form av clustering enn de fleste tilfellene i studien, enten i rommet, i tid, eller gjennom både tid og rom. For den vanlige (ikke fokusert) Q-statistikk analysene etter alder har mindre p-verdier, selv om ingen av disse er betydelige. Den fokuserte testene samlet har de minste p-verdiene, med et minimum oppnådd for de lokale varianter av p = 0,085. Vi konkluderer dermed er det lite som tyder på store globale gruppering av blæren krefttilfeller gjennom tiden. Dette utelukker ikke muligheten for betydelige lokale klynger som signal blir fortynnet av en ellers tilfeldig mønster i resten av tilfellene, lokaliteter og tidspunkt vurderes. Vi vurderer derfor timelige utviklingen i globale romlig statistikk, sammen med kart over betydelige lokale klynger, for å identifisere vedvarende og geografisk lokalisert skytende risiko. For å bedre retter opp p-verdier funnet i nærheten av alfa nivå av lokale tester, ble 9,999 randomizations gjennomført for følgende analyser.
Q-statistikken ble kjørt for perioden 1940-2003. For livsløpet statistikken Q
i, 14 tilfeller ble det funnet statistisk signifikant (S1 fig). Blant dem, syv er i Ingham, fire i Jackson og tre i Oakland. I tillegg ble en nedadgående trend i Q
t p-verdier observert (figur 1). Q
t p-verdier i perioden 1995-2003 var generelt lavere enn 0,1 med lavest (mindre enn 0,05) blir observert januar-august 1995 og september-desember 1998. Men antallet betydelig Q
i statistikken var ikke signifikant samlet, heller ikke var det for Q
t (global romlig gruppering av tilfellene ved
t
).
minima på den tiden handlingen indikere tidsperioder når global romlig gruppering av tilfellene var statistisk signifikant.
Analyser ble utført for alderen 1 år til 90 år gamle. Bruke Sp
I statistikk, ble 20 tilfeller funnet statistisk signifikant over deres livsløp. De fleste av disse tilfellene (14 av 18) levde i Jackson (S2 figur), og resten i Oakland, Genesee og Shiawassee. I tillegg er resultatene av Q
t-analyser viste at to alderstrinn var assosiert med sterk romlig clustering, nemlig, 23-24 og 31-35, som vist i figur 2. De minste p-verdier (mindre enn 0,1) det ble også observert i en alder av de tidlige 50-tallet. Justert for alle år ansett antallet betydelig Q
i statistikken var ikke signifikant, og heller ikke var det totale antallet betydelig Q
t-statistikk.
Sannsynlighet for gruppering av saker etter alder. Minima i denne grafen skje på aldre som viser økt statistisk bevis for clustering av tilfellene ved en gitt alder i forhold til kontroller på den alderen.
Fokusert statistikk ble beregnet for den operative periode av industri (1943- 1999). Bruke (Q
Fi), ut av 268 bransjer vurderes, 20 ble identifisert som statistisk signifikant fokuserer gjennom hele perioden (S3-S6 figurene). Disse var først og fremst i Ingham fylke nær byen Lansing (16 av 20); andre ble funnet i Oakland fylke (4 av 20) (se tabell 3 for detaljer). Tidsintervallene er forbundet med betydelig fokusert clustering var 1958, 1966-1968 og 1974-1975 (figur 3). På slutten av 1950-tallet (dvs. 1957-1959), betydningen av Q
Ft falt betraktelig sammenfallende med en rask økning i antall næringer i industrien database. Antallet bransjer har økt fra 54 i 1956-87 i 1957; og antall bransjer forbundet med betydelig Q
Ft statistikk fordoblet, fra 7 i 1956 til 15 i 1957; disse var alle i Ingham fylket.
Verdier plottes er sannsynligheten for fokusert clustering når alle industrielle områder anses samtidig (f.eks sannsynligheten for global fokusert clustering). Perioden med betydelig global fokusert clustering observert i 1974-1975 skyldes den fokuserte klynge som oppsto i byen Jackson.
De fleste av næringene i tabell 3 ble plassert i Lansing , Michigan og var produsenter av maling, kjemikalier eller plast.