PLoS ONE: Utførelse av tre Prognostiske Modeller hos pasienter med kreft som har behov for intensivbehandling i et Medical Center i China

Abstract

Mål

Hensikten med denne studien var å evaluere ytelsen av akutt fysiologi og kroniske helse Evaluering II (APACHE II), forenklet Akutt Physiology score 3 (SAPS 3) og akutt fysiologi og kroniske helse Evaluering IV (APACHE IV) hos pasienter med kreft innlagt på intensivavdeling (ICU) i en enkelt medisinsk senter i Kina.

Materialer og metoder

Dette er en retrospektiv kohort observasjonsstudie inkludert ni hundre og åtti en påfølgende pasienter over en to-års periode.

Resultater

sykehuset dødelighet var 4,5%. Når alle 981 pasienter ble evaluert, arealet under mottaker drift karakteristikk (AUROC, 95% Confidential intervaller) av de tre modellene i å forutsi sykehusdødeligheten var 0,948 (0,914 til 0,982), 0,863 (0,804 til 0,923), og 0,873 (0,813 -0,934) for SAPS 3, henholdsvis APACHE II og APACHE IV. P verdier av Hosmer-Lemeshow statistikk for modellene var 0,759, 0,900 og 0,878 for SAPS 3, henholdsvis APACHE II og APACHE IV. Men safter 3 og APACHE IV undervurdert i sykehusdødeligheten med standardisert mortalitetsrate (SMR) på 1,5 og 1,17 henholdsvis, mens APACHE II overvurdert i sykehusdødeligheten med SMR på 0,72. Videre analyser viste at diskriminering makt var bedre med SAPS 3 enn med APACHE II og Apache IV om for akutt kirurgisk og medisinsk pasienter (AUROC av 0,912 vs 0,866 og 0,857) eller for planlagte kirurgiske pasienter (AUROC av 0,945 vs 0,834 og 0,851). Kalibrering var bra for alle modeller (alle p 0,05) enten for planlagte kirurgiske pasienter eller akutte kirurgiske og medisinske pasienter. Men, i form av SMR, safter 3 var både nøyaktig forutsi sykehusdødeligheten for akutt kirurgiske og medisinske pasienter og for planlagte kirurgiske pasienter, mens APACHE IV og APACHE II ikke var.

Konklusjon

i denne kohorten, fant vi at APACHE II, APACHE IV og SAPS 3 modeller hadde god diskriminering og kalibrering evne i å forutsi i sykehus dødelighet av kritisk syke pasienter med kreft som trenger intensivbehandling. Av disse tre alvorlighets score, safter 3 var bedre enn APACHE II og Apache IV, enten i form av diskriminering og kalibrering makt, eller standardiserte dødelighetsforhold

Citation. Xing X, Gao Y, Wang H, Huang C Qu S, Zhang H, et al. (2015) Utførelse av tre Prognostiske Modeller hos pasienter med kreft som har behov for intensivbehandling i et Medical Center i Kina. PLoS ONE 10 (6): e0131329. doi: 10,1371 /journal.pone.0131329

Redaktør: Olga Y. Gorlova, Geisel School of Medicine ved Dartmouth College, USA

mottatt: 30 desember 2014; Godkjent: 01.06.2015; Publisert: 25 juni 2015

Copyright: © 2015 Xing et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: All relevant data er i avisen og dens saksdokumenter filer

Finansiering:. studien ble finansiert av Beijing håp Run Special Fund (LC2011B38) (https://www.cfchina.org.cn/list.php?catid= 301)

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

de generelle alvorlighetsgrad-of-sykdom scoring systemer ble innført i feltet av kritisk omsorg medisin i 1981 [1]. Siden den gang har mange alvorlighetsgrad-of-sykdom score er utviklet for å vurdere kritisk syke pasienter. I løpet av de siste få år, har tre nye generelle prognosemodeller er utviklet og publisert: forenklet Akutt Physiology Score 3 (SAPS 3) [2], Akutt fysiologi og kroniske helse Evaluering IV (APACHE IV) [3] og dødelighet sannsynlighetsmodell III (MPM III) [4]. Men studier har vist at alle tre modellene er gode til å presentere diskriminering, men med dårlig kalibrering [5-6]. På den annen side, er akutt fysiologi og kroniske helse Evaluering II (APACHE II) score fortsatt brukes i intensivavdelinger «prognose av kritisk syke pasienter [7].

Kreftpasienter representerer 13-15% av pasienter innlagt på intensivavdelinger [8-9]. Groeger et al utviklet det cancer dødelighet modellen i 1998 [10]. Imidlertid er denne bestemte stillingen modellen ikke mye brukt fordi det ikke har vist seg å være overlegen i forhold til andre modeller [11]. I de senere årene har enkelt- og multisenterstudier vist at SAPS 3 modellen er mer nøyaktig i prognosen for kreftpasienter som trenger intensivbehandling [11-12]. Men validering av SAPS 3 modellen ble bare gjennomført blant kritisk syke kreftpasienter i brasiliansk intensivavdelinger.

Derfor er målet med denne studien er å evaluere forestillinger av de tre prognostiske modeller (APACHE II, APACHE IV og SAPS 3) i kritisk syke kreftpasienter i Kina.

Materialer og metoder

Denne retrospektive studien ble gjennomført i Intensive Care Unit Institutt for Cancer Hospital ved Chinese Academy of Medical Sciences og Peking Union Medical College. The Cancer Hospital er den høyest rangerte sykehus som spesialiserer seg på kreft i Kina og dets ICU er en 10-sengs senter for vedlikehold av kritisk syke pasienter. Sykehusets Institutional Review Board godkjent studien og pasientenes informert samtykke ble frafalt på grunn av observasjons natur denne studien. Pasientjournaler /informasjon ble anonymisert og avidentifisert før analysen.

Studien involverte pasienter som ble innlagt på intensivavdelingen mellom oktober 2008 og september 2010, men ekskluderte de under 18 år eller med et opphold på intensivavdeling på mindre enn 24 timer. Kliniske og laboratorie variabler av hver pasient ble prospektivt samlet av seks intensivists (X. Xing, H. Wang, S. Sandsvær, C. Huang, H. Zhang og H. Wang). Data som anses for beregning av SAPS 3 ble samlet og registrert innen 1 time av ICU opptak, og predikerte dødelighet ble beregnet som anbefales [2]. APACHE II og APACHE IV score ble beregnet ved hjelp av data i løpet av de første 24 timene av opptak og predikerte dødelighet ble beregnet i henhold til litteraturen [1,3]. Pasientene ble klassifisert basert på den grunn av ICU innleggelse, dvs. medisinsk, planlagt kirurgi og akutt kirurgi. Sykehuset dødeligheten var den viktigste endepunktet.

Etikk erklæringen

Institutional Review Board (IRB) ved Cancer Hospital, Chinese Academy of Medical Sciences (ref. 11-75 /510) godkjent denne studien protokollen. Informert samtykke fra pasientene ble frafalt på grunn av observasjons natur denne studien. Studien ble utført i samsvar med de etiske standardene fastsatt i 1964 Helsinkideklarasjonen og dens senere endringer. Pasientjournaler /informasjon ble anonymisert og avidentifisert før analysen.

Statistical Analysis

Data ble inngått en database ved en enkelt forfatter (X. Xing). Statistiske analyser ble utført ved hjelp av SPSS programvare for Windows, versjon 16.0 (SPSS Inc., Chicago, IL, USA). Kontinuerlige variabler ble presentert som gjennomsnitt ± standardavvik eller median (25-75% interkvartilt område) og sammenlignet, henholdsvis ved hjelp av t-test. Kategoriske variabler ble rapportert som absolutte tall (frekvens prosenter) og analysert ved hjelp av χ2 test.

ble utført Statistisk analyse på samme måte som Soares «et al [13]. Kort sagt, ble validering av prognostiske Stillingen utført ved anvendelse av standard tester for å måle diskriminering og kalibrering for hver av de prediktive modeller. Arealet under mottakeren opererer karakteristiske kurve (AUROC) ble brukt til å evaluere evnen til hver enkelt modell for å skille mellom pasienter som levde fra de som døde (diskriminering). Hosmer-Lemeshow godhet-of-fit C statistikken ble brukt til å evaluere avtalen mellom observert og forventet antall pasienter som har eller ikke dø på sykehuset på tvers av alle lagene av sannsynlighetene for død (kalibrering). En høy p-verdi ( 0,05) indikerer en god passform for modellen. Kalibreringskurver ble konstruert ved å plotte spådd dødelighet stratifisert med 10% intervaller på dødsrisiko (x-aksen) mot observert dødelighet (y-aksen) ved hjelp av Microsoft Excel-programvare. Standardiserte dødelighetsforhold (SMRs) med 95% konfidensielt intervall (CI) ble beregnet for hver modell ved å dele observert av predikerte dødelighet. En to-tailed p-verdi 0,05 ble ansett som statistisk signifikant.

Resultater

I løpet av studieperioden, 1201 pasienter ble innlagt på intensivavdelingen. Totalt 220 pasienter ble ekskludert fra analysen på grunn av alder under 18 år (n = 3), tilbaketaking i samme sykehus (n = 49) og en ICU opphold på mindre enn 24 timer (n = 168). Derfor 981 pasienter utgjorde befolkningen i denne studien. Pasientenes egenskaper er vist i tabell 1. SAPS 3 var 36,9 ± 13,2 (range 16-102), APACHE II var 10,4 ± 5,5 (range 0-42), og APACHE IV minutter ble 37,7 ± 19,8 (range 3-160) (S1 data). Pasienter i stor grad led av thorax og abdominal svulster (80,1%), og hovedsakelig gjennomgikk planlagt kirurgi (92,9%).

De evalueringsresultatene av modellene for alle 981 pasienter er presentert i tabell 2. diskriminering ble veldig bra med AUROC for alle tre modeller i alle 981 pasienter. AUROC av SAPS 3 (0,948) var større enn de som ble observert for henholdsvis APACHE II (0,863) og Apache IV (0,873) (fig 1). Kalibrering var bra for alle modeller (alle

P

0,05) (Tabell 2 og Fig 2A-2C). Likevel, safter 3 og APACHE IV undervurdert i sykehusdødelighet, mens APACHE II overvurdert i sykehusdødelighet, og med SMR. 1,0 (Tabell 2)

Areal under mottaker drift karakteristikk var 0,949 ± 0,017 for SAPS 3 (p 0,001, 95% KI: 0,916 til 0,982), 0,863 ± 0,030 for APACHE II (p 0,001, 95% KI: 0,804 til 0,923) og 0,873 ± 0,031 for APACHE IV (p 0,001, 95% KI: 0,812 til 0,934). SAPS 3 Forenklet Akutt Physiology Score 3, APACHE II Akutt fysiologi og kroniske helse Evaluering II, APACHE IV Akutt fysiologi og kroniske helse Evaluering IV, CI konfidensielle intervaller.

Kalibrering var bra for alle modeller (alle p 0,05). (A) APACHE II; (B) APACHE IV; (C) SAPS 3.

De forestillinger av modellene ble videre analysert for planlagte kirurgiske pasienter og akutt kirurgiske og medisinske pasienter hhv. Resultatene er presentert i tabell 3. Igjen, AUROC av SAPS 3 (0,912) var større enn de som ble observert for APACHE II (0,866) og Apache IV (0,857) i nøds kirurgiske og medisinske pasienter, og AUROC av SAPS 3 (0,945) ble større enn de som ble observert for APACHE II (0,834) og Apache IV (0,851) i planlagte kirurgiske pasienter. Disse dataene viser at diskriminering makt var bedre med SAPS 3 enn med APACHE II og Apache IV enten for akutte kirurgiske og medisinske pasienter eller for planlagte kirurgiske pasienter. Kalibrering var bra for alle modeller (alle p 0,05) enten for planlagte kirurgiske pasienter eller for akutt kirurgisk og medisinske pasienter. Men, i form av SMR, SAPS 3 og APACHE II var nøyaktig forutsi sykehusdødeligheten for akutte kirurgiske og medisinske pasienter, mens APACHE IV undervurdert i sykehusdødelighet. SAPS 3 og APACHE IV var nøyaktig forutsi sykehusdødeligheten for planlagte kirurgiske pasienter, mens APACHE II overvurdert i sykehusdødelighet.

Diskusjoner

I løpet av studien, vi fant at APACHE II, APACHE IV og SAPS 3 modeller hadde utmerket diskriminering og kalibrering makt. I form av SMR, safter tre var mer nøyaktig forutsi den sykehusdødelighet enn APACHE II og Apache IV, enten for akutt kirurgisk og medisinsk pasienter eller for planlagte kirurgiske pasienter.

Så vidt vi vet, er dette første studien utforsker validering av APACHE II, APACHE IV og SAPS 3 modeller i kreftpasienter i Kina, uavhengig av om de har hatt operasjon eller ikke. Vi valgte APACHE II for sammenligning med APACHE IV og safter 3 modeller fordi APACHE II brukes i dag i vår ICU og er den mest populære modellen i Kina [9,14]. Mange Kina intensivavdelinger er motvillige til å gjennomføre APACHE IV og SAPS 3 modeller på grunn av større fortrolighet med APACHE II og mangel på valideringsstudier med APACHE IV og SAPS 3 i Kina. Med innføringen av SAPS 3 modellen i 2005 [2] og Apache IV-modellen i 2006 [3], har det blitt foreslått at de eldre modellene bør ikke brukes fordi de blir stadig mer unøyaktig [3]. God diskriminering og kalibrering av SAPS 3, spesielt tilpasset ligning av SAPS 3, har vært rapportert hos kritisk syke kreftpasienter i enkelt- og multisenterstudier i brasiliansk intensivavdelinger [11-12]. Til slutt velger vi APACHE IV fordi ytelsen til APACHE IV modellen tilbys utmerket diskriminering og kalibrering i en stor felles datasett [15], men det har ennå ikke blitt godkjent hos kreftpasienter i Kina. Vi valgte ikke CMM modellen fordi den overvurderer dødelighet uansett studere elektive kirurgiske pasienter eller ikke, og tidligere studier har ikke vist forbedring av dødelighet prediksjon sammenlignet med generelle score [11].

APACHE II modellen er fortsatt mye brukt over hele verden, enten generelt eller faglig intensivavdelinger [16-21]. I denne studien fant vi at AUROC av APACHE II er 0,863 i alle 981 pasienter, som er i samsvar med det som er rapportert av de fleste forfattere [16,18-20]. Men det overvurdert i sykehusdødeligheten med SMR på 0,72, selv om kalibreringen var bra, med en p-verdi på 0,900. Etter eksklusjon planlagte kirurgiske pasienter, var det nøyaktig forutsi sykehuset dødelighet for akutt kirurgisk og medisinske pasienter. Kirurgiske pasienter hadde midlertidig fysiologisk forstyrrelse på grunn av virkningene av anestesi. Derfor var det ikke overraskende at bruken av APACHE II score førte til en overvurdering av dødelighet hos kirurgiske pasienter [22]. Tilpasning eller legge til nye variabler kan forbedre kalibreringen makt. Chang et al innlemmet metastase og respirasjonssvikt variabler inn i APACHE II-modellen og fant at AUROC av APACHE II score for medisinske pasienter økt 0,82 til 0,86, og tilpasning av den modifiserte modellen var utmerket sammenlignet med APACHE II-modellen alene [22 ].

Apache IV modellen ble utviklet ved hjelp av en svært stor database i USA [3] og flere valideringsstudier har blitt rapportert [6,15-16,19]. Ikke overraskende APACHE IV modell tilbød den beste diskriminering og kalibrering hovedsakelig i amerikanske intensivpasienter [15], men dårlig kalibrering for pasienter utenfor USA, selv om det viste god diskriminering [16,19]. I vår studie fant vi at AUROC av APACHE IV er 0,873 i alle 981 pasienter, som er i samsvar med det som er rapportert av de fleste forfattere [6,15-16,19]. Men det undervurdert i sykehusdødeligheten med SMR på 1,17, selv om kalibrering av det var bra med en p-verdi på 0,878. Dens kalibrering kraft falt 1,17 til 1,61 for akutt kirurgisk og medisinske pasienter. Men dette var ikke tilfelle for planlagte kirurgiske pasienter, og kalibrerings evne APACHE IV modell for sistnevnte var 0.97 i form av SMR, som viste god kalibrering. Totalt sett den nye APACHE IV scoring system utviklet seg bedre enn eldre kolleger av APACHE II på grunn av innføring av mer prediktive variabler [6]. I utviklingsland, men byrden av manuell datainnsamling av mange variabler kan bli aktuelt på grunn av mangel på elektronisk kartlegging, som dels kan hindre valg og bruk av nye scoringsmodeller. Som et resultat av hvordan å balansere den komplekse og enkel bruk av nye scoring systemer er en utfordring.

Enkelt og multisentervalideringsstudier ledet av Soares et al viste at SAPS 3 prognostisk modellen var nøyaktig forutsi utfall i kritisk syke pasienter med kreft som trenger intensivbehandling [11-12]. I sine studier, både diskriminering og kalibrering var bra for ikke-planlagte kirurgiske pasienter for CSA (tilpasset ligningen for land fra Sentral- og Sør-Amerika) safter 3, men ikke for SAPS 3. I vår studie, valgte vi SAPS 3 for validering som generelle SAPS 3 viste god kalibrering og beskjeden diskriminering i asiatiske kritisk syke pasienter [23]. I denne studien fant vi at SAPS 3 hadde bedre diskriminering evne enn APACHE II og Apache IV modeller, og alle modeller hadde god kalibrering makt. I form av SMR, safter tre var mer nøyaktig forutsi den sykehusdødelighet enn APACHE II og Apache IV om for akutt kirurgisk og medisinsk pasienter eller for planlagte kirurgiske pasienter.

De fleste rapporterte lignende gode diskriminerende egenskapene studier alle prognostiske modeller, men motstridende resultater når det gjelder kalibrering [5-6,15-16,19]. Peek et al fant at kalibrerings testene var ekstremt følsomme for utvalgsstørrelsen [24]. I deres studie, fant de at i kalibreringsforsøk, hyppigheten av avtalen steg fra 78% (250 observasjoner) til 86% (750 observasjoner) og 93% (1000 observasjoner). Imidlertid, etter tilpasning, er Hosmer-Lemeshow test aksepterte modellen i de fleste tilfeller (99% med en prøvestørrelse på 250, 89% med en prøvestørrelse på 5000). Derfor kan det være hensiktsmessig at lokal tilpasning er obligatorisk å forbedre kalibreringen evne prognostiske modeller.

Alvorlighetsgrad av sykdom scoring systemer har blitt designet for benchmarking, bedre ytelse, ressursbruk, og klinisk beslutningsstøtte [25] . En fersk studie viste at førti prosent av 40933 pasienter hadde en dødsrisiko på mindre enn 10%, og ikke har en intensiv behandling som mekanisk ventilasjon, ikke-invasiv ventilasjon, blodprodukt administrasjon, renal replacement therapy, eller behandling med et vasoaktive medikamenter [26 ]. Som ICU er et sted for de mest kritisk syke pasienter, forskning har blitt gjort for å studere bedre enn alvorlighetsgraden av sykdommen triage beslutninger. En foreløpig studie viste at bruk av fremskritt innen helse informasjonsteknologi (HIT) kan bidra til bedre triage beslutninger [27]. Inntil nå har dagens utfall prediksjonsmodeller fokuserer stadig mer på standarder for ressursbruk [28].

Vår studie har potensielle begrensninger. For det første, dette var en enkeltsenterstudie og bare kritisk syke kreftpasienter ble inkludert. Derfor, kan resultatet av denne studien ikke generaliseres til andre generelle medisinske sentre. Dernest, lokal tilpasning kan gi en bedre kalibrering, derfor ytterligere undersøkelser bør utføres for å vurdere andre nivå tilpasning av alle prognostiske modeller i kritisk syke pasienter med kreft. For det tredje var det ingen pasienter som hadde leukemi eller lymfom, og få pasienter led metastatiske solide tumorer. Derfor resultatet av denne studien var lik den generelle kirurgiske intensivstudier [29]. Til slutt, den generelle sykehuset dødeligheten var svært lav, selv om vår kohorten inkluderte 981 pasienter. Dette kan ha en innvirkning på ytelsen til alle prognostiske modeller.

Konklusjoner

I denne kohorten, fant vi at APACHE II, APACHE IV og SAPS 3 modeller hadde god diskriminering og kalibrering evne i å forutsi i sykehus dødelighet av kritisk syke pasienter med kreft som trenger intensivbehandling. Av disse tre alvorlighets score, safter 3 var bedre enn APACHE II og Apache IV, enten i form av diskriminering og kalibrering makt, eller standardiserte dødelighetsforhold.

Hjelpemiddel Informasjon

S1 data. En del av rådata for alle 981 pasienter

doi:. 10,1371 /journal.pone.0131329.s001 plakater (RAR)

Legg att eit svar