Hvor gode er vi egentlig?

Skrevet av Torsten Eken

Vi skylder pasientene våre å gi dem best mulig behandling, derfor må vi arbeide kontinuerlig for å heve kvaliteten på alt vi gjør. Men hvordan finner vi ut hvor gode vi er, og om vi utvikler oss i riktig retning? For å få til dette må vi kunne sammenligne oss med hverandre, og med oss selv over tid. Dette innlegget handler om sammenligning av dødelighet hos traumepasienter som er i live når de kommer til sykehus.

Måling av dødelighet og overlevelse
Det er rimelig enkelt å telle hvor mange traumepasienter som overlever og dør, og dermed regne ut andel traumedødsfall. Dette tallet, i engelsk litteratur kalt “crude mortality”, kan imidlertid ikke brukes til så mye. F.eks. vil andel traumedødsfall i et sykehus gå ned hvis man slutter å ta imot pasienter med alvorlige skader, eller hvis man begynner å ta imot mange med svært lette skader, selv om kvaliteten på behandlingen er uendret. Det er også meningsløst å bruke tallet til å sammenligne sykehus som har forskjellig andel alvorlig skadde.

Hvordan måler vi da kvaliteten i et sykehus opp mot andre? Det hadde hjulpet hvis vi kunne se faktisk overlevelse opp mot beregnet sannsynlighet for overlevelse etter skade. Selv om vi bare treffer sånn noenlunde for hver enkelt pasient, kunne vi regne ut summen av sannsynlighetene for overlevelse i en større gruppe pasienter for å få et rimelig godt overslag over hvor mange av dem som burde ha overlevd. En sammenligning mellom forventet antall overlevende og hvor mange som faktisk overlevde kalles en risikojustert analyse av overlevelse. Dette kan vi bruke til å evaluere behandlingskvalitet mellom sykehus, og med oss selv over tid. Men hvordan regner vi ut forventet sannsynlighet for å overleve?

Sannsynlighet for å overleve etter traume
Vi vet at traumepasienter har høy risiko for å dø hvis de har stor anatomisk skade og hvis de har dårlig fysiologi. Pasientfaktorer før skaden spiller også inn, f.eks. evnen til å kompensere ved begynnende blødningssjokk. Denne evnen blir dårligere med alderen, og naturligvis også hvis pasienten har andre samtidige sykdommer som går ut over sirkulasjons- og respirasjonssystemet. Det finnes flere statistiske modeller som bruker disse faktorene for å beregne sannsynlighet for overlevelse.

USA: TRISS
Den mest brukte statistiske modellen internasjonalt kalles TRISS (Trauma score – Injury Severity Score), og er utviklet i USA[1]. Siste versjon er fra 2009[2]. Den er basert på alder, skademekanisme, GCS, systolisk blodtrykk, respirasjonsfrekvens og total anatomisk skadegrad. Alder er delt inn i tre kategorier (yngre enn 15 år, 15–54 år, eller eldre enn 54 år), mens skademekanisme er kategoriene stump eller penetrerende. Total anatomisk skadegrad blir beregnet på bakgrunn av den verste skaden i hver av inntil 3 kroppsregioner. En TRISS-kalkulator er publisert her.

Det er flere problemer med TRISS-modellen. Et lite intuitivt problem er selve definisjonen av traumedødsfall. USA bruker ikke personnummer, derfor kan pasienter oftest ikke følges etter utskrivelse fra sykehus. Modellen tar derfor utgangspunkt i overlevelse på traumesykehuset, og dødsfall senere i forløpet blir ignorert. Videre er aldersgruppene svært grove, og samtidige sykdommer inngår ikke i modellen. Dermed vil en frisk 55-åring få samme reduksjon i beregnet sannsynlighet for overlevelse som en 90-åring med hjertesvikt. Et annet problem er at modellen strengt tatt ikke skal brukes til å beregne sannsynlighet for overlevelse hos pasienter som kommer intubert og i narkose til sykehus, fordi vi ikke kan måle GCS og respirasjonsfrekvens ved innleggelse. I Traumeregisteret OUS har vi valgt å omgå dette ved å bruke de siste dokumenterte verdiene før en prehospital intubasjon, siden vi ellers hadde måttet ekskludere en stor andel av de hardest skadde pasientene våre. Vi har også valgt å bruke 30-dagers overlevelse i stedet for overlevelse i sykehuset.

Sammenligning av kvalitet
Traumeregisteret OUS har brukt TRISS-modellen til å se på kvalitet i egen traumebehandling. I 2016 publiserte vi en sammenligning mellom beregnet og faktisk overlevelse på Ullevål og Karolinska[3]. Vi fant at det var små forskjeller i behandlingsresultat for pasienter som kom direkte til de to traumesentrene, mens Ullevål tilsynelatende hadde dårligere resultater for pasienter som var innlagt via andre sykehus. Vi tilskrev disse forskjellene i stor grad til at pasienter som ble overflyttet til Ullevål var eldre og hadde flere samtidige sykdomstilstander, som altså ikke blir tatt hensyn til i TRISS. Dermed fikk pasientene våre kunstig høy beregnet sannsynlighet for overlevelse, og det så ut til at vi reddet færre liv enn vi burde ha gjort.

Vi har også brukt TRISS til å følge utviklingen i kvalitet på Ullevål i en 11-årsperiode[4]. Vi plottet forskjellen mellom summen av antall overlevende og summen av sannsynligheter for overlevelse fortløpende pr. pasient, og fant at en plutselig forbedring i overlevelse fra 2005 utelukkende skyldtes bedre håndtering av pasienter med kritisk hodeskade. Metoden vi brukte er også svært godt egnet til å oppdage forbigående endringer i kvalitet, f.eks. i perioder med flytting[5] eller bemanningsproblemer. Slike endringer drukner lett i analyser av gjennomsnittlig kvalitet målt over hele år.

Norge: NORMIT
På grunn av problemene med TRISS har vi valgt å utvikle en alternativ statistisk modell, kalt NORMIT (Norwegian survival prediction model in trauma)[6]. Den tar utgangspunkt i om pasienten overlever til 30 dager etter skade, i tråd med WHOs anbefalinger. Alder inngår som en kontinuerlig variabel, modellert slik at evne til å overleve synker raskere jo eldre vi blir. Vi tar også inn samtidige sykdommer kodet som ASA-gruppe før skade, et system som er godt kjent for alt anestesipersonell. Hvis pasienten er intubert ved ankomst i sykehus bruker vi siste dokumenterte GCS og respirasjonsfrekvens før intubasjon. Total anatomisk skadegrad blir beregnet fra de tre verste skadene, uavhengig av kroppsregion.

NORMIT har blitt validert i Finland[7], og vi har vist at en oppdatert versjon av modellen (NORMIT2) er bedre egnet enn TRISS på et stort pasientmateriale fra Ullevål[8]. Sannsynlighet for overlevelse etter NORMIT blir beregnet for alle pasienter i Nasjonalt traumeregister.

Vær varsom
Alle statistiske modeller må brukes med forsiktighet. Selv om vi tror at NORMIT er vesentlig bedre enn TRISS for nordiske traumesykehus har vi foreløpig ikke undersøkt formelt hvor godt modellen er egnet for andre norske sykehus enn Ullevål. Usikkerhet i beregningene kan også gi forholdsvis store utslag for sykehus med et lavt antall traumepasienter. Dette er momenter vi må ta med oss når vi etter hvert begynner å bruke NORMIT til å sammenligne behandlingsresultater mellom norske sykehus. Og husk for all del på at modellene er laget for å sammenligne pasientgrupper, de er absolutt ikke egnet til å lage prognoser for enkeltpasienter!

[1] Boyd CR, Tolson MA & Copes WS (1987). Evaluating trauma care: the TRISS method. Trauma Score and the Injury Severity Score. 27, 370–378.

[2] Schluter PJ, Nathens A, Neal ML, Goble S, Cameron CM, Davey TM & McClure RJ (2010). Trauma and Injury Severity Score (TRISS) coefficients 2009 revision. J Trauma 68, 761–770.

[3] Ghorbani P, Ringdal KG, Hestnes M, Skaga NO, Eken T, Ekbom A & Strömmer L (2016). Comparison of risk-adjusted survival in two Scandinavian Level-I trauma centres. 24, 66.

[4] Søvik S, Skaga NO, Hanoa R & Eken T (2014). Sudden survival improvement in critical neurotrauma: An exploratory analysis using a stratified statistical process control technique. Injury 45, 1722–1730.

[5] Flaatten H (2005). Effects of a major structural change to the intensive care unit on the quality and outcome after intensive care. Qual Saf Health Care 14, 270–272.

[6] Jones JM, Skaga NO, Søvik S, Lossius HM & Eken T (2014). Norwegian survival prediction model in trauma: modelling effects of anatomic injury, acute physiology, age, and co-morbidity. Acta Anaesthesiol Scand 58, 303–315.

[7] Raj R, Brinck T, Skrifvars MB & Handolin L (2016). External validation of the Norwegian survival prediction model in trauma after major trauma in Southern Finland. Acta Anaesthesiol Scand 60, 48–58.

[8] Skaga NO, Eken T & Søvik S (2018). Validating performance of TRISS, TARN and NORMIT survival prediction models in a Norwegian trauma population. Acta Anaesthesiol Scand 62, 253–266.