Acta chirurgiae orthopaedicae et traumatologiae Cechoslovaca

Acta chirurgiae orthopaedicae et traumatologiae Cechoslovaca

Původní práce / Original papers

ACTA CHIRURGIAE ORTHOPAEDICAE ET TRAUMATOLOGIAE ČECHOSL.,
77, 2010, p. 118 - 123

Je Kaplan-Meierova statistika nejvhodnější metodou k hodnocení přežívání výsledku v ortopedii?

Is Kaplan-Meier Statistics the Most Appropriate Tool for Survivorship Measurement of Outcomes in Orthopaedics?

K. LANGOVÁ1, J. GALLO2
1Ústav lékařské biofyziky LF UP v Olomouci
2Ortopedická klinika LF UP a FN, Olomouc
ABSTRACT

PURPOSE OF THE STUDY

An assessment of the results over a time period is an integral part of any treatment evaluation. A standard method used for this purpose is Kaplan-Meier survival analysis. The aim of this study was to show how, for total hip arthroplasty (THA), estimates of prosthesis survival probability can be affected by a factor known as competing events.

MATERIAL AND METHODS

A set of input data concerning competing events (death and loss to follow-up), in addition to the investigated event (revision THA), was analysed by both the Kaplan-Meier method and the method of cumulative incidence with the use of worst-case analysis.

RESULTS

Our results showed that, for the same input data, the Kaplan-Meier method gave lower estimates of prosthesis survival probability than the method of cumulative incidence. This difference increased with an increasing number of competing events occurring during the clinical study, and with an increasing duration of follow-up. These survival probability estimates can markedly be influenced by the use of worst-case analysis In our set of data this was more than 30 %.

DISCUSSION

Reports in the orthopaedic literature still show a predominant use of the Kaplan-Meier method, although it is obvious that this is not always optimal for observational clinical studies. Also, it is not clear how beneficial is the use of worst-case analysis, because our and other authors' results suggest that not all patients lost to follow-up should be considered as failed. Therefore, insolvement of such analysis might markedly distort the real survival curves and to disadvantage evaluated the orthopaedic method.

CONCLUSIONS

In observational clinical studies involving a higher number of competing events, it is preferable to use the cumulative incidence method rather than Kaplan Meier analysis for statistical evaluation of the results. The former gives more exact estimates of prosthesis survival probability. It is also recommended to avoid modifying survival curves indiscriminately according to the results of worst-case analysis.

Key words: evaluation, survival analysis, Kaplan-Meier method, cumulative incidence, worst-case analysis, competing events, total joint replacement.

ÚVOD

V medicíně používáme běžně jako kritérium hodnocení léčebné metody dobu, po kterou jí navozený výsledek vydrží (4). V této souvislosti je zcela zásadní definovat přesně, co je to selhání léčby, což je jednoduché například v  onkologii, kdy datum úmrtí společně s datem zahájení terapie vymezují jednoznačně časový interval výsledku, který označujeme jako dobu přežití ("survival time"). Protože není možné z pragmatických důvodů vyčkávat na selhání posledního pacienta ve sledovaném souboru, navrhli Kaplan s Meierem výpočet odhadu pravděpodobnosti přežití v kterémkoliv okamžiku v průběhu studie (10). Cílem je vytěžit maximum relevantních informací v době, kdy část sledovaných dat ještě není k dispozici. Původní práce, která přivedla tuto metodu na svět, byla jako teoretická matematicko-statistická studie inspirována dvěma zdroji - údaji o přežívání pacientů s nádorovým onemocněním a údaji o přežití elektronek instalovaných v souvislosti s kladením interkontinentál-ního podmořského kabelu mezi Evropou a Amerikou. Tento přístup se následně z onkologie rozšířil do ostatních oblastí klinického výzkumu a stal se samozřejmou součástí vědecké komunikace (21), což mimo jiné dokládá více než 35 000 citací článku Kaplana a Meiera evidovaných ve Web of Science (k 26. 6. 2009).

Kaplan-Meierův přístup byl však navržen k odhadu pravděpodobnosti výskytu jisté události, u níž se předpokládá, že se vyskytne při dostatečně dlouhé době sledování u všech pacientů ve studii. Typickým příkladem je právě úmrtí pacienta u malignit. Avšak někteří pacienti mohou být ze sledování ztraceni ještě před ukončením studie, a to proto, že se u nich vyskytla jiná než sledovaná událost, která svou přítomností vylučuje následný výskyt události sledované nebo významně mění následnou pravděpodobnost vzniku sledované události (7). Tyto jiné události než sledované se nazývají alternativní události ("competing events"), (8). Není třeba se přesvědčovat o tom, že jde o  zcela běžnou situaci. Představme si, že prospektivně sledujeme soubor endoprotéz kyčle a jako sledovanou událost si zadáme aseptické uvolnění. Hned na začátku studie nám musí být jasné, že předtím než dojde ke sledované události na jedné jediné kyčli, proběhne u určité části pacientů reoperace pro infekci, recidivující luxaci, periprotetickou zlomeninu anebo se ukáže některý jiný důvod časného selhání endoprotézy (18, 20). Kromě toho můžou další pacienti zemřít. Za těchto okolností je sledovanou událostí aseptické uvolnění a alternativními událostmi jsou infekce, recidivující luxace, periprotetická zlomenina a smrt. Z čistě metodologického hlediska není za této situace Kaplan-Meierův odhad vhodný, protože v případě většího výskytu alternativních událostí nadhodnocuje pravděpodobnost výskytu sledované události a poskytuje tak příliš pesimistické výsledky (7). Za této situace se jeví jako vhodnější použití metody odhadu kumulativní incidence, což je alternativa ke Kaplan-Meierově metodě (2). Problémovým místem dlouhodobého sledování výsledku jsou také pacienti, kteří nechodí ke kontrolám. Murray a spol. navrhli svého času zařadit všechny tyto případy s "neznámým osudem" mezi selhání (13). Tím se však ještě více navýší počet alternativních událostí v neprospěch sledovaného výsledku.

Protože je časově podmíněné hodnocení ortopedických výkonů běžnou součástí naší literatury (5, 15, 16, 22, 23), rozhodli jsme se téma zpracovat a  demonstrovat přednosti metody kumulativní incidence na příkladovém souboru pacientů.

METODIKA

Obecně je analýza přežívání soubor statistických metod, které zpracovávají proměnnou "čas do výskytu nějakého jevu (události)", která se obvykle nazývá dobou přežití. Dobou přežití rozumíme počet let, měsíců, týdnů nebo dní od začátku sledování jedince až do výskytu jevu. Například při sledování přežívání kloubních náhrad je zavedeným sledovaným jevem revize kloubu, ačkoliv je zjevné, že selhávání kloubu začíná mnohem dříve, nežli dojde k  revizi.

Většina studií zabývajících se analýzou přežívání je v praxi ukončena dříve, než u všech posuzovaných osob nastane sledovaná událost (4, 11). Tuto situaci nazýváme v analýze přežívání cenzorováním. Cenzorování může nastat ze tří důvodů:

Po ukončení klinické studie získáváme vstupní údaje pro následné statistické zpracování. Obvykle máme k dispozici soubor dat, který obsahuje mimo jiné informace o tom, zdali nastala sledovaná událost (předmět zájmu) a kdy. Jakýkoliv soubor tak můžeme rozdělit na tři skupiny jedinců (11):

ACHOT 2/2010 ACHOT 2/2010

U každého pacienta máme tedy dva údaje: dobu sledování a důvod ukončení sledování, který můžeme zakódovat například takto: 1 pro sledovanou událost (skupina 1), 0 pro pacienty, u nichž sledovaná událost nenastala (skupina 2 a  3).

Funkce přežití udává pravděpodobnost, že osoba je bez sledované události déle než konkrétně specifikovaný čas t [S (t) = P (T>t), kde T je nezáporná náhodná veličina, která vyjadřuje dobu uplynulou od zahájení pozorování jedince do výskytu sledovaného jevu]. Teoretický tvar funkce přežití je znázorněn v grafu 1.

Ke konstrukci funkce přežívání se běžně používají komerční statistické software. Při výpočtu pravděpodobnosti přežití nám statistické zpracování poskytne také informaci o mediánu přežití a průměrné době přežívání. Medián přežití je časový údaj, ve kterém je pravděpodobnost přežití rovna 0,5 (graf 2). Průměrná doba přežívání se definuje jako plocha pod křivkou přežití. Tyto statistické ukazatele jsou tedy v analýze přežívání definovány a počítány jiným způsobem než při počítání pouze s konečnými daty (11).

Kaplan-Meierova metoda

Odhadujeme-li funkci přežití metodou Kaplana a Meiera, pak S(t) značí teoretickou funkci (graf 1) přežití platnou pro celou Spopulaci a (t) funkci přežití pro konkrétní soubor plédovaný v klinické studii (graf 2). Hodnoty funkce S(t) se počítají ve všech časech, kdy došlo u některého z pacientů ke sledovanému jevu, tedy pro všechna konečná data. Výpočet vychází z teorie pravděpodobnosti a je založen na relativních černostech (4, 10, 11).

Kaplan-Meierův odhad funkce přežití v čase t. je definován následovně:

ACHOT 2/2010

Odhad hodnoty funkce přežití v čase t(i) tedy (t(i)) je pravděpodobnost, že výsledek vydrží všechny předchozí diskrétní okamžiky t1, t2,...,tj-1. A přežije také interval (tj-1 tj>). Funkce je schodovitá, to znamená, že každá událost způsobí pokles pravděpodobnosti přežití (=schod). Značky (svislé čárky) v  grafu značí cenzorova-ná data. Z této matematické teorie, tj. ze vztahu (1), vyplývá, že každá alternativní událost vede ke snížení pravděpodobnosti přežití zbývajících pacientů (výsledků).

Samozřejmou součástí prezentace výsledků Kaplan-Meierovy metody by mělo být vykreslení 95 % intervalů spolehlivosti, což některé komerční programy neumí.

Metoda kumulativní incidence

Metoda kumulativní incidence pracuje se stejnými daty a je založena na podobných principech jako Kaplan-Meierova metoda (2, 7). Výsledná kumulativní incidence se získává v řádcích, ve kterých došlo ke sledované události (revize TEP = 1) jako součet incidence a kumulativní incidence v předchozím čase. Pokud nedošlo ke sledované události (Revize TEP = 0) je kumulativní incidence rovna kumulativní incidenci v předchozím čase.

Analýza nejhoršího scénáře (Worst-case analysis)

Koncepce nejhoršího možného scénáře pracuje s předpokladem, že u všech pacientů ztracených ze studie dojde ke znehodnocení výsledku (6, 13). Je proto možné ji nasadit na kteroukoliv z obou posuzovaných metod.

SOUBOR PACIENTŮ

Fungování obou metod vysvětlíme na ilustrativním modelovém příkladu: Ve skupině 20, resp. 70 pacientů po operaci totální endoprotézy kyčle sledujeme pravděpodobnost přežití endoprotézy. Revize je v naší modelové studii vnímána jako selhání totální endoprotézy, je tedy sledovanou událostí. Předpokládejme, že se jedná o skupinu starších pacientů a že 9 pacientů během sledování zemře. Úmrtí je v tomto případě alternativní událostí.

VÝSLEDKY
ACHOT 2/2010 ACHOT 2/2010 ACHOT 2/2010

V tabulce 1 jsou v prvních čtyřech sloupcích vstupní data - označení pacienta, délka sledování pacienta po implantaci endoprotézy v letech, údaj zda byla nutná revize nebo ne, dále zda pacient zemřel nebo stále žije. Následující sloupec ukazuje výpočet odhadu pravděpodobnosti přežití metodou Kaplana a  Meiera podle vzorce (1), ve vedlejším sloupci je zobrazen výsledek. V  posledním sloupci je vypočítána pravděpodobnost selhání jako doplněk k  pravděpodobnosti přežití do 1.

V tabulce 2 je použita metoda kumulativních incidencí. Tabulka 2 navazuje na tabulku 1, vstupní data jsou shodná. V prvním řádku je zapsána situace v  počátku sledování, tedy v čase j=0. Údaj nj představuje počet sledovaných jedinců vstupujících do časového okamžiku tj, sloupec dj udává počet všech událostí (sledovaných i alternativních), které nastaly v čase tj. V následujícím sloupci je spočítána pravděpodobnost přežití jako poměr (nj-dj/nj. Pokud dj = 0, pak se tato pravděpodobnost nepočítá. Celkové přežití O(tj) vypočítáme jako součin pravděpodobnosti přežití (nj -dj/nj a celkového přežití v předchozím čase O(t j-1). Pokud dj = 0, je O(tj) rovno celkovému přežití v předchozím čase. Pravděpodobnost selhání h(tj) však počítáme jako číselný doplněk pravděpodobnosti přežití do 1. Počítáme pouze v  řádcích, kde je pravděpodobnost přežití (nj-dj)/n j definována. Incidence je definována jako součin h(tj)*0(tj-1). Opět pouze v řádcích, ve kterých je počítáno h(tj). Graf 3 porovnává odhad pravděpodobnosti selhání metodou Kaplana a Meiera a metodou kumulativních incidencí. Rozdíl se v případě naší demonstrační studie projevil až při delší době sledování, a v 10. roce od implantace činil 9,4 %.

Koncepci "worst case-analysis" přiblížíme na následujícím ilustrativním příkladu. Ve skupině 70 pacientů po operaci TEP kyčle studujeme pravděpodobnost přežití endoprotézy 12 roků od implantace. Sledovanou událostí je revize endoprotézy. V průběhu sledování souboru došlo u dvou pacientů k  luxaci, u dvou pacientů k infekci, u jednoho došlo k periprotetické zlomenině, 15 pacientů zemřelo a 25 pacientů během 121etého sledování přestalo docházet na kontroly. Luxace, infekce, periprotetická zlomenina a úmrtí jsou alternativními událostmi. Graf 4 ukazuje křivky přežití totální endoprotézy vypočítané metodou Kaplana a Meiera. Plná křivka znázorňuje pravděpodobnost přežití endoprotézy v případě, že údaje 25 pacientů, kteří přestali docházet na kontroly, považujeme za cenzorovaná data (nazývejme tuto situaci jako tradiční zpracování dat). Naopak čárkovaná křivka představuje vývoj pravděpodobnosti přežití v souladu s koncepcí nejhoršího scénáře, kdy předpokládáme, že u všech těchto 25 pacientů došlo ke sledované události, tj. k revizi. Z grafu je patrné, že rozdíly v pravděpodobnostech přežití totální endoprotézy za podmínek "worst-case analysis" byly 10 roků od implantace 33 %  při zpracování dat metodou Kaplana a Meiera. Při použití metody kumulativní incidence byl rozdíl 35,4 %.

V grafu 5 je vyjádřena pravděpodobnost selhání endoprotézy kyčle metodami Kaplana a Meiera, resp. kumulativní incidence v obou případech, tedy při běžném zpracování dat a v případě použití přístupu s nejhorším možným scénářem. Rozdíly se projevují zvláště po delší době sledování, v lOletém a  121etém přežívání. Výsledky jsou shrnuty v tabulce 3, k pravděpodobnostem selhání jsou spočítány 95% intervaly spolehlivosti. Ty jsou dosti široké, což je dáno poměrně malým počtem jedinců v ilustrativním příkladu (n=70). Porovnáním těchto intervalů pro různé křivky vidíme, že se většinou překrývají. Rozdíly tedy nejsou statisticky významné. Obvyklá praxe je pokládat statisticky významný výsledek za skutečný efekt, a v důsledku toho i  za výsledek klinicky důležitý a naopak. Tato interpretace však nemusí být nutně oprávněná. Rozdíl vysoce statisticky významný (např. díky velkému rozsahu výběru), nemusí být důležitý klinicky. Podobně není rozumné brát nevýznamný výsledek jako indikaci neexistence efektu jen proto, že nemůžeme zamítnout nulovou hypotézu.

DISKUSE
ACHOT 2/2010

Ilustrativní příklady použité v naší studii demonstrují jednoznačně vhodnost použití metody kumulativní incidence při výpočtu pravděpodobnosti selhání za situace, kdy se ve studii vyskytuje větší množství dat majících charakter alternativní události. Rozdíly se projevují hlavně při dlouhodobějším sledování. Analýza dat v kontextu nejhoršího scénáře nám ukazuj e, j aké výsledky bychom mohli dostat za nejméně příznivé situace, přičemž za určitých okolností může významně znehodnotit křivku přežití vypočtenou oběma posuzovanými metodami.

V éře medicíny založené na důkazu není možné používat léčebnou intervenci bez znalosti jejích charakteristik (1). Ty se týkají nejen velikosti léčebného efektu, rizika komplikací, nákladů na léčbu, ale také toho, jak dlouho léčbou navozený efekt vydrží. Přeloženo do jazyka endoprotetiky to znamená, jak dlouho pacientovi vydrží funkční endoprotéza bez toho, že by musela být reoperována. Z těchto důvodů jsou analýzy přežití nezbytnou součástí všech reportů národních registrů endoprotéz (12), ale také individuálních publikací zaměřených na dlouhodobé sledování jednotlivých endoprotéz (5, 6, 15, 16). Například kritéria britské agentury NICE (National Institute for Clinical Excellence) požadují pro dobrou endoprotézu kyčle minimálně 90% přežití 10 roků od operace (19).

Trvanlivost výsledku se vyjadřuje v mírách pravděpodobnosti, přičemž se využívají dvě základní pojetí. Podle prvního se pracuje s pravděpodobností přežití S(t), která nám říká, jaká je pravděpodobnost toho, že individuální endoprotéza zůstane bez reoperace po dobu od implantace k času "t". Zdůrazňuje se zde podíl kyčlí-pacientů, u nichž nedojde ke sledované události. Druhý přístup je doplňkový k výše uvedenému a sděluje nám pravděpodobnost vzniku sledované události u individuální endoprotézy v čase "t". Jde o tzv. modely rizika (hazardu), kterými se však v našem článku nezabýváme (3). Oba základní přístupy se musí vyrovnat především s konkurenčními událostmi, které mění následnou pravděpodobnost sledované události, protože endoprotézy selhávají z  celé řady důvodů, nikoliv pouze kvůli aseptickému uvolnění. To lze ošetřit analýzou přežití pro jednotlivé důvody selhání v kombinaci se souhrnným odhadem šancí na to, že protéza zůstane bez reoperace k času "t" (6). Podobným problémem je to, že někteří pacienti během sledování zemřou, přičemž platí, že každá alternativní událost mění v modelu Kaplana a Meiera pravděpodobnost sledované události (24). Při větším počtu úmrtí, který provází zejména studie s dlouhou délkou sledování od primoimplantace, tak může dojít k významnému zkreslení výsledků přežití. Proto se doporučuje použít ve studiích s vyšším výskytem alternativních událostí metodu kumulativní incidence (7, 8). V  souvislosti s hodnocením přežívání ortopedických implantátů upozornili na tuto skutečnost Biau a spol. (2).

Jen pro ilustraci, Skutek a spol. publikovali nedávno studii, v níž hodnotili přežití dříku TEP kyčle Harris-2 od firmy Howmedica (17). Hned v první větě části "výsledky" uvádějí, že z původní sestavy pacientů (166), resp. kyčlí (195) zemřelo v průběhu sledování 121 pacientů (73 %), tzn., že přišli o 141 kyčlí (72 %). Při použití metody Kaplana a Meiera tak prezentovali kumulativní přežití 83?6 % (? standardní chyba) průměrně 22 roků od primoimplantace při "end-point" revize z jakéhokoliv důvodu. Na základě této statistiky pak vyvodili závěry o úspěšnosti hodnoceného implantátu, což mu zlepšuje pověst ve virtuální soutěži endoprotéz. Odmysleme na chvíli konkrétní implantát a jeho současnou marketingovou pozici. Kdyby však autoři použili adekvátnější metodu kumulativní incidence, dosáhli by ještě lepších výsledků. V této souvislosti a  s jistou mírou nadsázky se dá říci, že vlastně hodnocenou endoprotézu mírně poškodili.

V neposlední řadě je problémem dlouhodobých sledování to, že se část pacientů nepodaří vyšetřit, resp. dohledat. Například Rozkydal a spol. nedávno publikovali studii, v níž analyzují dlouhodobé výsledky CLS jamky jako součásti primární náhrady kyčle (15). Základní soubor tvořilo 135 nemocných se 148 kyčlemi, zkontrolovat se jim podařilo 105 pacientů (112 kyčlí). Jedenáct pacientů zemřelo v průběhu sledování a 19 (14 %) se jim nepodařilo dohledat. Podle Murraye by měli všechny tyto případy zařadit mezi selhavší (13).

Tím by však byla podle našich údajů významně ovlivněna jak metoda Kaplana a  Meiera, tak metoda kumulativní incidence. Oprávněnou otázkou je proto, jak máme za této situace postupovat. Teoreticky platí, že standardní metody hodnocení (tj. metoda Kaplana a Meiera i kumulativní incidence) jsou validní za předpokladu, že došlo k tzv. neinformativnímu cenzorování, což znamená, že cenzorování nemění žádnou prognosticky cennou informaci týkající se přežití sledované události (4). V této souvislosti je zjevné, že pacienti "ztracení ze sledování" mají stejnou pravděpodobnost k selhání, resp. k úspěšnému výsledku, jakou mají ostatní, tj. zkontrolovaní pacienti. Jejich automatické zařazení do skupiny selhání proto neoprávněně zhoršuje křivku přežití výsledku podle jakékoliv analýzy přežití. Kromě toho není vůbec jisté, že všichni pacienti, které jsme nedohledali, mají špatný výsledek. Natož, aby byli všichni po revizní operaci (9). Rowley a McGurty dokonce zjistili, že nespokojenost s  výsledkem operace je méně častým důvodem k přerušení pravidelných kontrol, nežli se dříve myslelo (14).

ZÁVĚR

Závěrem je možné říci, že naše práce potvrdila významný vliv alternativních událostí na odhad pravděpodobnosti přežití implantátu. Je zřejmé, že metoda Kaplana a Meiera poskytuje pro stejná vstupní data nižší odhad pravděpodobnosti přežití než metoda kumulativní incidence. Tento rozdíl je tím větší, čím více alternativních událostí během doby sledování nastane. V  případě velkého počtu alternativních událostí je proto vhodné upřednostnit metodu kumulativních incidencí před metodou Kaplana a Meiera, neboť poskytuje přesnější odhad.

Literatura

Práce vznikla za podpory grantu MSMT ČR č. 6198959216.

Zpět


Nabídka nakladatelství:

 

Peter Wendsche, Radek Veselý et al.
Traumatologie

Traumatologie

Druhé, přepracované a rozšířené vydání

 

Jan Lebl, Zdeněk Šumník, Ondřej Souček, Hana Malcová, Klára Maratová, Jana Plešková, Štěpánka Průhová, Jan Štulík, Lukáš Wagenknecht
Onemocnění skeletu u dětí

Onemocnění skeletu u dětí

Motolské pediatrické semináře 4

 

Jiří Skála-Rosenbaum, Valér Džupa, Martin Krbec et al.
Zlomeniny proximálního femuru

Zlomeniny proximálního femuru

 

Jiří Kříž et al.
Poranění míchy

Poranění míchy

Příčiny, důsledky, organizace péče