PTU - Polskie Towarzystwo Urologiczne

POSZUKIWANIE ISTOTNYCH ATRYBUTÓW W ANALIZIE DOŚWIADCZEŃ NAD LECZENIEM KAMICY MOCZOWEJ ZA POMOCĄ ESWL
Artykuł opublikowany w Urologii Polskiej 1997/50/3.

autorzy

Andrzej Antczak, Zbigniew Kwias, Wojciech Sawicki 1, Krzysztof Słowiński 2, Jerzy Stefanowski 3
1 Katedra i Klinika Urologii Akademii Medycznej
im. K. Marcinkowskiego w Poznaniu
Kierownik Kliniki: prof. dr hab. med. Zbigniew Kwias
2 Klinika Chirurgii Urazowej Akademii Medycznej
im. K. Marcinkowskiego w Poznaniu
Kierownik Kliniki: prof. dr hab. med. Krzysztof Słowiński
3 Instytut Informatyki Politechniki Poznańskiej
Kierownik Instytutu: prof. dr hab. Roman Słowiński

słowa kluczowe

układ moczowy kamica moczowa ESWL metoda zbiorów przybliżonych

streszczenie

Wstęp. W Klinice Urologii AM w Poznaniu zabiegi ESWL w leczeniu kamicy
układu moczowego wykonuje się od 1990 roku za pomocą aparatu Dornier
MPL-9000 u około 1000 pacjentów rocznie. W kwalifikowaniu chorych do za-
biegu bierzemy pod uwagę dużą liczbę danych (dalej zwanych atrybutami)
pochodzących z wywiadu, testów laboratoryjnych i badań radiologicznych.
Material i metoda. Z lat 1993-1995 wybrano losowo 500 pacjentów i za po-
mocą metody zbiorów przybliżonych analizowano dane o nich. Celem pracy
było określenie istotnych atrybutów opisujących chorych z kamicą moczową i
mających wpływ na wskazania do tego zabiegu oraz końcowy efekt leczenia.
Wnioski. Wyniki naszego doświadczenia z leczeniem kamicy układu mo-
czowego i ich weryfikacja metodą zbiorów przybliżonych mogą być wykorzy-
stane do budowy bazy wiedzy dla komputerowego systemu doradczego.
Badając nowego pacjenta z kamicą, system brałby pod uwagę najbardziej
istotne atrybuty z punktu widzenia ich najbliższej zależności przyczynowo-
skutkowej z efektami leczenia ESWL.

Jedną z cech człowieka jest to, że podejmuje decyzje na podstawie

doświadczenia. Każdy z nas zbiera je w trakcie całego swojego życia i jest ono nie tylko związane ze sprawami codziennymi, ale także z wyko- nywaną pracą zawodową. Niestety, zasoby wiedzy z poszczególnych dziedzin stają się tak obszerne, że niemożliwe jest ich objęcie i zrozumie- nie oraz przetworzenie przez człowieka. Tutaj pomóc mogą komputery wyposażone w specjalne oprogramowanie wspomagające analizę danych.


Dziedzinami informatyki zajmującymi się tą problematyką są: uczenie ma- szynowe, odkrywanie wiedzy czy też systemy eksperckie. Doświadczenie lekarza w zakresie diagnostyki lub sposobu leczenia choroby zapisywane jest w postaci dokumentacji zwanej systemem in- formacyjnym. Jest to opis poszczególnych przypadków (obiektów) w kategoriach określonych cech (atrybutów). Są to cechy, które odpowia- dają danym z wywiadu chorobowego, wynikom badań klinicznych i analiz laboratoryjnych, a z drugiej strony jest to diagnoza lub wynik badań po- lub w trakcie leczenia. Ta druga grupa cech dzieli przypadki na skończoną liczbę klas.


Obecnie, oprócz metod czysto statystycznych, coraz częściej korzysta się z podejść wywodzących się z dziedziny sztucznej inteligencji. W przy- padku podejścia do nowego problemu, lekarz dobiera atrybuty opisują- ce (warunkowe) i charakteryzujące stan pacjenta (klasyfikujące). W związ- ku z tym jednym z podstawowych zadań jest zbadanie znaczenia atry- butów i rozpatrzenie możliwości zrezygnowania z mało aznaczących. Naturalne jest wtedy pytanie o zależności przyczynowo-skutkowe między pierwszą grupą cech a klasą, do której należy na podstawie dru- giej grupy cech. Dotychczas do poszukiwania tego typu zależności sto- sowano metody statystyczne, w szczególności metody analizy dyskry- minacyjnej. Metody te zakładają jednak, że cechy mają charakter ilościo- wy i że dane przynajmniej częściowo podlegają wpływom przypadko- wym, które należy uśrednić.


W praktyce klinicznej duża liczba cech ma jednak charakter jakościo- wy, a ponadto wiele cech ilościowych nie jest interpretowanych przez lekarza w kategoriach dokładnych liczb, lecz w kategoriach jakościo- wych, np. duża, średnia, mała. System informacyjny reprezentujący wie- dzę medyczną wynikającą z doświadczenia nie zawsze zawiera liczbę przypadków o tyle dużą, by testy badające znaczenie poszczególnych cech były wiarygodne, a ponadto rozkład liczby przypadków w klasach zwykle nie jest równomierny. Mimo to szukanie zależności przyczyno- wo-skutkowej ma wtedy sens, gdy analizuje się fakty, a nie obrazy uśred- nione lub obciążone przekształceniami, które nie są dla nich neutralne.


W tych sytuacjach okazało się, że odpowiednie narzędzie analizy stwa- rza teoria zbiorów przybliżonych, zaproponowana przez prof. Zdzisła- wa Pawlaka na początku lat osiemdziesiątych. Podstawą tej teorii jest obserwacja, że jeżeli nie dysponujemy dokładnymi informacjami o ana- lizowanych obiektach, to nie można ich precyzyjnie rozróżnić. Niedo- kładność informacji powoduje nierozróżnialność obiektów, dlatego wpro- wadzono relację nierozróżnialności, która pozwala na określenie na zbio- rze obiektów dwóch podstawowych operacji: górnego i dolnego przy- bliżenia zbiorów. Mając już dane obu przybliżeń zbiorów można wyli- czyć dokładność i jakość przybliżenia i klasyfikacji oraz rozważać zna- czenie atrybutów i ich ewentualną redukcję [2].


Stosując to podejście można rozwiązać dwa główne problemy analizy systemu informacyjnego: zredukować nadmiarowe atrybuty w celu otrzymania minimalnego zbioru istotnych atrybutów występujących w zależnościach przyczynowo-skutkowych (regułach decyzyjnych) oraz przedstawić system informacyjny jako tablicę decyzyjną i wyprowadzić zeń reguły decyzyjne będące zapisem faktycznych zależności między stanem obiektu opisanym za pomocą istotnych atrybutów a przynależ- nością do danej klasy [3, 5].


Praca jest podsumowaniem własnych doświadczeń z zastosowaniem teorii zbiorów przybliżonych do analizy danych z leczenia kamicy ukła- du moczowego za pomocą ESWL.


Od 1990 roku w Klinice Urologii Akademii Medycznej im. Karola Mar- cinkowskiego w Poznaniu leczonych jest około 1000 pacjentów rocznie z kamicą moczową, u których wykonywany jest zabieg ESWL za pomocą aparatu MPL-9000 firmy Dornier. W kwalifikowaniu pacjentów do za- biegu ESWL brano pod uwagę dużą liczbę informacji pochodzących za- równo z wywiadu, wyników testów laboratoryjnych oraz badań radio- logicznych (Rtg, USG). Poszczególne dane o pacjencie (nazywane dalej atrybutami) mają różne znaczenie dla prognozowania efektów leczenia metodą ESWL. Celem niniejszej pracy jest analiza zapisu doświadczenia w zakresie wyselekcjonowania atrybutów o największym znaczeniu pro- gnostycznym [1].


Zbiór danych oparty jest na analizie 500 losowo wybranych chorych opisanych za pomocą 26 atrybutów przedoperacyjnych oraz dwóch kla- syfikacji opisujących stan chorych po zabiegu.


Każdy chory z kamicą układu moczowego przyjmowany do Kliniki miał zakładaną ankietę, która zawiera dane (atrybuty) opisujące cho- rych (tabela I).


Dążono do określenia zależności przyczynowo-skutkowej między dany- mi opisującymi chorych z kamicą a klasyfikacjami podanymi w tabeli II. W pierwszej kolejności, dane opisujące chorych przedstawiono jako dwa systemy informacyjne. Każdy z dwóch systemów informacyjnych podda- no analizie za pomocą systemu komputerowego RoughDAS w celu uzy- skania najmniejszego zbioru atrybutów, które są w najbliższej zależności przyczynowej z klasyfikacją.


Spośród dwudziestu sześciu atrybutów opisujących chorych przed zabiegiem ESWL tylko trzy (al-wiek, a8-ESWL i a26-wielkość) przyjmu- ją wartości rzeczywiste, a są to atrybuty ilościowe. Pozostałe są atrybu- tami jakościowymi.


Przedziały wartości atrybutów ilościowych, jak i określenia kliniczne atrybutów jakościowych, opisane są następnie kodem liczbowym two- rzącym nową dziedzinę atrybutu [3, 5].


W wyniku procesu redukcji uzyskano zbiory istotnych atrybutów, które są w najbliższej zależności z przyjętymi klasyfikacjami. Proces ten prze- biega etapowo, od określenia rdzenia systemu informacyjnego, przez ustalenie reduktów do uzyskania zbioru atrybutów istotnych. Rdzeniem w teorii zbiorów przybliżonych jest zbiór atrybutów, które są częścią wspólną wszystkich reduktów. Reduktorem jest taki podzbiór atrybutów, którego jakość klasyfikacji jest równa jakości całego zbioru atrybutów, czyli jest to zbiór minimalny. We wczesnych fazach analizy naszych danych szybko okazało się, że proces szukania wszystkich re- duktów nie ma sensu ze względu na zbyt długi czas obliczeń. Zastoso- wano więc proces ?ręcznego” dodawania kolejnych atrybutów do rdze- nia. Celem było uzyskanie zbioru atrybutów o jakości klasyfikacji zbli- żonej do jakości całego zbioru atrybutów.


Dla klasyfikacji pierwszej (przebieg po zabiegu) uzyskano następują- cy rdzeń zbiorów atrybutów istotnych: a9 ?bóle okolicy lędźwiowej, a22 ?stan układu odprowadzającego mocz, a24-lokalizacja złogu. Po włączeniu operacji dodawania do rdzenia zbiór atrybutów istot- nych tworzący redukt o najsilniejszym wpływie na klasyfikację w kolej- ności przyłączania przedstawia się następująco: a6 ? przebyte operacje, al6 ? krystaluria, al ? wiek, a26 ? wielkość zło- gu, all ? objawy dyzuryczne.


Dla klasyfikacji drugiej (skuteczność leczenia) rdzeń stanowią: al-wiek, a9 ? bóle okolicy lędźwiowej, al6 ? krystaluria, a22 ? stan układu odpro- wadzającego mocz, a24 ? lokalizacja złogu.


Stosując dodawanie do rdzenia w celu uzyskania minimalnego zbioru istotnych atrybutów reduktu (w kolejności dodawania) następujące ce- chy miały najsilniejszy wpływ na klasyfikację: all ?objawy dyzuryczne, a6 ?przebyte operacje, a26 ?wielkość zło- gu, a25 ? złóg kielichowy.


Tak uzyskano redukt dla klasyfikacji pierwszej: al, a6, a9, all, al6, a22, a24, a26, i dla klasyfikacji drugiej: al, a6, a9, all, al6, a22, a24, a25, a26.


WNIOSKI


Uzyskane redukty posłużyły jako zbiór atrybutów warunkowych do utworzenia reguł decyzyjnych mających stworzyć komputerowy system doradczy. Podział chorych na grupy wg. przyjętej klasyfikacji z uwzględ- nieniem atrybutów istotnych pozwoli lepiej zaplanować zabiegi ESWL.

piśmiennictwo

  1. [1] Kwias, Z. i inni: Clinical experiences in treatment of urinary tract's stones
  2. using Dornier MPL 9000 lithotriptor. Nowiny Lekarskie, 2,15-24.
  3. [2] Michalski, R. S., Cabonell, J. G., Mitchell, T. M (ed.): Machinę Lear-
  4. ning. An Artificial Intelligence Approach Morgan Kaufman, str. 83-134.
  5. [3] Pawlak, Z.: Rough Sets. Theoretical Aspects of Reasoning About Data. Kluwer
  6. Academic Publishers. Dordrecht, 1991.
  7. [4] Słowiński, K., Stefanowski, }., Antczak, A., Kwias, Z.: Rough set appro-
  8. ach to the verifications of indications for treatment of urinary stones by ESWL.
  9. Soft Computing 1995 Simulation Councils, Inc. ,str. 93-95.
  10. [5] Słowiński, K.: Wykorzystanie teorii zbiorów przybliżonych do analizy leczenia
  11. wrzodu dwunastnicy wysoce wybiórczą wagotomią i ostrego zapalenia trzustki
  12. płukaniem otrzewnej. Akademia Medyczna im. Karola Marcinkowskiego w
  13. Poznaniu, 1990 r.
  14. [6] Stefanowski, ]., Słowiński, K., Antczak, A., Kwias, Z.: Verification of
  15. conclusions from the Rough Set analysis of the experience with ESWL for treatment
  16. of urinary stones. Warsaw University of Technology, Resaerch Report, 45/95.
  17. [7] Stefanowski, J., Słowiński, K.: Rough sets as a tool for studying attribute
  18. dependecies in the in the urinary stones treatment data set. Warsaw University
  19. of Technology, Resaerch Report, 14/96.