Lineáris kevert modellalkotás
I. Modellalkotás célja
Gyógyszerpiaci folyamatok leírása statisztikai alapokon nyugvó
modellalkotás segítségével. Megfelelő magyarázó változók
bevonásával írja le a modell a magyarázandó változót, ami
esetünkben egy adott készítmény dobozforgalma. A modell időbeli
folyamatot is figyelembe vesz, azaz periodikusan ismétlődően ad
becslést a magyarázandó változóra.
Modellünk kísérletet tesz arra, hogy időbeli elorejelzés
formájában becslést adjon a dobozforgalom alakulására.
II. Modellalkotás során használt változók
1. Magyarázandó változónk az egyes készítmények
kiszerelésenkénti dobozforgalma, pontosabban a normatív
támogatottságú piacon szereplő gyógyszerek dobozforgalma.
2. Magyarázó változóink, melyek készítményenkénti információval
rendelkeznek:
1. Fogyasztói ár
2. Térítési díj
3. Adott kiszerelés mellett az átlagos terápia hossza
napokban kifejezve (DOT)
4. Hány éve van forgalomban
3. A csoportosító változónk az ATC kategóriák első három jelét
figyelembe vevo ATC3-as besorolás alapján képződik.
4. Az időbeliséget megtestesítő változóink:
1. A kutatásba bevont 8 negyedévet hivatott jelölni. A jövőbeli
előrejelzés miatt még egy negyedévet felveszünk. (felvehető
értékek: 1, 2, 3, 4, 5, 6, 7, 8, 9)
2. Az első 4 negyedévet, azaz 2004-et jelzik (felvehető
értékek: 1, 2, 3, 4, 0, 0, 0, 0)
3. A második 4 negyedévet (2005) jelöli, plusz még egy érték
az előrejelzéshez: 2006 első negyedév. (felvehető értékek: 0, 0, 0,
0, 1, 2, 3, 4, 5)
III. Változók mérési szintjei
A kutatásba bevont változók a nominális vagy az arányskála
mérési szint valamelyikének felelnek meg.
1. Nominális mérési szintű változó:
Az ATC3-as besorolás. Ebben az esetben nem tudjuk sorbarakni
az egyes kategóriákhoz tartozó értékeket, tehát például az A05
nincs relációban a G03 csoporttal.
2. Arányskála mérési szintű változók:
Ennek a kritériumnak szinte mindegyik változónk eleget tesz.
Sorba tudjuk rendezni a gyógyszereket például fogyasztói áruk
szerint, továbbá ha az egyiknek az ára kétszer akkora mint a
másiknak, akkor azt mondhatjuk, hogy az kétszer olyan drága a
fogyasztói ár tekintetében. Tehát arányosan viszonyulnak egymáshoz
az értékek.
A fentieknek csak az időbeliséget kifejező segédváltozók
tesznek részlegesen eleget. Ugyanis ezeknek a változóknak az a
szerepük, hogy külön-külön jelezzék a két év alatt az idő
múlását.
IV. A modell leírása
A modell felépítését három részre tudjuk bontani: fix hatások,
random hatás, időbeli hatás.
1. Fix hatások
A fix hatások közé besorolt magyarázó változók különböző
arányban járulnak hozzá a magyarázandó változó megbecsléséhez.
Feladatunk az volt, hogy találjunk olyan ismérveket, melyek
hatásukkal szignifikánsan le tudják írni a dobozforgalmak
alakulását.
1. A fogyasztói ár hatásának tekintetében feltevésünk a
következő volt: minél magasabb egy gyógyszer fogyaszói ára, annál
kisebb a dobozforgalma. Tehát itt arról van szó, hogy nem vesszük
figyelembe azt, hogy kap-e támogatást egy adott készítmény, vagy
nem, illetve ha kap, akkor ez milyen mértékű.
2. Térítési díj hatásával kapcsolatban a fentiekkel
megegyező volt vélekedésünk: minél magasabb egy készítmény térítési
díja, annál kevesebb fogy belole. Ebben az esetben azt modjuk, hogy
vagy azért fogy jobban egy adott gyógyszer, mert eleve alacsony a
fogyasztói ára, vagy azért, mert magas támogatásban részesül.
3. Terápiás napok száma adott kiszerelés mellett (DOT)
változó tekintetében azt tételeztük fel, hogy minél nagyobb egy
készítmény kiszerelése, annál kevesebb fogy belőle.
4. A forgalmazás kezdete óta eltelt évek hatásával
kapcsolatos feltevésünk a következő volt: minél régebben van egy
gyógyszer a piacon, annál nagyobb a forgalma.
5. Fix hatásnak választottuk be az időt kifejező
segédváltozókat is. A vizsgált 8 negyedév alatt emelkedő forgalmi
tendenciát tételeztünk fel, de a lineáris trendet árnyalhatjuk, ha
azt feltételezzük, hogy a két évet (20004 és 2005) két különböző
iránytangensű, azaz meredekségű egyenes írja le. Tehát feltevésünk
az volt, hogy különbözik a két év dobozforgalmi növekmény
tekintetében.
2. Random hatás
Random hatás alatt azt értjük, hogy nem egy az egyben bír
jelentősséggel az ATC3 besorolás. Természetesen mondhatjuk azt,
hogy ez nincs így, mert valamely ATC3-as csoportok sokkal nagyobb
forgalommal rendelkeznek, mint más ATC3-as csoportok. De ezt a
szabályt csak bizonyos csoportok esetekben tudnánk alkalmazni.
Ezért azt mondjuk, hogy valamilyen struktúrált véletlen hatással
bír azt ATC3-as beosztás.
3. Időbeli hatás
Azt tételeztük fel, hogy a megfigyelési egységeink között,
azaz az egyes készítményekhez tartozó ismérvek között nincs
függetlenség. Tehát nem független egymástól az, hogy egy adott
készítménybol hány dobozzal fogyott az adott negyedévben és hány az
azt megelőző negyedévben. Feltevésünket természetesen ettől
konkrétabban is megfogalmaztuk: valamilyen mértékű autoregresszív
folyamat lesz megfigyelhető az egyes negyedévek között.
(Autoregresszivitás: a t-edik idopontbani megfigyelésünkre
hatással van a (t-1)-dik idopontban megfigyelt érték. Pontosabban
ezt elso rendu autoregresszív hatásnak hívjuk, mivel csak egy
időben korábbi megfigyelést vesz figyelembe.)
V. A modellt leíró eredmények ismertetése
1. Kutatásba bevont változók eloszlásainak elemzése
A kutatásba bevont változók eloszlásának elemzése után hamar
kiderült, hogy a normális eloszlás feltételeit nem teljesítik. Nem
is csoda, hiszen készítmények árával kapcsolatosak adataink,
valamint az áraktól egyáltalán nem független forgalmi eredményeket
akarjuk magyarázni.
Modellünk kizárólag a megfigyelt lineáris kapcsolatokra
érzékeny. Adataink egy részének eloszlása szignifikánsan eltér a
normáis eloszlástól, pontosabban közel exponenciális eloszlást
mutat.
Az alábbi változók esetében a természetes alapú logaritmus
tarnszformációját alkalmaztuk:
1. Dobozforgalom
2. Fogyasztói ár
3. Térítési díj
4. Terápiás napok száma (DOT)
Az elemzési eljárás során a modellben két féle leírást
használunk a dobozforgalom és a magyarázó változók közötti
kapcsolat leírására:
- loglog vagy loglineáris kapcsolatok (dobozforgalom
logaritmusa és fogyasztói ár logaritmusa);
- loglin kapcsoaltok (dobozforgalom logaritmusa és a piacon
eltöltött évek száma).
ln(Y)=ln(const)+b1*ln(X1)+b2*ln(X2)+...+b5*X5+b6*X6
2. Fix hatások a modellben
1. Konstans hatás: lineáris egyenletünk tartalmaz egy olyan
értéket, mely nem függ közvetlenül változóinktól. Ennek értéke
14.665 lett logaritmikus skálán mérve.
2. Fogyasztói ár logaritmusának hatása: negatív hatással van
a dobozforgalom alakulására. Az együttható értéke -0.384 lett.
3. Térítási díj logaritmusának hatása: negatív hatással van
magyarázandó változónkra. Az együttható értéke -0.465 lett, tehát
erősebb hatással van a dobozforgalomra, mint a fogyasztói ár.
4. Terápiás napok számának hatása logaritmikus skálán:
szintén negatív kapcsolatban áll a dobozforgalommal. Az együttható
értéke -0.399 lett.
5. A piacon töltött idő hatása (lineáris skálát használva):
pozitív hatása van a dobozforgalomra. Az együttható értéke 0.018.
6. A 2004-es év lineárisan emelkedő tendenciát jelző
segédváltozó hatása: pozitív hatást gyakorol a forgalomra, értéke
0.018 lett.
7. A 2005-ös év lineárisan emelkedő tendenciát jelző
segédváltozó hatása: pozitív hatással van a dobozforgalom
alakulására. Értéke 0.041 lett. Tehát a 2005-ös esztendőben erősebb
volt a forgalom növekménye, mint 2004-ben.
Az összes fix hatás tekintetében elmondhatjuk, hogy 5%-os
hibahatár mellett statisztikailag szignifikánsnak tekinthetjük a
kapcsolatokat.
3. Random hatás a modellben
A random hatás struktúrájának az egyforma szórású kovariancia
struktúrát választottuk. Ez azt mondja, hogy az egyes ATC3-as
kategóriákban a szórások megegyeznek, továbbá hogy nincs korreláció
a kategóriák között.
Az ATC3-as besorolás strukturált random hatása a modellben 5%-os
hibahatár mellett statisztikai szignifikanciát mutatott.
4. Időbeli hatás
A gyógyszerek között autoregresszív folyamatot feltételeztünk. A
modellalkotás során ennek helyessége igazolódott. Ezek után emeltük
az időbeli kapcsolat erősségére vonatkozó modell erosségét, azaz
több feltételnek kellett eleget tennie ahhoz, hogy illeszkedjenek
adataink a modellhez.
Tehát az AR(1) kapcsolatot felcseréltük az ARMA(1,1)
kapcsolatra. Ez azt jelenti, hogy az elsőrendű autoregresszív
kapcsolat mellett a mozgóátlag feltételét is bevettük a modellbe.
Az autoregresszív paraméter értéke (rho) 0.745 lett, a mozgóátlagé
(phi) pedig 0.817. Mindkét paraméter erős hatással bír az időben
egymást követő adatokra.
Az adatok ismételt megfigyelésének ARMA(1,1) hatása a modellben
5%-os hibahatár mellett statisztikai szignifikanciát mutatott.
VI. Nézzünk egy példát a dobozforgalom becslésére
A dobozforgalmat magyarázó változóinkon keresztül fogjuk
megbecsülni, illetve az időben megfigyelt változásokra hagyatkozva
egy negyedévet előre mutatva predikciót teszünk függő
változónkra.
Az alábbi készítményeket választottuk ki a módszer bemutatására,
és az eredmények ismertetésére:
Konakion MM paediatric 2 mg injekció(210016851)ATC3=B02
Atenolol comp. Pharmavit filmtabletta(210002682)ATC3=C07
Rivotril 2 mg tabletta(210029862)ATC3=N03
Convulex 300 mg kapszula(210006602)ATC3=N03
Mint fentebb már láttuk, a modell három fő részből áll: fix
hatások, random hatás, időbeli hatás. A fix hatásokra fel tudjuk
írni az egyenletet. Függő változónk, azaz a dobozforgalom
természetes alapú logaritmusára adtunk becslést. Magyarázó
változóink esetében ez a transzformáció nem minden esetben került
alkalmazásra.
Minden magyarázó változóhoz kaptunk egy szorzó tényezőt,
ezek segítségével fogjuk megadni a dobozforgalom megbecsléséhez az
egyenlet tagjait.
Diagram formájában megtekinthetjük az eredményeket mind a
négy készítmény esetében. A következő számpéldában viszont csak az
Atenolol comp. Pharmavit filmtablettán keresztül mutatjuk be a
becslést, a 2005. év 4 negyedéves adatain keresztül.
1. Legyen az első a konstans hatás: értéke 14.665. Ez önmagában
egy tagja az egyeneltnek.
2. Fogyasztói ár. Minél magasabb egy készítmény fogasztói
ára, nagy valószínűséggel annál alacsonyabb lesz dobozforgalma. A
készítmény fogyasztói ára a 2004-es év második negyedévétől
eltekintve 708 Forint volt. A modellbe a változó logaritmusa került
be, melynek értéke 6.56. A fogyasztói ár hatása: -0.384. Becslésünk
e két szám szorzata: -0.384*6.56=-2.519.
3. Térítési díj. Itt is a logaritmikus transzformációt
alkalmaztuk. A térítési díj 61 és 71 Forint között mozgott, a
vizsgált negyedévben 71 Forint volt. Ennek az értéknek a
logaritmusa 4.27. Mint láttuk, a térítési díj is negatív hatással
van a dobozforgalomra, a szorzó értéke: -0.465. A két szám szorzata
pedig: -1.985.
4. Terápiás napok száma. Természetes alapú logaritmussal
számoltunk itt is. Ez az érték nem változik, értéke 27, melynek
logaritmusa: 3.28. A hatás itt is negatív: -0.399. Szorzatunk pedig
a következo: -1.309.
5. Piacon töltött idő. Itt nem volt traszformáció. Az adott
kiszerelés, illetve TTT kód mellett a készítmény 14 éve van a
piacon. A pozitív hatás erősségét mutató szorzó értéke: 0.018. A
két szám szorzata: 0.252.
6. A 2004. év hatása. Nincs hatással eredményünkre, hiszen a
segédváltozó értéke nulla.
7. A 2004. év hatása. Nagy általánosságban lineáris
tendenciát is feltételeztünk. A segédváltozó értéke 4. A pozitív
hatást mutató együttható értéke pedig: 0.041. Így a szorzat:
0.164.
A fix hatások által meghatározott becslésünk a dobozforgalom
logaritmusára az imént meghatározott 7 számnak az összege, tehát
ln(dobozforgalom)=14.665-2.519-1.985-1.309+0.252+0+0.164=9.268.
Az exponenciális transzformáció segítségével megkaphatjuk a
dobozforgalom fix hatások által becsült értékét: 10594.
A random hatás, illetve az idobeli változás kifejező ARMA(1,1)
kapcsolat a fix hatások által kialakított értéket fogja tovább
árnyalni. A három hatás eredménye adaja meg a becslést, melynek
értéke 9,3523 lett logaritmikus skálán mérve. Nominálisan a
dobozforgalom 11525 lett. A ténylegesen mért forgalom pedig 11088
doboz volt.
Becslésünk természetesen tartalmaz hibát, ami ebben a példában
437 doboz. De azt ne feledjük el, hogy a modell a normatív
támogatású készítmények összességét leírja. Így számolnunk kell
bizonyos valószínuséggel téves becslésekkel is, annak ellenére is,
hogy a modellalkotás során a fő cél az volt a ezen reziduális
értékeket minimalizáljuk.