A támogatott gyógyszerpiac adatainak feldolgozása

Hevenyészett módszertan a publikus adatok elemzéséhez

Az elemzéseim során a magyarországi támogatott gyógyszerellátás idősoros (publikus) tényadatait dolgozom fel.

Látni kell, hogy a gyógyszertárakban alapvetően kiskereskedelmi tranzakciók történnek. Ami egyedivé teszi, az az, hogy különleges információkkal ellátva, minden esetben szakmai segítséggel juthatunk gyógyszerhez, illetve az, hogy sokszor nem annyit fizetünk érte, amennyi az ára, hanem kevesebbet — ez a TB-támogatás. A patikák ezeket az összegeket megelőlegzik a betegeknek majd később visszaigénylik a társadalombiztosítástól tételes elszámolás formájában.

A gyógyszerek árához nyújtott támogatás igénylése és kezelése éves szinten többszáz milliárd forintot mozgató pénzügyi folyamat (közfinanszírozás), amelynek adatfeldolgozási háttere is részletesen szabályozott (BÉVER-elszámolás oldal a NEAK honlapján). Itt megtekinthető az eredeti adatforrás is (a patikai elszámolások rekordszerkezete), amelyből a NEAK havi rendszerességgel riportokat készít a közfinanszírozási elszámolások alapján és közzéteszi honlapján.

A havi felösszegzett tény-adatokat a NEAK (és elődje az OEP) régebb óta közöl:

A lassan húsz évadnyi (havi bontású) adathalmaz kezelhetetlen számosságú file-t jelent (2006–2024 augusztus időszakban 224 állomány), ezért volt szükséges használhatóbb állapotba hozni az adathalmazt: a havi partíciók helyett éves táblák alkalmazása ésszerűnek tűnik.

Fontos szempont még a Jupyter / Pandas illetve a Power BI könnyű elérhetőség biztosítása is. Mindehhez egy kisebb erőforrásigényű, könnyen telepíthető adatbázismotort (SQLite3) választottam.

Python / Jupyter környezetben Pandas, Numpy, PyODBC, SQLite3 és OS csomagok segítségével egy áttöltő alkalmazást fejlesztettem, amely naplózza az MS-Access file-ok olvasását és az adatbázis-írást. Az adatokat havi helyett éves partíciókba rendeztettem. A leválogatást megkönnyítik a view-k összeállítása. A logika Pandas megvalósítás. A vizualizáció többféle programot használok igény szerint:

A folyamatos feldolgozás során évek alatt egy közös adatbázist építettem SQLite segítségével (ez jelenleg több mint 24 millió rekordot tárol), amelyből szabvány SQL-lekérdezésekkel állíthatók elő a kívánt statisztikák. Előnye, hogy Google COLAB környeztettel kompatibilis ez a tárolási mód.

Árréstömeg számításoknál

A kiskereskedelmi gyógyszertári árréstömeg számításokhoz csak a gyári gyógyszer-specialitások nettó forgalmi adatait vettem alapul. A számítás alapja az (5/2007. (I. 24.) EüM rendelet a társadalombiztosítási támogatással rendelhető gyógyszerek kereskedelmi árréséről) jogszabály táblázata. Ennek alapján az egyes gyógyszerek havi fajlagos árrése, a nettó árréstömeg illetve a nettó értéken számolt árrés is, ATC-csoportosításban, megyei bontásban és országosan is.

A különféle toplisták számolásánál is csak a gyári gyógyszerek adatait veszem alapul.

A megyei forgalmi eloszlások elemzésénél a teljes forgalmat veszem alapul.

Néhány fontos tudnivaló (amolyan disclaimer)

Fontos: ezek az elemzések magánvéleményt tükröznek.