Statisztika reggelire

Én csak annak a statisztikának hiszek amit én hamisítottam... Elemzések, statisztikák laikusoknak és hozzáértőknek.

Friss topikok

Archívum

Akár 10 évente lehet 900 cm körüli árvíz Budapesten..

2013.06.13. 10:15 Shinea

Az utóbbi bő tíz évben harmadszor ért el rekordmagasságot a Duna Budapesten. A 2002-es és 2006-os csúcsmagasságot 2013-ban ismét megdöntötte a folyó. Ezt kiegészíthetjük még azzal is, hogy a képzeletbeli toplista ötödik helyén a 2010-es év található, és a 2000-es évek utáni legmagasabb vízszintek mellett csak 1965 került be a lista negyedik helyére.

 

Vajon mekkora volt annak a valószínűsége, hogy 2002 és 2006 után ismét rekord magasságú vízállás lesz a Dunán? A választ a statisztika egy speciális ága adhatja meg számunkra, amely extrémérték eloszlásokkal foglalkozik. Ha a vízállások várható értékei köré szeretnénk konfidencia intervallumot szerkeszteni, nincs nehéz dolgunk, a statisztikát tanuló egyetemisták általában már az első év után meg tudnak oldani egy ilyen feladatot. A maximumok esetén azonban kicsit nehezebb a helyzet, mivel speciális eloszlásokat kell használni, ráadásul az idősor elemzéseknek külön eszköztára van a statisztikában. A tiszai árvizek kapcsán már készült hasonló elemzés (http://www.ksh.hu/statszemle_archive/2005/2005_10-11/2005_10-11_919.pdf), ennek analógiájára mutatom be a dunai árvizek előfordulásának  valószínűségét. A budapesti adatokat a Központi Hidrológiai Adattárból gyűjtöttem le (http://www.hydroinfo.hu/vituki/archivum/), ahol Budapest vízállásáról 1876-tól minden egyes napra elérhető adat. Első lépésben minden évre kiszámítottam a budapesti vízállás maximumát. Ezt szemlélteti a következő ábra:

h0.png

Ahogy látható, az idősor kilengése viszonylag nagy. A vastag piros vonal a tíz éves mozgó átlag simított értékét mutatja: ez alapján ugyan láthatóak rövid távú trendek (például egy enyhe felfelé irányuló trend megfigyelhető az 1990-es évek után), de az idősor alapvetően a maximum átlagához próbál visszatérni. Az átlaghoz való visszatértést erősíti az is, hogy a maximumokra kiszámolt hurst exponens értéke 0,15-ös értéket vesz fel (http://en.wikipedia.org/wiki/Hurst_exponent).

 

A maximum értékekre egy speciális eloszlást lehet illeszteni, amit a szakirodalomban általánosított extrémérték eloszlásnak (GEV) neveznek. Az eloszláshoz maximum likelihood módszerrel konfidencia intervallumot is lehet szerkeszteni, aminek segítségével jól modellezhető, hogy egy adott vízállás milyen gyakorisággal fordulhat elő újra. A modell egyik előfeltétele, hogy az idősorban szereplő egymást követő elemek függetlenek legyenek, valamint az, hogy az idősor stacionárius legyen (ne legyen benne trend- és ciklushatás). Az első előfeltételt többek között egy ARIMA modellel lehet tesztelni, amely alapján nincs autoregressziv folyamat az árvizek éves maximumában, tehát az adott év legmagasabb vízállása nem függ az előző év legmagasabb vízállásától. A stacionaritásra még visszatértünk, de előbb bemutatom azt a modellt, ami abból az előfeltevésből indul ki, hogy az idősor stacioner. 

h1.png

A baloldali ábra mutatja az elméleti és az empirikus eloszlást. Jól látható, hogy a maximumok átlagához közeli értékek az elméletileg vártnál ritkábban, míg extrém nagy és extrém kicsi értékek a vártnál valamennyivel nagyobb arányban fordultak elő. Ettől függetlenül a további statisztikák azt mutatták, hogy az elméleti eloszlás jól illeszkedett a vizsgált idősorra.

A jobboldali ábra mutatja az igazi érdekességet, a visszatérési szinteket. Az y tengelyen szürke vízszintes vonallal jelöltem a 2013-as árvíz szintet, és egy vertikális vonallal azt, hogy ez hol metszi a felső konfidencia intervallumot: eszerint ilyen nagyságú árvíz 99 százalékos valószínűség mellett maximálisan 50 évente fordulhatna elő. Ha ehhez hozzátesszük, hogy 2002-ben és 2006-ban is hasonló nagyságú vízállást mértek Budapesten, akkor egyértelműen kirajzolódik az, hogy a mostani árvíznek a valószínűsége extrém alacsony volt.

 

Ahogy korábban is utaltunk rá, egy enyhe emelkedő trend hatás figyelhető meg a vízállások maximumában. Ha az adatokra egy egyszerű lineáris trendvonalat illesztünk, akkor éves szinten megközelítőleg 0,8 centiméteres növekedés figyelhető meg az adatsorban. Ezt a trendet a modellből levonva újra elemeztem az idősort.

h2.png

A jobboldali ábráról látható, hogy a trendet levonva a 2013-as árvíz már nem is a legmagasabb, és a visszatérés nagyjából 25 éves periódusra esett vissza, ami jóval kisebb, mint az elsőként számított 50 év, azonban továbbra sem oldja fel azt a problémát, hogy az utóbbi bő 10 évből 4 évben extrém magas volt a vízállás.

 

A megoldás kulcsa ilyen esetben abban keresendő, hogy a vízállási maximumok mögött lévő idősor generáló-mechanizmusa megváltozott. Hogy ennek a globális felmelegedés az oka, vagy a folyók szabályozásának megváltozása, esetleg bármi más, nem témája ennek az elemzésnek.

Ha az 1990 utáni adatokra illesztjük az elméleti eloszlást, akkor látható, hogy az extrém magas árvizek bekövetkezésének valószínűsége jelentős megnő.

h3.png

A mostani árvíz vízszintje esetében a visszatérési idő felső konfidencia intervalluma 8 év, ami azt jelenti, hogy akár 8 évenként is előfordulhat a mostanihoz hasonló nagyságú árvíz, és 10 évente akár 900 centiméteres árvízre is számíthatunk.

Az erre kijelölt szervek helyében én már most elkezdenék gondolkodni a jövőbeni védekezésen...

 

Az elemzést az R statisztikai programcsomag evd csomagját használtam. 

Kmetty Zoltán

16 komment

Címkék: statisztika árvíz Duna extrém érték eloszlás

A bejegyzés trackback címe:

https://magyarstat.blog.hu/api/trackback/id/tr645358564

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

légügyi megfigyelő 2013.06.14. 04:14:51

Talán olvassák döntéshozók is. Nem kellene elküldeni néhány döntnök rézére ezt a kis írást?

DarthVader 2013.06.14. 07:48:02

@légügyi megfigyelő: ne marháskodj, ez szakmai megközelítés, a lőtéri kutyát nem érdekli. (És a "harc" szó ráadásul semmilyen kontextusban nem hangzik el benne!)

kristoof 2013.06.14. 07:54:48

De jó, hogy a sok idióta marha barom miatt nem építettük meg a Bős-Nagymarost! Gondolom aki kint volt a tüntetéseken az nem a Duna felső szakaszán lakik! Ilyen egy idióta barom országot még nem látott a világ... :-(

pucros 2013.06.14. 08:11:17

Hogyha ez az okfejtés nem csak játék, hanem hasznosnak is tekinti a szerző, akkor nincs-e emögött az a feltevés, hogy a valóság mindenestül belefér a modellünkbe?

Ha attól lesz az extrém érték, hogy ugyanazon mechanizmusok működnek, mint máskor (mint korábban) is, csak sokkal inkább "összejönnek a dolgok", akkor rendben van és a módszer használható.

De ha ilyenkor a teljes rendszerre nézve külső hatások érvényesülnek - néha ilyen, néha olyan, de minden extrém érték esetében másik, egyedi mechanizmuson át -, akkor erről nem tud semmit sem mondani egy tisztán "technikai elemzés".

Ezt végiggondolja ilyenkor valaki? Gyakran szokás elkövetni azt a hibát, hogy a modell és a valóság közé egyenlőségjelet teszünk, pedig reálisan minden rendszerhez képest van külvilág, "és akkor jött a csősz és elzavart mindenkit".

Link elek 2013.06.14. 08:16:02

@légügyi megfigyelő:
Ha jok a gatak, akkor nem kellenek "hős" politikusok, akik megmentik az orszagot.

Szandekosan szarnak a hosszutavu tervezesre.
Ha ez neked nem tetszik, akkro vandorolj ki Hollandiaba, ott vannak 100+ éves (ár)vizi tervek is.
Raadasul nem csak papiron, hanem megvalositva is.

qbr 2013.06.14. 08:54:13

@Shinea

Ha jól látom, ez az első poszt ezen a blogon.
Tetszik a koncepció, hajrá!

Shinea 2013.06.14. 10:54:47

@pucros: Jó a logika, a modell ebben az esetben abból indul ki, hogy egy generáló folyamat van az adatsor mögött (bár az lehet nagyon bonyolult is), ha ennél több van, azt már nehéz szétszálazni...

Shinea 2013.06.14. 10:56:22

@qbr: Köszi, a következő valószínűleg az öngyilkossági statisztikákról fog szólni..

Konfidencia_Kapitany 2013.06.14. 16:47:50

mennyi a valószínűsége, hogy véletlenül ugyanaz a blog jelmondata mint az enyém? :)))

statistics.blog.hu/

amúgy tetszik az elemzés, sok ilyet még.
(én is hasonló dolgokat szerettem volna kielemezgetni, de csak két posztig jutottam, de sebaj...)

LPista 2013.06.14. 18:14:59

@pucros: 1. A bemutatott idősor a negyvenes évek elejétől statisztikailag homogén. Ha ilyen van, az árvízhidrológiában előnyt szoktunk adni neki a rövidebb (bizonytalanabb) idősorokkal szemben.
2."A maximum értékekre egy speciális eloszlást lehet illeszteni". Többféle eloszlás is illeszthető (elvileg is). A vízügyben alapvető módszert Szigyártó Zoltán dolgozta ki annakidején.
3. Az utóbbi 10-20 évben nem tudok olyan folyószabályozási beavatkozásokról, amelyek az idősort érdemben befolyásolták volna. Az éghajlatváltozás hatását többen elkezdték vizsgálni, a részleteket nem ismerem.
Egy régi árvízhidrológus.

Patek Fülöp 2013.06.14. 21:38:35

Kedves Blogszerző!

Ki tudnád számolni a Mértékadó Árvízszint definíciója szerinti "100 évenkénti 1% -os valószínűségű árvízhullám" méretét Budapesten, a friss adatok beillesztésével, illetve az új modell alapján?

A régi statisztikai adatok szerinti hatályos vízügyi rendelet szerint ez jelenleg 850cm...

Nagyon kíváncsi lennék, mekkora a valós szám..

Köszönöm!

Shinea 2013.06.17. 16:41:48

@Konfidencia_Kapitany:
Statisztikai blognál, volt ennek esélye:)
Ha esetleg írnál ebbe a blogba valamit azt szívesen venném, szeretnék sok vendég szerzőt, hogy legyen minél folyamatosabb tartalom..

Shinea 2013.06.17. 16:45:58

@LPista:
1. Valóban homogénnek tűnik, de ha 1940-től egybe kezelem, akkor az utóbbi 10 év 3-4 vízállásának extrém alacsony lesz a valószínűsége.

2. Igen, ez teljesen jogos, több megközelítés is létezik, az általam használt GEV-nek is van több speciális eloszlása, de lehet Pareto eloszlásokat is alkalmazni például, de akkor picit más adatsorokat szoktak használni.

3.Jeleztem is az írásban, hogy ehhez nem nagyon értek. De itt arra gondoltam, hogy esetleg a külföldi országokban történő szabályozás hatása csapódik át Magyarországra..

Shinea 2013.06.17. 16:50:25

@Patek Fülöp:
Sajnos azt ezekből az adatokból nem lehet kiszámolni, annál jóval több adatra van szükség..

Ezen modell szerint ha a teljes idősort nézzük, akkor kb 900 cm-nél van, ha csak az utolsó 20 évet, akkor pedig még pár méterrel felmehet, de ott már nagyon széles a modell konfidencia intervalluma..

peregrinus@index.hu 2013.06.21. 14:09:13

Nagyon tetszik. Továbbfejlesztésre azt javaslom, hogy a vízhozam értékek idősorát is nézd meg. Nem ellenőriztem, de azt olvastam, hogy a mostani árvíz vízhozama valójában nem is volt nagyobb pl. a 2006-osnál. Ha így lenne (és ebben valamilyen tendenciát is lehetne találni), akkor mindjárt lenne oka az eltérésnek. Na megnéztem is nincs róla adat a hydroinfon. Pedig érdekes lenne összevetni.

Shinea 2013.06.21. 15:15:45

@peregrinus@index.hu: Igen, ezt is nagyon jó lenne megnézni, a hivatkozott írásban Zempéniék ezt is megnézték a Tiszánál, és ott az volt a tanulság, hogy a vízhozam nem vett fel extrém értékeket. Sajnos adatokat én se találtam ehhez...
süti beállítások módosítása