Szerelemgyerek
Ma egy villámposztnak indult, de annál egy picit bővebbre sikerült irományt kaptok alapjában véve a taktika és a statisztika találkozásáról. Coutinho kapcsán akartam a taktikai feladatok statisztikai kimutathatóságáról egy rövidke posztot írni – nála gyönyörű és nagy különbségek vannak -, amely viszont aztán kibővült Hendó és Gerrard teljesítményével is.
Az általunk legsűrűbben használt két taktikai formáció – a 4-2-3-1 és a 4-1-2-3 -működésének különbözőségéről és a alapjában véve a 2-1 illetve 1-2 középpályás háromszögek különbözőségéről már volt szó. Legrészletesebben itt, ahol le is írtam a különböző középpályás szerepeket/feladatokat (most külön nem fogom újra megtenni), így most csak azt említeném meg, hogy egészen máshogy hívjuk a két rendszerben betöltött szerepeket. Alapesetben a 2-1-es középpályán van a duplaszűrő (double pivot) benne a DM-ek vagy a deeplying midfielderek (mélységi irányítók) meg előttük az AM/tkp, míg 1-2 esetén van a DM/controller és előtte a CM-ek b2b szerepben. Most ehhez nyúlok vissza és statisztikával támogatom meg.
Még mielőtt konkrétan néznénk meg a játékosokon a példákat, jöjjön egy gyors statisztikai alapozás. Minden statisztika annál megbízhatóbb, minél nagyobb az elemszáma. Esetünkben ez azért fontos, mert az ellenfelek erőssége nem mindegy, ahogy az adott napi forma sem – ezeket az eltéréseket pedig statisztikailag nem lehet súlyozni. Főleg nem úgy, hogy jelen esetben átlagokról van szó, így egy-egy átlagtól erősen eltérő teljesítmény el tudja vinni az eredményt (mint tette most is Hendó esetén, aki durván nagyot játszott a Fulham elleni hazai meccsen: 4-2-2-2-ben játszottunk, ő jobb oldali támadó volt, de igazi középső középpályás teljesítményt hozott). Az adatokat megbízhatóbbá teszi a nagyobb elemszám, mert kerül bele mindenféle-fajta teljesítmény (számíthattok rá, hogy megismétlem később). A másik megjegyzés: ezek az adatok – bár már többször láthattátok csodás tábláimat – meccsre vetített értéket mutatnak, így nem mindegy, hogy a meccseken ki mennyit játszik. Az adataim a whoscored-ról vannak. Jelen esetekben elég kicsik a minták, ezért csak korlátozott megállapításokra alkalmasak, így csak ilyenekre törekszem. Remélem érthető ez így a példákkal, ha nem, matekos-statisztikus kommentelőink majd kijavítanak.
Törzskommentelőnk GlenTheMathematician kiegészítése statisztika szemszögéből: „Általában ami mintákat mi vizsgálunk, normális eloszlásúak elméletben (ennek is van matek oka, de az már tényleg messzire visz). A pontos eredményekhez végtelen nagyságú minta kell. Ez sosincs. Viszont a t-eloszlással már kisebb mintákon is tudunk tutibb dolgokat mondani (persze nagyon nagy szórással, tehát csak nagy eltérésekre mondhatjuk, hogy tényleg különböznek). Úgy kb. 100-150-es mintától pedig már lényegében megegyezik a normálissal. Na ebből a lényeg, hogy Máté ugye a játékosok egy-egy poszton nyújtott teljesítményét szeretné összehasonlítani, vajon azok tényleg eltérnek-e. Erre van a kétmintás t-próba. (a Guiness sörgyár minőségellenőre találta ki 100 éve) Nagyon egyszerű, van egy képlet, bedobálod a számokat, összeveted a t-eloszlástábla számával, és meg tudod mondani, hogy pl. 95%-os bizonyossággal tényleg eltér-e pl. Coutinho tackle száma a két poszton. Viszont ehhez elég sok számolás kell (pl. minden meccs tackle,… száma is), de pl. azt kiszámoltam, hogy Coutinho 0,3 és 0,6 interception számára nagyon nem mondhatjuk, hogy azok különböznek. (ha nagyobb lenne a minta, valszeg már igen).”
Nézzük először Coutinhot. Most nem arra fókuszálva, hogy a szélen játszva mennyire eltér attól, amikor középen játszik – pedig ez a helyzet -, nem is azt akarom megállapítani, hogy AM-nek vagy CM-nek jobb-e, mert ezekhez kicsi a minta, hanem a két különböző fajta középpályás szerepének eltérőségére szeretnék rávilágítani. Cou gyönyörűen hozza azt, amit kell, azaz az adatok pontosan azt és ráadásul nagyon látványosan hozzák, amire számítani lehet. 6 alkalommal játszott CM-t és 5 alkalommal AM-t, vagyis közel azonos számban és játékidőben, hogy elég jól összehasonlíthatóak legyenek az adatok (azzal a poszt elején hangsúlyozott fenntartással, hogy a minta kicsi). Viszont gyönyörűen látszik, hogy mikor AM-t játszott, akkor lényegesen kevesebbet szerelt, de sokkal többet lőtt meccsenként. Több kulcspasszt is adott (igaz, nem sokkal), többet cselezett, többet passzolt és pontosabban is, mint mostanában, amikor CM-t játszik. CM-ként viszont baromi jó védekező számai vannak, így még mindig korai, de továbbra is jó döntésnek tűnik őt ebben a szerepkörben játszatni.
Hendó sok tekintetben hasonló szerepkörökben játszott idén, de az azért látszik, hogy más típusú labdarúgó, mint a brazil. Ő is játszott elég sokat (11 alkalommal) a jobboldalon, de sokkal visszafogottabb szerepben pl. volt ő szárnyvédő is. Nála is inkább a középpályás szereplésére koncentrálnék. Az egyszeri alkalomra, amikor ő volt az AM (az idegenbeli Hull vereség alkalmával) nem foglalkozom, inkább azzal, hogy miként szerepel duplaszűrő DM-ként és CM-ként. Az ő teljesítményében kisebbek a különbségek. Megjegyzendő, hogy elég jelentős a különbség a szereplések számában: duplaszűrős rendszerben DM 4 alkalommal volt idén, míg CM 14szer. Az viszont látszik, hogy DM-ként jobbak a védekező számai, lényegesen többet passzol és pontosabban, mint CM-ként, ami viszont kicsit meglepő, hogy támadásban nem sokkal jobb a teljesítménye, mikor CM-t játszik.
Remélem a rövidítésekkel is érthető.
Gerrard helyzete egyszerűbb. Ő csak középpályán szerepelt idén, viszont 3 különböző szerepben. Legkevesebb alkalommal (4) CM-t játszott, legtöbbször (14 alkalommal) a duplaszűrő egyik tagja volt és most már 8 alkalommal szerepelt a controller poszton az 1-2 mélyén. Elég nagyok az eltérések az elemszámban, és CM esetében sokkal kisebb az átlag játékidő is, így ezzel részletesebben nem is foglalkozom. Elméletileg a maradék két esetben DM-t játszik, de óriási a különbség, hogy egyedül vagy társsal teszi. Addig rendben is van, hogy amikor van társa, kevesebbet kell védekeznie, így gyengébbek a védekező mutatói, de többet mehet előre, így többet lő. Gerrard esetében egyébként is arra lehetett számítani, hogy a kulcspasszok minden szerepkörben hasonlóan alakulnak, mert döntő többségében rögzített szituációkból származna. Az viszont meglepő, hogy amikor egyedül van hátul, lényegesen kevesebbet és pontatlanabbul passzol, és nem a hosszú passzai miatt, ahogy korábban hittem (érdemes a jelenlegi tábla korai verzióját megnézni 3 meccs után mennyivel mások voltak a számok -> kis elemszám). Nekem továbbra is az a bajom azzal, ahogy ő játssza a controller szerepet, hogy nem eleget és nem elég pontosan passzol, mert egyébként remekül helyettesíti Lucast. Szezon végén biztos visszatérek még a témára, hogyan változtat az utolsó 11 meccs a fenti adatsorokon.
Kis kárpótlás azoknak, akik nem szeretik a statisztikát.
Számomra örömteli, hogy a taktikai különbségeket statisztikailag ki lehet mutatni. Alapvetően ennyiről és nem többről szól ez a poszt. Azért érdemes lehet elmerengeni, hogy Hendó és Gerrard, amikor azonos szerepben játszik, mennyire hasonló számokat hoz. Továbbá azon, hogy hasonló szerepben – CM-ként – eltérő stílusú/típusú labdarúgók – Cou és Hendó – mennyire eltérő mutatókkal bírnak. Valamint azon, hogy a whoscored teljes bajnoki átlag számai milyen jelentős különbségeket fedhetnek el.
Azt hiszem, fogtok még ilyen táblákat látni tőlem, hiszen ezek az adatok és a belőlük levonható következtetések például érdekesek lehetnek akár már a Soton ellen mérkőzésen is, hogy hogyan is álljon fel a középpályánk.
* A táblák kattintásra nőnek.