Kétdimenziós látásmód

Nagyképű leszek ilyet leírni, de valahol a mai Liverpool luxusproblémája üldöz ennek a beharangnak az írása közben: vezetünk huszon ponttal, gyakorlatilag zsebben, csak még azért mégsem, és nehéz motivációt találni egy Watford elleni meccsre februárban. Ebben az állapotban a héten olvastam Watsonról, a Leicester IBM-es mesterséges intelligenciájáról, és amúgy kurvára tetszik az ötlet. (És biztos lehetsz benne, hogy a Pool annál évekkel jár előrébb.) Az ilyen focis MI-kről születő cikkekben azonban még mindig klasszikus vonalú, viszonylag egyszerű statisztikai következtetések vonódnak le. Ez a valóságot aligha tükrözi, de egy MI-gyerekcipőben járó iparágnál így vezetődik fel az újságírásban. Pont olyan fantasztikus eredmények, mint amiket szigorúan 2 darab dimenzió mentén is meg tud csinálni az ember. Ez a poszt is ennek az egyszerűségnek lesz példája, természetesen MI háttér nélkül.  Ehhez egyik kedvenc, de ritkán látogatott oldalamat, az Experimental 3-6-1-et fogom használni, mert talán még sosem volt onnan a Fonatra lopva anyag, pedig azért megérdemli, jó blog – csak egyszerű, pont mint a 2 dimenziós deskriptív stat. (Hogy mi van a két dimenzión és ezeken a sokszor emlegetett egyszerű MI-s használásokon túl valójában, talán a Merseyball-ban kap egy szeletet. ;))

Legfrisebb lövési statok a PL idei szezonjára

Ahogy ígértem 2 dimenzió: vízszintes átlag lövésszám meccsenként, függőleges átlag engedett lövésszám. Jobb lefelé a legjobb. A City meglepően brutális, mármint ahhoz képest, mi hol állunk. Aktuális ellenfelünk, a Watford, már igazi középmezőny harcos ezen két dimenzió mentén szemlélve. Azonban sokkal fontosabb, hogy hol álltak a legutóbbi meccsünk után decemberben:

Fejlődtek, ha kicsit is, de mindkét mutatóban.

Támadó statok, szintén februáriak

Támadás – amiben a meglepően kiváló védekezés és kevés gól okán talán nem is tartjuk annyira világverőnek magunkat épp, pedig azok vagyunk. Lövésszámban megint a City vezet utcahosszal, érdekes, hogy a Chelsea és a MU is a környéken kolbászol. Viszont a gólokhoz szükséges lövésszámban legjobbak vagyunk, a Leicesterrel párban (a háttérben felsejlik a BR-féle outscore nosztalgikus képe). Ez egy olyan statisztika – egy, azaz egy dimenzió -, ami nagyon sok információt tömörít, csakúgy, mint társai, viszont pont ezért a mögötte rejlő statisztikai zajra illetve ok-okozatra a legkevesebb fény sem derül. A.k.a. jó, hogy nekünk csak 6 és fél lövés kell egy gólhoz, de ez a rúgás helye miatt, támadás sebessége, feltolt védelem, rúgó technikája, vagy mi miatt van így – ez rejtély marad.

Watford. Ha a fenti ábrára nézünk, azt látjuk, hogy gyötrelmesek. Ha az alábbira, akkor pedig azt, hogy határfos volt a decemberi teljesítményük:

Ugyanúgy támadóstatok csak decemberi állapotban

A kettő között helyezésben nincs különbség (tök utolsó), viszont a mutatókban óriási a fejlődés. Két hónap alatt az egész szezonos 18 lövés / gól mutatót lehozni 13 alá brutális teljesítmény, és dicséri Deeney-éket. A csk egyébként az egyik legkiugróbb a ligában az xG felülteljesítésében.

Defenzív statisztikatér

És akkor még védelmi felületrajzok. Kezdve ismét magunkkal és a top6-tal, itt is nagyon jól kijön miben vagyunk nem csak baromi jók, de mások is, mint a többiek. City és társai kevés lövésbe néznek bele, viszont abból rekord gyakran kapnak gólt. Oka főleg, hogy kitámadó csapatok, hatékony kontrák vége pedig nagy helyzet az ellennél, igaz, hogy ezekből ugye kevés van (tiki-taka labdabirtoklás). Mi pedig nagyságrendileg ugyanennyi lövésbe nézünk bele, azt viszont olyan hatékonysággal hárítjuk, mint konkrétan a legsündisznóbb csapatok, sőt. (És amúgy BR ismét a nyakunkon.) Hogy megint miért is van ez – világ legjobb kapusa, VVD, Hendo munkája, kopaszunk szűrése, passzsávok zárása -> rosszabb helyzetek, stb.), az az egy dimenzióból, de bármilyen csak deskriptív vagyis leíró statisztikából nem jön ki. Ha egy tanuló algoritmust mögé teszel, nagyon sok dimenzióval, akkor majd igen, és akkor már nem csak ez a végábra az érdekes, ahogy azt a legtöbbször olvashatjuk pedig.

A Watfordra vetve egy újabb pillantást: nem látványos, de itt is mindkét mutató mentén egy elég erős fejlődés figyelhető meg. Védekezésben is tehát, csakúgy mint sok támadó mutatóban.

És akkor mindenki kedvenc deskriptívje, az xG. Ábrát ehhez már direkt nem hozok, de tudjuk: mi mocskos nagy xG-vel vagyunk, és keveset engedünk, a Watford meg fordítva. A lényeg viszont az, hogy mi is a statisztikai modellezés létének alapja: a világ túl bonyolult, ezért jól dobva ki az információ egy (nagy) részét, egyszerűsíthető a világ annyira, hogy megértjük, és még jól közelíti azt. Az elveszett info a statisztikai zaj. Az xG-nél sokan elfelejtik, hogy statisztika és nem atomfizika: létének alapeleme, hogy információt dobjon el, így nem fog tökéletesen leírni.

Hogy miért van az XG módszertanos ponttáblázathoz képest a Poolnak 9-cel több pontja, nem tudjuk. Hogy miért teljesített a Watford mélyen az XG alatt decemberig, azóta viszont masszívan az elvárt felett, a 2 dimenzió nem válaszolja meg:

Watford forma xG módszertanban: piros alulteljesítés, kék a felül

Viszont látjuk, hogy a fejlődés kicsapódik a valóságra a Watford elmúlt két hónapjában. Ez szombat este egy nehéz meccs lesz, sokkal nehezebb, mint a decemberi 2-0, és nem csak a saját motiváltságunk miatt.

És hogy keretbe foglaljam a mondandót: Persze, nagyon izgi, szexi tömeggyilkos robotokat vizionálni, de esetleges MI-k interpretálása teljesen felesleges ha a sci-fi mellett 2D-ben csapódik le. Arra ott a jó öreg leíró statisztika. Ez az irodalmi felkészültség viszont változni fog.