Az átigazolási sikerráta rejtelmeiről

Jó vendég írásokat mindig szívesen veszünk. Most Benyo készített egyet a felkérésünkre az egyik kedvenc témánkban. Élvezzétek!

Pár hónappal ezelőtt olvashattatok egy cikket tőlem a Britannián. Alapvetően azért ott, mert Lac segített nekem egy-két kérdésben a kutatás során, így neki küldtem el a végeredményt, annak ellenére, hogy a Fonaton szoktam csak kommentelni. Ezután, valamikor október elején találkoztam Glennel és Mátéval, hogy átbeszéljük, miről is van itt szó valójában. Akkor már benne voltam az adattábla továbbfejlesztésében és abban maradtunk, ha befejezem, akkor jó lenne azokat az infókat megjelentetni a blogon. Ez az idő most jött el, így fogadjátok sok szeretettel a következő sorokat.

A britannián megjelent cikk alapján az alapkutatás folyamán arra jutottam, hogy összehasonlítva 180 játékos teljesítményét az átigazolás előtt és után, megállapítható, hogy mennyit fizettek ki az adott játékosért, nem befolyásolja a sikeresség valószínűségét.

Itt egy pillanatra vegyünk egy levegőt. Ha elolvassátok a fentebbi cikket, akkor azt fogjátok találni, hogy sokszor fogok Tomkinsra hivatkozni. Gyorsan vizsgáljuk meg miben különbözik az én módszerem az övétől. Fontos, hogy teljesen más módszertannal, teljesen más alapsokaságon, teljesen más adatbázissal, egy jóval kisebb mintán, de elsőre egy hasonló eredmény jött ki, mint Tomkinsnak. Azonban én tovább folytattam a kutatást, és elvégezve egy kapcsolatmérő tesztet, sikerült rácáfolni arra a feltételezésre, hogy a pénzzel együtt jár a siker. Ad egy, igen tudom, kicsi a minta, hiszen csak 180 játékos a több ezres mintához képest (egyébként a bővítés folyamatban van), de a teszt végrehajtásához ennyi is elég, az alkalmazási feltételek érvényesülnek, így lehet hinni a teszt eredményének, de ami fontos, az én mintámon. Ad kettő, nem mondom, hogy amit Tomkins csinál, az rossz, sőt nagyon is jó, innovatív és előremutató, nagyra tartom a munkáját, de nagyon sok szempontból vitatkoznék vele, valamint nála nem láttam semmiféle tesztet, amivel magyarázná azt, hogy van kapcsolat. Tehát még egyszer, nem állítom, hogy az én vizsgálódásom hibátlan, rengeteg fejlesztenivaló van még a modellen, de az is benne van, hogy Tomkins sem vizsgált még meg mindent minden oldalról.

/Glen: Aki kicsit benne van: Benyo itt Pearson-féle khi-négyzet függetlenségi próbát használt, helyesen. A következtetésnél viszont egy nagyon gyakori klasszikus statisztikai problémába szaladt bele: Klasszikus statisztikában nullhipotéziseket állítunk fel, és ezeket próbáljuk meg a gyűjtött mintánkon végzett teszt(ek)kel vagy elutasítani vagy _nem elutasítani. A khi-négyzet teszt nullhipotézise az, hogy a játékos ára és a sikerráta függetlenek. Benyo számításainak eredménye az, hogy nem utasíthatjuk el azt a hipotézist, hogy tényleg azok. Ebből viszont nem vonhatjuk le egyértelműen azt, hogy tényleg nem függ a siker az ártól, ahhoz más próbákat érdemes végigcsinálni. – Ettől még ne gondolja senki, hogy tévedéssel indul a poszt, ez a kutatások szépsége: sokan sokféle, akár látszólag ellentétes eredményre jutnak egy témában, konszenzust még tisztán matek dolgokban is ritkán érnek el. Viszont ezek a progresszív “viták” vezetnek olyan elméleti és gyakorlati eredményekhez is, mint ami a továbbiakban következik Benyotól vagy amiket már megismerhettetek akár Tomkins cikkeiből./

(macca8: Én sokkal inkább abban látom a különbséget – amennyiben ez jelentős különbség -, hogy más definíciót ad Tomkins és Benyo a sikerességnek. És ehhez pontosan meg kellene adni, hogy milyen paraméterek mentén tekint egy igazolást sikeresnek: ahogy Tomkins megadta, hogy hosszas kísérletezés után maradt annál, hogy a pályára lépések számát tekinti a siker kritériumának, majd később ezt finomította pluszpontokkal 100 meccsenként, illetve, ha valakin sok pénzért sikerült túladni, úgy itt is meg kellene pontosan adni ezeket a paramétereket. Az eredeti posztban csak példaként volt megemlítve pár. Ráadásul Tomkinsnál a siker a játékosért kifizetett pénz értékéhez mérődik: value for money, nem futballszakmai értelemben – ami sokkal szubjektívebb: https://tomkinstimes.com/2017/07/the-best-value-premier-league-signings-since-1993/, valamint az adatbázis mérete is jelentősen eltér 180 vs 4000.)

Szóval ez az alaphelyzet, melyből kiindulva két további területen folytattam a kutatást. Az egyik a labdarúgó piacon megfigyelhető inflációra korlátozódik, míg a másik további bontásban vizsgálja az adattáblát, mint például, hogy mely országokba igazoltak ezek a játékosok.

Kezdjük az elsővel. Érdekelt, hogy ha a pénz nem befolyásolja szignifikánsan a sikerességet (Glen.: mármint nem utasíthatjuk el, hogy nem függnek össze), akkor vajon mi. Megvizsgáltam több szempont alapján az adattáblát. Kezdtem azzal, hogy összevetettem, hogy ez a 180 játékos mely országokba igazolt. Ennek az összesítése itt található:

Az első oszlopban található az, hogy a játékos melyik országba igazolt. A második oszlopban azt láthatjuk, hogy abból a 180 játékosból hány igazolt Angliába, Franciaországba stb,. majd a következőben ugyanez látható, csak százalékos formában. Tehát itt az Angliánál szereplő adat azt jelenti, hogy ebből a 180 játékosból majdnem minden második Angliába igazolt (hiszen a százalék 49,44%). Visszautalásként, az adattábla az elmúlt 4 átigazolási szezon 45-45 legdrágább átigazolását tartalmazza. Nem meglepő módon Anglia kimagaslik, hiszen ismerjük, hogy a Premier League-ben játszó csapatoknak milyen gazdasági erejük van az átigazolási piacon.

A negyedik oszlopba azt láthatjuk, hogy az adott országba igazoló játékosok között hány darab sikeres üzlet volt. Maradva az angliai példánál, a 89 átigazolásból 45 darab volt sikeres. Ez az adat még nem is mondd túl sokat a számunkra, de a következő oszlop annál inkább. Itt az látható, hogy az adott országba érkező játékosok között mekkora a sikeres üzletek aránya, azaz, a negyedik oszlop elosztva a másodikkal. Ebben viszont a legmagasabb arányszámmal már nem Anglia büszkélkedhet, hanem Spanyolország (Portugáliától eltekintünk az alacsony darabszám miatt). Szóval megállapíthatjuk, hogyha egy kevéskével is, de Spanyolországban jobban hasznosulnak a befektetett milliók.

/Glen: Egy másik király dolog, amire Benyo elemzése előhozza belőlem a strébert: konfidenciaintervallumok. Az egyik leginformatívabb dolog tud lenni, mikor átlagokat számolunk, és ebből látjuk valaminek az irányvonalait. Egyszerű, és sok infót ad. Viszont elég sokat el is vesz egy mögöttes eloszlásból. Például a sikerrátának is van egy mögöttes valószínűségi eloszlása, ezt próbáljuk fejtegetni mintavétellel, bár az igazságot pontosan sosem fogjuk megismerni. Az átlag az első, amit elmondunk ilyenkor, mutatja is az általános képet. A második viszont egyből a szórás, ami kb. annyi, hogy mennyire szóródnak szét az adatok (sikerráták) az átlag körül. Ez azért is hasznos, mert megállapíthatjuk, hogy a minta átlaga, amit kiszámoltunk, egy bizonyos valószínűséggel (általában 95%) milyen intervallumba esik. Konkrét példa fent: Anglia sikerrátája 50.5% (ez az átlag), de ha majdnem biztosan (95%) nem akarunk tévedni, akkor annyit mondhatunk csak, hogy valahol 47.6% es 53.4% között van. Elég szűk ez, azt meg szeretjük. A spanyoloknál viszont a kis minta miatt ez egy jóval szélesebb intervallumra jön ki, ami viszont belelóg ebbe az angol konfidenciaintervallumba. (Már maga a spanyol átlag is belelóg.) Ebben az esetben viszont a mi kívánt 95% biztonsági szintünkön nem zárható ki, hogy bizony Anglia sikerrátája a spanyoloké fölött van. Tehát lehet, hogy Spanyolországban tényleg jobban hasznosulnak az elköltött milliók, de ehhez statisztikai bizonyítékot még nem talált Benyo, ahhoz nagyobb minta kell – ha egyáltalán igaz, ugye./

Még ehhez a táblához annyi, hogy számomra meglepő, hogy Németország az utolsó oszlopban szereplő arányszámok rangsorában a negyedik helyre szorult és csak Franciaországot előzi meg. (kis minta => széles konf. int. => óvatosan!) Azt gondoltam volna, hogy ezt a rangsort ők fogják messze vezetni, de nem így történt, ami egyfelől logikus, hiszen a német foci alapját és sikerességét nem a drágán vásárolt játékosok teszik, hanem az a rengeteg fiatal focista, akik az akadémiákról kikerülve megkapják a folyamatos bizalmat a fiatal és innovatív felfogású edzőktől. Emellett hozzájárul még ehhez a Bayern átigazolási politikája, de ez már egy másik bejegyzés témája is lehetne, hogy miként szipolyozzák ki a konkurenseiket.

Emellett érdemes megemlíteni azt a tény, hogy Tomkins szerint nem növeli a sikeresség esélyét az, hogyha a játékos már játszott az adott ligában az átigazolása előtt. Érdekelt, hogy az én adattáblámból milyen következtetés látszik, így megvizsgáltam, hogy mely átigazolások jártak országváltással és melyek nem, és melyiknél mekkora a valószínűsége a sikeres üzleteknek. A tábla a következő:

Számunkra most az utolsó oszlop az igazán fontos, ahol azt látjuk, hogy az adott kategórián belül – tegyük fel, azoknál, akiknél az igazolás járt országváltással- a sikeres üzleteknek mekkora volt az előfordulási valószínűségük – 44,44% -. Itt látszik, hogy 10%-pontos különbség van azon játékosok javára, akik ligán belül váltottak csapatot. (szerk.: és ez itt tényleg szignifikáns eltérés!) Tehát ebből most más eredmény jött ki, mint amire Tomkins kutatásai alapján számíthattunk volna. Érdekes lenne mondjuk ezt megvizsgálni csak azokra a játékosokra, akik Angliába igazoltak. Kíváncsi lennék, hogy ott is marad-e ez az arány, vagy az inkább Tomkins következtetéseit támasztja alá. Ha úgy alakul, hogy van érdeklődés ez iránt, akkor majd kommentmezőben közzéteszem az eredményt.

(macca8: Tomkins csak Angliáról ír, nem bármely adott ligáról: https://tomkinstimes.com/2015/06/killing-the-myth-of-buying-prior-pl-experience/ így ez az összehasonlítás az alma és a körte esete)

Másik érdekes kérdés, amin gondolkodtam, az az, hogy vajon függ-e a sikeresség attól, hogy az átigazolási időszak mely szakaszában igazolták az adott játékost. Ahhoz, hogy ezt megvizsgálhassam ki kellett bővíteni a táblát az átigazolások pontos dátumával. Ezt követően négy kategóriába kerültek a játékosok. Az egyikbe azok, akik a téli átigazolási időszakban váltottak csapatot. Emellett a nyári időszakot három részre bontottam. Az első azokat a játékosokat tartalmazza, akiket július 15. előtt szerződtetett az új csapatuk. Azért ez a dátum került kiválasztásra, mert a legtöbb klub ezen időszak körül kezdi el a felkészülést az új szezonra, így akik ezen dátum előtt csatlakoztak, azok szinte az egész alapozást az új csapatukkal tudják tölteni. A második kategóriába azon játékosok kerültek, akik július 15. és augusztus 15. között csatlakoztak új egyesületükhöz, vagyis még az új szezon kezdete előtt aláírták szerződésüket. Az utolsó kategóriát pedig azok alkotják, akik a nyári átigazolási piac utolsó két hetében érkeztek meg az új állomáshelyükre. A logika azt diktálta volna nekem, hogy a nyári időszak elején szerződtetek játékosok között lesz a legmagasabb, míg a pánikigazolások, azaz az augusztus vége felé nyélbe ütött üzletek között lesz a legkisebb a sikeres üzletek aránya.

Az eredmények a következő, már jól ismert táblázatban láthatóak:

Az eredmény számomra is meglepő volt. Az igaznak bizonyult, hogy a téli átigazolások között messze a legrosszabb a sikeres üzletek aránya. Viszont ami meglepő, hogy kiemelkednek a sikeres üzletek az átigazolási időszak hajrájában igazolt játékosok között. Hogy ennek pontosan mi is az oka, az jó kérdés, de az mondjuk közrejátszhat ebben, hogy az új szezon kezdetén már fel tudják térképezni a csapatok a kiszemelt játékosokat élesben meccsszituációban is és ezek alapján tudják meghatározni, hogy melyik játékost igazolják le. Az remekül látszódik, hogy a hangsúly megint csak a kiválasztási folyamaton, azaz az adatok értelmezésen van. Mindenhol, így a fociban is egyre több és több adat áll rendelkezésre, és akik ezeket az adatokat jobban tudják értelmezni és hatékonyabban felhasználni, azok versenyelőnyhöz juthatnak. Ezért kritikus pont ez, de ez újfent egy külön bejegyzés témája is lehetne. Visszakanyarodva, az viszont tény, hogy ezek a sorok rácáfoltak azokra, akik a nyáron ellenezték (köztük én is) az augusztus végi igazolásokat, hogy ők kimaradnak a felkészülésből stb, és így nem tudnának úgy a csapat hasznára lenni. Reméljük OX is majd erősíti ezt a szabályszerűséget.

Összegzésként tehát megállapítható, hogy a bajnokságon belüli vásárlás ezen adatok alapján mégsem akkor balgaság. Itt fontos kiemelni a kiválasztási folyamat fontosságát. Nem az a lényeg, hogy honnan jön, hogy hívják, hány éves az adott játékos, hanem hogy a stáb bízzon benne és tudják, pontosan mire akarják alkalmazni. Ezért bízok én személy szerint nagyon Kloppban, hiszen van egy tiszta víziója arról, hogyan is akar sikeres lenni a Liverpoollal és ebből nem enged. Ellenben pont ez volt a baj BR-rel, hogy elvesztette az identitását és össze-vissza kapkodtunk az átigazolási piacon, mint egy fejetlen csirke. Az utolsó tábla tanulsága alapján megállapítható az is, hogy ha egy csapat nem nagyon igazolt augusztus végéig (lásd Spurs idén nyáron) az nem jelenti azt, hogy a board-nak nincs elképzelése az átigazolásokról és nem is akarnak igazolni, hanem várnak a megfelelő emberre és alkalomra.

A következő blokk az infláció lenne, de már így is 1000+ szónál járok, így azzal most nem untatnálak már titeket. Ha érdekesnek találjátok azt a rész is, akkor a későbbiekben arról is szívesen írok. Remélem tetszett a bejegyzést és élveztétek.

Köszönöm a lehetőséget.