top of page

Baseball vedonlyöjän näkökulmasta

Kirjoittajana on tilastonörtti, joka harrastaa baseballia sekä kentällä räpylä kädessä että sohvalla läppäri sylissä. Kirjoitus on aiemmin julkaistu Eastside Sports Analysis -sivustolla.

Baseball on laji, jossa joukkueiden keskinäistä paremmuutta on helpompi mitata (kvantifioida) kuin monessa muussa lajissa. Ottelu koostuu hyvin pitkälti yksittäisistä kaksintaisteluista syöttäjän ja lyöjän välillä, joissa muiden pelaajien vaikutus pelitapahtumiin on vähäistä. Koska peli on ”pysähtyneessä tilassa” jokaisen syötön välillä, on pelin pienempienkin yksityiskohtien tilastointi mahdollista. Kun lyöjä osuu palloon, kentällä tapahtuu huomattavasti vähemmän asioita (ja helpommin mallinnettavia) kuin esim. jalkapallo-ottelussa, jossa yksittäisen pelaajan hyvä/huono suoritus voi olla erittäin riippuvainen kanssapelaajien suorituksista.

MLB-joukkueet pelaavat kaudessa 162 runkosarjan ottelua ja parhaat joukkueet vielä pudotuspelit päälle. Pelin luonteesta johtuen yksittäisissä otteluissa nähdään paljon yllätyksiä. Pitkässä sarjassa parhaat joukkueet kuitenkin erottuvat edukseen, tosin monesti erot ovat hyvin pieniä. Parhaat joukkueet voittavat yleensä kaudessa noin 60 % ja heikoimmat noin 40 % otteluistaan. Vaikka baseballissa yksittäisen ottelun lopputuloksesta iso osa selittyy sattumalla, löytyy jokaisen ottelun koti-/ vierasjoukkueelle luku (todennäköisyysarvio), joka kertoo kuinka monta ottelua koti-/vierasjoukkue voittaisi, mikäli ne kohtaisivat tarpeeksi monta kertaa samoilla lähtöoletuksilla (kokoonpanot, tilastot, sääolosuhteet jne.). Vertaamalla tätä lukua (todennäköisyysarviota) tarjolla oleviin kertoimiin pystytään määrittämään onko kyseessä pelattava kohde.

Kattavan tutkimuksen ja suureen määrän julkisesti käytössä olevan datan avulla on pystytty tunnistamaan mitkä tekijät vaikuttavat tehtyjen/päästettyjen juoksujen määrään baseball ottelussa. Nämä tekijät ovat yleisesti tiedossa (ainakin baseballia seuraavien tilastoihmisten parissa). Yksi ehkä tunnetuimmista tilastoista, jonka on todettu korreloivan hyvin tarkasti tehtyjen juoksujen kanssa, on lyöjille laskettava OBP (on base %). Tilaston teki suurelle yleisölle tunnetuksi Moneyball kirja/elokuva. Toinen lyöjille keskeinen tilasto on esimerkiksi SLG (slugging %) kun taas syöttäjille keskeisiä tilastoja ovat mm. K (strikeouts), BB (bases-on-balls) ja HR (home runs).

Omassa analyysissäni käytän ainoastaan tilastoja ja tunnuslukuja joiden rakenteen ja vaikutuksen lopulliseen arvioon ymmärrän täysin. Tämä on mielestäni erittäin olennainen asia analyysin tekemisessä ja mallien rakentamisessa. Jossain vaiheessa tulee eteen tilanne, jossa omia toimintatapoja ja tuotoksia on hyvä tarkastella kriittisesti. Mikäli ei täysin ymmärrä mitä jokin yksittäinen tilasto tai tunnusluku tarkoittaa kokonaisuudelle, on mahdollisten virheiden tai tehottomien tunnuslukujen löytäminen todella vaikeaa. Myös vihjattavan lajin tunteminen (urheilullinen aspekti) on mielestäni myös todella tärkeää. Mikäli ei ymmärrä lajia tarpeeksi hyvin, on mielestäni mahdotonta myöskään ymmärtää mitkä eri osa-alueet vaikuttavat lopputulokseen.

Eri tulemien todennäköisyys

Arviointimenetelmäni perustuu pääosin yksittäisten pelaajien tilastoihin. Lasken pelaajalle todennäköisyyden jokaiselle mahdolliselle tulemalle hänen ollessa lyönti- tai syöttövuorossa. Pelaajien todennäköisyydet eri tulemille ovat lähtökohtaisesti staattiset, mutta muuttuvat kauden mittaan pelaajan performanssin mukaan. Mahdolliset tulemat ovat 1B (single), 2B (double), 3B (triple), HR (home run), BB (bases on balls/walk), IBB (intentional bases on balls), HBP (hit by pitch), K (strikeout) ja GO/FO (groundout/flyout).

Lisäksi huomioin mm. pelaajan tilastot koti- ja vierasotteluissa, eli onko pelaajan suorituksissa eroja hänen pelatessa koti- tai vieraskentällä. Myös kätisyys, eli miten hyvin lyöjä/syöttäjä on pärjännyt oikea-/vasenkätisiä lyöjiä/syöttäjiä vastaan, vaikuttaa osaltaan eri tulemien todennäköisyyteen. Tämän lisäksi huomioin kenttäkohtaiset erot (ns. park factor). MLB-joukkueiden kotikentät omaavat erilaiset ominaisuudet esim. San Francisco Giantsin kotikenttä AT&T Park on ns. syöttäjän kenttä ja samassa lohkossa pelaavan Colorado Rockiesin kotikenttä ns. lyöjän kenttä. Eroavaisuudet johtuvat mm. sääolosuhteista sekä kenttien koosta ja muodosta. Kenttäkohtaiset erot on otettava huomioon verrattaessa pelaajien ja joukkueiden keskinäistä paremmuutta. Alla esimerkki koti-/vieras tilastojen käytöstä ja kenttäkorjauksesta:

Boston Red Soxin David Ortizin OBP vierasotteluissa kaudella 2011 oli 0.357 ja kaudella 2012 0.361. Kotiotteluissa vastaava luku oli kaudella 2011 0.436 ja kaudella 2012 0.463, eli 7.9 %-yksikköä ja 10.2 %-yksikköä suurempi kuin vierasotteluissa. Tämän lisäksi Ortiz pelaa kotiottelunsa Fenway Parkilla, jossa nähdään enemmän juoksuja kuin keskiverto MLB-kentällä. Esim. nämä em. seikat on hyvä huomioida, kuin tehdään todennäköisyysarviota ottelusta, jossa Boston Red Sox on toisena osapuolena.

Kun pelaajien eri tulemien todennäköisyydet on määritelty, simuloin arvion kohteena olevan ottelun 100000 kertaa. Simuloinnin tulemana on matriisi, josta voidaan laskea todennäköisyydet koti- ja vierasjoukkueen voitoille sekä todennäköisyydet ottelun eri tuloksille.

Käytännön toteutus

Tietokantani päivittyy kerran päivässä. Päivityksen jälkeen teen arviot illan/yön otteluihin. Suurin osa arviointimenetelmäni eri vaiheista on täysin ”automatisoitu”. Ohjelmointi ja testaus on vaatinut paljon aikaa, monta epäonnistumista, yhtä monta onnistumista ja myös muutaman ahaa-elämyksen. Mitään ”game-changeriä” en voi kuitenkaan väittää luoneeni, vaan ennemmin tehokkaan tavan hallita tilastoja ja tehdä otteluista perusanalyysi.

Analyysin tavoitteena on löytää virhehinnoitteluja ja tilanteita, joissa historia todennäköisesti toistaa itseään ja joissa panostus on perusteltua. Analyysin tuottamia arvioita vertaan Pinnaclen Sportsin kertoimiin ja mikäli pelattavaa löytyy katson kohdetta tarkemmin ja viimeistelen todennäköisyysarvion ja analyysin.

Lue lisää osoitteesta: http://www.eastsidesportsanalysis.com

Pääkirjoitukset
Uusimmat
bottom of page