5 yıllık bir hiatus sonrası herkese merhaba. uzun bir süredir bu xg hakkında canımı sıkan bir şeyler vardı ancak adlandıramıyordum. aslında basit bir sorunun karşılığını görmediğim için başlamıştı, böyle bir istatistikte olmamasına imkan vermediğim bir eksiklik: possession futbol ve transition futbol takımlarının oyun etkisi ve değişkenleri. işim gücüm yok gibi bu kaşıntıya artık karşı koyamayıp ufak bir araştırma yapmaya karar verdim ve sonunda geldiğim nokta, benim canımı sıkan xg değil, xg’yi şimdiki zamanda yorumlayan izleyiciymiş.
önce biraz xg’yi açalım. bütün stokastik modeller gibi belli formüllere ve prensiplere dayalı. yani her ne kadar insan faktörünü içine koymaya çalışsa da kendi içinde kapalı bir durumu söz konusu. bunu gözönünde bulunduran istatistikçiler zaten xg’yi günümüzü yorumlamak için ortaya atmamışlar. xg temel olarak bir takımın uzun bir sürelik maçlarını (bir sezon gibi) ele alıp, gelecekteki ilerleyebileceği yolu çizmede fikir sunuyor. bunu yaparken ele aldığı temel veriler 4 adet: şut çekecek kişinin pozisyonu, neresiyle vuracağı (kafa, ayak), pasın türü (orta mı, ara pas mı, duran top mu) ve son olarak pozisyonun nasıl hayat bulduğu (buildup play, top kapma, defansın yerleşme şansı olmuş mu, driplingle devam edilmiş mi).
buna stokastik model demiş olsam da aslında tek bir formülasyonu yok maalesef. bu nedenle farklı istatistik sitelerinde farklı sonuçlar bulabilirsiniz. en temel farklılık şutu çeken oyuncunun pozisyon yorumu. araştırdığım sitelerde callum wilson’ın southampton’a attığı bir golü örnek vermişler. boş sayılabilecek bir kaleye penaltı noktasında şut çekiyor. birçok sitede bu 0,5 ile 0,66 xg olarak işlenmiş. bunun sebebi referans pozisyon azlığı. o noktadan çekilen şutların sadece %3’ü önü açık olarak çekilmiş. bunu yorumlayan istatistik siteleri de farklı sonuçlara ulaşıyor. mesela statsbomb aynı pozisyonu 0.97 xg olarak kaydetmiş.
tek bir doğru xg yorumu olmadığını söyledikten sonra şimdi yapısal eksikliklere gelelim. zincirleme devam eden pozisyonların istatistiği konusunda bazı sıkıntılar var. yine araştırdığım bir sayfada, bir nürnberg maçındaki pozisyonu örnek almışlar. oyuncu kaleci yerindeyken şut çekiyor xg=0,37, şutu defans karşılıyor top tekrar önüne geliyor bu sefer kaleci yerinde değil ama bir defans var xg=0,68, top direkten dönüp önüne geliyor bu sefer boş kale xg=0,81. şimdi ilk sorun: normalde düz bir şekilde pozisyon toplamları alınırken burada toplam 1,86 olmakta ki bu imkansız. çünkü bir pozisyonda sadece bir gol üretebilirsiniz. bunu aşmak için defans yapan takım üzerinden olasılık hesaplayıp bunu 1’den çıkartarak atak yapan takımın xg’sini hesaplamaya çalışmışlar. bu da her pozisyonu ayrı ayrı 1’den çıkartıp çıkan sonuçları birbiriyle çaraparak elde edilmiş. bu pozisyonda çıkan sonuç %3,83 oranında defans yapan takımın golü önleyeceği. atak yapan takımın xg’si ise 0,9617 olarak ortaya çıkmış.
şimdi ikinci soruna gelmiş olduk. birbiri ardı zincir pozisyonda son gol pozisyonu ilkinden ayrı düşünülemez, ancak aritmetik olarak eklenemez de. referans veri elimizde olmadığında xg verileri tamamen normal çizgisinden taşıyor. bu örnekte pozisyon sadece 2-3 saniyede yaşandığı için ayırmış olabiliriz ancak top oyundan çıkmadan, 1-2 dakika süren ataklarda benzer şekilde xg hesaplaması yapıldığında durumu ayırt etmesi daha da zor. dediğim gibi bir pozisyonda sadece bir gol üretilir ama bir pozisyonu neye göre belirliyoruz? devam eden oyun içinde ardışık iki gol pozisyonunu sayarsak, ikincisi ilkinin sonucu doğmuşken, ilkini saymak ne kadar doğru?
xg’nin yetersiz olduğunu uzmanlar ona desteklemek için başka istatistik arayışlarına girmişler. bunun için stokastik modellerden biri markov modelini kullanmışlar. bunu yapmak için non-shot expecting goals, nsxg, ve expected threat xt kullanmışlar. nsxg’yi şöyle açıklayabiliriz; bir oyuncu ortasahada taç çizgisine yakın topla dururken gol tehlikesi neredeyse sıfırdır. orta açarsa ve top rakipten dışarı çıkarsa korner kazanır ve bunun tehlikesi %4 diyelim. başlangıç noktası %1 iken bu futbolcu orta açarak %4 çıkarmıştır ihtimali. futbolcu katkısı %3 olarak işlenir ve bu nsxg olarak kaydediliyor.
expected threat ise daha formülize bir yapıya sahip. ve bence xg yorumu, xt ile yapılmalı. böylelikle bir takımın hücum aksiyonları ve sonuçlandırması üzerine daha sağlıklı verilerle konuşulabilir.
şu linte ingilizce olarak açıklanmış.
https://karun.in/blog/expected-threat.html kısaca ball progression’a yani topun ilerleyşine bakıyor ve her oyuncunun pozisyona katkısını hesaplıyor. evet, gerçekten hesaplıyor. belli bir formülü var ve tek tek hesaplanabiliyor. henüz tamamlanmamış bir çalışma, gelecekte off the ball hareketlerini daha iyi içine katıp en doğru takım analizi istatistiği haline gelebilir.
şimdi benim sorduğum basit soruyor cevaplandıralım. hayır maalesef possession futbol ve transition futbolun xg çalışması olmamış. sadece kendi çıkarımlarımı söyleyebilirim. nürnberg golündeki örneği düşünün, bir takım pozisyon sonuçlandırmadan ne kadar önde pozisyon yaratmaya çalışırsa o kadar xg artıyor ancak aslında biz biliyoruz ki top oyundayken sadece bir gol atılabiliyor. possession futbolda amaç rakibi ters ayakta yakalamak, pozisyon hatası yaptırmak için topu dolaştırmak ise, transition futbolda ise amaç bunu top ayağında bile değilken yapabilmek. possession futbolda haliyle daha fazla xg çıkabilmekte. galatasaray derdimiz olduğundan onun örneğini alalım. galatasaray takıntılı şekilde possession futbol oynamaya çalışıyor ancak istatistikte çıkan xg’ye göre çok düşük gol üretiyor. normalde istatistik okuyan biri bunu galatasaray’ın doğru yolda olması olarak okuyabilir. sahada olan ise bambaşka bir şey söylüyor. benim canımı sıkan da işte bu noktada izleyicinin xg oranlarına bakıp bunu sanki galatasaray iyi oynuyor ya da oynayabilir diye yorumlaması. bu istatistiğe bakarak futbolun güzelliği veya doğrusu konuşulamaz. possession futbolumuz ve xg’nin henüz tamamlanmamış bir istatistik olmasından dolayı possession futbol oynayan takımların xg’si için tabiri caizse kıyak geçmesinden dolayı yüksek görünüyor. izleyicinin bakması gereken nokta galatasaray’ın takıntılı şekilde bu oyunu oynarken, buna asla uymayan şekilde sahaya konumlanması. bunu da başka başlık altında uzun uzun yazacağım.
şimdi tekrar xg, nsxg ve xt’nin sorunlarına. iki önemli hatası var, ilki temel fizikle açıklayabileceğim momentum. basketboldaki gibi iki takımın bir güç olarak ele alınabileceği oyun momentumunu da sayabilirsiniz elbette ama benim anlatacağım topum momentumu. xg’nin 4 temel aldığını söylemiştik ancak bunlardan hiçbiri topun hereketin ele almıyordu sadece pozisyon değişimini ele alıyor. biliyorsunuz beyzbol ve tenis gibi sporların puan kazanımının temelinde topun dönüş hareketi vardır. teniste bazen atak yapan oyuncu, a, defans yapan oyuncuya, b, birbirinin neredeyse aynı toplar atar. iki farklı noktaya, hep aynı şekilde. bunun amacı defans yapan oyuncunun o vuruşa alışıp kendini bir sonraki vuruşa aynı şekilde hazırlaması içindir. a, 4-5 vuruş sonrası yine aynı noktaya topu atarken bu sefer topun dönüş hızını değiştirecek şekilde vurur. defans yapan oyuncu b ise topu bir önceki pozisyondaki gibi vurmaya kalkarsa top ya fileye takılır ya da fazla yülselerek çıkar. dışarıdan bakan bir izleyici için topun hareketinde belki fark yoktur ancak tenisçi için sonuç bambaşkadır. üst düzey oyuncular rakibi çalışırken onların her bir hamlesini ve vuruşu tekniğini ezberleyerek çalışır. bu nedenle üst düzeyde bu atağı yapmak daha zordur.
beyzbolda topun dönüşü her şeydir dersek yanlış olmaz. futbolda da kullandığımız knuckleball beyzbolda da vardır. futbolda knuckleball şutun kontrolü zordur ve kontrol da etseniz topun gidiş şekli genelde tesadüfidir. beyzbolda ise birden farklı knuckleball atış vardır. bunu da topun dönüş hızını kontrol ederek yaparlar. bunun dışında slide veya change up gibi atışlar da vardır. change up topu gidiş ritmini değişmiş gibi görünmesini sağlayan bir top dönüş şeklidir.
futbolda ise bunların hiçbirine bakılmaz. bu nedenle pasın isabeti yeterli görünse de aslında topun momentumu şut çekecek oyuncunun alacağı sonucu etkileyen en önemli faktörlerdendir. rakibin ayağını sıyırarak gelen bir şuta vurmakla, iniesta’dan gelen bir topa direkt vurmak arasında dağlar kadar fark olur.
ikinci hatası ise stokastik model olarak aynı markov modeli gibi o anki durumu ele alırken ondan önce olan durumları göz ardı eder. stokastik bir model olarak önceki durumu ele almayarak aslında akışkan bir oyun olan futbolun direkt yapısına karşı geliyor. zaten bütün mesele de burada, futbol beyzbol değildir, akışkan bir oyundur. o nedenle ne kadar iyi istatistiki veri ele alsak da asıl olması gereken her zaman buildup play sırasında gerçekleşen milyarlarca olasılıklı durumlardır. ilk hatayı temel fizikle anlatmıştık, bunu da kuantum ile anlatabilirim ama o kadar derine girip kaybolmayalım:)
3 cümle yazıp çıkacaktım, yine saçma uzun bir yazı olmuş. kusura bakmayın, long post here is potato “0”