• 26
    geleceği tahmin etme disiplini olarak da ele alabileceğimiz istatistik biliminin bir parçası. siz elinizdeki data'yı ne kadar iyi işlerseniz o kadar optimizasyon yapabilirsiniz. bugün evrende her saniye oluşan yıldız sayısından bir insan vücudundaki hücrelerin mitoz bölünme sayılarına kadar istatistik kullanılıyor. yani kimse oturup saymıyor bunları.

    bu bilimin futbola izdüşümü olarak bugün kullanılan parametrelerden biridir gol beklentisi. takımlar artık boşu boşuna istatistikçiler ve bu işle uğraşan departmanlar kurmuyor. bizim takımımız xg'mizden az gol atıyorsa bitiricilik çalışması gerekiyor, xcg'niz yediğiniz golden azsa sizin defansif aksiyonlar çalışmanız gerekiyor.

    ferguson'un sözü bu tür istatistik biliminin ciddi parametreleri için değil gol sayısı asist sayısı gibi sayılabilir çoğunluklar için söylenmiştir. bir takım 100 gol atıp kupa kazanamıyorsa hatta avrupaya bile gidemiyorsa ne yapayım o kadar golü mesela.

    edit: bu gün istatistik biliminin b*klanmasının umarım galatasaray'ın gol beklentisi parametrelerinde ligin tepesinde olmasıyla bir alakası yoktur. bilimsel bir veriye karşı çıkmak nedir yani? bugün şampiyonlar ligindeki takımların %99'u rakibin bu parametrelerine göre hazırlık yapıyor. mesela psv bizim maça nerede eksiğimiz var onları bilerek çıktı çünkü istatistiklerimize göre hazırlanıyorlar, oturup 50 küsur maçımızı izlemiyorlar. avrupa ligi grubumuzdaki lazio, marsilya ve lokomotif moskova da bizim istatistiklerimizi kullanarak maça hazırlanacak.
  • 27
    bu istatistikler çok şey ama her şey değil.

    koşu mesafesi; bakıyorsun adam en çok koşan oyuncu ama saha içinde bir varlığını hissedememişsin. rakip topu aldığında dibinde bitmemiş, ani kontra ataklarda top sürmemiş. sadece gitmiş gelmiş kaçak dövüşmüş.

    isabetli pas; oyuncu hiç riske girmeden, sürekli geriye hatta muslera'ya oynarsa, tabii ki istatistik onu ön plana çıkaracak.
    ileriye isabetli pas desen, o da göreceli durum. ilerideki bomboş adama atılan düz pas ile, topun yönünü ve şiddetini ayarlaman gereken bir pas arasında çok fark var. zor pasları deneyen adamın istatistiği kötü, sadece daha kolay ve garanti pasları deneyen adamın istatistiği iyi. işte bu kısım hepimizi yanıltıyor.

    gol beklentisi; özellikle bunu merak ediyorum, neye göre gol beklentisi?
    sağ çaprazdan emre akbaba'nın çektiği şut bu istatistiğe giriyor mu mesela? çünkü topun kaleye gitmesi mucize olur.
    babel'in sol çaprazdan yürüyerek gelip, sağa çekip vurduğu şut gol beklentisi olarak sayılıyor mu? çünkü %99 rakibe çarparak kontra yememize sebep oluyor.
    ama hiç istatistiğe girmeyen, belki anlık atılamayan bir pas belki de büyük gol beklentisiydi. özetlere bile girmez ama ''ah be soldan bomboş gidiyordu, görse çok tehlikeli olurdu'' dediğimiz pozisyonlar da oluyor.

    modern futbolda istatistik çok önemli. bu verilere önem verilmesi elzem oldu.
    fakat benim düşüncem bu verileri kullanmak, takip etmekle beraber, her şey olmadığının bilincinde olmak gerekiyor.

    takım iyi mi oynuyor, kötü mü oynuyor? bunun en büyük ölçütü tribünlerdir, taraftardır.
    galatasaray'ın maçını iple çekiyor musun, maçı büyük bir heyecanla izliyor musun, maçın bitişi yaklaşınca hafif üzülüyor musun, maçtan sonra defalarca kez geniş özeti izliyor musun, muhteşem oynadığımız maçtan sonra rıdvan'ın yüzünü görmek istiyor musun, bütün spor programlarını tek tek izleyip hakkımızda ne demişler merak ediyor musun ????

    ama son 2 yıldır, ''maçı izlemesem de olur'' modundayım. kazanırsak gollere bakıyorum, kaybedersek dünya ile bağlantımı koparıyorum. keyif almıyorum. böyle bir durumda, istatistikler isabetli pas attığımızı, en çok pozisyona giren takım olduğumuzu, hava toplarını en çok kazanan takım olduğumuzu yazsa ne olur yazmasa ne olur.
  • 28
    bilimi de mi yok saymaya başlayacağız şimdi? hem de hagi'nin 35 metreden golünün ne kadar değerli ve zor bulunan bir şey olduğunu anlatan bir metriği bu olayla eleştirerek mi? bu oksimorondur arkadaşlar. yapı kendi içinde kendini çürütür.

    buradaki problem ise basit. tanımlara dair kafa karışıklıkları var. gördüğünüzle cümleleriniz uyuşmuyor. sonra gidip bunun sebebini metrikte arıyorsunuz. çok saçma. örnek vereyim takıma hala "geçen seneki gibi" pas takımı deniyor. evet takımımız az pas yapmıyor ama geçen senenin aksine dribling sayın 30'dan 45'e çıkmış (başarı oranın artarken ki düşmesini bekleyebilirsiniz) pas sayın bir önceki senenin %60 %65'ine falan düşmüş. bu tablo nasıl geçen yılla aynı olabilir. ama kafayı takmışsınız bir tane sese onu hep dışarı atmak istiyorsunuz. bu arada iki oyun da varlığıyla eleştirilecek şeyler değil. bunlar yöntemler ve bir yöntem değişimi var.

    ya da takımın baskı yapmadığına inanıyorsun ancak metrik öyle göstermiyor. hatta bunun verimini bile ölçebilirsin ancak sadece bir şeyin varlığı ve yokluğu üzerinden konuşalım. bir şeyi var olması eleştiremeyeceğin anlamına gelmiyor. ama yok dersen orada işler can sıkıcı hale gelmeye başlıyor.

    xg'de topun şuta dönüştüğü noktaların doğruluğuna dair bir datadır. çok basit bir datadır. o bölgeden çekilmiş şutlara bakarsın yüzde kaçı gol olduğu ise xg'yi verir. işe yarar ve basittir. buradaki teknisyenlik ve bilim insanlığı kısmı nerede? parametrelere bölme işlemi teknik kısmıyken bu çıkan verilerin mantıklı olup olmadığı ise istatistik biliminin işidir. sizin kafanızı karıştıran psxg datası. yani top şuta dönüştükten sonraki değişkenleri ele alır. şutun geliş yönü, savunmacıların ve kalecinin yeri, şutun gittiği yer gibi ekstra parametreler dahil olur. böylece topu ulaştırdığın yere doğru gitmiş misin, rakibinden kurtulabilmiş misin, iyi şut çekebilmiş misin buna dair tahminlerde bulunabileceğin bir datan olur. şu anki teknoloji ne kadar izin veriyor bilmiyorum ancak buradaki parametreleri sabitleyip diğer değişkenleri kontrol ettiğinde problemine ulaşman çok daha kolaylaşır.

    istatistik bir eleştiri unsuru değildir. size olanı, gerçeği anlatma aracıdır. siz gerçeği algıladığınız zaman (ki datayı ne kadar istatistiki olarak manalı şekilde geliştirirseniz o kadar iyi anlarsınız) daha düzgün eleştiriler, çözümler önerebilirsiniz. daha sonra bu öneriliniz de yine istatistikle aktarırsınız. göz testiniz önemsiz demeye çalışmıyorum. zira analizlerimizin sonucuna bir amaç koyan göz testiniz ya da daha doğrusu aklınız. kerem'in top kayıpları üzerine konuşmaya karar verdik diyelim. benim için kerem'in top kaybının yükseklüğü ve muadillerine olan farkı hiç önemli olmayabilir. zira ben kerem'in getirdiği yırtıcılığın maliyeti olarak bunu kabul etmişimdir. bir başkası ise tam tersi düşünüp kerem bu tok kayıplarını ağırlıklı nerelerde nasıl yaptığını kontrol eder ve bu senaryolardan onu uzak tutar ya da oyuncuyu değiştirir. istatistik sana bir durumu anlatır. eylemler yine sana kalmıştır.

    takımı özetlersek: takım topu doğru yerlere götürüyor ama şuta dönüştürdükten sonrası çok kötü. geçen yıla kıyasla daha topla harekete dayalı bir takıma dönüşüyor. rakibe baskı yapmaya çalışıyor (verimini konuşmuyorum). kat edilen mesafeler daha yüksek. sprint sayılarını ve top kayıp sayılarını hatırlamıyorum. biraz daha arttırabiliriz ama ben aradığınız sıkıntıyı söyleyeyim size. tempo arkadaşlar tempo. oyun hızlı oynanmıyor. galatasaray'ın 2 3 tane temel problemi var. bunlardan biri de oyunun hızı. oyunun hızı artırılırsa ki bu çalışmayla olacak sorunların önemli kısmı çözülür. siz de bir anda bak daha fazla dribling yapıyoruz dersiniz. hayır! zaten daha fazla dribling yapıyorsun. ama bu daha çok etkili, daha göze çarpar hale gelecek.

    edit: şunu söylemeyi unutmuşum. futbol bağımsız değişkenlerin çok etki ettiği bir spor. bu sebepten bir basket maçının istatistik kağıdına baktığınızda kafanızda maçı hemen hemen oturtabilirsiniz. zira basketbol bağımlı değişkenlerin fazla olduğu bir spordur. bu sebepten istatistiğe rağmen futbolda "tuhaf" sonuçlar çıkabilir. bundan data sayısını arttırdığınız uzaklaşabilirsiniz (muhtemelen de tam kurtulamazsınız). ancak optimizasyonla alakalı bir işe yaparken temele odaklanmak zorundasınız. istisnai sonuçlara değil çoğunlukla olan basit ve belki sıkıcı olaylara göre işlem yapmanız gerekir.

    edit 2: şu amme hizmetini de yapayım. duran topların devamında gelen hücum beraber sayılıyor. bu da penaltıda problem yaratıyor. kurtarılan penaltı sonrası şutlarda yöntem farklı. mantık ve istatistik derslerini hatırlayın. bir birine bağlı olaylarda biz ihtimalleri çarparız değil mi? buradaki mantık şu. p = penaltının gole dönüşmesi olsun. q = penaltı dönüşü vurulan şutun gol olma ihtimali olsun. bu ikisinin de tersini yani değilini düşünün. yani iki şutun da gol olmama ihtimallerini ele alıyoruz. bir birine bağımlı olduğu için yani p'nin değili "ve"q'nun değili olabilmesinn ihtimalini buluyoruz. dikkat ederseniz şuan kesinlikle gol yok. biz golün ihtimalini aradığımız için metrik bu çıkan sayıyı 1'den çıkartıyor. işte size penaltı ve penaltı sonrası şutun xg'ye etkisi.
  • 29
    xg yüksek diye takımı beğenirsin, önemli olan gol derler.

    gol attı diye takımı beğenirsin, önemli olan güzel oyun derler.

    takım güzel oynadı dersin, önemli olan skor derler.

    skoru alırsın, düşük xg ile takım şansa kazanıyor derler.

    xg yüksek diye takımı beğinirsin, ...

    xg hakkında böyle bir kısır döngüye sahip sosyal medyada insanlara bir şey anlatmaya çalışan galatasaray sözlük yazarlarını sabırlarından ve inançlarından dolayı tebrik ediyorum. aslında bomşoş yazılar yazıp, sinir uçları ile oynayarak, tamamen kendi kafalarındaki hayallere göre girdi girmek daha kolay.
  • 30
    xg epey basit bir model ve bircok eksigi var. ancak bir yerden baslamak gerekiyor. tahminimce onumuzdeki birkac yil icerisinde istatistik ve makine ogrenmesinin futbolun icerisindeki yeri giderek artacak ve daha gelismis metrikler ve analizler ortaya cikacak. cunku milyar eurolarin dondugu bir endustride bilinemezligi ne kadar azaltip ne kadar iyi olcum yaparsaniz riski o kadar azaltmis oluyorsunuz. "olcemediginiz seyi gelistiremezsiniz" kisacasi.

    xg'nin eksiklerini duzeltmeye calisan alternatif yeni metrikleri merak edenlere ise tehdit beklentisine (expected threat) goz atmalarini oneririm. takip ettigim kadariyla turkiye'de ilk kez bülent kalafat dile getirmisti, gecenlerde de dunyanin muhtemelen bir numarali spor icerik ureticisi the athletic'te bu konuyla ilgili bir yazi yayinlandi.
  • 33
    son derece mühim bir gösterge. örneğin bir takım bir maçı yarısı çerçeveyi bulan 10 şut ile tamamlayabilir. bunlar dar açıdan, ceza sahası dışından şutlar ise xg değeri düşük olacaktır. kalecinin kucağına giden cılız şutlar yine aynı takımın rakip kaleyi abluka altına aldığı anlamına gelmez. 5 isabetli şut 2 xg'ye karşılık gelebilir.

    eğer yekta kurtuluş penaltısı tarzında şutlar atıyorsanız 3 xg'den 1 gol, gomis ya da ilk dönem muhammed gibi gol vuruşlarınız varsa 0.6-0.7 xg'den 1 gol çıkarırsınız.
  • 35
    sezon maç gol ort.
    1959-59 114 264 2,31
    1959-60 380 929 2,44
    1960-61 380 850 2,23
    1961-62 380 857 2,25
    1962-63 352 937 2,66
    1963-64 306 691 2,06
    1964-65 240 516 2,15
    1965-66 240 545 2,27
    1966-67 272 549 2,02
    1967-68 272 602 2,21
    1968-69 240 471 1,96
    1969-70 240 419 1,74
    1970-71 240 445 1,85
    1971-72 240 464 1,93
    1972-73 240 449 1,87
    1973-74 240 405 1,68
    1974-75 240 442 1,84
    1975-76 240 479 1,99
    1976-77 240 442 1,84
    1977-78 240 474 1,97
    1978-79 240 486 2,02
    1979-80 240 422 1,75
    1980-81 240 466 1,94
    1981-82 272 490 1,80
    1982-83 306 636 2,08
    1983-84 306 633 2,06
    1984-85 306 686 2,24
    1985-86 342 808 2,36
    1986-87 342 776 2,26
    1987-88 380 1032 2,71
    1988-89 342 985 2,88
    1989-90 306 819 2,67
    1990-91 240 672 2,80
    1991-92 240 677 2,82
    1992-93 240 716 2,98
    1993-94 240 700 2,91
    1994-95 306 945 3,08
    1995-96 306 873 2,85
    1996-97 306 878 2,86
    1997-98 306 861 2,81
    1998-99 306 875 2,85
    1999-00 306 878 2,86
    2000-01 306 1017 3,32
    2001-02 306 910 2,97
    2002-03 306 853 2,78
    2003-04 306 908 2,96
    2004-05 306 901 2,94
    2005-06 306 849 2,77
    2006-07 306 736 2,40
    2007-08 306 784 2,56
    2008-09 306 787 2,57
    2009-10 276 666 2,41
    2010-11 306 838 2,73
    2011-12 330 860 2,60
    2012-13 306 817 2,66
    2013-14 306 806 2,63
    2014-15 306 873 2,85
    2015-16 306 827 2,70
    2016-17 306 828 2,70
    2017-18 306 906 2,96
    2018-19 306 821 2,68
    2019-20 306 875 2,85
    2020-21 400 1136 2,84 genel ort. 2,46

    bu veriler ligimize ait. diğer liglerde de benzer bir ortalama bulunabilir. ülkelerin futbol anlayışlarına göre bazılarının gol ortalamaları daha yüksek, bazılarının daha düşük olacaktır ama son kertede tüm futbol maçlarının gol ortalamasında bulacağınız sayı, muhtemelen 3'e daha yakın, 2 ve 3 arasında bir sayı olacaktır. (zaten futbol bahis dünyasında en fazla tercih edilen bahsin 2,5 gol alt-üst olmasının istatistiksel nedeni budur.) bu ortalamanın önemi, yazının ilerleyen bölümlerinde ortaya koyulacak sevgili romalılar.

    expg ya da xg, ecnebilerin expected goals adını verdiği çeşitli parametreler kullanılarak oluşturulan ve gol beklentisini gösteren verinin kısaltılmış hali. özellikle teknik direktörlerin kullanması ve gerekli çıkarımları yapması gereken değerli bir veri. ama futbol, bu tür verilerin en az geçerli olduğu takım sporudur. çünkü futbol, doğası gereği, hawking'in uğraştığı ve başaramadığı theory of everything (her şeyin teorisi) gibi bir teori talep eder. şöyle örneklendirelim: kendi sahasında topla buluşan bir orta saha oyuncusu, sağ kanattan fırlayan ve önü açık olan beke pas versin. ve bu pas, açısı, şiddeti, topun havadan ya da yerden gitmesi vs. gibi sebeplerden biri ya da birkaçı yüzünden, hızlanan ve momentumu artan bekin bir adım gerisine düşsün. istatistiklerde bu başarılı bir pas olarak görünecektir. ancak, bir adım gerisine düşen top nedeniyle hızını yavaşlatmak zorunda kalan ve momentumu düşen bek, önü artık kapalı olduğu için topu geriye oynamak zorunda kalacak. maçı izleyen bizler, verilen pas bekin gerisine değil de, bir adım önüne olsa, o çok değerli 2 saniyenin harcanmayacağını ve takımımızın olası bir golden olduğunu görürüz. ve tüm bu olaylar atak yapan takımın kendi yarı sahasında yaşansın. benzer milyonlarca örnek verilebilir. ve bu örneklerin verileri toplanamaz. herhangi bir şut olmadığı için, xg de bunu ölçemez.

    diğer takım sporlarında ortalama goal (yani hedef, skor) sayıları çok yüksek olduğu için, istatistiksel veriler çok daha fazla şey ifade eder. çünkü bir maçta yüzlerce skor ve yine yüzlerce şut pozisyonu olur. söz gelimi, bir basketbolcunun serbest atış çizgisindeki ya da 3 sayılık şut başarı istatistiği net olarak ortadadır. çünkü bir basketbolcunun kariyerinde onbinlerce şut istatistiği vardır ve bir maçta atacağı serbest atış oranı gerçek değerine çok yakın olacak şekilde öngörülebilir. bir parayı 10 kez havaya atın. 8t 2y, 4t 6y, 7t 3y gelebilir. ama örneklem kümesini yükseltirseniz, yani parayı 2000 kez havaya atarsanız, 1000t 1000y sonucuna çok yakın veriler toplarsınız. futboldaki gol ortalama sayısına geri dönelim: 2 ve 3 arası sihirli bir sayı. yani goal, futbolda diğer takım sporlarına göre öldürücü önemde. diğer sporlara nazaran çok nadir (şut ve pozisyon sayısı da) ve oluşması için 20 öncesi pasın kalitesinin bile etkisi diğer takım sporlarına göre çok fazla.

    ayrıca xg aritmetik toplamayla oluşturulan bir veri. hayali bir atletico madrid-real madrid maçı düşünelim. real maç boyu 14 şut çekmiş olsun. bu 14 şutun xg değerleri toplamı 2,3 olsun. ama maçı izleyen bizler atletico'nun maç boyu çok iyi defans yaptığını ve ral'in zorlama şutlar dışında etkili ataklar geliştiremediğini gördük. maç boyu rakip yarı sahada boş alan bulamamış, taraftarlarını heyecanladıracak pozisyonlara girememiş ve maçı 2-0 kaybetmiş bir real madrid. ama xg:2,3!

    inanın futbolun doğasına dair çok daha fazla örnek verilebilir. xg değerli bir veri. tekrar ediyorum, teknik direktörler tarafından üzerinde çalışılması ve değerlendirilmesi önemli. ama futbolun diğer takım sporlarının yanına asla yaklaşamayacağı kadar çok değişkenleri var ve bu ölçüm denemeleri tüm iyi niyetlerine rağmen, eşyanın doğası gereği yetersiz.

    bu konunun son zamanlarda sözlüğümüzde sık dillendirilmesinin sebebinin, fatih terim'i her daim savunma refleksine sahip yazarlar olduğunu düşünüyorum. (bkz: fenerbahçe kırmak üzereyken tanımlanan rekorlar) örneğindeki fenerlilerin psikolojisine ve refleksine sahip yazarlar var aramızda. çünkü futbolumuza dair bir çok şey kötü gidiyor, fatih terim daha yüksek sesle eleştiriliyor. bu yüzden bulabildikleri her fatih terim'i aklayacak bilgi parçacığına bile dört elle sarılıyorlar. bir zahmet, misliyle fazla para harcadığın, yine misliyle fazla medya ve hakem desteğine sahip olduğun bu leş ligin takımlarına karşı xg değerin yüksek olsun. ama avrupa kupalarında az biraz vasat üstü takımlara karşı xg verisi üretecek bir şey bile yapamıyoruz.

    ama ''biz aslında iyi oynuyoruz, şu kadar xg'miz var'' diyebilirsiniz. valla gülmem.
  • 36
    xg hakkindaki dü$üncelerim daha önce de söyledigim gibi açik ve nettir:

    xg'ye inanma, xg'siz de kalma. xg de topa sahip olma orani vs. gibi bir parametredir. tabii ki bilimi hiçe sayamayiz. ancak xg'si yüksek olan takim illaki $ampiyon olacak diye bir kaide yok. hagi örnegi verildi (mütemadiyen uzaklardan gol vuru$lari yapmasi) veya kale agzinda içeri sokulamayan toplar (fi tarihdeki yasin, umut örnekleri).

    tekrar ifade edelim. xg önemlidir, ancak her $ey degildir.

    yakin tarih'den örnek örnek (süperlig 2021/22 sezonu 3. hafta sonu):
    altay (xg 7.18) 0-2 fenerbahçe (xg 3.92)
    kasimpa$a (xg 3.23) 2-2 galatasaray (xg 7.54)

    altay yüksek bir oranla evinde maglub oluyor, gs ise deplasmanda ligin 3. haftasi itibari ile en yüksek xg oraniyla berabere kaliyor.

    dedigim gibi, bazi maçlar olur, fark atman gereken yerde saçmasapan bireysel bir hata ile galibiyeti kaçirirsin, hatta maglup bile olabilirsin.

    xg de bir çogu gibi bir parametredir ancak xg üzerinden her $eyi açiklayamazsin. xg'si çok olana 3 puan vermiyorlar. 3 xg bir penalti sayilmiyor. pozisyona gireceksin ve atacaksin karde$im. gol atmak için 10 tane pozisyona girmene gerek yok.

    futbolda geçerli olan tek kural gol atmaktir. gol ise de +/- averajla ölçülür. bu demektir ki, hem atacaksin, hem yemeyeceksin.

    yok öyle en yüksek xg oranina sahip olup aptal aptal bireysel hatalarla 2 puandan* olmak.

    daha dün* dünyalari kaçirip son dakika golü ile 2 puan biraktik.

    öte yandan yine milli takim üzerinden gidecek olursak türkiye'nin dünya kupasi elemerlinde 4.38'lik xg orani ile 10 gol(u: https://www.goal.com/...e3dyl61r7bshwywrrv2) attigini görüyoruz. türkiye'de hagi, oynuyordu da, sneijder oynuyordu da, benim mi haberim yoktu?

    xg'ye inanma, xg'siz de kalma.

    son olarak, gol gol, ne olursan ol, yine gol!
  • 39
    bir pozisyonun gol ile sonuçlanıp sonuçlanmama olasılığını gösteren istatistik.

    istatistikten çok anlamam.

    üniversite'de bile vizeden sonra finale 3 gün günlük 2 saatlik uyku ile sabahlayıp ancak geçebilmiştim dersinden. *

    ancak bir bilim olarak saygı duyuyorum, duymalıyım. hepimiz de aynı saygıyı göstermeliyiz. nedenine gelecek olursam eğer;

    bir istatistiği gerçek ve doğru sonucuna ulaştırmak için verilen emek, toplanan data, bu datanın doğru işlenmesi emin olun dünyanın en zor işlerinden birisi.

    neyse anladığımı düşündüğüm; kendimi geliştirmek için kitaplarını okuduğum, videolar izlediğim, dökümanlar incelediğim konuya gelelim bunu geçtikten sonra: futbol.

    düşünün hepimiz bir üniversitede birlikte okuyoruz, bir amfi salondayız. aldığımız ders futbol 101, futbola giriş. dönemin ilk dersindeyiz.
    gelen öğretim görevlisinin ilk söyleyeceği şey şu cümledir: futbol 11 kişilik 2 takımın olduğu, takımların birbirinini kalesine gol atarak üstün gelmeye çalıştığı bir spordur.

    yani futbol 101 dersinde ilk öğrendiğimiz şey: futbolun amacının gol atmak olduğudur.

    peki bu konu ne alaka, xg ne alaka diyecek arkadaşlarla devam edelim:

    xg bize gole ne kadar yaklaştığımızı gösterir. şut başına xg oranı pozisyonun kalitesini, gole yaklaştığımızı - yaklaşmadığımızı, şut atma becerimizi ve daha bir çok verimizi bize verecektir. bunu çalışmadan, incelemeden, analiz etmeden başarıya ulaşabilmek pek de kolay bir sonuç olmayacaktır.

    bir takım düşünelim, sözlük fc. bu takımın forvetinde de pivot santrfor oynuyor olsun (başka kimse olmazdı bizim sözlükten zaten *). bakıyoruz xg istatistiğine, takım 3 xg üretsin maç başı. biz maçları 3-4-5 gol civarı bitiriyorsak, pivot santrfor iyi bir bitirici diyebiliriz. ama aynı xg'de 1-2 gol buluyorsak pivot santrfor bitiricilik çalışmalıdır, daha iyi şut atmalıdır. böylece oyun gelişmeli ve daha iyi bir takım elde edebiliriz.

    istatistik (xg de dahil herhangi birisi de dahil) size asla ama asla bir takımın nasıl oynadığını doğru parametreleri ile göstermez. gösteremez. sadece bir istatistiğe bakarak "off takım uçuyor kaçıyor" da denmez, "bu takımdan bi yol olmaz" da denmez. denilirse o zaman istatistik bilimine ihanet etmiş oluruz.

    ancak bir takımın sahada yapması gereken her şeyi istatistik + video analizlerle birleştirirsen ve bunlara uygun doğru antrenman metotları kurarsan o zaman işte bir şeyler değişir. ki benim "modern futbol" dediğimde aslında anlatmak istediğim kavram bu. halen 80'ler 90'lar gibi belli başlı antrenman düzenleri geride kalmıştır. her takım eksiğine çalışarak "nasıl daha iyi olabiliriz" sorusunun cevabını bulmalıdır.

    yani istatistik, takım bazında gelişimin önemli kilit noktalarından birisidir. neyi eksik yaptığınızı salt maçı izleyerek göremezsiniz, en bilemedin oyuncu başına top kaybının sayısını tutarsın ki bu bile bir istatistiktir. xg de size atılan şutu gösteren istatistiktir, takımın attığı şutları sayıp hangi bölgeden kaç gol attığının sayısını tutarsan sen de evde kendi xg'ni yapabilirsin aslında. büyük veri şirketlerinden (opta - wyscout vb.) data aldığında da sana dünya çapında database'lerinde olan aynı noktadan atılan şutların gol olma / olmama olasılığını verir. yani babel'e gidip "35'ten attığın şutun bizdeki dataya göre gol olma olasılığı yok, buradan şut atma" uyarısını yapabilirsin. ya da cicaldau'nun gol pozisyonlarının xg'sine bakıp "bu adamı daha ceza sahası çevresi ve içinde kullanmamız lazım 8 olursa uzak kalıyor kaleye" diyebilirsin.

    şunu da eklemeyi bir borç bilirim, salt bu istatistiğe bakarak "takım uçuyor kaçıyor" denilmez. diyeni de görmedim açıkçası, sadece "takım pozisyon bulma sorununu bitirdi, pozisyon buluyoruz. şimdi bu pozisyonları gole çevirmeyi çözmek lazım" diyoruz, ben de öyle diyorum. yani şut kalitesi artmalı, yani şut çalışmalıyız, yani bitiricilik önemli.

    takımın uçup kaçmadığını bilmek için matematik dehası, taktik uzmanı olmaya gerek yok. açıp premier lig'den bir maç izliyoruz bizim maçtan önce, bizim maça dönünce ağlamaklı oluyoruz. bu kadar basit oynadığımız futbolun yeterli olmadığını görmek için. ancak nerede hata yaptığını istatistik + video analiz olmadan bulamazsın, bunlara çalışmadıkça da oyununu düzeltmezsin.

    modern futbol diye direttiğim (en azından benim) dalga bunun ta kendisidir.

    futbol 101 diye girdik, futbol 302 falan bitirdik galiba ama, neyse. *

    edit: eklemeyi unutmuşum az da gülelim ya. * https://pbs.twimg.com/media/EVT-YaEXYAAfCHZ.jpg
  • 40
    yeni yeni literatüre giren ve bence oldukça önemli bir istatistik türü. yıllar içerisinde puanlama modelleri iyice oturacak ve değeri daha da anlaşılacaktır. çok tartışılan bir örnek olduğu için dile getiriyorum. hagi’nin uzak mesafeden attığı gollerin xg’sinin düşük olması aslında hagi’nin ne kadar büyük oyuncu olduğunu gösterir. bu hagi’nin leblebi gibi gol attığı gerçeğini değiştirmediği gibi bunun aslında ne kadar zor ve değerli bir şey olduğunu bize anlatıyor. zaten düşük xg ve yüksek gol oyuncularınızın bireysel yetenekleri ile gol bulduğunuzun da bir göstergesi olduğundan istatistiki veri de amacına ulaşmış oluyor. dediğim gibi modelleme sistemi zaman içerisinde oturduğunda muazzam bir veri elde etmiş olacağız ve bu durum belki de izlediğimiz futbolun çehresini tamamen değiştirecek.
  • 41
    şutu çeken futbolcunun meziyetlerinden, çekilen şutun kalitesinden, kalecinin veya defansın kalitesinden, en önemlisi de defansın hazırlıksız yakalanıp yakalanmamasından bağımsız olarak, şutun çekilmiş olduğu konumdan çekilen şutların golle sonuçlanabilme ihtimalini gösteren istatiatiki bir değerdir. her istatistik gibi 3-4 maçlık örneklemde anlamlı olmayıp, 40 maçlık bir sezonda takımın pozisyona girip girmediği konusunda daha anlamlı sonuçlar verecektir.

    ancak pozisyona girmek iyi bir futbol mudur? bence problem burada başlıyor. evet, futbol bir fırsat oyunu ve yeterli fırsatı yakalayabiliyorsan "iyi oynadım" diyebilirsin. en azından sonuç odaklı baktığın zaman bu doğru bir önerme olabilir. ancak futbol bir eğlence aracı ve sadece sonuç değil, sonuca nasıl gittiğin de önemli. net bir örnek değil ancak anlatmak istediğimi anlatmakta yardımcı olabilir: 80 dk. boyunca hiçbir aksiyonun olmadığı bir oyunda son 10 dk. üstüste 5-6 net gol fırsatı yakalayabilirsiniz ve bu 10 dk. boyunca gerçekten iyi oynamışsınızdır, ancak 80 dk. boyunca seyirciye hiçbir şey vaadedemiyorsanız seyirciyi kaybedersiniz. sonucu almış veya alamamış olmanızdan bağımsız olarak, futbol izleyicisi sizi izlerken kısa bir süre hariç sıkıldığı hissine kapılıyorsa burada iyi bir oyundan söz edilmemeli.

    buradan galatasaray'a bağlayabiliriz. evet, pozisyona girebiliyoruz ancak pozisyona girmediğimiz zamanlarda ne kadar aksiyon veya heyecan yaşatabiliyoruz. tempolu bir oyunumuz yok, sadece sonuç odaklıyız. katı bir savunma futbolu kadar olmasa da sonuç odaklıyız ve topu vermezsem gol yemem anlayışıyla daha risksiz olduğunu düşündüğümüz bir oyun oynuyoruz. kontrataklarda yaşadığımız problem de bu oyunun daha az riskli olup olmadığı konusunda bir soru işareti oluşturuyor. maç içerisinde bölüm-bölüm oyunu hızlandırıp gol atmayı amaçlıyoruz ama bu bölümler genel anlamda yetersiz. daha düşük tempoda oynayıp topu kaptığımızda ani atağa çıkıp rakibi düzensiz yakalamak yerine topu kaptırma riskini almayarak topu tutup rakibin geri dönmesine müsaade ediyoruz. burada da xg açısından fatal olmasa da bir error oluşuyor. bizim xg yarattığımız pozisyonlarda savunmaya yerleşmiş takımın defans hattının arasında görece küçük boşluklar yaratarak o boşluklardan şut çekerken rakip takımlar bizim kalemize ani ataklarla 3'e 3 veya 4'e 4 gelerek çok büyük boşluklardan çok daha rahat şut pozisyonları buluyorlar. misal bizim çektiğimiz şut 4 savunma oyuncusunun arasından gol olmak zorundayken rakibimizin birebir aynı yerden çektiği şut en fazla iki savunma oyuncumuzun arasından atılıyor. xg değeri aynı da olsa daha az baskı altında yapılan vuruş daha kontrollü ve gol ihtimali daha yüksek olan vuruş oluyor.

    sonuç olarak rakiplerimizden daha fazla pozisyona girip ve xg üretmiş olabiliyoruz ancak hem dar alandan yapılan vuruşların kalitesi çok daha düşük oluyor hem de pozisyon bulamadığımız zamanlarda coşkulu olmayan hücumlarımız yüzünden izlemesi hayli zor oluyor. son oynadığımız randers maçının ikinci yarısı ve kasımpaşa maçının ilk yarısında çok daha coşkulu ve hızlı bir oyun oynadık, rakip savunmanın düzenini bu şekilde bozabildik. bunu şahsen bir istisna değil, ilerleme olarak düşünmek istiyorum. umarım bu oyunumuzu 90 dakikaya yayabildiğimiz maçlar izleyebiliriz.
  • 42
    2020-2021 sezonunu la lig şampiyonu olarak bitiren atletico madrid, bu istatistikte beşinci olmuş. sezonu real madrid’in beş puan gerisinde bitiren barcelona, xg’de fark atmış real madrid’e.

    biz de sezon başlayalı, üç hafta olmuş. beşiktaş ve fener henüz gol yememiş. xg’de lideriz diye övünüyoruz. kendi evinde zayıf hatay karşısında ikinci dakikada gol yersen, xg zaten yüksek olur.
  • 43
    insanların nedir ne değildir araştırmadan hakkında fikir yürüttükleri istatistik. iddianın galibiyet oranları gibi zannedenler bile var anladığım kadarıyla. ancak bu xg öyle bir şey değil. yaptığınız vuruşun gol olarak değeridir. hani ortaokulda falan çok olurdu maç berabere bitmiştir biri der ki bizim şu şu pozisyon var gol olsa yenmiştik öbürü der bimem kim kafayı vurabilseydi biz almıştık falan. işte xg bu pozisyonların gol değerlerine bakar. yani daha önce bu pozisyonların 100 tanesinden kaç tanesi gol olmuş? 3 tanesi mi? o zaman o pozisyon 0,03 gol değerindedir. 20 tanesi mi gol olmuş? o zaman 0,2 gol değerindedir. yani kim maçta gol atmaya daha çok yaklaşmış, daha gerçekçi gol tehlikeleri üretmiş onun veriyor elimize. aynı zamanda kim daha iyi bitirici kim hiç pozisyona giremezken şapkadan tavşan çıkartmış bunu gösteriyor. olayın iyi oynamak kötü oynamakla pek bir alakası yok. girilen pozisyonun kalitesi ile alakası var tamamen. bunların gol değerlerinin toplamı tam olarak.

    galatasaray ligin en çok xg üreten ve en çok pozisyona giren takımı olduğu ortaya çıkınca şu istatistiğe de saçma sapan sallanıyor ya yuh diyorum cidden. adamlar 300.000 civarında şutu incelemişler ortaya bilimsel bir şey koymuşlar ama hatalı nesnel bilgiler girip çürütmeye çalışanlar var. sebep? galatasaray kaleye gidemiyor tezlerini çürütüyormuş...
  • 44
    ben kendisinden razıyım.
    futbol skor bakımından kısır olduğu için istatikler için sıkıntılı bir spor dalı.
    xg burada yeni bir metrik olarak sunuldu. yani buna metrik olarak bakmak lazım, birkaç konuda size fikir sağlar, her şeyin cevabını beklerseniz yanılırsınız.

    xg, xga, xa vs bunlar oyunu yorumlamanızı sağlıyor. bak xg en yüksek biziz, en iyi biz oynuyoruz denemez. formülasyona bakarsanız sıkıntılar vardır ki sabit durmuyor bu zaten işle uğraşan şirketler daha sağlıklı sonuçlar için devamlı geliştirme yapıyorlar.

    şu örnek çok güzel bence; https://youtu.be/O1og2U9NQCk https://fbref.com/...als-model-explained/" class="title">*

    bu gole sadece şut olarak bakarsanız yüksek çıkar, şut anında rakip pozisyonlarına bakarsanız daha da yüksek çıkar. ama pozisyon gelişimi olarak bakarsanız xg düşer. adamlar da bunları geliştirmeye çalışıyorlar, emek var. daha da iyi noktalara gelecektir.
  • 45
    defanstan çıkarken gol yediğiniz, aynı hatalarla peş peşe goller yediğiniz, kale ağzında ve ceza sahasında birçok defa kötü tercihler yaptığınız, daha boşa kaçanları göremediğiniz sürece anlamı kalmayan istatistik. bir zahmet hatay, giresun, randers, kasımpaşa gibi takımlara karşı xg üstünlüğünü vermeyelim bari. 25 milyon yatırım alan, daha öncesinde 40 küsür tranafer gören takımız. fatih hoca'yı galatasaray'ı pozisyona sokuyor diye övecek değilim, beklentilerimi düşürmek istemiyorum şimdilik.
  • 46
    ya eski kafayla düşünüyorum, mantığıma oturtamadığım şeyler var; ya da bayağı salak durumdayım ki hala anlayamadım.

    abi beklentinin istatistiği olur mu? diyorsunuz ki o pozisyonun xg'si sıfır virgül şu, bilmem ne. yani bunu hesaplayan cihaz, makine, neye göre hesaplıyor? pozisyonun netlik değerini gösterir objektif bir değerlendirici var mıdır? mesela auta giden topu hesaplarsınız, kale çizgisini geçen ve atak yapan takımdan çıkan her top auttur. ancak gol beklentisi gibi göreceli bir şey nasıl istatistik olarak değerlendiriliyor? veya bu göreli sözümona istatistiğin beklenti sınırlarına dahil olan şeyin karar vericisi, ya da kıstası nedir? hagi kaleye 40 metre mesafedeydi, topa vuruşu, ayaktan çıkışı, filelerle kavuşması topu topu 1.5-2 saniye falan. bu da gol beklentisine dahil midir? aynı yerlerden çekilen şutlara bakılıyor diyorsunuz, o mesafeden çekilen şutun daha önce tekrar olma ihtimali sizce kaçtır?

    ya da diyelim iki forvet oyuncusu kaleciyle karşı karşıya, biri yanındakine pas verdi, kale bomboş. ancak ayağında eveledi, geveledi, şutu çekemeden rakip savunma araya girdi uzaklaştırdı, ya da ayağından açtı. sonuç olarak gol yok. şut çekilmediği için xg değerine dahil olmuyor mu bu?

    net gol pozisyonu, %100'lük gol pozisyonu gibi spiker uydurmaları laflar da zaten öznel şeylerdir, bunları da örnek olarak kabul edemeyiz. kanıtlanırlığı ve somut neticesi olan şeyler değil bunlar. hava bugün çok güzel demekle aynı şey. o da öznel bir şeydir. ama hava 28 santigrat derecedir dersen, işte bu nesnel bilgidir.

    sana göre net, bana göre net değil mesela bahsedilen pozisyon?
  • 47
    maçlarda xg veya türevi verilerin toplam değil de ortalama olarak da verilmesi, bir takımın hücum gücü ve bitiricilik becerileri konusunda daha doğru bir değerlendirme yaratacaktır. yani kapalı bir defansa karşı cezayayı önünden çekeceğin 20 şut'un her biri 0.3 xg olsa toplam 6 xg yaratacak. ancak aynı takıma karşı 0.6 xg'li 10 pozisyon yaratan takım benim için daha değerlidir. 0.2'yi gole çevirmek 0.6'yı gole çevirmekten daha yüksek bir bireysel yetenek ister. tabi kaç atakta bu ortalama oluştuğu verisi ile birlikte. yoksa 0.50 xg'li bir atak bize tam bir veri vermez...
  • 48
    niye hakkında meşruiyetini sorgulayıcı tartışmaların döndüğünü anlamadığım üzerine tezler ve makaleler yazılmış, dolayısıyla bilimselliği yıllar öncesinde kanıtlanmış bir metriktir. "expected goal (gol beklentisi)" adı ile literatürde bilinen bu metrik öyle bir metriktir ki özünde "bir takım tarafından yaratılan gol girişimlerinin kalitesini nasıl kantitatif (nümerik - sayısal) hale getirebiliriz?" sorusuna cevap arar. bunu da "gol fırsatı yaratan bir şutun değerini nasıl ölçebiliriz?" şeklindeki bir alt sorudan elde etmeye çalışır. bu noktada şutu çeken oyuncunun performansının da göz önünde bulundurulduğu açıktır. dolayısıyla a oyuncunun çektiği şutun yarattığı sayısal değer ile b oyuncununkinin bir olmayacağı bellidir. hatta a oyuncusunun x maçındaki şutu ile y maçındaki şutunun da değerinin aynı olmayacağı çıkarımında bulunulabilir.

    yapılan çalışmalar göstermiştir ki; bir takımın bulduğu gol dağılımı poisson dağılımına uymaktadır. bu öncül bilgi ile yapılan çalışmada binary olarak (gol oldu veya olmadı - 1 veya 0) target değişken; lojistik regresyon, karar ağaçları, rassal orman ve ada boost yöntemleri ile tahmin edilmiştir. bu modellerden elde edilen veriler auc performans metriği sayesinde olasılıksal olarak karşılaştırılmıştır. yazarlar bu aşamada da kalmayıp literatürde var olan platt kalibrasyonu ve izotonik regresyon yöntemlerini kullanarak fiili olasılıklar ile kalibre edilmiş olasılıklar (kalibre edilmiş modellerden elde edilen sonuçlar) arasındaki farkı gözlemlemiştir. bu verileri güven aralıkları ile destekleyerek bulgularına ulaşmışlardır.

    koca tezi açıklayarak uzatmak istemiyorum ama son olarak sonuçlarından bahsedeyim. yapılan bu çalışmanın amacı aslında takımların gol beklentisi üzerinden ev sahibi kazanır, berabere biter veya deplasman takımı kazanır şeklindeki tahmini yapmak. kalibrasyondan sonra elde edilen sonuçlar gayet tatmin edici olmuş olmalı çünkü f1-score yukarıda saydığım modellerin hepsinde %70-75 bandında çıkmış. ancak modellerin gol beklentisi istatistiğinin beraberliği işaret ettiği maçlarda genellikle yanıldığı ve bu tip maçlarında çoğunlukla bir tarafın tek fark ile kazandığı zorlu maçlar olduğu açıklanmış.

    bu konuyla ilgili o kadar çok çalışma var ki aklınız çıkar. çok basit bir literatür araştırmasından sonra birçok çalışmanın atıfta bulunduğu görece daha eski bir çalışmaya giderek bu bilgileri öğrendim. ilgili çalışmanın da başlığı şu: "expected goals in soccer: explaining match results using predictive analytics". eindhoven teknoloji üniversitesi'nde bir öğrencinin 2016 yılında yaptığı master tezi. buna benzer bir çalışmayı günümüzde ben yapacak olsaydım bir kere daha fazla sınıflandırıcı kullanırdım. xgboost ve lightgbm gibi modelleri de kesinlikle dikkate alırdım. optuna gibi kütüphaneler ile parametre optimizasyonu yaparak en ideal skora ulaşmaya çalışırdım ve en sonunda da ensemble modelling yaparak modelleri kombinlerdim. ayrıca sınıflandırma yaparken kullandıklarını ifade ettikleri kalecinin ve şutu çeken oyuncunun performansı gibi faktörlerin yanına hava durumu, maçın yapıldığı zeminin durumu gibi çeşitli featurelar da ekleyip çalışmayı daha anlamlı kılmaya çalışırdım. bunlar benim ilk anda aklıma gelen geliştirmeler olurdu. mutlaka 2016 yılından bu yana daha başarılı modeller de ortaya konulmuştur. merak eden araştırabilir. benim bu entryi yazmamdaki amaç akıllardaki bulutları biraz olsun dağıtmak ve anlamsız şüphelerin önüne geçmekti.
  • 49
    ben de bir katkı yapayım. xg istatistiği ölçülürken kullanılan modellerin ne olduğunu bilmiyorum ama istatistikten daha doğrusu ekonometri’den anlarım. yüksek lisans tezimde enflasyon belirsizliğini ölçmüştüm. dolayısıyla literatürde beklentiyi ve hatta belirsizliği ölçebilen modellemeler var. benim katkım, hiç bir istatistik dersi almamış arkadaşlar için daha açıklayıcı olması yönünde bir analojik katkı olacak.

    öncelikle matematik ile istatistik arasındaki farkı basit bir şekilde göstereyim:

    matematik => y=2x+3 denkleminin türevini “x 1 birim arttığında y 2 birim artar” şeklinde yorumlar

    istatistikte ise bu bir denklem değil modele dönüşür ve denklemin sonuna bir harf eklenir: “u” yani hata terimi => y=2x+3+u modelinde türev artık şöyle yorumlanır “x 1 birim arttığında y’nin 2 birim artma olasılığı vardır”. güven aralığı (genellikle %90, %95, %99) dediğimiz kavramı işin içine katmak istersek yorumu şu şekilde yapabiliriz: “x 1 birim arttığında y %95 ihtimalle 2 birim artacaktır”

    işte formel bir bilim olan istatistikte aslında en büyük uğraş bu hata terimidir, onu minimize etmektir. şimdi bunu bir analojiyle açıklamaya çalışayım:

    “elimizdeki bardağı yere bırakırsak kırılır.” bu ilişkideki hata terimi epey yüksektir dolayısıyla açıklayıcılık gücü zayıftır. kırılacağına yönelik beklentimizin güçlenmesi için ilave bilgilere ihtiyacımız var. örneğin zeminin sertliğini, bardağın hangi malzemeden yapıldığı ve dayanaklılığı, ne kadar yükseklikten bırakıldığı, hangi hızla yere çarptığı vs. bu bilgilere sahipsek ilgili verileri modele dahil ederek hata terimini minimize eder açıklayıcılık gücünü arttırız ve böylece “beklentimiz”, kesinliğe yaklaşır.

    umarım bu analoji “gol beklentisi ölçülebilir mi?” ya da “beklentinin ölçülmesinin mantığı ve yöntemi nedir?” sorularına bir cevap olabilmiştir.
  • 50
    istatistiklere göre galatasaray'ın pozisyon sonlandırma problemi var. yani pozisyona giriyoruz ama atamıyoruz. forvet pozisyonundaki bilinmezlikte bir sebep olabilir tabii. diagne ile başladık sonra halil oynamaya başladı. muhtemelen bir daha ki maç mohamed oynayacak. eğer kesinlikle bonservisi alınacaksa bence mohamed 1. tercih olmalı ama halil'e de diyecek bir şeyim yok. veya halil'in forvet mohamed'in sol kanat forvet rolünde oynaması da bir şeyleri çözebilir diye düşünüyorum.

    öncelikle net şekilde 11i belirleyip anormal durumlar olmadıkça en az 70 dakika o takımla oynamamız gerekiyor. maç kötü gidiyorsa 45te değişiklik çözüm değil olmayacak da. önce birbirleriyle oynama alışkanlığı kazanmaları lazım. sonra bazı şeyler oturacaktır, roller belirlenecektir. yapısal anlamda da sorunlar var ama onlar başka mesele. lazio maçı hariç 90 dakika iyiydik dediğimiz maç yok. devamlılık sağlanırsa olacağına inanıyorum ben.

    sonuç olarak ilk 5 haftada en çok net fırsat ve xg yaratan takım bizmişiz. trabzon, beşiktaş ve fener bizden daha az pozisyon üretmelerine rağmen gol buluyor olmalarını tecrübeli oyuncularına bağlıyorum. trabzonda nwakayeme ve bakasetas, çok gol atamasa da fenerde valencia, pelkas, mesut, berisha gibi bir çok opsiyon var. bjk'de ise batshuayi, larin, ghezzal arkasında pjanic var. yani genç bir takımız fatih hoca hatalarında ısrar etmezse bu gençlere imkan verirse çok daha iyi olacağımızı düşünüyorum.

    https://twitter.com/.../1439964757172396036
App Store'dan indirin Google Play'den alın