Lược dịch từ bài viết “The 10 Commandments of football analytics” của Tom Worville trên The Athletic.
Trong những năm gần đây, công việc phân tích dữ liệu ngày càng trở nên quan trọng đối với thể thao nói chung và bóng đá nói riêng. Tuy nhiên, không phải lúc nào chúng cũng được sử dụng một cách chính xác.
Bài viết này sẽ giúp cho các bạn có được một cái nhìn sâu sắc hơn về bối cảnh cần thiết khi sử dụng những con số thống kê để nói về các cầu thủ và đội bóng, cần tập trung vào những con số nào và làm thế nào hiểu rõ hơn những con số mà bạn đang thấy.
Sau đây là top 10 những quan niệm sai lầm khi sử dụng các con số thống kê.
1. Sử dụng tỉ lệ cản phá thành công để đánh giá khả năng cản phá của một thủ môn
Ví dụ: Martin Dubravka là thủ thành có khả năng cản phá xuất sắc thứ 8 tại Premier League mùa giải này khi có cho mình tỉ lệ cản phá thành công lên đến 73.9%.
Tại sao lại sai: Công thức để tính tỉ lệ cản phá thành công là số cú sút cản phá được/tổng số cú sút phải đối mặt. Có thể thấy rõ ràng lỗ hổng ở trong công thức này là việc không thể cho thấy được sự khác biệt trong kiểu dứt điểm hay chất lượng của cú dứt điểm mà thủ môn phải đối mặt, những thứ có ảnh hưởng rất lớn đến khả năng cứu thua của một thủ môn.
Một thủ môn X phải đối mặt với 10 cú sút ở khoảng cách gần chắc chắn sẽ gặp nhiều khó khăn hơn so với một thủ môn Y chỉ phải đối đầu với 10 cú sút ở khoảng cách 30 yard.
Expected Goal và người anh em của nó Expected Goal on Target (xG dành cho những cú sút trúng đích) sẽ cho chúng ta biết rằng những cú sút ở khoảng cách xa sẽ ít có khả năng trở thành bàn thắng, trong khi những cú sút từ vị trí trung tâm hoặc đi thẳng vào vị trí thủ môn nhiều khả năng sẽ bị cản phá.
Với việc coi tất cả các cú sút là giống nhau khi tính toán tỉ lệ cản phá thì đó là một sự bất công đối với thủ môn X và cũng khiến cho chỉ số của thủ môn Y trông đẹp hơn so với thực tế.
Sử dụng gì để thay thế: So sánh chất lượng những cú sút trúng đích bằng xG on Target với số bàn thua phải nhận sẽ giúp cho mọi người có một cái nhìn rõ nét hơn về những con số của thủ môn.
Goals Prevented (bàn thắng ngăn chặn được) cho chúng ta biết có bao nhiêu bàn thắng mà thủ môn đã cứu được dựa trên chất lượng của những cú sút mà anh ấy phải đối mặt, so với con số trung bình của một thủ môn. Theo như thống kê này, Martin Dubravka sẽ trông xuất sắc hơn nhiều so với những gì tỷ lệ cản phá của anh cho thấy, và Vicente Guaita thì trông giống như là thủ môn xuất sắc nhất giải đấu:
2. Sử dụng quãng đường di chuyển hay chạy nước rút để đánh giá sự nỗ lực
Ví dụ: Mesut Ozil di chuyển nhiều hơn tất cả các cầu thủ Arsenal ở trong trận đấu này với quãng đường lên tới 11.2km.
Tại sao lại sai: Các CLB tại Premier League đã có quyền truy cập vào những dữ liệu theo dõi cầu thủ kể từ mùa giải 2013/14, và trong thỏa thuận đó, các phương tiện truyền thông sẽ được quyền truy cập vào hệ thống để lấy các dữ liệu đầu ra. Và cho đến thời điểm này, hầu như tất cả những gì chúng ta thấy là những con số thống kê về quãng đường hay tốc độ di chuyển.
Nhưng, thực tế là những con số này thường khá vô nghĩa, mặc dù chúng được sử dụng thường xuyên để phân tích các đội bóng cũng như các cầu thủ. Và lý do cho vấn đề này thì nhiều vô kể.
Đầu tiên, không có mối tương quan nào giữa quãng đường di chuyển và khả năng chiến thắng một trận đấu. Khoảng cách di chuyển được trong một khoảng thời gian nhất định chỉ hữu ích khi bạn đang tham gia một cuộc chạy đua tính giờ mà thôi, điều mà rõ ràng không đúng đối với bóng đá. Theo bản báo cáo kỹ thuật của UEFA về Champions League mùa giải năm ngoái, Shakhtar Donetsk là đội có quãng đường di chuyển nhiều nhất trong số tất cả 32 đội tham gia giải đấu, nhưng họ chỉ đứng thứ ba trong bảng đấu và bị loại khỏi Europa League ở vòng 1/16. Trong khi đó, Manchester United có quãng đường di chuyển ít thứ hai giải đấu, nhưng họ vẫn có thể lọt vào tới trận tứ kết. Tóm lại thì quãng đường di chuyển thực sự không nói lên được quá nhiều điều.
Thứ hai, quãng đường di chuyển và chạy nước rút của mỗi người sẽ là khác nhau, bởi nó còn phụ thuộc vào những gì mà đội bóng yêu cầu, hệ thống của đội bóng, cách đối thủ sắp xếp đội hình, kết quả trận đấu đang như thế nào và rất nhiều những yếu tố khác nữa. Nếu không thể kiểm soát được (hoặc ít nhất là đề cập đến) những yếu tố khác, các con số này sẽ không cho chúng ta biết thêm được nhiều điều.
Cuối cùng, có một số bằng chứng cho ta thấy rằng chạy ít hơn thực sự có thể có những lợi ích riêng của nó, giống như những gì mà Lionel Messi làm. Hầu hết các cầu thủ đều có thể lực đủ sung mãn để cày ải hết một trận đấu nhưng khả năng khai thác không gian mới là điều quan trọng. Tương tự như vậy, có rất nhiều cầu thủ sở hữu một tốc độ kinh khủng nhưng họ biết rõ khi nào nên sử dụng cái tốc độ đấy của họ. Rất hiếm khi các cầu thủ cần đánh bại đối thủ trong một cuộc chạy đua, nhưng việc bất ngờ tăng tốc để vượt qua một ai đó hoặc bứt tốc để cứu một đường bóng thì lại cực kỳ quan trọng trong bóng đá.
Con số thống kế này không hẳn là vô nghĩa hoàn toàn, nhưng nó cũng chỉ giúp các đội bóng trong việc quản lý cầu thủ mà thôi khi nó giúp họ đảm bảo được rằng các cầu thủ đang ở trạng thái thể lực tốt nhất để thi đấu. Bóng đá là một môn thể thao của không gian và thời gian, và chúng ta hiện đang không có công cụ nào để có thể đo lường được những hạng mục đó một cách chính xác nhất có thể.
Sử dụng gì để thay thế: Không có bất cứ sự thay thế nào cho những con số thống kê này cả. Một là bạn dùng nó trong những hoàn cảnh nhất định, hai là đừng đụng đến nó.
3. Sử dụng tỉ lệ kiểm soát bóng để đánh giá chất lượng đội bóng
Ví dụ: Tottenham kiểm soát bóng lên đến 79.8% trong trận thua 0-1 trước Newcastle, lớn thứ hai trong các đội thua cuộc tại Premier League tính từ mùa giải 2003/04
Tại sao lại sai: Như Marti Perarnau đã nói trong cuốn sách Pep Confidential của mình “kiểm soát bóng chỉ đơn giản là một công cụ hỗ trợ, không phải là một mục đích hay một mục tiêu tối thượng của cả đội bóng” (nguyên văn: possession is only a means to an end. It’s a tool, not an objective or an end goal). Leicester City vô địch Premier League mùa giải 2015/16 với tỉ lệ kiểm soát bóng chỉ 42.6%. Manchester City vô địch mùa giải trước với tỉ lệ kiểm soát bóng lên đến 67.7%. Điều quan trọng nhất ở đây không phải là bạn kiểm soát bóng được bao lâu, mà là bạn làm được những gì khi đang kiểm soát bóng.
Tỉ lệ kiểm soát bóng cũng sẽ chỉ cho chúng ta biết về cách nhập cuộc của một đội bóng trước một trận đấu và nó cũng có thể bị thay đổi phụ thuộc vào tỉ số hiện có ở trên sân. Lấy ví dụ như chiến thắng 1-0 của Atletico Madrid trước Liverpool cách đây không lâu, sau khi có bàn mở tỉ số ở ngay phút thứ 4, Atletico đã tổ chức phòng ngự số đông và chỉ có tỉ lệ kiểm soát bóng là 27%. Con số này chắc chắn sẽ khác nếu như đại diện đến từ Tây Ban Nha không có được bàn thắng sớm.
Sử dụng gì để thay thế: Tỉ lệ kiểm soát bóng vẫn là một thống kê hữu hiệu để giúp mọi người có thể biết rằng đội nào cầm bóng nhiều hơn - chỉ là đừng dùng nó để chứng minh rằng đội A hay hơn đội B. xG sẽ là một lựa chọn tốt hơn nhiều khi so sánh các đội với nhau.
4. Đánh giá khả năng phòng ngự của một cầu thủ dựa trên số lần xoạc bóng và tắc bóng
Ví dụ: Ricardo Pereira là cầu thủ phòng ngự xuất sắc nhất Premier League, với 119 lần xoạc bóng thành công.
Tại sao lại sai: Không phải tất cả các hành động phòng ngự có thể được thể hiện bằng những con số và output của một cầu thủ còn phải phụ thuộc vào lối chơi đội bóng của cầu thủ ấy. Nói cách khác, nếu như một đội bóng thi đấu với lối chơi phòng ngự, cầu thủ của họ sẽ có nhiều cơ hội phòng ngự hơn. Ngược lại, nếu một đội bóng thi đấu với lối chơi tấn công, cầu thủ của họ sẽ ít cơ hội phòng ngự hơn.
Chính vì vậy, thống kê về số lần xoạc bóng và tắc bóng thường dùng để đánh giá lối phòng ngự của một cầu thủ (chủ động hay bị động) hơn là dùng để đánh giá khả năng phòng ngự. Virgil Van Dijk chỉ có 0.76 lần xoạc bóng thành công mỗi 90 phút, nhưng không ai dám bảo anh là một cầu thủ phòng ngự tệ cả.
Thêm vào đó, bởi vì những con số này còn phụ thuộc vào lối chơi của toàn đội cho nên sẽ rất khó để có thể so sánh được các cầu thủ với nhau.
Sử dụng gì để thay thế: Chúng ta có thể điều chỉnh thống kê theo số lần một cầu thủ thực hiện tắc bóng hay xoạc bóng trong mỗi 1000 lần chạm bóng của đối phương - một cách thống kê công bằng hơn cho tất cả các cầu thủ. Lấy ví dụ, Jordan Henderson có 2.6 lần xoạc bóng mỗi 90 phút, đứng thứ 15 toàn Premier League, tuy nhiên khi điều chỉnh theo tỉ lệ kiểm soát bóng, Henderson có 4.6 lần xoạc bóng mỗi 1000 lần đối phương chạm bóng, đưa anh lên vị trí thứ 5 toàn giải đấu.
Việc điều chỉnh những con số thống kê phòng ngự theo tỉ lệ kiểm soát bóng sẽ giúp cho chúng ta có một cái nhìn khái quát hơn về các hành động phòng ngự, nhưng nó vẫn chỉ cho thấy lối phòng ngự chứ không phải là khả năng phòng ngự của một cầu thủ.
5. Sử dụng tỉ lệ xoạc bóng thành công để đánh giá khả năng xoạc bóng của một cầu thủ
Tại sao lại sai: Có một sự thật mà có lẽ ít người biết đó là số lần xoạc bóng thành công và số lần xoạc bóng thất bại là hai thống kê tương tự nhau và đều bỏ qua hai kết quả quan trọng khác sau khi thực hiện một tình huống xoạc bóng.
Xoạc bóng thường chia ra làm hai danh mục: xoạc bóng thành công và xoạc bóng thất bại. Xoạc bóng thành công là khi bạn giành lại được quyền kiểm soát bóng cho đội sau khi thực hiện tranh chấp, xoạc bóng thất bại là khi bạn thực hiện tranh chấp nhưng không giành lại được quyền kiểm soát bóng cho đội. Xoạc bóng thất bại có thể là những tình huống bạn xoạc bóng nhưng bóng lại đi ra ngoài và để cho đối thủ có được một quả ném biên/phạt góc, xoạc bóng và bóng bật vào chân của một cầu thủ khác bên phía đối phương hay vì một vài lý do nào đó khác.
Tỉ lệ xoạc bóng thành công sẽ được tính theo công thức xoạc bóng thành công/(xoạc bóng thành công + xoạc bóng thất bại). Con số này cho chúng ta thấy bao nhiêu phần trăm những cú xoạc bóng của một cầu thủ có thể giành lại được quyền kiểm soát cho đội bóng.
Đó chính là vấn đề. Tỉ lệ xoạc bóng thành công sẽ bỏ qua những tình huống xoạc khiến bóng bật ra khỏi chân cầu thủ đang cầm bóng, hoặc những tình huống phạm lỗi. Do đó, hậu vệ cánh có tỉ lệ xoạc bóng thành công cao nhất tại Premier League lúc này lại là Martin Kelly với 80%, trong khi “thánh xoạc” AWB lại ngụp lặn ở vị trí thứ 11.
Sử dụng gì để thay thế: True tackle win-rate có thể giải quyết được vấn đề này khi nó thêm vào hai hạng mục kể trên. Công thức lúc này sẽ là tổng số lần xoạc bóng/(tổng số lần xoạc bóng + số lần tranh chấp thua + số lần phạm lỗi khi thực hiện xoạc bóng). Nếu sử dụng công thức này, AWB sẽ là cầu thủ đứng đầu danh sách với 78.9% true tackle win-rate, trong khi Martin Kelly tụt xuống tận vị trí thứ 29.
(Còn tiếp)
Comments