今シーズンのアーセナルの試合統計(興味深い点)
はっきりさせておきたいのですが、今シーズンのアーセナルの統計をまとめる作業は、最初は情熱から始めたわけではなく、ただ…腹が立ったから始めたんです!
義理の弟はリヴァプールファンなのですが、私をからかってきました。アーセナルが勝ったり好調だったりするたびに、「ああ、ただの運だよ。シーズンが終われば2位になるだろう。xG(期待ゴール数)の統計を見ろよ。データは嘘をつかない」と言っていました。私はその話を長い間聞いていてうんざりしてきました。経済学を専攻し、鋭い推論力を持っていた彼に反論することもできませんでした。そこで私は、「よし、データで遊ぼう!」と決意しました。自分の好きなチームがどんなプレーをしているのか、何か本当に良い点がないか、自分でデータを集めて確認しなければならなかったのです。
データ抽出と「手動」データ入力のプロセス
最初は、オンラインで数回入力するだけで簡単に出てくると思っていました。大手統計サイトではVIPアカウント登録や、マトリックスのような複雑なインターフェースが必要だなんて、誰が想像したでしょうか。私はそれらの面倒な手順が嫌いなので、考えを変えて「古典的な」方法に切り替えました。

私は各試合のデータを検索するという旅を始めました。
ステップ1:5~6つの異なるスポーツウェブサイトを開きます。それぞれのサイトは特定の分野に強みを持っています。あるサイトはボール支配率を明確に示し、あるサイトはシュート数に特化し、あるサイトはカードとファウルにのみ焦点を当てています。
ステップ2:「武器」として、質の低いGoogleスプレッドシート(インターネット上のExcelファイル)を用意します。専門的なツールは一切使用しません。目標はスプレッドシートを作成することです。
ステップ3:手でコピー、手でコピー、そして手でコピー。シーズン開幕からのアーセナルの試合リストを開き、列ごとに、ボックスごとに、ボールポゼッション、正確なパス数、シュート数、枠内シュート数、xG(幸いにも、これを明確に記載したページがありました)、タックル成功数…といったデータを、ただひたすらに並べていきました。ミスを避けるために、試合ごとに3~4つの異なるソースからコピーして比較する必要がありました。この作業は本当に苦痛でした。マウスをクリックし、キーをひたすら押し続け、目がくらみました。データ収集だけで週末の2晩近くを費やしました。
チームファンの名誉のためにやっているのであって、妙なデータエンジニアリングの仕事のためではない、と思いながら、歯を食いしばって作業しました。
大まかな分析と、私が見つけた「良い」点
雑然としたデータをスプレッドシートのファイルに詰め込んだ後、簡単な計算関数をいくつか使い始めました。SUM関数、AVERAGE関数など、基本的な関数だけです。私の信条は、問題を複雑にしないことです。シーズンの各ステージでの平均統計を計算するだけで、義理の弟と話をするのに十分です。
そして、私が掘り出した「良い」点は以下の通りです。
発見1:真の守護天使。確かにゴール数は誰の目にも明らかですが、再計算してみると、アーセナル戦のxG(期待ゴール数)は他のトップチームと比べて大幅に低いことがわかりました。これは、ゴールキーパーがセーブする必要はあったものの、ブロックするミッドフィルダーによる守備システムが非常に効果的に機能していたことを意味します。アーセナルは幸運に恵まれただけでなく、相手にチャンスを作り出すことに非常に長けていました。これはコーチングチームの功績と言えるでしょう。
発見2:致命的な弱点。しかし、近距離からのシュートとチャンスのコンバージョン率の統計を見ると、アーセナルは依然として無駄が多すぎると感じました。xGは非常に高いものの、実際のゴール数は(時期によっては)期待を下回ることも多かったのです。これは義兄がよく言う考えを裏付けるものですが、今やそれを裏付ける正確なデータを手に入れました。「確かに無駄はあるが、生み出されたチャンスはすでに大きい!」
発見3:沈黙を守る「チームを運ぶ存在」。さらに、キーパスのデータと、3~4人のキープレーヤーがゴールに直接関与した回数のデータも除外しました。データは大きく異なっていました。懸命にプレーし、精力的に走りながらも、新聞にはあまり登場しない選手もいました。しかし、統計データからは、彼らがチームの骨組みを支える要であることが示されました。
物語の結末と個人的な満足感
合計900個近くのデータセルからなる緻密な統計表を完成させ、私は安堵のため息をつきました。ついに、反撃の最終兵器を手に入れたのです。
私はSheetsファイルを義兄に送りました。彼は1時間も黙っていました。折り返し電話をくれた彼の声は少し落ち込んでいたようで、「とても丁寧に計算しましたね。アーセナルの守備は今年、格段に良くなりました。数字は嘘をつきませんよ」と言った。
ほら!理屈で、数字で勝つ感覚は、言葉で勝つよりもずっと楽しい。正直に言うと、一つ一つの数字をじっくり分析するのは疲れるし大変だけど、サッカー観戦中に感情に左右されることがなくなり、全体像を把握できる。自分のチームの強みと弱みがわかる。
今では、アーセナルの試合が終わるたびに、Sheetsファイルを開いて1行ずつ更新する。もう習慣になっている。もう誰かと議論する必要はなく、自分の統計表に満足するだけでいい。最初は意地悪で始めたこの統計作業は、今ではサッカーを愛するおじさんの優雅な趣味になっている。
このプロセスを共有しているのは、何かを数えたい人が、手作業の方法を恐れずに、とにかくやってみてほしいと思っているからだ。時々、自分でやって、自分で掘るのが一番です!

