LightGBMでプロ野球チーム順位を予想しよう①
何十年ぶりかの中日ドラゴンズ優勝を願って、今流行りの機械学習で順位予想をしてみましょう。
データ分析業務もやっており、その時にLightGBMを使いました。果たして野球の順位予想に適した手法かと言われると自信が無いですが、まあ機械学習の勉強と優勝祈願を兼ねてますので良しとしましょう。
この記事でやること
環境構築
Pythonの導入
まずはpythonのインストールをします。バージョンは3.11.8でwindows版64bitを入れます。
Python Release Python 3.11.8 | Python.org
exeファイルを実行します。一番下の「Add python.exe to PATH」はチェックしておきましょう。自動でexeファイルのパスを環境変数に設定してくれるので、どこからでも「python」コマンドを実行できるようになります。
最後の「Disable path・・・」もクリックしておきましょう。パスの長さ上限が無しになります。(確か)
一通り終わったらコマンドプロンプトで「python」と打って以下の画面が出れば成功です。
仮想環境の作成
pythonは色々なパッケージをインストールします。プロジェクトごとに必要なパッケージが違ったり、そもそもpythonのバージョンが違ったりする時にバージョンの違いによるエラーが起きることがしばしばあります。
仮想環境はこれらのミスを防ぐ有効な手段で、任意のプロジェクトごとに独立した環境を作成できます。バージョンの競合も無くなりますし、最悪、何か失敗したらその仮想環境フォルダごと削除すればさっぱりやり直すことができます。
まずVS Codeでプロジェクト用に作ったフォルダ(ここではbaseball_predict)を開き、ターミナルを立ち上げます。以下のコマンドを打ちます
py -3.11 -m venv baseball_predict_env
-3.11はバージョン指定、baseball_predict_envは仮想環境名なので好きな名前で大丈夫です
作成した仮想環境を有効にするには以下のコマンドを打ちます。
. .\baseball_predict_env\Scripts\activate
これは、predict_1_envというフォルダの中のスクリプトを実行するコマンドなので、baseball_predict_envフォルダパスを指定できればどこをカレントディレクトリにしても大丈夫です。(全く別のフォルダからアクティブにしてもよいという事です)
・・・と思ったら以下のエラーが出ました。
このシステムではスクリプトの実行が無効になっているため、ファイル C:\Users\OneDrive\デスクトップ\predict_1\predict_1_env\Scripts\Activate.ps1 を読み込むことができませ
ん。詳細については、「about_Execution_Policies」(https://go.microsoft.com/fwlink/?LinkID=135170) を参照してください。
ググったらどうも初期のpower shellでファイルを実行すると発生するエラーのようです。power shellを管理者権限で立ち上げて以下のコマンドを打ちましょう。
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned
VS Codeに戻って先ほどの仮想環境有効化コマンドを打って以下の画面になれば成功です。
左側に(baseball_predict_env)というのがありますが、これが仮想環境に入った証です。
ついでにpythonの拡張機能も入れちゃいましょう。これを入れると変数とか色付きにしてくれるしメソッドもサジェストしてくれます。
拡張機能で一番上の「Python」を入れましょう。
VSCodeにJupyter Labをインストール
pythonと言えばjupyterを思い浮かべる人も多いのではないでしょうか(ちなみにジュピターじゃなくてジュパイターって読むらしいですね。総じて名称の読み方は難しい)。コードを書いては実行、書いては実行・・・が出来るいかにもpythonチックな代物でデータ分析する際にはとても便利です。ですがこれはpythonをインストールしただけでは実行できません。ちょっと前まではpythonやるならAnacondaをとりあえず入れとけみたいな風潮があって、その中にjupyterも入っていたのであまり気にすることはなかったようです。ところがAnacondaが法人に対して有料化したのでそういうわけもいかず、何か別の手立てを考える必要が出てきました。
・・・まあ大体こういう時はVSCodeの拡張機能ですよ。
左のタブの拡張機能からjupyterと検索すればすぐ出てきます。一番上の「Jupyter」をそのままインストール。なんかえらい評価低いな・・・
ただしこれを入れただけでは動きません。jupyterを動かすためのモジュールをpipで入れなくてはいけません。
先ほどの仮想環境をアクティブにした状態のターミナルで
pip install jupyterlab
を打ち込みましょう。
(pipの待ち時間に。jupyter notebookとjupyter labと似た名前がありますが、notebookは旧でlabが新です。なのでlabを入れましょう。でも名残なのか今でもjupyterの事をノートブックって呼ぶ人が多いです)
問題なく入れば大成功です。
動作テスト
ではテストしてみましょう。今のフォルダに.ipynb拡張子のファイルを作るとjupyter形式のファイルが開かれます。
以下のコードを打ちます。ここで色がついたりサジェスチョンが出るのはpythonの拡張機能のおかげです。
import datetime
print(datetime.datetime.now())
すぐ上の「すべてを実行」を押すとpythonの実行環境を聞かれるので先ほど作った仮想環境を選択します
今の時間が出れば成功です
お疲れ様でした。以上で環境構築はいったん終わりです。多分。
次回からはいよいよ生データを取得しましょう!!!