top of page

​球員薪水預測

在預測球員薪資方面,我們認為使用多元回歸是一個很好的分析方法,底下是我們使用多元回歸的一些步驟:

1.收集數據:收集與球員薪水相關的各種數據,包括打擊率、全壘打數、打點。除了這些,還可以考慮其他可能影響薪水的因素。

 

2.整理數據:確保數據完整且格式正確,去除缺失值或異常值,並將數據轉換成適合模型CSV檔案。

3.選擇特徵:考慮對薪水有影響的多個特徵,包括打擊率、全壘打數、打點等。

4.建立多元回歸模型:在建立模型時,不僅考慮一個特徵,而是考慮多個特徵。例如,將球員的打擊率、全壘打數、打點等作為自變量,薪水作為因變量,建立多元回歸方程式。

 

5.分割數據:將數據分成訓練集和測試集,按照設定比例進行分割。

6.訓練模型:使用訓練集的數據來訓練多元回歸模型,調整模型的訓練即與測試集,使其最能夠擬合資料。

7.預測薪水:根據球員的各種特徵,使用訓練好的多元回歸模型來預測其薪水。

image.png
image.png

使用工具:

  • JASP

  • ​RapidMiner Studio

打者

image.png

相關分析

  • 犧短

解釋:

紅色圈起來的是與月薪不相關

image.png

線性回歸模型

  • 解釋力:44%

  • 平均誤差:13.6萬

  • 四壞球(0.29)

  • 全壘打(0.34)

  • 高飛出局、打席PCA(0.75)

  • ​被三振(-0.31)

解釋:

四壞球、全壘打、高飛出局、打席可以解釋月薪的44%變異

投手

image.png

相關分析

  • ​完封、中繼成功、投手犯規、滾飛出局比

解釋:

紅色圈起來的是與月薪不相關

image.png

線性回歸模型

  • 解釋力:47%

  • 平均誤差:10.12萬

  • 投球局數 (0.34)

  • 救援成功 (1.14)

  • 死球 (-0.84)

  • 四壞 (-0.40)

解釋:

投球局數、救援成功、死球、四壞可以解釋月薪的47%變異

image.png
image.png

RapidMiner Studio
視覺化的呈現預測模型訓練結果

image.png

預測結果(單位萬)

RapidMiner Studio
​分別為打者與投手的預測

2024年的成績

|

V

預測

2025年的薪水

image.png
bottom of page