球員薪水預測
在預測球員薪資方面,我們認為使用多元回歸是一個很好的分析方法,底下是我們使用多元回歸的一些步驟:
1.收集數據:收集與球員薪水相關的各種數據,包括打擊率、全壘打數、打點。除了這些,還可以考慮其他可能影響薪水的因素。
2.整理數據:確保數據完整且格式正確,去除缺失值或異常值,並將數據轉換成適合模型CSV檔案。
3.選擇特徵:考慮對薪水有影響的多個特徵,包括打擊率、全壘打數、打點等。
4.建立多元回歸模型:在建立模型時,不僅考慮一個特徵,而是考慮多個特徵。例如,將球員的打擊率、全壘打數、打點等作為自變量,薪水作為因變量,建立多元回歸方程式。
5.分割數據:將數據分成訓練集和測試集,按照設定比例進行分割。
6.訓練模型:使用訓練集的數據來訓練多元回歸模型,調整模型的訓練即與測試集,使其最能夠擬合資料。
7.預測薪水:根據球員的各種特徵,使用訓練好的多元回歸模型來預測其薪水。
使用工具:
-
JASP
-
RapidMiner Studio
打者
相關分析
-
犧短
解釋:
紅色圈起來的是與月薪不相關
線性回歸模型
-
解釋力:44%
-
平均誤差:13.6萬
-
四壞球(0.29)
-
全壘打(0.34)
-
高飛出局、打席PCA(0.75)
-
被三振(-0.31)
解釋:
四壞球、全壘打、高飛出局、打席可以解釋月薪的44%變異
投手
相關分析
-
完封、中繼成功、投手犯規、滾飛出局比
解釋:
紅色圈起來的是與月薪不相關
線性回歸模型
-
解釋力:47%
-
平均誤差:10.12萬
-
投球局數 (0.34)
-
救援成功 (1.14)
-
死球 (-0.84)
-
四壞 (-0.40)
解釋:
投球局數、救援成功、死球、四壞可以解釋月薪的47%變異
RapidMiner Studio
視覺化的呈現預測模型訓練結果
預測結果(單位萬)
RapidMiner Studio
分別為打者與投手的預測
2024年的成績
|
V
預測
2025年的薪水