top of page

資料蒐集

image.png

在抓資料的過程中,我們使用了Python的Selenium,Selenium透過WebDriver來模擬及控制瀏覽器,用以執行網頁爬蟲任務。

image.png
image.png

我們主要抓取的網站為中華職棒大聯盟官網(https://www.cpbl.com.tw/),提取六支球隊的團隊成績,並儲存至Excel檔(如上圖)。

image.png

然而在蒐集球員薪資時,也是使用 Selenium,步驟大概是啟動 Chrome 瀏覽器,開啟 Google 網頁並模擬輸入搜尋框,確認網頁內容是否包含特定關鍵字,有包含的話在從搜尋結果中提取標題以及URL,並輸出頁面的資訊,最後也會將球員月薪資料儲存至Excel檔中。

bottom of page