大數據農民曆:農民種作的最佳參考
Agricultural Calendar with big data
分析與預測方法說明
本次對於菜價的模型需要分別建立幾個不同的模型,其代號與內容分別為:
(1)未來氣候模型(M1):
使用中央氣象局歷年之氣候資料建立的時間序列模型, 旨在預測未來的氣候常態,變項包含各地區不同年月份之月均溫、累積雨量、降雨強度、降雨日數、颱風數目與強度等等。其中我們用來建立氣候模型的變項包括各地區不同時期的氣溫、累積雨量、降雨強度、降雨日數、颱風數目與強度等等,但因聖嬰現象與反聖嬰現象之效果會反映在上開數據上,故將ENSO指數與SOI南方震盪指數排除。而關於侵台颱風數之預估,因颱風係屬非常態之特別事件,模型並無法有效的對其數量、強度和災損金額做出擬合,因此在我們的未來氣候模型中對其的預估量均假設為零。
(2)未來不同果菜市場不同作物月交易量模型(M2,將北中南分開建模)
針對不同果菜市場建立的時間序列模型(使用向量自我迴歸模型),得到未來的交易量預估。
(3)氣候與不同作物交易量對不同作物菜價模型
(M3, 一樣將北中南分開建模):
其中所欲預測的 Yi=不同作物之菜價,變項 Xi=氣候和不同作物之交易量
本模型之目的在於找出氣候與交易量對菜價之數學關係,不同作物的建模方式與採納之變項可能有所不同,將會透過比較Multi-Regression與Random Forest何者對於測試集的配適度較佳而決定,變項則會經過逐步向前變數選取篩選,以確保模型能有最佳的擬合值。
(4)未來菜價之時間序列模型(M4):
針對不同果菜市場建立的時間序列模型(使用向量自我迴歸模型),得到未來的菜價預估。
(5)最終的菜價預測模型(M5):
這個模型結合了上開四個模型,結合方式如下:
X-new= Union(M1,M2) (氣候與交易量預估值X-new)
Y1= M3[X-new] (利用M3和未來的氣候與交易量預估值擬合未來菜價的第一預估值Y1)
Y2=M4 (利用M4建立未來菜價的第二預估值Y2)
M5=(Y1+Y2)/2 (計算Y1,Y2的平均)
之所以使用Y1和Y2的平均值作為最終的菜價預估值乃是因為若單純使用時間序列模型(M4)建模,其序列最終會趨於均衡態的波動幅度,雖有一定的準確度,但並不適用於非平穩之時間序列,且難以處理極端值;而若單純以M3來建模,雖然考量的因素較多,也有一定之準確度(參考實際值與模型),但容易高估特定月份會出現的波動幅度。因此,將Y1和Y2做平均的處理,可有效的解決上述兩個問題(Y1過於平穩、Y2波幅過大),經過後續的實際驗證(預測期間自2019.08開始,我們在2019.10比較過模型預測的準確度),將兩者平均作為預測值所造成的殘差較小,且對於ARIMA模型未能掌握的劇烈漲幅、跌幅亦有較佳的掌握度。
(6)收益模型(Revenues Model):
這個模型只是利用經濟學的規則,將價格之預估值(由M5模型所預估)乘上交易量的預估值(由M2所預估),以得出未來不同作物在不同時間與不同市場,其「收益」的預估值。本模型之目的在於更貼近農業經濟的特性,農業主要是由供需(Qs/Qd)影響價格(P),農民只是價格的被動接收者,不是像工商業者具有議價的空間,也因此,對於農民而言,最重要的參考應當是「收益(W)」的大小預估,也就是價格乘以數量(P*Q)。透過本作品對於收益的預估,農民便得以更精準的決定是否要轉作(轉種其他未來預估收益較好的作物)。