鈦鐵礦多組分高光譜品位評估
圖1b(藍色線條)為HSI捕獲到的原始平均光譜曲線,可以明顯看到在整個光譜區(qū)域沒有特異的波峰波谷。為了找出峰谷突出的區(qū)域,分析了光譜波段之間的相關(guān)性。對于維度為(x, y, λ)的高光譜數(shù)據(jù),轉(zhuǎn)換為(z = x × y, λ),并對z進行相關(guān)性分析,結(jié)果如a所示。圖中顯示紅色域的波段在整個波段中占比94.34%,其余顏色域總共占比5.66%。為了***限度地保留 “純凈數(shù)據(jù)",防止其它顏色域數(shù)據(jù)的干擾,通過查詢顏色欄數(shù)據(jù)并結(jié)合波段得知紅色與其余顏色域的相關(guān)性分界點為0.8(波段:483)。隨后,將相關(guān)性小于0.8的30個波段從數(shù)據(jù)分析中剔除,從而***了1685.47-1735.34 nm的光譜區(qū)域。得到的光譜曲線如圖1b(紅線)所示。該過程獲得的光譜數(shù)據(jù)(150×483)用于后續(xù)的模型建立和分析
采集礦石樣本高光譜圖像結(jié)合光譜曲線分析
結(jié)論
通過高光譜相機檢測出了鈦鐵礦中品位較高的9種金屬元素,根據(jù)其品位高低對樣本進行分組。其中,1%及以上為主要品位(Ti, Fe),0.02-1%為次要品位(V, Mn, Co, Cu),0.02%及以下為微量品位(Zn, Zr, Pb)。鈦鐵礦中各組分品位的統(tǒng)計分布如表1所示,可以清晰看出,不同組分的品位有明顯的差異,這對回歸模型的建立至關(guān)重要。
表1 鈦鐵礦樣品品位測定的統(tǒng)計分析
鐵礦樣本的光譜反射率值在0.03 - 0.27之間,證實粉狀鈦鐵礦的整體反射率較低,并隨品位的增加而降低。圖1b顯示在NIR區(qū)域,該鈦鐵礦的光譜特征分別在940nm、1020nm和1300~1650nm處出現(xiàn)了波谷。具體地,光譜反射率值在940 nm處達到谷值,隨后急劇下降,這主要歸因于O-Ti-O的拉伸和變形。該鈦鐵礦較寬的吸收波段主要位于1300 ~ 1650 nm,Izawa指出這是由八面體配位的亞鐵在此附近產(chǎn)生晶體場躍遷分裂而引起的。
采用SG、MSC、CR、SD、MSC+SG等5種預處理方法對原始光譜數(shù)據(jù)進行處理?;贒D模型對比原始光譜數(shù)據(jù),探索出HSI光譜數(shù)據(jù)的***預處理方法,結(jié)果如表2所示。預測集中,與原始數(shù)據(jù)相比,MSC+SG方法下的各指標R2P提高了5.88%,RMSEP降低了34.39%,RPD和RPIQ分別提高了28.86%和38.93%。
表2 DD模型下不同預處理方法的結(jié)果
為直觀地看到各預處理方法對數(shù)據(jù)的改變,繪制了HSI采集的鈦鐵礦樣本三維原始光譜如圖2a所示,圖2b-d所示三維光譜為CR、SD、MSC+SG預處理的結(jié)果。SG預處理后的光譜反射率曲線趨勢與鈦鐵礦原始光譜反射率曲線相似。MSC和MSC+SG預處理的光譜變化不大,但有效地***了光譜散射,突出了光譜峰谷區(qū)域。相比之下,CR和SD預處理后的光譜變化明顯,兩種方法的光譜反射率范圍差異過大,導致原始數(shù)據(jù)的一些特征丟失。然而,***MSC+SG預處理圖譜顯示,光譜特征區(qū)域顯著增強,反射率數(shù)據(jù)得以明顯集中,有效增強了光譜特征信息。因此,MSC+SG可以作為一種有效的光譜預處理方法來預測鈦鐵礦多組分的品位信息。
圖2 HSI采集鈦鐵礦樣品的三維光譜:(a) RAW光譜;(b) CR預處理后的光譜;(c) SD預處理后的光譜;(d) MSC + SG預處理后的光譜。
采用t-SNE、iPLS-VCPA-IRIV和iPLS-VIP-IRIV三種不同的降維算法對近紅外光譜數(shù)據(jù)進行不同程度地約簡。
圖3為不同降維算法的數(shù)據(jù)分布情況。t-SNE改變了原始數(shù)據(jù)集,經(jīng)該方法輸出的高維(483維)原始光譜數(shù)據(jù)特征映射到了三維平面之上。
特征選擇方法iPLS-VCPA-IRIV和iPLS-VIP-IRIV三步混合策略算法提取的波長數(shù)分別為28和38,比原始維度相應減少了94.19 %和92.12 %。
總的來說,三種降維算法有效地***了原始光譜矩陣中的冗余信息,為減少計算時間和確保精度奠定了基礎
圖3 不同降維方法下的數(shù)據(jù)分布:(a) t-SNE;(b) iPLS-VCPA-IRIV;(c) iPLS-VIP-IRIV。
表3為鈦鐵礦樣本中各組分的VIF檢驗分數(shù)。在相關(guān)程度上,L代表相關(guān)度低,H代表相關(guān)度高。對于每個變量,VIF得分均不超過2,
說明各變量之間的共線性現(xiàn)象不突出,相關(guān)程度符合研究要求。因此,可以采用數(shù)據(jù)預處理,降維等方法對各組分品位數(shù)據(jù)進行處理,并參與模型預測。
表3 鈦鐵礦樣品中各組分的VIF指數(shù)。
提取礦石樣本的顏色特征是否可以用于構(gòu)建品位預測模型,還有待進一步驗證?;阝佽F礦多組分品位(平均品位)與顏色特征參數(shù)進行Pearson相關(guān)性分析(圖4)。從圖中可以看出,除S顏色通道的特征參數(shù)與多組分品位存在弱相關(guān)(R < 0.3)外,其余顏色特征參數(shù)對于品位預測模型都是合理的。造成這種現(xiàn)象的原因是,鈦鐵礦本身是一種不透明礦物,而HSI采集到的圖像過于單一,整體顏色偏暗。
圖4 品位和顏色特征參數(shù)的皮爾遜相關(guān)性分析
多元回歸模型DD、PLSR和SSA-KELM可能對兩個維度中某一特定數(shù)據(jù)集的表現(xiàn)好,但基于多組分品位模型穩(wěn)定性的需求,BPNN才是*佳的模型選擇。
圖5為基于BPNN兩個效果*好的光譜和圖像數(shù)據(jù)結(jié)果,可以看出,兩個數(shù)據(jù)的指標變化差異不大,證實了BPNN模型即使在小樣本量下也具有很強的泛化性能和魯棒性。
綜合評價表明,BPNN對兩組數(shù)據(jù)集的預測都是成功的,但利用圖像數(shù)據(jù)預測鈦鐵礦多組分品位的可靠性略低于利用特征選擇的光譜數(shù)據(jù)。
從iPLS-VCPA-IRIV特征選擇的擬合光譜數(shù)據(jù)圖(圖6)可以看出,在校正集中,鈦鐵礦多組分品位都均勻準確地分布在理想曲線上。然而,對于預測集來說,明顯可以看出來的是,除擬合良好的主要品位(Ti、Fe)和次要品位(V、Mn、Co、Cu)外,微量品位(Zn、Zr、Pb)的擬合似乎并不令人滿意。因此,在下一步工作中,可以對少樣本量下礦石內(nèi)部微量品位的變化進行更深入的研究。
本解決方案從光譜和空間維度出發(fā),探討了HSI與化學計量學相結(jié)合預測鈦鐵礦多組分品位的能力。
電話
微信