摘要:利用可見光和短波近紅外光譜結(jié)合化學計量學方法,研究了五種不同番茄種子品種快速無損分類的可行性。從番茄種子的多光譜圖像中提取了19種不同波長(375 nm至970 nm)的可見-近紅外光譜。主成分分析(PCA)用于數(shù)據(jù)挖掘,偏最小二乘判別分析(PLS-DA)和支持向量機判別分析(SVM-DA)用于對5個不同番茄品種進行分類。結(jié)果表明,無論化學計量學方法如何,對于所有番茄品種,兩個獨立測試集的分類準確率都非常高,范圍從94%到100%。PLS-DA和SVM-DA校準模型的總體分類錯誤率分別為3.2%和0.4%。結(jié)果表明,可見-近紅外光譜有可能用于番茄種子品種的無損鑒別,并有機會將其納入植物遺傳資源管理、植物品種保護或登記方案。
圖1.捕獲的五個番茄種子品種的多光譜圖像。(a)藍色背景分割后的圖像;種子上的白邊顯示ROI的選擇(b);525nm下的種子圖像(c)
來自五個番茄品種種子的Vis-NIR光譜數(shù)據(jù)顯示出變化,但在每個波長上表現(xiàn)出相似的反射趨勢(圖 2)。光譜的變化表明番茄品種在番茄種子的物理和化學特性方面存在差異。可見光范圍的變化可歸因于種子樣品的顏色,而NIR區(qū)域的變化是由于品種種子的化學差異所致。這些光譜變化表明 Vis-NIR 可用于定性使用化學計量學方法進行分類。PCA 最初是在 Vis-NIR 光譜上進行的,沒有任何數(shù)據(jù)預(yù)處理,以探索番茄品種的可能聚類并識別可能的異常值。然而,沒有觀察到番茄品種之間的明顯區(qū)別(數(shù)據(jù)未顯示)。這并不奇怪,因為種子的光譜特性可能會影響光散射、粒度分布和與入射光束對齊等物理現(xiàn)象,這些現(xiàn)象會給數(shù)據(jù)增加噪聲。因此,數(shù)學數(shù)據(jù)預(yù)處理算法 SNV 和 detrend 用于消除或最小化物理效應(yīng)以進行進一步數(shù)據(jù)分析。對預(yù)處理的 Vis-NIR 光譜執(zhí)行的 PCA 顯示校準集中很少有異常值(數(shù)據(jù)未顯示)。然而,去除異常值并沒有改進模型,它們隨后被保留用于分類模型的進一步開發(fā)。圖 3 顯示了使用前三個得分向量 PC 1、PC 2 和 PC 3 的三維主成分 (PC) 得分圖,它們貢獻了 96.5% 的大部分光譜變化,即分別為47.8%、42.6% 和 6.1%。它顯示了相同栽培品種的種子樣本的聚類,盡管觀察到栽培品種的聚類之間存在一些重疊。結(jié)果表明,根據(jù)種子的反射率可以區(qū)分五種番茄品種。此外,這意味著來自樣品的不同光譜屬性可以與來自每個栽培品種的種子的特征相關(guān)聯(lián)。
圖2.從19個波長的種子圖像的 ROI 中提取的五個番茄品種的平均 Vis-NIR 光譜。375nm至700nm的波長來自可見光范圍,780nm至970nm的波長來自NIR區(qū)域 (a);番茄種子的平均SNV和detrend預(yù)處理可見-近紅外光譜(b)
PLS-DA模型
利用六個LVs建立了PLS-DA模型對番茄品種進行分類。開發(fā)的PLS-DA模型解釋了99.7%的可見-近紅外光譜變化,其中96.4%的變化信息來自前三個LV。該模型能夠以3.2%的總體分類ER對校準集的所有品種進行分類,HRD17和CL的最小ER分別為0.3%和0.8%。校準模型在分類品種BL410、Care Nepal和T9時相對較差,因為每個品種的誤分類率較高,并且對總體ER有顯著貢獻。這可能是合理的,因為在探索性分析中發(fā)現(xiàn)這三個品種的集群重疊(圖3)。然而,該模型能夠預(yù)測樣本的測試集,兩個測試集的分類準確率為94%至100%。在兩個試驗組中,誤分類種子的比例幾乎相似。圖4顯示了測試集1的PLS-DA模型的分類精度。測試集1和測試集2的總體ERs也一致,分別為1.8%和2.1%。此外,對于CL和HRD17具有絕對分類的所有品種,模型的敏感性,即正確識別屬于該類別的陽性樣本的能力,合理地更高。該模型的特異性,即拒絕所有其他品種樣品的能力,也足夠高,與正確分類樣品的能力非常相似,這表明該模型的穩(wěn)健性?偟膩碚f,PLS-DA顯示了可見-近紅外光譜數(shù)據(jù)對番茄品種種子分類的潛力。
圖3.前三個主成分(PC)得分圖顯示了五個番茄品種對它們的群體成員的聚類。括號中的值表示各個 PC 中包含的變化信息
Videometer Lab4多光譜種子表型成像系統(tǒng)是丹麥理工大學與丹麥Videometer公司開發(fā),是用于種子研究先進的多光譜表型成像設(shè)備,典型客戶為ISTA國際種子檢驗協(xié)會、ESTA歐洲種子檢驗協(xié)會、John Innes Centre、LGC化學家集團、奧胡斯大學等等,利用該系統(tǒng)發(fā)表的文章已經(jīng)超過300篇。
Videometer種子表型表型成像系統(tǒng)可測量種子如尺寸、顏色、形狀等,間接測定種子參數(shù)如種子純度、發(fā)芽百分比、發(fā)芽率、種子健康度、種子成熟度、中壽命等。種子活力綜合種子活力是種子發(fā)芽和出苗率、幼苗生長的潛勢、植株抗逆能力和生產(chǎn)潛力的總和(發(fā)芽和出苗期間的活性水平與行為),是種子品質(zhì)的重要指標,具體包括吸漲后旺盛的代謝強度、出苗能力、抗逆性、發(fā)芽速度及同步性、幼苗發(fā)育與產(chǎn)量潛力。種子活力是植物的重要表型特征,傳統(tǒng)檢測方法包括低溫測試、高溫加速衰老測試、幼苗生長測定等。
該系統(tǒng)也可以對細菌、蟲卵、真菌等進行高通量成像測量,進行病理學、毒理學或其它研究。對于擬南芥等冠層平展的植物,可以進行自動的葉片計數(shù)等。