引言
高光譜圖像擁有“看見人眼看不見"的能力,但真正讓數據變成信息、讓特征從噪聲里被“挖"出來的,是光譜預處理和降維。本期我們用最直觀的案例——瘀傷獼猴桃,帶你看看原始光譜如何在一系列預處理(平滑、SNV、MSC)和降維方法(PCA、MNF)的作用下,逐漸顯露出清晰的組織結構和損傷特征。只需幾張圖,你就能看到“高光譜處理前后"的巨大差別,也能迅速理解為何預處理,比建模本身更重要。
4 光譜圖像預處理
4.1 光譜預處理
平滑方法主要用于消除光譜中的高頻隨機噪聲,同時盡量保留光譜的整體趨勢和峰形。
(1)移動平均
移動平均是最基本的平滑方法。它通過取當前點及其鄰域點的平均值來平滑光譜。該方法可以平滑高頻噪聲,但對一些尖刺噪聲不敏感。公式如下:
其中,為移動窗口的大小。
python代碼示例:

(2)Savitzky-Golay平滑
SG平滑的核心思想是對光譜信號在一個滑動窗口內進行多項式擬合,用擬合后的值替換原始光譜點。與簡單的移動平均相比,SG平滑不僅可以去除高頻噪聲,還能保持光譜峰形和信號的局部特征。該公式如下:在窗口大小為2m+1的條件下,對第i個光譜點的平滑為:
其中,是多項式擬合得到的系數,為窗口內光譜點的原始值。
python代碼示例:

(3)中值濾波
中值濾波是用窗口內的中位數替代當前點值,對偶發的尖刺噪聲(毛刺)特別有效。
python代碼示例:

(4)標準正態變換(SNV)
SNV是一種歸一化方法,通過對每條光譜進行中心化與標準化,消除光譜間的散射效應或強度差異,并保留光譜的相對形態。公式如下:

其中表示光譜均值,表示光譜標準差。
python代碼示例:

(5)多元散射校正(MSC)
MSC通過線性回歸將每條光譜與參考光譜(通常為平均光譜)擬合,校正乘法與加法散射效應。該方法可以校正散射引起的強度差異,保留光譜的形狀特征。公式如下:
,其中
其中為第i波長的光譜,參考光譜,通常是所有樣本的平均光譜,、為回歸系數,為擬合后的光譜。
python代碼示例:

4.2 光譜圖像降維
(1)主成分分析降維(PCA)
在高光譜圖像處理中,PCA是一種常用的降維方法,用于減少波段冗余、降低噪聲并提取主要光譜信息。高光譜圖像通常由三維數據立方體表示,包含空間維度和數百個光譜波段。PCA 降維的核心思想是將每個像素的光譜向量視為高維數據,通過對所有像素數據進行零均值化、計算協方差矩陣并求其特征值和特征向量,得到按方差大小排序的主成分。選取前若干主成分即可將高光譜數據從高維映射到低維,同時保留大部分光譜信息。降維后的數據不僅減少了計算量,還顯著提高了信噪比,可用于可視化、分類或聚類分析。例如,前三個主成分可以組合成偽彩色圖像直觀展示空間結構。總體而言,PCA降維是高光譜圖像處理和分析中的重要預處理手段,可有效壓縮數據、去除冗余和噪聲,同時保留光譜特征。
(2)最小噪聲分數降維(MNF)
在高光譜圖像處理中,MNF降維是一種常用的數據降噪與壓縮方法,其核心思想是通過考慮光譜噪聲特性來提取主要信號成分。MNF降維一般分兩步進行:*一步,對原始高光譜數據進行噪聲估計并對數據進行噪聲歸一化,將噪聲影響標準化;第二步,在歸一化后的數據上進行主成分分析(PCA),提取方差*大的成分作為主要信號,而將噪聲占主導的低方差成分舍棄。與傳統PCA不同,MNF 通過先考慮噪聲結構,使降維后的前幾主成分在信噪比上更優,更能突出真實光譜信號。MNF降維后的數據不僅減少了波段冗余,還有效降低了噪聲,廣泛應用于高光譜圖像的可視化、分類和目標識別等任務。由于其能夠同時實現噪聲抑制和特征壓縮,MNF 常被認為是處理高光譜數據的高級降維方法。
4.4 案例前后對比
(1) 光譜預處理案例
不同預處理方法處理后的光譜曲線如下圖所示。相對于原始光譜,平滑預處理方法(如Savitzky-Golay、移動平均和中值濾波)主要消除了光譜曲線上的高頻波動,使光譜曲線更平滑,同時保持了整體峰位和基線的基本形態。SNV方法則對原始光譜的幅值和偏移進行了標準化,使不同樣品的光譜在同一水平上對齊,同時略微改變了曲線的整體高度。MSC通過線性回歸校正光散射造成的幅值和偏移差異,既保持峰形特征,又消除了樣品間的散射差異。然而,SNV和MSC沒有消除光譜中的高頻噪聲。組合方法(如SG+SNV或SG+MSC)先對光譜進行高頻噪聲平滑,再進行散射校正,兼顧了平滑與散射校正的效果,使光譜既平整又保持峰形特征。通過對比處理前后的光譜,可以直觀觀察到各方法對噪聲、散射和基線的調節作用,從而選擇*適合的預處理策略。

(2) 光譜圖像降維案例
以瘀傷獼猴桃的光譜圖像降維為例,瘀傷獼猴桃的高光譜圖像及特定波長的灰度圖像如下圖所示。

瘀傷獼猴桃的高光譜圖像及特定波長的灰度圖像
在對瘀傷獼猴桃的高光譜數據進行PCA與MNF分析后發現,兩種方法均能在主成分中提取出與組織變化相關的特征,但表現存在顯著差異。PCA的PC1主要表征果肉組織的整體反射率與密度分布,PC2能夠明顯突出瘀傷區域的吸收增強,是PCA中*具診斷意義的分量;而從PC3開始噪聲占主導,出現明顯條紋偽影,已不適合進一步分析。相比之下,MNF通過按信噪比排序有效抑制了噪聲,其 MNF1展現穩定的組織背景特征,MNF2能以更高的對比度和更清晰的邊界分離出瘀傷核心區域,MNF3則進一步強化損傷邊緣結構,呈現出瘀傷擴散的層次變化。整體而言,MNF在瘀傷特征增強、噪聲抑制和組織細節保持方面顯著優于PCA,其中MNF2–MNF3是*具診斷價值的特征分量。

獼猴桃樣本的全光譜圖像進行PCA和MNF分析
下期預告
下期我們將介紹關于高光譜圖像的識別分類,關于高光譜圖像分類的方法監督分類。