相關(guān)鏈接: 中國(guó)安全網(wǎng) 中國(guó)質(zhì)量網(wǎng) 中國(guó)論文網(wǎng) 中國(guó)資訊網(wǎng)
基于圖像歐式距離和拉普拉斯特征映射的端元提取算法(通訊)
楊 磊, 劉尚爭(zhēng)
(南陽(yáng)理工學(xué)院電子與電氣工程學(xué)院,河南南陽(yáng)473004)
摘要:由于多重反射和散射,高光譜圖像中的混合像元實(shí)際上是非線性光譜混合。傳統(tǒng)的端元提取算法是以線性光譜混合模型為基礎(chǔ),因此提取精度不高。針對(duì)高光譜圖像的非線性結(jié)構(gòu),提出了基于圖像歐氏距離非線性降維的高光譜遙感圖像端元提取方法。該方法結(jié)合高光譜數(shù)據(jù)的物理特性,將圖像歐氏距離引入拉普拉斯特征映射進(jìn)行非線性降維以更好地去除高光譜數(shù)據(jù)集中冗余的空間信息和光譜維度信息,然后對(duì)降維后的數(shù)據(jù)利用尋找最大單形體
體積的方法提取端元。真實(shí)高光譜數(shù)據(jù)實(shí)驗(yàn)表明,提出的方法對(duì)高光譜圖像端元提取具有良好的效果,性能優(yōu)于線性降維的主成份分析算法和原始的拉普拉斯特征映射算法。
關(guān)鍵詞:圖像處理;高光譜圖像;端元提;非線性降維;圖像歐氏距離;拉普拉斯特征映射 中圖分類號(hào):TP751 文章編號(hào):1671 -637X(2016)04 -0048 -05
0 引言
由于高光譜成像光譜儀空間分辨率的限制以及自然界地物的復(fù)雜多樣性,獲得的遙感圖像的某些像素中往往包含多種地物類型,即混合像元¨J。如何有效地實(shí)現(xiàn)混合像元分解,已經(jīng)成為遙感研究的一個(gè)重要方向;旌舷裨纸饪梢苑譃槎嗽崛『拓S度估計(jì)兩個(gè)步驟。端元提取是混合像元分解的前提,已有的端元提取算法有:基于凸面幾何學(xué)的像元純度索引,頂點(diǎn)成份分析,N-FINDR;可以同時(shí)完成端元提取和豐度估計(jì)的迭代誤差分析,最小體積變換,非負(fù)矩陣分解等算法。這些算法均以線性光譜混合模型為基礎(chǔ),但是由于地面散射的非線性、最小反射率波長(zhǎng)明顯的非線性變化、像素內(nèi)水體變化的衰減作用、一個(gè)像素內(nèi)的多種散射和亞像元成分的異質(zhì)性等因素,高光譜數(shù)據(jù)具有內(nèi)在的非線性特征。
處理高光譜圖像非線性的一個(gè)策略是進(jìn)行非線性降維,流形學(xué)習(xí)算法可在降維的同時(shí)更好地挖掘數(shù)據(jù)的非線性特性,已經(jīng)被成功應(yīng)用于高光譜圖像的非線性特征提取、分類、異常檢測(cè)、混合像元解混等方面。將經(jīng)典流形學(xué)習(xí)算法等距映射(Iso-metric Mapping,Isomap)引入高光譜圖像處理,代替主成分分析( Principal Component Analysis,PCA)對(duì)高光譜數(shù)據(jù)進(jìn)行非線性降維,獲得較好的分類效果。提出利用光譜夾角距離( Spectral Angle Distance,SAD)和光譜信息散度(Spectral Information Divergence,SID)代替歐氏距離與測(cè)地線距離相結(jié)合對(duì)高光譜圖像進(jìn)行特征提取,獲得較好效果。參考Isomap算法提出了基于測(cè)地線距離的最大單形體體積解混算法,雖然該算法考慮了高光譜數(shù)據(jù)的非線性,得到了較好的解混結(jié)果,但僅考慮了高光譜圖像的光譜特征,忽略了其空間信息。本文針對(duì)高光譜圖像的非線性特征,結(jié)合高光譜圖像的空間信息,采用基于圖像歐氏距離的流形學(xué)習(xí)算法,對(duì)高光譜圖像進(jìn)行非線性降維,并參考N-FINDR算法對(duì)降維后的數(shù)據(jù)進(jìn)行端元提取。提出的算法充分考慮了高光譜圖像的非線性結(jié)構(gòu)和圖像的空間信息,提高了端元提取的精度。
1 拉普拉斯特征映射算法
拉普拉斯特征映射( Laplacian Eigenmaps,LE)算法是2001年BELKIN等人基于圖譜理論提出的,是一種局部流形學(xué)習(xí)算法,其基本思想是在高維空間中鄰近的點(diǎn)映射到低維空間上時(shí)仍是鄰近的。
LE算法的實(shí)現(xiàn)如下所述。
LE算法的基本思想較簡(jiǎn)單,即保留流形的局部近鄰信息,有利于數(shù)據(jù)的聚類與分類;因其考慮局部近鄰信息,求解過(guò)程為稀疏矩陣的特征值問(wèn)題,因此計(jì)算較簡(jiǎn)單。
2基于圖像歐氏距離流形降維的端元提取算法
2.1 圖像歐氏距離矩陣
原始的LE算法采用的是歐氏距離尋找與每個(gè)點(diǎn)最近的k個(gè)近鄰,被廣泛地應(yīng)用于人臉、手寫字體等高維數(shù)據(jù)的特征提取和識(shí)別。但是對(duì)于高光譜圖像數(shù)據(jù),地物在圖像中的分布具有連續(xù)性,每種端元的光譜與其周圍的背景像元緊密相關(guān)。根據(jù)圖像的空間特性,2005年WANG等人提出了圖像歐氏距離,它的核心思想是將空間關(guān)系引入圖像塊距離計(jì)算中,對(duì)其改進(jìn)后將其應(yīng)用于高光譜圖像塊之間的距離計(jì)算。對(duì)于水平寬度、垂直寬度和波段數(shù)分別為W,
式中,t是空間因子,表征了空間關(guān)系的影響程度。由于圖像距離對(duì)t并不敏感,一般可取3~6。
從式(2)和式(3)可看出,圖像歐氏距離很好地給出了高光譜圖像中以觀測(cè)像素為中心的八鄰域之間的距離關(guān)系。在實(shí)際應(yīng)用中,當(dāng)?shù)匚锓植驾^為集中或呈大片分布時(shí),圖像塊中的像素之間的空間關(guān)系較為顯著,因此空間因子£取較小值;反之,需選擇較大的t。
2.2基于圖像歐氏距離流形降維的端元提取算法
本文算法利用圖像歐氏距離代替LE算法中的歐氏距離對(duì)高光譜數(shù)據(jù)進(jìn)行非線性降維,并參考N-FINDR端元提取算法,對(duì)非線性降維后的數(shù)據(jù)隨機(jī)選擇p
當(dāng)前選擇的光譜端元,如果某個(gè)替換能得到更大體積的單形體,則這次替換作為有效替換得以保留,否則作為無(wú)效替換而被淘汰,最終得到p個(gè)端元。
算法具體步驟為:
1)指定端元數(shù)目p,用2.1節(jié)所述的圖像歐氏距離代替LE算法中的歐氏距離對(duì)數(shù)據(jù)進(jìn)行降維,使其維數(shù)降至p-1維;
3)在降維后高光譜數(shù)據(jù)其他像元中選擇一個(gè)像元P1,取代一個(gè)候選端元,形成新的凸面單體,計(jì)算體積V2,如V2>V1則該像點(diǎn)取代候選端元形成新的候選點(diǎn);
4)所有其他像元循環(huán)執(zhí)行步驟3),最終形成體積最大的單體,其頂點(diǎn)對(duì)應(yīng)的降維前的高光譜圖像中的像元為所提取的端元。
3實(shí)驗(yàn)結(jié)果
本節(jié)中采用實(shí)際的高光譜數(shù)據(jù)測(cè)試算法的性能,將本文提出的算法與PCA,Isomap,LE 3種降維算法進(jìn)行比較。降維后的數(shù)據(jù),結(jié)合N-FINDR端元提取算法,通過(guò)端元提取精度來(lái)評(píng)價(jià)這四種算法的性能。本文采用SAD和平均SAD,SID,平均SID作為端元提取結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn),這些參數(shù)越小,說(shuō)明端元的估計(jì)值與真實(shí)值越相似。所有的算法均運(yùn)行10次,取其均值。本文中涉及到的所有算法均利用Matlab 2010a,在同一臺(tái)計(jì)算機(jī)上實(shí)現(xiàn)(Win7系統(tǒng),Intel Pentium處理器3.0 GHz,4 GB內(nèi)存)。
3.1 AVIRIS Cuprite數(shù)據(jù)
AVRIS Cuprite數(shù)據(jù)為1995年7月獲取的美國(guó)Ne-vada州Cuprite采礦區(qū)的數(shù)據(jù),該高光譜圖像數(shù)據(jù)大小為250 x191,224個(gè)波段(0.4~2.5ym),空間分辨率和光譜分辨率分別為20 m和10 nm。本實(shí)驗(yàn)從中截取50 x50像素大小的子圖。除去存在水氣吸收和信噪比較低的波段,實(shí)驗(yàn)中使用了188個(gè)波段。實(shí)驗(yàn)數(shù)據(jù)的圖像(波段35)如圖1所示。
在虛警概率PF= 10-6或者更小時(shí),用虛擬維度方法求出端元個(gè)數(shù)為4。與實(shí)地勘測(cè)地物分布圖相比較,圖1中主要包含的4種礦物成分分別為鈣鐵榴石、藍(lán)線石、白云母、榍石。對(duì)比美國(guó)地質(zhì)勘探局( USGS)光譜實(shí)驗(yàn)室所提供的實(shí)地探測(cè)分布及對(duì)該地區(qū)包含礦物類型的描述,圖1中主要包含的4種礦物成分如表1所示,利用SAD和平均SAD,將3種降維算法提取得到的端元光譜與USGS光譜庫(kù)中的對(duì)應(yīng)光譜進(jìn)行比較,用于確定端元提取結(jié)果與光譜庫(kù)中相應(yīng)地物光譜的近似程度。
本文算法在端元個(gè)數(shù)確定后,還包括空間因子t和LE的鄰域K兩個(gè)參數(shù),其中t為空間因子,根據(jù)2.1節(jié)所述,當(dāng)?shù)匚锓植驾^為集中或呈大片分布時(shí),t取較大值,AVRIS Cuprite數(shù)據(jù)地物分布較為分散,因此取t為3。本文對(duì)k取[3 30]值進(jìn)行實(shí)驗(yàn)發(fā)現(xiàn),k<10時(shí)結(jié)果不穩(wěn)定,但當(dāng)k取[10 30]時(shí),結(jié)果差別不大,因此取k為15。表1、表2分別為4種算法提取的端元結(jié)果與USGS光譜庫(kù)中對(duì)應(yīng)光譜的SAD和SID。從表1和表2中看出,Isomap算法、LE算法和本文提出算法由于考慮了高光譜圖像的非線性結(jié)構(gòu),提取結(jié)果優(yōu)于線性降維算法PCA。而本文算法在進(jìn)行非線性降維的同時(shí)結(jié)合了圖像的空間信息,因此得到了最小的平均SAD和平均SID,即與真實(shí)光譜曲線最接近。
對(duì)于計(jì)算復(fù)雜度,以計(jì)算量最大步驟的復(fù)雜度表示:設(shè)L為原始高光譜數(shù)據(jù)維數(shù),N為數(shù)據(jù)點(diǎn)個(gè)數(shù)。Iscmap算法需要對(duì)N x N的拉普拉斯矩陣進(jìn)行特征分解,計(jì)算復(fù)雜度為0( N3);LE算法的拉普拉斯矩陣是稀疏陣,計(jì)算量最大的步驟是搜索k個(gè)最近鄰點(diǎn),計(jì)算復(fù)雜度為0(LN);PCA算法的計(jì)算復(fù)雜度取決于對(duì)Lx L的協(xié)方差矩陣和類內(nèi)離差陣的特征值分解,為0(L)。從表3可看出,PCA算法所需時(shí)間最少,LE算法次之,本文算法在LE算法的基礎(chǔ)上,將歐式距離改為較為復(fù)雜的圖像歐氏距離,因此所需時(shí)間多于LE算法,而Isomap算法最復(fù)雜,因此所需時(shí)間遠(yuǎn)多于LE算法和本文算法。
3.2 AVIRIS圣地亞哥機(jī)場(chǎng)數(shù)據(jù)
美國(guó)圣地亞哥機(jī)場(chǎng)AVIRIS數(shù)據(jù)的圖像光譜范圍為0. 389~2.467 ,共224個(gè)波段。去除水吸收譜段,剩下1 88個(gè)譜段被用于進(jìn)一步處理。為了減少計(jì)算的時(shí)間復(fù)雜度,從原始圖像左下角截取大小為50×50的子圖,如圖2所示。從圖2中看出,包含硬土、飛機(jī)、混凝土1、混凝土2這4種端元。為了定量評(píng)價(jià)算法的性能,各端元的參考光譜為根據(jù)地物真實(shí)分布情況人工從圖像中提取得到。在每一類像元的中心處分別抽取4個(gè)點(diǎn),并將其均值作為該端元的參考光譜。
該實(shí)驗(yàn)數(shù)據(jù)地物分布比較集中,根據(jù)2.1節(jié)所述空間因子選取£為3,對(duì)k取[3 30]的值進(jìn)行實(shí)驗(yàn)發(fā)現(xiàn)k<10時(shí)結(jié)果不穩(wěn)定,但當(dāng)k取[10 30]時(shí),結(jié)果差別不大,因此取k為15。比較4種算法得到的端元估計(jì)光譜與真實(shí)光譜之間的SAD,SID如表4、表5所示。從表4、表5中可看出,本文算法得到的平均SAD和平均SID均最小,即算法精度最高。從表6可看出,4種算法中的Isomap算法需要時(shí)間最長(zhǎng),PCA算法運(yùn)行時(shí)間最短。本文算法精度優(yōu)于Isomap算法,且效率遠(yuǎn)高于Isomap算法。
4 結(jié)語(yǔ)
針對(duì)高光譜數(shù)據(jù)的非線性特征,提出了基于圖像歐氏距離非線性降維的高光譜遙感圖像端元提取方法。該方法結(jié)合高光譜數(shù)據(jù)的物理特性,將圖像歐氏距離引入拉普拉斯特征映射非線性降維算法中以便更好地去除高光譜數(shù)據(jù)集中冗余的空間信息和光譜維度信息。真實(shí)高光譜數(shù)據(jù)實(shí)驗(yàn)表明,提出的方法對(duì)高光譜圖像端元提取具有良好的效果,性能優(yōu)于線性降維
PCA算法、Isomap算法和原始的LE算法,并且算法效率高于非線性降維的Isomap算法。