遥感图像的多监督分类器集成的研究及应用

Download Report

Transcript 遥感图像的多监督分类器集成的研究及应用

交叉学科项目报告
遥感图像的多监督分类器集成的研究及应用
——本科生科研基金项目
指导教师:
黄海洋 数学科学学院
陈 晋 减灾与应急管理研究院
地表过程与资源生态国家重点实验室
项目成员:
陈 杉 邢庆峰 饶玉晗
4/10/2015
项目背景与意义
国内外现状分析
研究内容与方案
技术流程分析
项目创新与前景
4/10/2015
项目背景与意义
近年极端天气频发
关注全球变化
(哥本哈根)
当前分类体系存在缺陷
研究地表覆盖
(空间分布/动态变化)
863重点项目
(全球地表覆盖遥感制图及关键技术研究)
4/10/2015
项目背景与意义
国内外现状分析
研究内容与方案
技术流程分析
项目创新与前景
4/10/2015
国内外现状分析
监督分类器
(结果存在缺陷,具有选择性)
在遥感方面无多分类器集成的先例
国内的首次尝试
(基于误差分析)
4/10/2015
项目背景与意义
国内外现状分析
研究内容与方案
技术流程分析
项目创新与前景
4/10/2015
研究目标
通过样本检验、理论分析等手段筛选和构
建最优的多分类器集成方法,并进一步应
用到地表覆盖的分类中,切实的提高地表
覆盖分类的精度。
4/10/2015
研究内容及方案
研究各种监督分类器的数学原理
并应用其进行遥感图像分类
最大似然(ML)
神经网络(NN)
…
研究各种集成整合算法的数学原理,
并应用样本进行集成
朴素贝叶斯法(NB)
模糊积分法(FI)
…
筛选:使用独立样本进行检验
形成最佳多监督分类器集成策略
4/10/2015
项目背景与意义
国内外现状分析
研究内容与方案
技术流程分析
项目创新与前景
4/10/2015
4/10/2015
4/10/2015
项目背景与意义
国内外现状分析
研究内容与方案
技术流程分析
项目创新与前景
4/10/2015
项目创新与前景
目前,在国内遥感界,引进多分类器集成
对遥感图像进行处理尚无先例,故项目本
身具有十分重要的意义。
另外,依托于国家863重点项目“全球地表
覆盖遥感制图及关键技术研究”,本项目
在国内地表覆盖技术中将有重要的作用
4/10/2015
4/10/2015
选择优越性
研究表明,对于同一套遥感数据,不同的
分类器分类精度不同,同一个分类器对不
同类别的分类精度也存在差异,而这种差
异随分类方法的不同而有变化,这种情况
被称为“选择优越性”。
因此,不同的分类器之间存在互补的可能
。多分类器集成就是通过一定的规则,将
不同的分类器进行优势互补,从而提高分
类精度的过程
4/10/2015
Background1
遥感图像分类
遥感图像中所包含的信息可以转化为该图像所覆盖的地表
范围内每个像元在各个波段(特定波长范围)的反射率。
遥感图像分类,就是要根据像元在各个波段的反射率的不
同,将像元划分到不同的地物类别(如植被、城市、水体
等)。
多光谱遥感图像中包含多个波段,每个波段可以视为像元
的一个特征。假设有 n个波段,则以这n个特征为坐标轴
,可以创建一个 n维的空间坐标系,这个空间称为特征空
间。每一个像元都可以用这个空间里的一个点来表示。在
特征空间中,不同的地物将会分布在不同的区域,通过确
定各个区域之间的边界,就可以将像元划分到相应的地物
类别中。
4/10/2015
Background1
遥感图像分类
根据有无类别的先验知识,可以将遥感图像分类方法分为
监督(supervised)与非监督(unsupervised)两类。监督
分类是指通过一些已知光谱信息与类别的数据(称作训练
数据)来获取各个类别的先验知识,再根据这些先验知识
对像元进行分类的方法。(本课题研究的内容)
非监督分类则是在没有训练数据的情况下,根据特征空间
中数据的聚集和离散特点对像元进行分类。(多元统计中
的聚类分析)
分类完成后, 将像元被分得的类别与其真实的类别比较
,可以评价该次分类的精度。
精度评定是遥感图像分类的重要一步,一般以混淆矩阵(
confusion matrix)的形式来表示。
4/10/2015
1. 监督分类器
遥感中常用的分类器有:最大似然(ML)、最小距离
(MinD)、马氏距离(MD)、光谱角分类(SAM)、
支撑矢量机(SVM)、神经网络(NN),等等。
分类器的输出结果:
4/10/2015
Background2
——常用监督分类器
最小距离(MD)
在特征空间中,每个样
本可以用一个
n 维的向量
x  (x 1 , x 2 ,  , x n )来来表示
根据训练数据确定每一
类地物的均值
 i  (  i1 ,  i2 ,  ,  in )
计算样本x到各类中心
d(i | x) 
(x -  i ) (x -  i ) 
'
将样本归入距离最小的
4/10/2015
(即均值)的距离,

一类。
( x k   ik )
2
Background2
——常用监督分类器
最小距离(MD)
在特征空间中,每个样
本可以用一个
n 维的向量
x  (x 1 , x 2 ,  , x n )来来表示
根据训练数据确定每一
类地物的均值
 i  (  i1 ,  i2 ,  ,  in )
计算样本x到各类中心
d(i | x) 
(x -  i ) (x -  i ) 
'
将样本归入距离最小的
4/10/2015
(即均值)的距离,

一类。
( x k   ik )
2
Background2
——常用监督分类器
马氏距离(MahD)
类地物的均值
根据训练数据确定每一
计算样本 x 到各类中心的马氏距离
,
d M (i | x)  (x -  i )  i (x -  i )
'
将样本归入马氏距离最
4/10/2015
小的一类。
 i 和方差  i ,
Background2
——常用监督分类器
最大似然(ML)
假设图像中所有样本在
特征空间中的数据
训练数据确 定 每一类地
分布为正态分布,根据
物的均值  i 和方差  i , 计算样本属于各类的
似然
函数(即概率):
p ( x | i )  ( 2 )
n / 2
| i |
将样本归入概率最大的
4/10/2015
1 / 2
exp[ 
1
2
一类
( x   i )  i ( x   i )]
'
Background2
——常用监督分类器
神经网络(NN)
4/10/2015