基于主动学习的多标签多示例SVM分类器

Download Report

Transcript 基于主动学习的多标签多示例SVM分类器

多示例多标签学习
Multi-Instance Multi-Label
Learning(MIML)
报告人:李杰龙
报告主要内容
 研究背景
 多示例多标签学习(MIML)
 MIML相关的研究
研究背景
 “在利用机器学习技术解决实际问题时,常见的做
法是先对真实对象进行特征提取,用一个特征向量
来描述这个对象,这样就得到了一个示例(instance),
然后把示例与该对象所对应的类别标记(label)关联起
来,就得到了一个例子(example)”——周志华:
《多示例多标记学习》
研究背景
Image
Features Representation
instance
传统的监督学习
label
elephant
研究背景
除elephant外,
图片的其他
信息是否可
忽略?
■多标签学习
■多示例学习
多标签学习
Image
Features Representation
label
elephant
instance
tree
lion
研究背景
多标签学习算法的不足
一幅图像通过提取全局特征表示视觉数据,但视
觉数据具有歧义性,一幅图像包含若干不同区域
,各个区域对应不同的语义,各个标注实际上对
应的是图像当中的部分区域而不是全局关系。使
用一个全局特征是很难表示图像的全部语义。(
示例与标签之间具有模糊性)
多示例学习
Image
Features Representation
label
instance1
instance2
instance3
instance4
instance5
elephant
研究背景
多示例学习算法的不足
解决了视觉数据歧义性问题,但局限于单语义概
念学习上。多示例学习简单地把标注任务分解为
独立地单概念标注,然后独一完成,忽略了标签
的联系。(标签与标签具有模糊性)
MIML学习
Image
Features Representation
instance1
label
tree
instance2
instance3
elephant
instance4
lion
instance5
MIML学习
在MIML学习框架下,一个对象被表示为多
个示例组成的包,并且关联多个标签;
真实世界的对象更容易采用多示例多标签
学习框架来建模;
传统的监督学习、多示例学习以及多标签
学习都可以看作是多示例多标签学习的特
例。
MIML学习
MIML学习的退化策略
Solution A:MIML→MISL→SISL(e.g.:MIMLBOOST)
Solution B:MIML→SIML→SISL(e.g.:MIMLSVM)
MIMLSVM算法
 在MIMLSVM算法
中,先对训练数据包
进行聚类,将训练数
据包聚类成指定的K
部分,确定相应聚类
中心包,这样可求出
所有数据包与这些中
心包的距离,作为包的
特征,变成k维的实数
矩阵,转化为SIML
MIML应用
 退化策略
最大分类间隔的MIML算法
RBF神经网络MIML算法
Makov的MIML算法
 示例包的生成(主要为图像)
基于像素块的包生成(e.g.:SBN)
基于SOM分割的包生成(e.g.:ImaBag)
词袋模型+TF-IDF
..
..
.
.
MIML应用
MIML应用
文本分类
图像检索、标注
视频标注
参考文献
[1]周志华,张敏灵.MIML多示例多标签学习.
[2]Zhou Zhi-hua, Zhang Min-ling, Huang Sheng-jun. Multiinstance multi-label learning[J].
[3] Zhou Zhi-hua, Zhang Min-ling. Multi-instance multi-label
learning with application to scene classification[C].
[4]黄双萍.通用视觉目标识别的关键技术[D].