基于主动学习的多标签多示例SVM分类器
Download
Report
Transcript 基于主动学习的多标签多示例SVM分类器
多示例多标签学习
Multi-Instance Multi-Label
Learning(MIML)
报告人:李杰龙
报告主要内容
研究背景
多示例多标签学习(MIML)
MIML相关的研究
研究背景
“在利用机器学习技术解决实际问题时,常见的做
法是先对真实对象进行特征提取,用一个特征向量
来描述这个对象,这样就得到了一个示例(instance),
然后把示例与该对象所对应的类别标记(label)关联起
来,就得到了一个例子(example)”——周志华:
《多示例多标记学习》
研究背景
Image
Features Representation
instance
传统的监督学习
label
elephant
研究背景
除elephant外,
图片的其他
信息是否可
忽略?
■多标签学习
■多示例学习
多标签学习
Image
Features Representation
label
elephant
instance
tree
lion
研究背景
多标签学习算法的不足
一幅图像通过提取全局特征表示视觉数据,但视
觉数据具有歧义性,一幅图像包含若干不同区域
,各个区域对应不同的语义,各个标注实际上对
应的是图像当中的部分区域而不是全局关系。使
用一个全局特征是很难表示图像的全部语义。(
示例与标签之间具有模糊性)
多示例学习
Image
Features Representation
label
instance1
instance2
instance3
instance4
instance5
elephant
研究背景
多示例学习算法的不足
解决了视觉数据歧义性问题,但局限于单语义概
念学习上。多示例学习简单地把标注任务分解为
独立地单概念标注,然后独一完成,忽略了标签
的联系。(标签与标签具有模糊性)
MIML学习
Image
Features Representation
instance1
label
tree
instance2
instance3
elephant
instance4
lion
instance5
MIML学习
在MIML学习框架下,一个对象被表示为多
个示例组成的包,并且关联多个标签;
真实世界的对象更容易采用多示例多标签
学习框架来建模;
传统的监督学习、多示例学习以及多标签
学习都可以看作是多示例多标签学习的特
例。
MIML学习
MIML学习的退化策略
Solution A:MIML→MISL→SISL(e.g.:MIMLBOOST)
Solution B:MIML→SIML→SISL(e.g.:MIMLSVM)
MIMLSVM算法
在MIMLSVM算法
中,先对训练数据包
进行聚类,将训练数
据包聚类成指定的K
部分,确定相应聚类
中心包,这样可求出
所有数据包与这些中
心包的距离,作为包的
特征,变成k维的实数
矩阵,转化为SIML
MIML应用
退化策略
最大分类间隔的MIML算法
RBF神经网络MIML算法
Makov的MIML算法
示例包的生成(主要为图像)
基于像素块的包生成(e.g.:SBN)
基于SOM分割的包生成(e.g.:ImaBag)
词袋模型+TF-IDF
..
..
.
.
MIML应用
MIML应用
文本分类
图像检索、标注
视频标注
参考文献
[1]周志华,张敏灵.MIML多示例多标签学习.
[2]Zhou Zhi-hua, Zhang Min-ling, Huang Sheng-jun. Multiinstance multi-label learning[J].
[3] Zhou Zhi-hua, Zhang Min-ling. Multi-instance multi-label
learning with application to scene classification[C].
[4]黄双萍.通用视觉目标识别的关键技术[D].