基于主题情感混合模型的无监督文本情感分析
Download
Report
Transcript 基于主题情感混合模型的无监督文本情感分析
基于主题情感混合模型
的无监督文本情感分析
汇报人:周学广 教授
海军工程大学信息安全系
主要内容
一
LDA模型
二
UTSU模型
三
实验对比与分析
海军工程大学信息安全系
LDA模型
VSM模型
LSA模型
pLSA模型
LDA模型
海军工程大学信息安全系
VSM模型
VSM: Vector Space Model
d
w1
w2
w3
……
wN
海军工程大学信息安全系
LSA模型
LSA :Latent Semantic Analysis
U
D
documents
dims
=
dims
dims
C
dims
words
words
documents
VT
海军工程大学信息安全系
pLSA模型
pLSA :Probabilistic Latent Semantic Analysis
d
z
w
N
M
海军工程大学信息安全系
LDA模型
LDA :Latent Dirichlet Allocation
a
q
z
β
f
w
K
N
M
海军工程大学信息安全系
情感分类方法
有监督的机器学习方法
无监督的机器学习方法
海军工程大学信息安全系
UTSU模型
UTSU :Unsupervised topic-sentiment unification model
a
c
qd
jd
L
ms
(z,m)n
β
fz,m
K
(z,m) n L
wn
N
S
M
海军工程大学信息安全系
UTSU模型
给定所有参数,UTSU模型所有潜在变量和可观察变量的联
合概率为:
p(f(1,1):( K , L ) ,q1:M , j1:M , ( z, m)1:M , w1:M )
K, j
M
Nds
Ns
p(f(i , j ) ) p(q d a ) p(jd c ) p(ms jd ) p( ws ,n f( z ,m ) s ,n ) p z, m s ,n ms , q d
1,1
d 1
n 1
s 1
word plate
topic sentiment plate
sentence plate
document plate
其中,Nds表示文档内的句子数,Ns表示句子s内的词数。
海军工程大学信息安全系
UTSU模型求解
p( z, m w)
文档~主题分布 q
文档~情感分布 j
主题情感~词分布 f
海军工程大学信息安全系
UTSU模型求解
p( zi , msi zi , m si , w)
p( z , m, w)
p( z i , m si , w)
p ( w z , m) p ( z , m)
p( w i z i , m si ) p ( wi ) p ( z i , m si )
B(nk , j )
B(nk , j , i
B(nd c ) B(nd , j a )
) B(nd , si c ) B(nd , j , i a )
(nk( t,)j t )
(nd( j ) c j )
(nd( k, )j a k )
V (t )
L ( j)
K (k )
(nk , j t ) (nd c j ) (nd , j a k )
t 1
j 1
k 1
L
V (t )
(n( j ) c ) K ( k )
(nk , j , i t ) d , si
(
n
a
)
j
k
d , j , i
j 1
t 1
k 1
(nk(t,)j , i t )
(nd( ,j) si c j )
(nd( k, )j , i a k )
海军工程大学信息安全系
UTSU模型求解
nd( k, )j a k
q d , j ,k
K
(k )
(
n
d , j ak )
k 1
nd( j ) c j
jd, j
L
( j)
(
n
d cj)
j 1
nk( w, j) t
f k , j,w
V
( w)
(
n
k , j t )
t 1
海军工程大学信息安全系
实验结果与分析
数据集
快递
烧烤
酒店
计算机
Pos
1150
910
1130
1270
Neg
1140
1230
1200
1150
Sum
2290
2140
2330
2420
海军工程大学信息安全系
主题-情感词发现
计算机(-)
不
系统
装
有点
买
大
散热
屏幕
时
面
感
问题
一般
京东
高
重
驱动
手
郁闷
笔记本
运行
声音
触摸板
慢
分
分区
卡
开机
显示
机
内存
坏
太
换
胆包
行
需要
鼠标
不能
计算机(+)
不错
键盘
电池
没有
小时
做工
机器
漂亮
本
速度
大
配置
外观
带
上网
方便
性价
使用
性能
长
单
实
小巧
时间
比较
舒服
起来
价格
功能
散热
手感
喜欢
开
本本
硬盘
强
摄像头
白色
精致
海军工程大学信息安全系
情感分类准确率对比
90
85
80
precision/%
75
70
pang
UTSU
ASUM
JST
65
60
55
50
1
2
3
4
corp
海军工程大学信息安全系
情感分类召回率对比
90
pang
UTSU
ASUM
JST
85
recall/%
80
75
70
65
1
2
3
4
corp
海军工程大学信息安全系
情感分类综合指标对比
90
pang
UTSU
ASUM
JST
85
80
F1/%
75
70
65
60
55
1
2
3
4
corp
海军工程大学信息安全系
汇报完毕,谢谢大家!
海军工程大学信息安全系