Transcript Document

基于意象图式的文本蕴涵识别
初探
倪盛俭,姬东鸿
1 前言
文本蕴涵识别(RTE)重要性和现有研究的
不足(文本蕴涵概念参考第8页例子)
• 有学者指出RTE是大部分NLP应用研究的核
心,(Pazienza等,2005)
• 缺乏对图式理据的挖掘(本文的切入点)。
• 下文结构:先简单说明本文涉及的各类图
式概念,然后说明图式怎样成为RTE的理
据,最后是总结,进一步明确本研究的意
义。
2 图式
• 图式特点:理想性、整体性、不易变动性
,同时具有开放性、选择性、普遍性等。
(Ungerer&Schmid,1996)
• 作用:扩展词语理解的(可预测)语境,
为RTE服务。
2.1 物性结构
• 主要作用: 描述实体(特别是人工物)语义内容。
• 物性结构的四部分内容:构成角色、形式角色
(体现非论元性语义依存关系)、功用角色和施
成角色(体现论元性语义依存关系)。
• 物性结构是桥接词汇、句法和常识的有效手段之
一,这种特性使得它可以对蕴涵识别做出贡献。
• 具体概念(Pustejovsky,1996, 2006;宋作艳,
2011)
2.2 理想认知模型
• 在Lakoff(1987)一书中首次得到全面、系
统描述。理想认知模型是是组织知识的手
段。
• 王寅:较为复杂的心智结构,具有体验性、
完形性和内在性(是心智中认识事体的方
式)(王寅,2005:140)
• 作用:储存和表达抽象概念的语义内容
(概念结构)。
2.3 框架和框架关系
• 社会语境中事件结构的描述和理解。
• 每一个格框架刻画一个抽象、具有图式化
特征的小“情景”或“语境”。
• 框架关系:继承、利用(预设)、视角、
子框架关系(母框架相当于小型脚本,包
含条件和因果关系)等。
2.4 脚本
• 多个框架构成脚本,脚本是框架的序列。
• 不同于脚本的特点
弱式脚本
强式脚本
最强式脚本
3 RTE中的图式理据
• 文本语义预设、文本语用预设、文本语义
蕴涵、文本规约会话含义、文本非规约会
话含义和文本结果蕴涵。
• 3.1 RTE的QS理据
• (1)明天天气:浙北地区将有大雪,浙南
大部分地区将有小雪。(文本T-蕴涵文本)
• (1)a 温州明天很可能会下小雪。(假设
H-被蕴涵文本)(文本蕴涵概念)
“温州”物性结构草图
3.2 RTE的ICM理据
• Lakoff认为“母亲”的ICM至少应当包括以
下子模型:
•
生殖模型——生孩子
•
遗传模型——提供基因
•
养育模型——养育孩子
•
婚姻模型——父亲的妻子
• 宗谱模型——孩子最亲近的女性长辈
(Lakoff,1987:74)
• (2)A生了B。
• (2a) B身上有A的基因。(或“B继承了
A的基因”)
• (2b)A养育了B。(或“A对B有养育之
恩”)
2.3 RTE的框架(关系)理据
• (3)他于是就退学了,以示抗议,但至今没
有找到工作。(T)
• (3a)至今没有人聘用他。(H)
• “雇佣”框架两个不同视角:“找工作”
框架和“聘用”框架触发“雇佣”框架。
• “至今没有人聘用他。”和“他至今没有
找到工作。”
2.4 RTE的脚本理据
根据Schank & Abelson,从顾客角度,饭店脚本的草图包括
以下内容:
•
脚本:饭店
•
角色:顾客,服务员,厨师,出纳员(cashier)
•
理由:取得并享受食物,充饥。
•
场景1:进入(饭店)
•
顾客进入饭店,寻找空位,就坐。
•
场景2:点菜
•
接受菜单,看菜单,决定吃什么,点菜
•
场景3:吃
•
收到食物,吃食物
•
场景4:从饭店出来
•
要求结账,拿到账单,给女服务员消费,走到出
纳处,把钱给出纳,从饭店出来。
(不同场景见具有条件、因果关系)
• (4)A:小徐,一起去吃饭吧。B:我刚
从小观园回来呢。
• (4a)B已经吃过饭。
• (默认理论、关联理论、非标记性)
结语
• 认知模式主要是意象图式形式(而不是命题
形式),语言中无处不在的隐喻、换喻运作
是基于意象图式之上的。(本PPT没有体现)
• 意象图示的重要性和构建各类意象图式库
的必要性。(未来工作)
• 图示理据的研究还需结合NLP的方法特点。
• 不足:例示性,等。
敬请指点
谢谢!