Transcript Document
基于意象图式的文本蕴涵识别 初探 倪盛俭,姬东鸿 1 前言 文本蕴涵识别(RTE)重要性和现有研究的 不足(文本蕴涵概念参考第8页例子) • 有学者指出RTE是大部分NLP应用研究的核 心,(Pazienza等,2005) • 缺乏对图式理据的挖掘(本文的切入点)。 • 下文结构:先简单说明本文涉及的各类图 式概念,然后说明图式怎样成为RTE的理 据,最后是总结,进一步明确本研究的意 义。 2 图式 • 图式特点:理想性、整体性、不易变动性 ,同时具有开放性、选择性、普遍性等。 (Ungerer&Schmid,1996) • 作用:扩展词语理解的(可预测)语境, 为RTE服务。 2.1 物性结构 • 主要作用: 描述实体(特别是人工物)语义内容。 • 物性结构的四部分内容:构成角色、形式角色 (体现非论元性语义依存关系)、功用角色和施 成角色(体现论元性语义依存关系)。 • 物性结构是桥接词汇、句法和常识的有效手段之 一,这种特性使得它可以对蕴涵识别做出贡献。 • 具体概念(Pustejovsky,1996, 2006;宋作艳, 2011) 2.2 理想认知模型 • 在Lakoff(1987)一书中首次得到全面、系 统描述。理想认知模型是是组织知识的手 段。 • 王寅:较为复杂的心智结构,具有体验性、 完形性和内在性(是心智中认识事体的方 式)(王寅,2005:140) • 作用:储存和表达抽象概念的语义内容 (概念结构)。 2.3 框架和框架关系 • 社会语境中事件结构的描述和理解。 • 每一个格框架刻画一个抽象、具有图式化 特征的小“情景”或“语境”。 • 框架关系:继承、利用(预设)、视角、 子框架关系(母框架相当于小型脚本,包 含条件和因果关系)等。 2.4 脚本 • 多个框架构成脚本,脚本是框架的序列。 • 不同于脚本的特点 弱式脚本 强式脚本 最强式脚本 3 RTE中的图式理据 • 文本语义预设、文本语用预设、文本语义 蕴涵、文本规约会话含义、文本非规约会 话含义和文本结果蕴涵。 • 3.1 RTE的QS理据 • (1)明天天气:浙北地区将有大雪,浙南 大部分地区将有小雪。(文本T-蕴涵文本) • (1)a 温州明天很可能会下小雪。(假设 H-被蕴涵文本)(文本蕴涵概念) “温州”物性结构草图 3.2 RTE的ICM理据 • Lakoff认为“母亲”的ICM至少应当包括以 下子模型: • 生殖模型——生孩子 • 遗传模型——提供基因 • 养育模型——养育孩子 • 婚姻模型——父亲的妻子 • 宗谱模型——孩子最亲近的女性长辈 (Lakoff,1987:74) • (2)A生了B。 • (2a) B身上有A的基因。(或“B继承了 A的基因”) • (2b)A养育了B。(或“A对B有养育之 恩”) 2.3 RTE的框架(关系)理据 • (3)他于是就退学了,以示抗议,但至今没 有找到工作。(T) • (3a)至今没有人聘用他。(H) • “雇佣”框架两个不同视角:“找工作” 框架和“聘用”框架触发“雇佣”框架。 • “至今没有人聘用他。”和“他至今没有 找到工作。” 2.4 RTE的脚本理据 根据Schank & Abelson,从顾客角度,饭店脚本的草图包括 以下内容: • 脚本:饭店 • 角色:顾客,服务员,厨师,出纳员(cashier) • 理由:取得并享受食物,充饥。 • 场景1:进入(饭店) • 顾客进入饭店,寻找空位,就坐。 • 场景2:点菜 • 接受菜单,看菜单,决定吃什么,点菜 • 场景3:吃 • 收到食物,吃食物 • 场景4:从饭店出来 • 要求结账,拿到账单,给女服务员消费,走到出 纳处,把钱给出纳,从饭店出来。 (不同场景见具有条件、因果关系) • (4)A:小徐,一起去吃饭吧。B:我刚 从小观园回来呢。 • (4a)B已经吃过饭。 • (默认理论、关联理论、非标记性) 结语 • 认知模式主要是意象图式形式(而不是命题 形式),语言中无处不在的隐喻、换喻运作 是基于意象图式之上的。(本PPT没有体现) • 意象图示的重要性和构建各类意象图式库 的必要性。(未来工作) • 图示理据的研究还需结合NLP的方法特点。 • 不足:例示性,等。 敬请指点 谢谢!