词性标注

Download Report

Transcript 词性标注

NiuParser 1.0.0 Beta
总览
• 中文句法语义分析系统
• 分词,词性标注,命名实体识别,组块分析,
成分句法分析,依存句法分析,语义角色标注
• C++语言,无别人开源代码
• 分析速度快,业内最好性能
功能关系
系统形式
使用方法
• 分词:
Niuparser-v1.0.0-beta-for-research-win.exe
径> -c <配置文件路径>
• 词性标注:
Niuparser-v1.0.0-beta-for-research-win.exe
• 命名实体识别:
Niuparser-v1.0.0-beta-for-research-win.exe
• 组块识别:
Niuparser-v1.0.0-beta-for-research-win.exe
• 成分句法分析:
Niuparser-v1.0.0-beta-for-research-win.exe
• 依存句法分析:
Niuparser-v1.0.0-beta-for-research-win.exe
• 语义角色标注:
Niuparser-v1.0.0-beta-for-research-win.exe
--WS -in <输入文件路径> -out <输出文件路
--POS …
--NER …
--CHK …
--CP …
--DP …
--SRL …
分词
ctb 分词测试数据,348句,13738汉字。
消耗时间:0.443sec
分词结果:最后一行“(完)”丢了
词性标注
• 标注规范:CTB规范,33个词性标记。
词性标注
• ctb 标注测试数据,348句,8008个词。
• 0.568sec
命名实体识别
• 18种命名实体
组块分析
成分句法分析
• 标注规范:CTB规范,23个句法标记。
依存分析
• 输出格式:CoNLL格式
语义角色标注
• 标注规范:中文PropBank。
添加词典