Transcript 词性标注
NiuParser 1.0.0 Beta 总览 • 中文句法语义分析系统 • 分词,词性标注,命名实体识别,组块分析, 成分句法分析,依存句法分析,语义角色标注 • C++语言,无别人开源代码 • 分析速度快,业内最好性能 功能关系 系统形式 使用方法 • 分词: Niuparser-v1.0.0-beta-for-research-win.exe 径> -c <配置文件路径> • 词性标注: Niuparser-v1.0.0-beta-for-research-win.exe • 命名实体识别: Niuparser-v1.0.0-beta-for-research-win.exe • 组块识别: Niuparser-v1.0.0-beta-for-research-win.exe • 成分句法分析: Niuparser-v1.0.0-beta-for-research-win.exe • 依存句法分析: Niuparser-v1.0.0-beta-for-research-win.exe • 语义角色标注: Niuparser-v1.0.0-beta-for-research-win.exe --WS -in <输入文件路径> -out <输出文件路 --POS … --NER … --CHK … --CP … --DP … --SRL … 分词 ctb 分词测试数据,348句,13738汉字。 消耗时间:0.443sec 分词结果:最后一行“(完)”丢了 词性标注 • 标注规范:CTB规范,33个词性标记。 词性标注 • ctb 标注测试数据,348句,8008个词。 • 0.568sec 命名实体识别 • 18种命名实体 组块分析 成分句法分析 • 标注规范:CTB规范,23个句法标记。 依存分析 • 输出格式:CoNLL格式 语义角色标注 • 标注规范:中文PropBank。 添加词典