性能

分词模块

基础模型在人民日报测试数据上的性能如下:

语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。

  F1
测试集 98.5%

词性标注模块

基础模型在人民日报数据集上的性能如下:

语料信息:人民日报1998年2月-6月(后10%数据作为开发集)作为训练数据,1月作为测试数据。

  ACC
测试集 98.5%

命名实体识别模块

基础模型在人民日报数据集上的性能如下:

语料信息:人民日报1998年1月做训练(后10%数据作为开发集),6月前10000句做测试作为训练数据。

  F1
测试集 95.4

语义角色标注模块

基础模型在CPB3.0上的性能如下:

  F1
测试集 80.6%

依存句法分析模块

Chinese Dependency Treebank(CDT) 数据集上的性能如下。

  LAS
测试集 89.5

语义依存分析模块

CCL2020 数据集上的性能如下。

  LAS
测试集 75.2