LTP 的下载和安装¶
如果你想要使用LTP,必须拥有两部分内容
- LTP项目文件
- LTP模型文件
你可以从以下链接获得最新的LTP项目源码。
如果你是windows用户,你也可以跳过从源代码编译的环节,从以下链接获得编译好的二进制文件
你可以从以下链接获得LTP的模型文件
- 百度云 当前模型版本3.3.1
依赖:CMake¶
LTP使用编译工具CMake构建项目。在安装LTP之前,你需要首先安装CMake。CMake可以在 CMake项目官网 。如果你是Windows用户,请下载CMake的二进制安装包;如果你是Linux,Mac OS或Cygwin的用户,可以通过编译源码的方式安装CMake,当然,你也可以使用Linux的软件源来安装。
在 Windows (MSVC) 下编译¶
第一步:构建 VC Project¶
在项目文件夹下新建一个名为 build
的目录,打开CMake Gui,在source code中填入项目目录,在binaries中填入 build
目录。然后Configure -> Generate。
或者在命令行build目录下运行:
cmake ..
编译结果说明¶
编译成功后,会在 bin
目录下生成以下二进制程序:
程序名 | 说明 |
---|---|
ltp_test |
LTP主程序 |
ltp_server [2] |
LTP Server |
在 bin/examples
目录下生成以下二进制程序:
程序名 | 说明 |
---|---|
cws_cmdline |
分词模块命令行程序 |
pos_cmdline |
词性标注模块命令行程序 |
ner_cmdline |
命名实体识别模块命令行程序 |
par_cmdline |
依存句法分析模块命令行程序 |
在 lib
目录下生成以下静态链接库 [3] :
程序名 | 说明 |
---|---|
splitsnt.lib |
分句lib库 |
segmentor.lib |
分词lib库 |
postagger.lib |
词性标注lib库 |
parser.lib |
依存句法分析lib库 |
ner.lib |
命名实体识别lib库 |
srl.lib |
语义角色标注lib库 |
在 tools/train
目录下生成以下二进制程序:
程序名 | 说明 |
---|---|
otcws |
分词训练和测试套件 |
otpos |
词性标注训练和测试套件 |
otner |
命名实体识别训练和测试套件 |
nndepparser |
依存句法分析训练和测试套件 |
lgsrl |
语义角色标注训练和测试套件 |
注
[1] | boost::multi_array 与VS2010不兼容的bug已经在3.1.0中得到修复,3.1.x及以上版本已经可以使用Debug方式构建,但出于效率考虑,仍旧建议使用Release方式构建。 |
[2] | 在window版本中 ltp_server 、Maxent 、SRLExtract 、SRLGetInstance 并不被编译。 |
[3] | window下产生的静态库的后缀是.lib,linux下产生的静态库的后缀是.a |