简介

语言技术平台(Language Technology Platform,LTP)是 哈工大社会计算与信息检索研究中心 历时十年开发的一整套中文语言处理系统。LTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的丰富而且高效的中文语言处理模块(包括词法、句法、语义等6项中文处理核心技术),以及基于动态链接库(Dynamic Link Library, DLL)的应用程序接口,可视化工具,并且能够以网络服务(Web Service)的形式进行使用。

从2006年9月5日开始该平台对外免费共享目标代码,截止目前,已经有国内外400多家研究单位共享了LTP,也有国内外多家商业公司购买了LTP,用于实际的商业项目中。2010年12月获得中国中文信息学会颁发的行业最高奖项:“钱伟长中文信息处理科学技术奖”一等奖。

2011年6月1日,为了与业界同行共同研究和开发中文信息处理核心技术,我中心正式将LTP开源。

2013年9月1日,语言技术平台云端服务” 语言云 “正式上线。

新闻

语言技术平台3.2.0版 发布

  • [增加] 分词模块增量模型训练工具。使用户可以在语言技术平台基线模型的基础之上增加训练数据,从而获得特定领域性能更好的模型。
  • [修改] Boost.Regex到1.56.0,由于旧版本Boost.Regex的 match_results 类存在竞争问题,这一修改修复了 multi_cws_cmdline 随机出错的问题。
  • [修改] 使自动化测试脚本支持Windows运行以及多线程测试
  • [修改] 将原 examples 文件夹下的示例文件转移到 test 文件夹下并纳入语言技术平台的编译链
  • [测试] 新版语言技术平台通过 cygwin 编译测试
  • [测试] 多线程程序 multi_ltp_testmulti_cws_cmdline 以及 multi_pos_cmdline 在Windows通过测试

索引及表格