NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
2021-10-22 18:36:57 4.05MB 分词器 nlpir 张华平 词性标注
1
中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45%,API不超过200KB,各种词典数据压缩后不到3M,是当前世界上最好的汉语词法分析器。
2021-10-08 21:45:32 8.66MB 中科院 分词 人工智能 机器学习
1
Readme 欢迎使用汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System) 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。 访问我们的网站www.i3s.ac.cn,您可以获取ICTCLAS3.0的最新版本,同时还可以下载更多的技术组件。 中科计算技术转移中心(ICT Technology Transferring Center)是属于中国科学院计算技术研究所所有的全资国有孵化器公司,主要使命是负责孵化中科院计算所的前沿技术与最新科研成果,通过市场化运作促进科研成果的产业化,进一步实现“产学研”的有机协调发展。中科计算技术转移中心信息智能与信息安全事业部(Division of Information Intelligence and Information Security,简称I3S)是中科院计算所信息智能与信息安全中心直接孵化的一个独立事业部,主要负责孵化该研究中心在Web信息智能处理、Web信息安全与Web搜索应用三个方向积累了10余年的核心技术与实用产品。
2021-09-28 14:22:06 3.81MB 中科院 分词
1
在张华平博士的空间上直接下载的,用VS2010打开发现有几处BUG,主要是VC6.0转VC10.0的兼容问题,我上传的源码中,BUG已经恢复,代码现在能完美运行(包括分词词库)。
2021-09-03 20:02:51 2.6MB 中科院分词 2011 最新 ICTCLAS
1
NLPIR中科院分词系统JAVA项目,包含源代码(只有经典组件),相关的包。许可证会过期,请到官方仓库下载复制到Data目录下。
2021-06-03 17:02:34 16.56MB NLPIR 分词系统 JAVA
1
中科院汉语词法分析系统ICTCLAS安装包的安装包, 破解见我的其他资源
2021-05-22 11:10:29 9.68MB ICTCLAS 中科院,分词系统
1
包括java编写的爬虫和用java代码实现的分词,以及Lda算法实现的相关代码!
2021-04-26 15:50:49 5.8MB java爬虫 中科院分词 lda算法
1
中科院分词系统,开发,古诗自动生成程序。
2020-01-03 11:36:46 16.08MB 中科院分词
1
很好的分词软件…… 支持各种分词,对于中文分词效果更佳……
2019-12-21 20:28:43 6.97MB 分词
1
JAVA版本的比C版本功能更加强大全面!建议大家下载使用,注意请配置WIN32环境下的java
2019-12-21 18:55:34 7.58MB 中科院分词
1