对预处理后的英文文本聚类我要分享

The pre-processed English version cluster

文本 预处理 英文

关注次数: 210

下载次数: 0

文件大小: 11.55 MB

代码分类: 其他

开发平台: matlab

下载需要积分: 2积分

版权声明:如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

代码描述

中文说明: 1,中文处理用的是中科院的分词软件, 2,文本聚类用的是词频统计称文档单词矩阵之后, 3,进行tiidf处理,在进行k-means聚类。


English Description:

1, is used for treatment of Chinese word segmentation software Chinese Academy of Sciences, 2, text clustering using a statistic called the document the word matrix, 3, tiidf, k-means clustering.


代码预览