改进的基于FIHC的科学数据聚类算法 |
| |
作者单位: | ;1.浙江省教育科学研究院 |
| |
摘 要: | 针对FIHC文本聚类算法基于频繁词集实现聚类而未考虑词语间潜在语义联系的缺陷,对FIHC算法进行了有效改进。通过把基于知网的语义相似度计算方法归并到FIHC的Score函数中,有效的改善了score函数单纯的基于向量空间模型的不足。通过实现证明,改进后的FIHC算法明显的提高了聚类质量。
|
关 键 词: | 聚类 FIHC 知网 语义相似度 |
Improved Scientific Data Clustering Algorithm Based on FIHC |
| |
Abstract: | |
| |
Keywords: | |
|
|