[1]黄文江 李翔 林祥.基于Chameleon算法的文本聚类技术研究[J].计算机技术与发展,2010,(06):1-4.
 HUANG Wen-jiang,LI Xiang,LIN Xiang.Research on Text Clustering Based on Chameleon Algorithm[J].,2010,(06):1-4.
点击复制

基于Chameleon算法的文本聚类技术研究()

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2010年06期
页码:
1-4
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Text Clustering Based on Chameleon Algorithm
文章编号:
1673-629X(2010)06-0001-04
作者:
黄文江 李翔 林祥
上海交通大学信息安全工程学院
Author(s):
HUANG Wen-jiangLI XiangLIN Xiang
School of Information Security Engineering,Shanghai Jiaotong University
关键词:
文本聚类Chameleon文本向量
Keywords:
text clustering Chameleon text vector
分类号:
TP311.5
文献标志码:
A
摘要:
文本聚类是聚类的一个重要的研究方向,是聚类在文本处理领域的重要应用。但是,传统的聚类算法在文本聚类应用中的表现并不能让人满意。文中将一种新的聚类算法——Chameleon算法引入中文文本聚类领域中。在构建中文文本聚类模型的基础上结合了分词、文本向量化等技术进行了相关实验。实验的结果表明Chameleon算法可以应用在中文文本聚类领域中,同时也解决了传统算法在聚类形状发现方面的不足。相关实验说明了这种算法在中文文本聚类领域应用中的有效性和实用性。
Abstract:
Text clustering,one of the most important research branches of clustering,is the application of clustering algorithm in the text processing.The performance of traditional clustering algorithm in the Chinese text processing may not be satisfying.In this pa

相似文献/References:

[1]费洪晓 穆珺 刘正.基于文本聚类和权重调整的用户兴趣建模算法[J].计算机技术与发展,2007,(02):128.
 FEI Hong-xiao,MU Jun,LIU Zheng.Study on User Profile Learning Algorithm Based on Document Clustering and Feature Weight Adjustment[J].,2007,(06):128.
[2]许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,(06):187.
 XU Gao-jian.Research on Text Mining Techniques Web- Based[J].,2007,(06):187.
[3]何聚厚,范文静.基于改进K-Means算法的教学反思文本聚类研究[J].计算机技术与发展,2013,(11):99.
 HE Ju-hou[],FAN Wen-jing[].Research on Text Clustering of Teaching Reflection Based on Improved K-Means Algorithm[J].,2013,(06):99.
[4]李培,马力.网络用户兴趣的智能挖掘方法研究[J].计算机技术与发展,2014,24(02):76.
 LI Pei,MA Li.Research on Intelligent Mining Method for Web Users Interests[J].,2014,24(06):76.
[5]李晨,杨子江,朱世伟,等. 基于Hadoop的网络舆情监控平台设计与实现[J].计算机技术与发展,2016,26(02):144.
 LI Chen,YANG Zi-jiang,ZHU Shi-wei,et al. Design and Implementation of Network Consensus Monitoring System Based on Hadoop[J].,2016,26(06):144.
[6]潘晓英,胡开开,朱静. 一种基于TextRank的文本二次聚类算法[J].计算机技术与发展,2016,26(08):7.
 PAN Xiao-ying,HU Kai-kai,ZHU Jing. A Secondary Text Clustering Algorithm Based on TextRank[J].,2016,26(06):7.
[7]王安瑾.一种基于 MinHash 的改进新闻文本聚类算法[J].计算机技术与发展,2019,29(02):39.[doi:10.3969/j.issn.1673-629X.2019.02.008]
 WANG Anjin.An Improved News Text Clustering Algorithm Based on MinHash[J].,2019,29(06):39.[doi:10.3969/j.issn.1673-629X.2019.02.008]
[8]杨丹,朱世玲,卞正宇.基于改进的K-means算法在文本挖掘中的应用[J].计算机技术与发展,2019,29(04):68.[doi:10. 3969 / j. issn. 1673-629X. 2019. 04. 014]
 YANG Dan,ZHU Shi-ling,BIAN Zheng-yu.Application of Improved K-means Algorithm in Text Mining[J].,2019,29(06):68.[doi:10. 3969 / j. issn. 1673-629X. 2019. 04. 014]
[9]殷 硕,王卫亚,柳有权.基于语义特征抽取的文本聚类研究[J].计算机技术与发展,2020,30(03):46.[doi:10. 3969 / j. issn. 1673-629X. 2020. 03. 009]
 YIN Shuo,WANG Wei-ya,LIU You-quan.Research on Text Clustering Based on Semantic Feature Extraction[J].,2020,30(06):46.[doi:10. 3969 / j. issn. 1673-629X. 2020. 03. 009]

备注/Memo

备注/Memo:
国家自然科学基金项目(60772098); 教育部新世纪优秀人才支持计划项目(NCET-0600393); 上海市科学技术委员会科技攻关项目(08511501902); 2007年上海市曙光计划(IAP1027)黄文江(1983-),男,辽宁沈阳人,硕士研究生,研究方向为互联网内容安全;李翔,副教授,研究方向为网络内容安全。
更新日期/Last Update: 1900-01-01