[1]许晓昕 李安贵.一种基于TFIDF的网络聊天关键词提取算法[J].计算机技术与发展,2006,(03):122-123.
 XU Xiao-xin,LI An-gui.A New TFIDF- Based Chat Stream Keyword Extraction Algorithm[J].,2006,(03):122-123.
点击复制

一种基于TFIDF的网络聊天关键词提取算法()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2006年03期
页码:
122-123
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
A New TFIDF- Based Chat Stream Keyword Extraction Algorithm
文章编号:
1005-3751(2006)03-0122-02
作者:
许晓昕 李安贵
北京科技大学应用科学学院数力系
Author(s):
XU Xiao-xin LI An-gui
Department of Mathematics and Mechanics, School of Applied Science, Beijing University of Science and Technology
关键词:
TFIDF文本挖掘即时通讯软件关键词提取
Keywords:
TFIDF text mining IM software keywords extraction
分类号:
TP301.6
文献标志码:
A
摘要:
随着Internet的普及,即时通讯软件(IM software)也就是网络聊天软件越来越多地服务于人们的日常生活。利用聊天双方的聊天信息来提供更好的服务成为研究者们的重要课题,而如何提取聊天文本中的关键词又成为此类研究的重点。聊天文本不同于普通的文章,它是一种动态输入的文本,对于这种文本,传统的TFIDF算法存在着缺陷。文中针对传统TFIDF在处理此类文本时的不足之处,利用一个按主题分类的历史缓存来提高TFIDF算法对于这类文本的处理能力
Abstract:
By the common use of Intemet, IM software has more and more affected people's life. How to take advantage of chat text to serve people and how to extract keywords from this text has attracted more and more researchers. Chat text is different from article text. Only using TFIDF algorithm to extract keywords is not well. In this paper, a history cache is introduced to improve the performance of TFIDF in chat text

相似文献/References:

[1]沈亚田 沈夏炯 张磊.基于图划分的谱聚类算法在文本挖掘中应用[J].计算机技术与发展,2009,(05):96.
 SHEN Ya-tian,SHEN Xia-jiong,ZHANG Lei.Application of Spectral Cluster Algorithm Based on Graph Partition in Text Mining[J].,2009,(03):96.
[2]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(03):1.
[3]黄凯峰 何洁月.基于生物医学文献的知识发现研究[J].计算机技术与发展,2008,(02):62.
 HUANG Kai-feng,HE Jie-yue.Survey of Biomedicine Literature - Based Discovery[J].,2008,(03):62.
[4]李建军 杨路明 刘波 胡智飞.基于Xcluster的XML松弛查询小枝评分方法[J].计算机技术与发展,2008,(10):53.
 LI Jian-jun,YANG Lu-ming,LIU Bo,et al.Method of Relaxation Queries Twig Scoring Based on Xcluster of XML[J].,2008,(03):53.
[5]许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,(06):187.
 XU Gao-jian.Research on Text Mining Techniques Web- Based[J].,2007,(03):187.
[6]邹腊梅 肖基毅 龚向坚.基于Maximum Likelihood与HMM的文本挖掘[J].计算机技术与发展,2007,(12):110.
 ZOU La-mei,XIAO Ji-yi,GONG Xiang-jian.Text Information Mining Based on Maximum Likelihood and Hidden Markov Model[J].,2007,(03):110.
[7]王娜 李云松.基于概念格的文本挖掘[J].计算机技术与发展,2006,(01):114.
 WANG Na,LI Yun-song.Text Mining Based on Concept Lattice[J].,2006,(03):114.
[8]桂丹萍 陈佳祥 何红生.视频检索在汉字识别中的应用研究[J].计算机技术与发展,2010,(10):207.
 GUI Dan-ping,CHEN Jia-xiang,HE Hong-sheng.Application Research of Video Retrieval Model on Chinese Character Recognition[J].,2010,(03):207.
[9]薛中玉 李春梅 黄道雄.基于文本挖掘的本体自动构建系统架构解析[J].计算机技术与发展,2011,(01):100.
 XUE Zhong-yu,LI Chun-mei,HUANG Dao-xiong.System Architecture Analysis of Automatic Construction System of Ontology Based on Text Mining[J].,2011,(03):100.
[10]苏小英,胡彦鹏[],杨竣辉,等.一种新的用于文本分类的概率分类器设计[J].计算机技术与发展,2014,24(03):46.
 SU Xiao-ying[],HU Yan-peng[],YANG Jun-hui[],et al.A New Probabilistic Classifier Design for Text Categorization[J].,2014,24(03):46.

备注/Memo

备注/Memo:
许晓昕(1982-),男,云南昆明人,硕士研究生,研究方向为模糊数学及计算机软件李安贵,教授,研究方向为模糊数学
更新日期/Last Update: 1900-01-01