[1]许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,(06):187-190.
 XU Gao-jian.Research on Text Mining Techniques Web- Based[J].,2007,(06):187-190.
点击复制

基于Web的文本挖掘技术研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2007年06期
页码:
187-190
栏目:
应用开发研究
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Text Mining Techniques Web- Based
文章编号:
1673-629X(2007)06-0187-04
作者:
许高建12
[1]合肥工业大学计算机与信息学院[2]安徽农业大学信息与计算机学院
Author(s):
XU Gao-jian
[1]School of Computer & Information, Hefei University of Technology[2]School of Information & Computer, Anhui Agricultural University
关键词:
Web挖掘文本挖掘文本分类文本聚类
Keywords:
Web mining text mining text categorization text clustering
分类号:
TP393
文献标志码:
A
摘要:
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器
Abstract:
Most information on Internet are text formatting. How to find the potential knowledge from the immensity text information is an awaiting to be settled question, which is the purpose of text mining. This is a process for analyzing text and getting the customizing messages from them. This paper introduces what is the text mining systemically, and it also further discusses the aspects involved in text mining process, including text architecture construction, feature mining, text categorization, text clustering etc. And a text mining model based on Web is presented. And will build an automatic text classification system on BBS by using programming language

相似文献/References:

[1]张春生 庄丽艳.基于兴趣的Web挖掘中用户身份的识别新方法[J].计算机技术与发展,2009,(05):62.
 ZHANG Chun-sheng,ZHUANG Li-yan.New Method on Identification of User in Web Mining Based on Interesting[J].,2009,(06):62.
[2]沈亚田 沈夏炯 张磊.基于图划分的谱聚类算法在文本挖掘中应用[J].计算机技术与发展,2009,(05):96.
 SHEN Ya-tian,SHEN Xia-jiong,ZHANG Lei.Application of Spectral Cluster Algorithm Based on Graph Partition in Text Mining[J].,2009,(06):96.
[3]葛育祥 熊励.整合文本挖掘的商务智能系统结构研究[J].计算机技术与发展,2009,(04):1.
 GE Yu-xiang,XIONG Li.System Structure Study of Business Intelligence Integrated Text Mining[J].,2009,(06):1.
[4]陈永平 苏新 毛万胜.基于兴趣度的协作过滤技术研究[J].计算机技术与发展,2008,(01):106.
 CHEN Yong-ping,SU Xin,MAO Wan-sheng.Research of Collaborative Filtering Technology Based on Interest[J].,2008,(06):106.
[5]黄凯峰 何洁月.基于生物医学文献的知识发现研究[J].计算机技术与发展,2008,(02):62.
 HUANG Kai-feng,HE Jie-yue.Survey of Biomedicine Literature - Based Discovery[J].,2008,(06):62.
[6]周勇 刘锋.基于粗糙集的Web结构挖掘[J].计算机技术与发展,2008,(03):151.
 ZHOU Yong,LIU Feng.Web Structure Mining Based on Rough Set Theory[J].,2008,(06):151.
[7]陈永平 刘俞 苏新.基于兴趣度的Web页面关联规则的研究[J].计算机技术与发展,2008,(05):86.
 CHEN Yong-ping,LIU Yu,SU Xin.Research of Web Page Association Rules Based on Interesting[J].,2008,(06):86.
[8]方元康 胡学钢 夏启寿.一种改进的Web日志会话识别方法[J].计算机技术与发展,2008,(11):214.
 FANG Yuan-kang,HU Xue-gang,XIA Qi-shou.An Improved Method for Transaction Session Identification in Web Usage Mining[J].,2008,(06):214.
[9]方贤进 李龙澍 钟娟[].基于主观Bayes方法对Web使用挖掘的研究[J].计算机技术与发展,2007,(06):56.
 FANG Xian-jin,LI Long-shu,ZHONG Juan.Research on Web Usage Mining by Subjective Bayesian Approach[J].,2007,(06):56.
[10]熊忠阳 周亚峰.Web访问挖掘的预处理技术的研究[J].计算机技术与发展,2007,(08):11.
 XIONG Zhong-yang,ZHOU Ya-feng.Research on Data Preprocessing Technology in Web Log Mining[J].,2007,(06):11.

备注/Memo

备注/Memo:
安徽省高校省级自然科学研究项目(2006KJ168B)许高建(1974-),男,安徽肥东人,讲师,研究方向为计算机应用、文本挖掘
更新日期/Last Update: 1900-01-01