[1]刘金岭 谈芸 李健普 袁娜.基于多因素的中文文本主题自动抽取方法[J].计算机技术与发展,2010,(07):72-75.
LIU Jin-ling,TAN Yun,LI Jian-pu,et al.Automatic Extraction Method of Chinese Text Theme Based on Multi-Factor[J].,2010,(07):72-75.
点击复制
基于多因素的中文文本主题自动抽取方法(
)
《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]
- 卷:
-
- 期数:
-
2010年07期
- 页码:
-
72-75
- 栏目:
-
智能、算法、系统工程
- 出版日期:
-
1900-01-01
文章信息/Info
- Title:
-
Automatic Extraction Method of Chinese Text Theme Based on Multi-Factor
- 文章编号:
-
1673-629X(2010)07-0072-04
- 作者:
-
刘金岭 谈芸 李健普 袁娜
-
淮阴工学院计算机工程学院
- Author(s):
-
LIU Jin-ling; TAN Yun; LI Jian-pu; YUAN Na
-
Dept.of Computer Eng.,Huaiyin Institute of Technology
-
- 关键词:
-
主题句; 主题抽取; 文本主题; 重要词汇; 语句权值
- Keywords:
-
subject sentence; subject extraction; text subject; important words; sentence weight
- 分类号:
-
TP181
- 文献标志码:
-
A
- 摘要:
-
提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系。根据概念间的相互关系,对同义概念进行语义归并和上下位概念进行语义聚焦。对于给定的文本,先进行特征词抽取进而生成代表主题概念的重要词汇。综合语句所在位置、语句中的标题、语句中所含重要词汇等多因素构造语句权值表达式,在此基础上,采用主题句选择算法保证每一个主题句被选中,同时解决了主题句的去重问题。实验结果表明,该方法具有较高的抽准率
- Abstract:
-
A multi-factor based on the theme of the text extraction methods is presented,and particularly described the algorithm and the corresponding weight system.Analysis of the interrelation between the concept were the synonymy merging and the superior concept
备注/Memo
- 备注/Memo:
-
淮安市科技项目(HAG09061); 江苏省大学生实践创新训练项目(312509001)刘金岭(1958-),男,教授,研究方向为数据仓库及文本数据挖掘
更新日期/Last Update:
1900-01-01