[1]范新 沈闻 丁泉勋 沈洁.基于正例和未标文档的半监督分类研究[J].计算机技术与发展,2009,(06):58-60.
 FAN Xin,SHEN Wen,DING Quan-xun,et al.Research on Semi- Supervised Classification Based on Positive and Unlabeled Text Document[J].,2009,(06):58-60.
点击复制

基于正例和未标文档的半监督分类研究()
分享到:

《计算机技术与发展》[ISSN:1006-6977/CN:61-1281/TN]

卷:
期数:
2009年06期
页码:
58-60
栏目:
智能、算法、系统工程
出版日期:
1900-01-01

文章信息/Info

Title:
Research on Semi- Supervised Classification Based on Positive and Unlabeled Text Document
文章编号:
1673-629X(2009)06-0058-03
作者:
范新 沈闻 丁泉勋 沈洁
扬州大学信息工程学院计算机科学系
Author(s):
FAN Xin SHEN Wen DING Quan-xun SHEN Jie
Dept. of Computer Science, College of Information Engineering, Yangzhou University
关键词:
聚类k-meansEM分类
Keywords:
cluster k - means EM classification
分类号:
TP311
文献标志码:
A
摘要:
针对负例类别很难获得训练样本的情况,提出了一种基于正例和未标文档的半监督分类方法。已知仅有正例文本的情况下,引入k—means聚类算法对未标样本集进行聚类,从未标样本集中选出最为可靠的负例样本信息,初始化分类器。基于EM的极大似然估计理论,在每步迭代的E—step中,将中间分类器最有把握对其类别进行预测的未标注样本进行分类,并应用到M—step中修正分类器的参数值,迭代选择最优分类器。实验结果表明,该方法取得了较好的分类效果
Abstract:
Presents a high performance method classifying positive and unlabeled documents. The idea is to first use cluster to extract same reliable negative documents from the unlabeled set and initial a classifier. Then optimize our classifier with the expectatio

相似文献/References:

[1]蒋璐璐 王适 王宝成 李慧敏 李鑫慧.一种改进的标记分水岭遥感图像分割方法[J].计算机技术与发展,2010,(01):36.
 JIANG Lu-lu,WANG Shi,WANG Bao-cheng,et al.Segmentation of Remote Sensing Image Based on an Improved Labeling Watershed Algorithm[J].,2010,(06):36.
[2]张甜 罗眉 孟晓红 赵宗涛.一种基于状态特征的航天发射故障诊断技术[J].计算机技术与发展,2010,(01):93.
 ZHANG Tian,LUO Mei,MENG Xiao-hong,et al.A Technology in Fault Diagnosis of Spaceflight Launch Based on State Character[J].,2010,(06):93.
[3]王会颖 章义刚.求解聚类问题的改进人工鱼群算法[J].计算机技术与发展,2010,(03):84.
 WANG Hui-ying,ZHANG Yi-gang.An Improved Artificial Fish- Swarm Algorithm of Solving Clustering Analysis Problem[J].,2010,(06):84.
[4]赵敏 倪志伟 刘斌.K—means与朴素贝叶斯在商务智能中的应用[J].计算机技术与发展,2010,(04):179.
 ZHAO Min,NI Zhi-wei,LIU Bin.Application Research of K - Means Clustering and Naive Bayesian Algorithm in Business Intelligence[J].,2010,(06):179.
[5]吴楠 胡学钢.基于聚类分区的序列模式挖掘算法研究[J].计算机技术与发展,2010,(06):109.
 WU Nan,HU Xue-gang.Research on Clustering Partition-Based Approach of Sequential Pattern Mining[J].,2010,(06):109.
[6]耿波 仲红 徐杰 闫娜娜.用关联分析法对负荷预测结果进行二次处理[J].计算机技术与发展,2008,(04):171.
 GENG Bo,ZHONG Hong,XU Jie,et al.Using Correlation Analysis to Treat Load Forecasting Results[J].,2008,(06):171.
[7]游芳 姜建国 张坤.基于二维属性的高维数据聚类算法研究[J].计算机技术与发展,2009,(05):111.
 YOU Fang,JIANG Jian-guo,ZHANG Kun.Cluster- Algorithm Studies Based on Two- Dimensional Attribute Higher - Dimension Data[J].,2009,(06):111.
[8]刘淑英 程国建 彭方.人工神经生长细胞结构网络在医疗诊断的应用[J].计算机技术与发展,2009,(05):231.
 LIU Shu-ying,CHENG Guo-jian,PENG Fang.Applications of Growing Cell Structures of Artificial Neural Network for Medical Diagnosis[J].,2009,(06):231.
[9]王园园 倪志伟 赵裕啸 伍章俊.基于决策树的模糊聚类评价算法及其应用[J].计算机技术与发展,2009,(09):232.
 WANG Yuan-yuan,NI Zhi-wei,ZHAO Yu-xiao,et al.Fuzzy Clustering Evaluation Algorithm Based on Decision Tree and Application[J].,2009,(06):232.
[10]段凤玲 李龙澍 曹文婷.具有多态特征和聚类处理的蚁群算法[J].计算机技术与发展,2009,(12):77.
 DUAN Feng-ling,LI Long-shu,CAO Wen-ting.Ant Colony Algorithm with Polymorphism and Clustering Processing[J].,2009,(06):77.
[11]朱云贺 张春海 张博.基于数据分段的K-means的优化研究[J].计算机技术与发展,2010,(11):130.
 ZHU Yun-he,ZHANG Chun-hai,ZHANG Bo.Optimizing Research on K-means Based on Data Partition[J].,2010,(06):130.
[12]胡磊,蔡红霞,俞涛. 双重聚类的协同过滤算法在智能家居中的应用[J].计算机技术与发展,2017,27(02):100.
 HU Lei,CAI Hong-xia,YU Tao. Application of Collaborative Filtering Recommendation Based on Double Clustering in Smart Home System[J].,2017,27(06):100.
[13]鲍黎明,黄刚. 基于多叉树确定K值的动态K-means聚类算法[J].计算机技术与发展,2017,27(06):41.
 BAO Li-ming,HUANG Gang. A Dynamic Clustering Algorithm of K-means Based onMulti-branches Tree for K-values[J].,2017,27(06):41.
[14]王义武,杨余旺,于天鹏,等.基于 Spark 平台的 K-means 算法的设计与优化[J].计算机技术与发展,2019,29(03):72.[doi:10.3969/ j. issn.1673-629X.2019.03.015]
 WANG Yi-wu,YANG Yu-wang,YU Tian-peng,et al.Design and Optimization of K-means Algorithm Based on Spark Platform[J].,2019,29(06):72.[doi:10.3969/ j. issn.1673-629X.2019.03.015]
[15]贺艳芳,梁书田.优化加权多视角 K-means 聚类算法[J].计算机技术与发展,2019,29(03):81.[doi:10.3969/ j. issn.1673-629X.2019.03.017]
 HE Yan-fang,LIANG Shu-tian.Optimizing Weighted Multi-view K-means Clustering Algorithm[J].,2019,29(06):81.[doi:10.3969/ j. issn.1673-629X.2019.03.017]
[16]辛壮,万良,李均涛.改进的聚类算法在网络异常行为检测中的应用[J].计算机技术与发展,2019,29(03):111.[doi:10.3969/ j. issn.1673-629X.2019.03.024]
 XIN Zhuang,WAN Liang,LI Jun-tao.Application of Improved Clustering Algorithm in Network Abnormal Behavior Detection[J].,2019,29(06):111.[doi:10.3969/ j. issn.1673-629X.2019.03.024]

备注/Memo

备注/Memo:
国家自然科学基金资助项目(60673060)范新(1983-),男,江苏南通人,硕士研究生,研究方向为数据挖掘、机器学习;沈洁,教授,硕士生导师,研究方向为数据挖掘、信息管理。
更新日期/Last Update: 1900-01-01