您的位置: 专家智库 > >

闫屹

作品数:3 被引量:13H指数:2
供职机构:安徽大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划安徽省高校省级自然科学研究项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 1篇电信
  • 1篇电信客户
  • 1篇电信客户细分
  • 1篇信息检索
  • 1篇数据挖掘
  • 1篇特征选取
  • 1篇中文
  • 1篇中文网页
  • 1篇中文网页分类
  • 1篇准则函数
  • 1篇网络
  • 1篇网络挖掘
  • 1篇网页
  • 1篇网页分类
  • 1篇文本处理
  • 1篇文本分类
  • 1篇文本分类方法
  • 1篇聚类
  • 1篇聚类算法
  • 1篇类方

机构

  • 3篇安徽大学

作者

  • 3篇闫屹
  • 2篇张燕平
  • 2篇耿筱媛

传媒

  • 2篇计算机技术与...

年份

  • 3篇2008
3 条 记 录,以下是 1-3
排序方式:
基于CHI值特征选取和覆盖的文本分类方法被引量:5
2008年
利用CHI值特征选取和前向神经网络的覆盖算法,通过对文本进行分词的预处理后,实现文本的自动分类。该方法利用CHI值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将CHI值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验,并在不同的维数上与SVM算法、朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM算法和朴素贝叶斯方法相比较,覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。
闫屹张燕平耿筱媛
关键词:文本处理文本分类
改进的K-means算法在电信客户细分中的应用被引量:8
2008年
在K-means算法中,选择不同的初始聚类中心会产生不同的聚类结果且有不同的准确率,并且其迭代过程在时间上不是高效的。针对K-means算法的这两点不足做了一定程度上的改进,理论分析表明,改进后的算法具有较高的准确度和较低的时间复杂度。采用改进后K-means聚类算法对电信客户数据进行聚类分析,得到具有不同特征的客户群组,通过与统计分析的对比,聚类结果分析更合理清晰,更便于对不同群组采取不同的经营策略,为管理者提供了合理的决策支持。
耿筱媛张燕平闫屹
关键词:数据挖掘聚类算法K-MEANS算法准则函数
基于覆盖的中文网页分类研究
随着Internet的迅速发展,尤其是World Wide Web的全球普及,Web网络上信息资源己经涵盖了社会生活的各个方面,网络信息过载(Information Overload)问题日益突出,这又促使Web挖掘技术...
闫屹
关键词:网络挖掘中文网页分类信息检索
文献传递
共1页<1>
聚类工具0