垃圾评论自动过滤方法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金资助项目(60903225);国防科技大学优秀研究生创新基金资助项目(S100502)


Method of review spam detection
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对互联网上存在的大量垃圾评论,提出一种基于电阻网络的垃圾评论检测方法,该方法用电阻距离来度量评论之间的上下文语义相似性,把整个评论数据表示成一个电阻网络,把垃圾评论当作该网络上的语义离群点来处理,根据网络节点对电阻网络平均电能消耗的影响,建立电离群因子来度量数据的离群程度,以此来识别垃圾评论。实验证明了该方法的有效性,在多个数据集上取得了较好的效果。

    Abstract:

    For detecting review spam in the Internet automatically, an method based on resistance network is proposed. By treating the distance between two reviews as a resistance, we represent the given dataset as a resistance network and the resistance distance between two nodes is a measure of the semantic distance between them. Spam reviews are semantic outliers in this network. An electrical outlier factor (EOF) for each review based on its influence on the power dissipated of the network was used to detect the spam reviews. Experimental results testified that EOF is suitable for detecting review spam, and is efficient and effective.

    参考文献
    相似文献
    引证文献
引用本文

谭文堂,朱洪,葛斌,等.垃圾评论自动过滤方法[J].国防科技大学学报,2012,34(5):153-157 ,168.
TAN Wentang, ZHU Hong, GE Bin, et al. Method of review spam detection[J]. Journal of National University of Defense Technology,2012,34(5):153-157 ,168.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-03-04
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2012-11-05
  • 出版日期:
文章二维码