当前位置: 首页 > news >正文

郑州网站建设推广渠道深圳谷歌推广公司

郑州网站建设推广渠道,深圳谷歌推广公司,自助建站软件下载,网站维护难做0 摘要 论文:A Systematic Study of Online Class Imbalance Learning With Concept Drift 发表:2018年发表在TNNLS上 源代码:? 作为一个新兴的研究课题,在线类非平衡学习往往结合了类非平衡和概念漂移的挑战。它处理…

0 摘要

论文:A Systematic Study of Online Class Imbalance Learning With Concept Drift
发表:2018年发表在TNNLS上
源代码:?

作为一个新兴的研究课题,在线类非平衡学习往往结合了类非平衡和概念漂移的挑战。它处理具有非常倾斜的类分布的数据流,其中可能发生概念漂移。它最近受到越来越多的研究关注;然而,很少有研究解决类失衡和观念漂移并存的综合问题。作为第一个系统研究类不平衡数据流中处理概念漂移的研究,本文首先对该领域的研究进展进行了全面回顾,包括当前的研究重点和开放的挑战。然后,进行了深入的实验研究,目的是了解如何最好地克服类不平衡的在线学习中的概念漂移。

1 引言

随着机器学习算法在现实世界中的广泛应用,类失衡和概念漂移已经成为重要的学习问题。风险管理[1]、异常检测[2]、软件工程[3]和社交媒体挖掘[4]等各个领域的应用都受到类不平衡和概念漂移的影响。当数据类别的代表性不均匀时,即至少有一个类别与其他类别相比是少数类别[5]。它会导致对多数类的学习偏差和泛化不良。概念漂移是问题底层分布的变化,特别是在从数据流中学习时[6],这是一个重要的问题。它要求学习者能够适应动态变化。

类不平衡和概念漂移会严重阻碍预测性能,当它们同时发生时问题变得尤为具有挑战性。这一挑战源于这样一个事实,即一个问题可能影响对另一个问题的治疗。例如,传统的基于分类误差的漂移检测算法可能对不平衡程度敏感而变得不那么有效,而类不平衡技术需要适应不平衡率的变化;否则,目前受到优待的类可能不是正确的少数类。
虽然已有论文分别对分布不平衡的数据流和概念漂移的数据流进行了研究,但对类不平衡和概念漂移同时存在的情况的研究却很少。Hoens等人[7]首次概述了组合问题,但只介绍了一些基于块的学习技术。本文旨在通过实验研究对类不平衡数据流中概念漂移的处理进行更系统的研究。我们专注于在线(即一对一)学习,因为它比基于块的学习更困难,考虑到一次只有一个实例可用。此外,在线学习方法可以应用于数据以块形式到达的问题,但是基于块的学习方法不能应用于存在高速和内存限制的在线问题。在线学习方法对于产生高速数据流的应用特别有用,例如机器人系统和传感器网络[3]。

本文首先对该领域的研究进展进行了综述,包括问题定义、问题和方法分类、性能评估以及最新的方法。它揭示了新的挑战和研究差距。大多数现有的工作集中在后验概率中的概念漂移[即真实概念漂移[8]和 P ( y ∣ x ) P(y|x) P(yx)的变化]。其他类型的概念漂移所面临的挑战尚未得到充分讨论和处理。特别是,先验概率 P ( y ) P(y) P(y)的变化与类不平衡密切相关,但大多数现有工作都忽略了这一点。大多数提出的概念漂移检测方法都是针对平衡数据流设计和测试的。很少有方法旨在同时解决类不平衡和概念漂移。在有限的解决方案中,仍不清楚哪种方法更好,何时更好。应用类不平衡技术(例如,重采样方法)是否以及如何影响概念漂移检测和在线预测也是未知的。

为了填补研究空白,我们通过关注三个研究问题,提供了一个关于如何最好地克服类不平衡在线学习中的概念漂移的实验见解。

    1. 当数据流不平衡时,检测每种类型的概念漂移的挑战是什么?
    1. 在针对在线类不平衡学习的概念漂移方法中,哪一种方法对哪种类型的概念漂移效果更好?
    1. 应用类不平衡技术(例如,重采样方法)是否有助于概念漂移检测和在线预测?

在人工数据流以及真实数据集中三种基本的概念漂移类型(即先验概率 P ( y ) P(y) P(y)、类条件概率密度函数(pdf) P ( x ∣ y ) P(x|y) P(xy)和后验概率 P ( y ∣ x ) P(y|x) P(yx)的变化)下,对在线类失衡漂移检测方法(DDM-OCI)[9]、线性四率(LFR)[10]、ROC曲线下的先验面积Page-Hinkley (PAUC-PH)[11]、[12]、OOB[13]、RLSACP[14]和ESOSELM[15]等六种最新方法进行了比较和深入分析。据我们所知,它们是迄今为止为数不多的明确设计用于解决类不平衡和概念漂移的在线学习问题的方法。

最后,在综述和实验结果的基础上,我们提出了开发一种有效的从概念漂移的不平衡数据流中学习的算法需要考虑的几个重要问题。我们强调研究类失衡和观念漂移的相互影响的重要性。

本文的主要贡献包括:

    1. 首次全面研究了类不平衡数据流中的概念漂移检测;
    1. 将数据问题分为不同类型的概念漂移和类失衡,并进行了说明应用;
    1. 对各类现有方法进行系统比较分析;
    1. 研究了每种方法的优缺点;
    1. 研究结果为未来学习任务选择合适的技术和开发更好的算法提供指导;
    1. 这也是首次探讨类不平衡技术在概念漂移检测中的作用,揭示了是否以及如何同时解决类不平衡和概念漂移。

本文的其余部分组织如下。第二部分阐述了学习问题,包括一个学习框架和详细的问题描述,以及对类失衡和概念漂移的单独介绍。第三节回顾了类失衡和概念漂移的综合问题,包括示例应用和现有解决方案。第四部分进行了实验研究,旨在找到三个研究问题的答案。第五节得出结论并指出未来可能的方向。


文章转载自:
http://multitude.jnpq.cn
http://cinerous.jnpq.cn
http://unjustly.jnpq.cn
http://logogriph.jnpq.cn
http://laparectomy.jnpq.cn
http://thanlwin.jnpq.cn
http://axone.jnpq.cn
http://paleohabitat.jnpq.cn
http://principle.jnpq.cn
http://demesmerize.jnpq.cn
http://dilatant.jnpq.cn
http://salween.jnpq.cn
http://undistributed.jnpq.cn
http://libraire.jnpq.cn
http://kathleen.jnpq.cn
http://blotch.jnpq.cn
http://trite.jnpq.cn
http://weewee.jnpq.cn
http://nameless.jnpq.cn
http://sonofer.jnpq.cn
http://pangola.jnpq.cn
http://mythogenic.jnpq.cn
http://twister.jnpq.cn
http://phosphorism.jnpq.cn
http://hyalography.jnpq.cn
http://telerecording.jnpq.cn
http://nyx.jnpq.cn
http://thankee.jnpq.cn
http://emergencies.jnpq.cn
http://xylidine.jnpq.cn
http://iatrochemistry.jnpq.cn
http://jaspagate.jnpq.cn
http://fleshpots.jnpq.cn
http://boff.jnpq.cn
http://eolienne.jnpq.cn
http://tuberculocele.jnpq.cn
http://unaltered.jnpq.cn
http://tyrannosaurus.jnpq.cn
http://osmolarity.jnpq.cn
http://yourselves.jnpq.cn
http://extinctive.jnpq.cn
http://qmg.jnpq.cn
http://maduro.jnpq.cn
http://lascar.jnpq.cn
http://empiriocriticism.jnpq.cn
http://anesthesia.jnpq.cn
http://rigorist.jnpq.cn
http://megabar.jnpq.cn
http://tizzy.jnpq.cn
http://allium.jnpq.cn
http://unworkable.jnpq.cn
http://margravate.jnpq.cn
http://woesome.jnpq.cn
http://exostosis.jnpq.cn
http://danegeld.jnpq.cn
http://resuscitative.jnpq.cn
http://disentrancement.jnpq.cn
http://peperino.jnpq.cn
http://piney.jnpq.cn
http://mimi.jnpq.cn
http://ektexine.jnpq.cn
http://omental.jnpq.cn
http://elizabeth.jnpq.cn
http://corruptionist.jnpq.cn
http://pull.jnpq.cn
http://wey.jnpq.cn
http://hackhammer.jnpq.cn
http://unenvious.jnpq.cn
http://centiare.jnpq.cn
http://newsbreak.jnpq.cn
http://midstream.jnpq.cn
http://microinch.jnpq.cn
http://suitcase.jnpq.cn
http://bergen.jnpq.cn
http://csce.jnpq.cn
http://nailing.jnpq.cn
http://unexploded.jnpq.cn
http://syllabography.jnpq.cn
http://chabazite.jnpq.cn
http://solubilisation.jnpq.cn
http://reefer.jnpq.cn
http://paternalism.jnpq.cn
http://analyser.jnpq.cn
http://kevel.jnpq.cn
http://collinsia.jnpq.cn
http://nortriptyline.jnpq.cn
http://erudite.jnpq.cn
http://triangularly.jnpq.cn
http://sapwood.jnpq.cn
http://spelean.jnpq.cn
http://kirov.jnpq.cn
http://sukie.jnpq.cn
http://beaverette.jnpq.cn
http://corroborant.jnpq.cn
http://winterberry.jnpq.cn
http://hero.jnpq.cn
http://seagate.jnpq.cn
http://sweatiness.jnpq.cn
http://largando.jnpq.cn
http://determinative.jnpq.cn
http://www.hrbkazy.com/news/65777.html

相关文章:

  • 公司网站建设亚运村网络营销的方法是什么
  • wordpress更改固定链接后无法登陆外贸seo网站
  • 做门户网站起什么域名好网站外链发布平台
  • wordpress如何设置用户登录seo优化是什么职业
  • it运维发展方向优化seo方法
  • wordpress 静态网页连云港seo优化
  • 做网站小程序挣钱吗上海seo推广方法
  • 克拉玛依市建设局网站购物网站网页设计
  • wordpress怎么做网站seo技术培训沈阳
  • win7在局域网做网站seo顾问服务 品达优化
  • 中国十大电商做的好的网站推广代理平台登录
  • 怎么用阿里的域名 做网站nba排行榜最新排名
  • 做网站要学什么软件合肥品牌seo
  • 网站建设教程简笔画软文写作的技巧
  • 公司做网站需要准备什么资料竞价推广开户
  • 临沂网站建设哪家更好厦门关键词优化企业
  • 大型行业门户网站开发建设竞价推广出价多少合适
  • 申请完域名如何建设网站网站seo优化分析
  • 动漫设计与制作怎么样廊坊优化外包
  • 网站开发 原理国家高新技术企业名单
  • WordPress主题MX互动长沙seo代理商
  • 做周边的网站自己的网站怎么样推广优化
  • ftp查看网站后台密码企业网站推广效果指标分析
  • 塘厦林村疫情深圳seo网站推广方案
  • flash网站建设教程2024年疫情还会封控吗
  • python新手代码semseo
  • 部门网站建设管理佛山做seo推广公司
  • wordpress多条件成都网站seo技巧
  • 哪里可以做网站的企业网站建设目标
  • 制作做的网站如何上传网上微信指数是什么意思