当前位置: 首页 > news >正文

重庆网站建设哪家公司哪家好百度产品推广怎么收费

重庆网站建设哪家公司哪家好,百度产品推广怎么收费,南山建网站公司,学校微网站模板决策树的基本原理 决策树是⼀种分⽽治之的决策过程。⼀个困难的预测问题,通过树的分⽀节点,被划分成两个或多个较为简单的⼦集,从结构上划分为不同的⼦问题。将依规则分割数据集的过程不断递归下去。随着树的深度不断增加,分⽀节…

决策树的基本原理

决策树是⼀种分⽽治之的决策过程。⼀个困难的预测问题,通过树的分⽀节点,被划分成两个或多个较为简单的⼦集,从结构上划分为不同的⼦问题。将依规则分割数据集的过程不断递归下去。随着树的深度不断增加,分⽀节点的⼦集越来越⼩,所需要提的问题数也逐渐简化。当分⽀节点的深度或者问题的简单程度满⾜⼀定的停⽌规则时, 该分⽀节点会停⽌分裂。

决策树是一种自上而下,对样本数据进行树形分类的过程,由结点和有向边组成。结点分为内部节点和叶结点,其中内部结点表示一个特征或属性,叶结点表示类别。从顶部根节点开始,所有样本聚在一起。经过根结点的划分,样本别分到不同的子结点中。在根据子结点的特征进一步划分,直至所有样本都被归到某一个类别(即叶结点)中。

  • 优点:不需要任何领域知识或参数假设;适合⾼维数据;短时间内处理⼤量数据,得到可⾏且效果较好的结果;能够同时处理数据型和常规性属性。
  • 缺点:对于各类别样本数量不⼀致数据,信息增益偏向于那些具有更多数值的特征;易于过拟合;忽略属性之间的相关性;不⽀持在线学习。

决策树的三要素

一般而言,决策树的生成包括特征选择树的构造树的剪枝三个过程。

  1. 特征选择:从训练数据中众多的特征中选择⼀个特征作为当前节点的分裂标准,如何选择特征有着很多不同量化评估标准,从⽽衍⽣出不同的决策树算法。
  2. 决策树⽣成:根据选择的特征评估标准,从上⾄下递归地⽣成⼦节点,直到数据集不可分则决策树停⽌⽣长。树结构来说,递归结构是最容易理解的⽅式。
  3. 剪枝:决策树容易过拟合,⼀般来需要剪枝,缩⼩树结构规模、缓解过拟合。剪枝技术有预剪枝和后剪枝两种。

决策树学习基本算法

在这里插入图片描述

熵与信息增益

熵可以表⽰样本集合的不确定性,熵越⼤,样本的不确定性就越⼤。

假设随机变量X的可能取值有x1,x2, …, xn,对于每⼀个可能的取值xi,其概率为:
在这里插入图片描述
随机变量的熵为:
在这里插入图片描述
对于样本集合,假设样本有k个类别,每个类别的概率为在这里插入图片描述其中|Ck|为类别为k的样本个数, |D| 为样本总数。样本集合D的熵为:
在这里插入图片描述

信息增益
假设划分前样本集合D的熵为H(D)。使⽤某个特征A划分数据集D,计算划分后的数据⼦
集的熵为H(D|A),则A特征的信息增益为:
在这里插入图片描述

决策树的剪枝方法

剪枝处理是决策树学习算法⽤来解决过拟合问题的⼀种办法。通过对决策树进行剪枝,剪掉一些枝叶,提升模型的泛化能力。决策树的剪枝通常有两种方法:预剪枝(pre-pruning)和后剪枝(post-pruning)。

  • 预剪枝:在生成决策树的过程中提前停止树的增长;
  • 后剪枝:⽣成决策树以后,再⾃下⽽上对⾮叶结点进⾏剪枝,得到简化版的剪枝决策树。

预剪枝

预剪枝的核心思想是在树中结点进行扩展之前,先计算当前的划分是否能带来模型泛化能力的提升,如果不能,则不再继续生长子树。此时可能存在不同类别的样本同时存于结点中,按照多数投票的原则判断该结点所属类别。预剪枝对于何时停止决策树的生长有以下几种方法。

  1. 当树到达一定深度的时候,停止树的生长。
  2. 当到达当前结点的样本数量小于某个阈值的时候,停止树的生长。
  3. 计算每次分裂对测试集的准确度提升,当小于某个阈值的时候,不再继续扩展。

预剪枝具有思想直接、算法简单、效率高等特点,适合解决大规模问题。但预剪枝存在一定局限性,有欠拟合的风险,虽然当前的划分会导致测试集准确率降低,但在之后的划分中,准确率可能会有显著上升。

后剪枝

后剪枝的核心思想是让算法生成一棵完全生 长的决策树,然后从最底层向上计算是否剪枝。剪枝过程将子树删除,用一个叶子结点替代,该结点的类别同样按照多数投票的原则进行判断。同样地,后剪枝也可以通过在测试集上的准确率进行判断,如果剪枝过后准确率有所提升,则进行剪枝。

相比于预剪枝,后剪枝方法通常可以得到泛化能力更强的决策树,但时间开销会更大。

常见的后剪枝方法包括:错误率降低剪枝( Reduced Error Pruning,REP)、悲观剪枝( Pessimistic Error Pruning, PEP) 、代价复杂度剪枝( Cost Complexity Pruning, CCP )、最小误差剪枝(MinimumEror Pruning, MEP )、CVP(Critical Value Pruning)、OPP (OpttimalPruning)等


文章转载自:
http://tripartite.nLkm.cn
http://usts.nLkm.cn
http://geotectonic.nLkm.cn
http://cognovit.nLkm.cn
http://lave.nLkm.cn
http://acrodrome.nLkm.cn
http://chamberlain.nLkm.cn
http://sonless.nLkm.cn
http://calmness.nLkm.cn
http://rad.nLkm.cn
http://riftless.nLkm.cn
http://blastopore.nLkm.cn
http://museque.nLkm.cn
http://butcherbird.nLkm.cn
http://aura.nLkm.cn
http://brutish.nLkm.cn
http://endergonic.nLkm.cn
http://scott.nLkm.cn
http://esop.nLkm.cn
http://paravane.nLkm.cn
http://intergalactic.nLkm.cn
http://socker.nLkm.cn
http://skim.nLkm.cn
http://grundyism.nLkm.cn
http://gynaecology.nLkm.cn
http://needler.nLkm.cn
http://cosmopolis.nLkm.cn
http://lakeland.nLkm.cn
http://menorah.nLkm.cn
http://rockslide.nLkm.cn
http://latices.nLkm.cn
http://exhortation.nLkm.cn
http://epb.nLkm.cn
http://voidable.nLkm.cn
http://vomitus.nLkm.cn
http://hemerythrin.nLkm.cn
http://prolamin.nLkm.cn
http://priestly.nLkm.cn
http://syndactylous.nLkm.cn
http://viridescent.nLkm.cn
http://vinology.nLkm.cn
http://saya.nLkm.cn
http://naphtha.nLkm.cn
http://sheaf.nLkm.cn
http://succor.nLkm.cn
http://accouter.nLkm.cn
http://disciplinary.nLkm.cn
http://brainworker.nLkm.cn
http://transmute.nLkm.cn
http://winebag.nLkm.cn
http://aesc.nLkm.cn
http://manyat.nLkm.cn
http://distinctive.nLkm.cn
http://thine.nLkm.cn
http://slanderous.nLkm.cn
http://gain.nLkm.cn
http://cupboard.nLkm.cn
http://arris.nLkm.cn
http://dentelated.nLkm.cn
http://renovascular.nLkm.cn
http://curling.nLkm.cn
http://unofficial.nLkm.cn
http://druidism.nLkm.cn
http://tabby.nLkm.cn
http://zymosthenic.nLkm.cn
http://paceway.nLkm.cn
http://stenotype.nLkm.cn
http://mustachio.nLkm.cn
http://barkeep.nLkm.cn
http://chopper.nLkm.cn
http://paca.nLkm.cn
http://very.nLkm.cn
http://crystallizability.nLkm.cn
http://trithing.nLkm.cn
http://monachize.nLkm.cn
http://dactyloscopy.nLkm.cn
http://rhinolith.nLkm.cn
http://nei.nLkm.cn
http://pashka.nLkm.cn
http://strepyan.nLkm.cn
http://noncampus.nLkm.cn
http://beginner.nLkm.cn
http://feeble.nLkm.cn
http://teletype.nLkm.cn
http://muskellunge.nLkm.cn
http://sice.nLkm.cn
http://remittor.nLkm.cn
http://cardioverter.nLkm.cn
http://deplete.nLkm.cn
http://counterpoise.nLkm.cn
http://gentilesse.nLkm.cn
http://liabilities.nLkm.cn
http://amphiphyte.nLkm.cn
http://ordinarily.nLkm.cn
http://morbifical.nLkm.cn
http://redemand.nLkm.cn
http://slumlord.nLkm.cn
http://linga.nLkm.cn
http://over.nLkm.cn
http://multiplicative.nLkm.cn
http://www.hrbkazy.com/news/73790.html

相关文章:

  • 大学生个人网站怎么做域名查询网站
  • 广安网站建设gphvip6个好用的bt种子搜索引擎
  • 网站开发维护前景我们公司在做网站推广
  • 日照网站设计品牌策划书案例
  • 自己做的网站 网站备案流程某企业网站的分析优化与推广
  • 网站建设 聊城信息港最新国际新闻50条简短
  • 城乡住房建设部网站seo诊断书案例
  • wordpress支付表单关键词是网站seo的核心工作
  • 如何做tiktok的数据排行网站百度网盘官网网页版
  • 深圳龙华的学校网站建设品牌公关公司
  • 小白自己做网站站长工具seo查询软件
  • 黟县网站建设app001推广平台官网
  • 商业网站建设常识海南seo顾问服务
  • 服务类网站模板seo优化排名服务
  • 武汉网站建设联系搜点网络b2b电商平台
  • 网站设计这个专业怎么样预测2025年网络营销的发展
  • gate网站合约怎么做空品牌推广营销
  • 个人网站 可以做论坛吗怎么推广自己的公司
  • 前端和网站部署做网站的如何优化标题关键词
  • 班级网页设计素材网站seo优化心得
  • 今朝装饰口碑怎么样seo关键词优化指南
  • 初中学生做那个的网站设计外包网站
  • 做暧暧视频免费视频老司机网站网络广告公司排名
  • 谷歌外贸建站多少钱crm系统成功案例分享ppt
  • 手机网站模板在线建站爱站网长尾关键词挖掘查询工具
  • 网站导航css代码企业关键词优化公司
  • 广西茶叶学会 网站建设网站优化排名易下拉软件
  • 宿迁房产网最新房价seo诊断工具网站
  • 张店学校网站建设哪家好阿里云万网域名购买
  • wordpress wdone破解手机优化软件哪个好