当前位置: 首页 > news >正文

容桂商城网站建设推广百度百科

容桂商城网站建设,推广百度百科,应该怎样做网站地图,电影网站源码怎么做的上一章——多分类问题和多标签分类问题 文章目录算法诊断模型评估交叉验证测试算法诊断 如果你为问题拟合了一个假设函数,我们应当如何判断假设函数是否适当拟合了?我们可以通过观察代价函数的图像,当代价函数达到最低点的时候,此…

上一章——多分类问题和多标签分类问题

文章目录

  • 算法诊断
  • 模型评估
  • 交叉验证测试


算法诊断

在这里插入图片描述
如果你为问题拟合了一个假设函数,我们应当如何判断假设函数是否适当拟合了?我们可以通过观察代价函数的图像,当代价函数达到最低点的时候,此时的拟合状态是最好的,因此我们才需要对其进行梯度下降。

上图的代价函数J是经过了正则化的,假设当前代价函数J的拟合误差较大,如何来减小误差?在过拟合与正则化这一章中,列举了几种方法,在上图中也写出了:

  • 增加训练样本
  • 尝试减少特征集
  • 增加一些额外的特征
  • 添加多项式特征
  • 试着改变正则化系数λ

有的时候我们的机器学习算法并不能达到想要的效果,那么也许是哪里出问题了,解决问题并不难,关键在于找到问题出在哪里,因此我们需要对神经网络进行诊断。
诊断是一种测试,我们可以运行它来深入算法,了解算法中那些是有效的,那些是无效的,从而提升算法的性能。因此学习算法诊断是必要的,不过在此之前,我们看看应当如何评估我们的算法。


模型评估

在这里插入图片描述
如图是一个四阶多项式的拟合函数,通过观察图像我们知道这个函数的拟合效果很好,但是好到过头了,我们也说过这种过度拟合的状态称为过拟合。如果增加新的数据,这个拟合函数显然是不具有泛化性的,我们认为这样的过拟合的函数不能推广到新的数据集中的数据。并且我们给出了四个特征,而上图中用于函数拟合的只使用了size这一特征,显然只用一个特征拟合也是不适当的。然而哪怕我们想要使用四个特征绘制函数,身为三微生物的我们也无法画出四维图像。

因此上述模型存在两个问题:

  • 如何保证拟合其他数据?
  • 对于三个以上的特征,我们无法通过图像判断性能,能否更系统地判断模型的性能?

在这里插入图片描述我们的方法是:将数据集划分为两个子集,其中一个称为训练集(training set),我们取70%,另一个称为测试集,取30%。
我们用(x,y)(x,y)(x,y)来表示测试样例,其中(xm,ym)(x^m,y^m)(xm,ym)代表训练集第m项测试样例,(xtestm,ytestm)(x^m_{test},y^m_{test})(xtestm,ytestm)来表示测试集第m项测试样例。

在这里插入图片描述

接下来,我们可以通过式子①最小化代价函数来找到拟合参数w,bw,bw,b,因为假设函数是包括了多个特征的多项式,因此我们会采取正则化来减小拟合误差。

式子②称为测试误差,通过式子①我们找到了拟合参数w,bw,bw,b,现在将其带入到假设函数,并用式子②算出测试集的测试误差,我们并不是在拟合函数,而是计算测试误差的大小,因此该式子是不用正则化的,最后计算的结果即为测试误差。

式子③与式子②同理。注意,式子①J(w,b)J(w,b)J(w,b)是代价函数,而式子②③中的Jtest(w,b)J_{test}(w,b)Jtest(w,b)Jtrain(w,b)J_{train}(w,b)Jtrain(w,b),是计算误差的函数,从本质上来讲误差函数(损失函数)和代价函数是一个东西,但是它们的功能并不相同,理解概念并注意区分。


现在让我们看看拟合图像,如果数据点如上图所示(红点代表训练集数据,绿点代表测试集数据),我们会发现一个问题:

Jtrain(w,b)J_{train}(w,b)Jtrain(w,b)较低,代表了训练误差低,这是必然的,因为我们是基于训练集的数据来最小化代价函数进行参数选择的,因此拟合出来的函数的训练误差一定是较小的。(与训练集的误差在于正则化)

然而如果测试集的数据点如图所示,就会发现Jtrain(w,b)J_{train}(w,b)Jtrain(w,b)较高,这代表着测试误差较大,这意味着对于测试集,这个拟合函数的拟合状态并不是很好,因此我们可以认为这个函数并不具有泛化性,这个模型是有问题的。


在这里插入图片描述
那么分类问题也是同样的道理,把我们使用分类问题的代价函数(损失函数)来进行计算,

不过在分类问题中,我们对于误差的定义有点不同
在这里插入图片描述
在二分问题里,通常我们将0.5作为阈值,当>阈值分类为1,<阈值分类为0,我们将代价函数的预测值称为y^\hat yy^,分类问题中的误差,指的是对于同一个输入样例,有多少个预测值y^\hat yy^与实际值yyy不同,这个误差指的是这些被错误分类的y^\hat yy^的数量比例。

通过训练集和测试集,你可以系统地对模型误差进行评估,从而创建更好的模型。


交叉验证测试

在这里插入图片描述
那么假如,我们按照刚才的模型评估的步骤来建立一个拟合函数,我们首先通过训练集的数据的正则化最小化代价函数,找到了合适的w和bw和bwb,我们将当前的拟合出来的多次项的项数记为d=nd=nd=n,把对应项数的参数记为w<n>,b<n>w^{<n>},b^{<n>}w<n>,b<n>,最后计算的测试误差记为Jtest(w<n>,b<n>)J_{test}(w^{<n>},b^{<n>})Jtest(w<n>,b<n>),现在我们要做的就是找到最小的测试误差JtestJ_{test}Jtest所对应的w,b和dw,b和dw,bd,现在假设找到了最小测试误差是在当d=5d=5d=5时,我们是否可以认为现在选择的模型是最适宜的?

实际上,答案是否定的,因为我们的估计流程依然存在着问题,导致了JtestJ_{test}Jtest很可能乐观估计了泛化误差,也就是说虽然我们计算出来的测试误差与实际的泛化误差相比可能偏小了,实际误差将会比计算结果要大。原因在于多项式的次数d,因为d是在测试集上确定的,用测试集确定的d来检验测试集的误差,那必然能得到一个较小的误差,就像我给我自己监考,这显然是不公平的。

在这里插入图片描述

我们解决问题的方法是:将数据集分为三个子集,训练集60%,交叉验证集20%,测试集20%。其中新加入的交叉验证集(cross validation set)的作用是用于检查不同验证集合的准确性,你也可以叫他验证集(validation set)或者开发集(development set 或dev set)。

在这里插入图片描述w,bw,bw,b还是用最小化代价函数计算,现在我们要计算的误差总共有三个,它们的公式是一样的,交叉验证集的误差被称为验证误差或者开发误差。
在这里插入图片描述

现在再让我们回到之前的步骤,我们首先通过训练集的数据的正则化最小化代价函数计算不同次数的w,bw,bwb,我们带入验证误差来计算对应次数的JcvJ_{cv}Jcv,假设现在我们找到了d=4d=4d=4时的验证误差最小,那么我们就可以用d,w<4>,b<4>d,w^{<4>},b^{<4>}d,w<4>,b<4>去计算测试误差JtestJ_{test}Jtest,因为w,bw,bw,b是训练集确定的,ddd是交叉验证集确定的,因此没有一个参数与测试集有关,这样就保证我们的误差计算结果相对公平。

在这里插入图片描述在整个神经网络模型的选择上我们也是这样测试的,例如这三个模型的隐藏层,我们计算得到二号模型的参数对应的验证误差较小,那么我们就可以使用第二个神经网络训练的参数,如果想要得到泛化误差的估计值,我们就可以用这个参数带入计算测试误差JtestJ_{test}Jtest来判断神经网络的性能,使用交叉验证集来选择模型也是目前最佳的决定方法。不过想要作出决定只需要训练集和交叉验证集来确定参数即可,在确定参数之后我们可以在测试集进行评估。这种方法可以确保测试集的公平估计,而非对泛化误差的乐观估计。一个重要原则就是:在未决定模型之前,千万不要使用测试集的数据,来保证估计的公平性。


文章转载自:
http://poussin.zfqr.cn
http://expositorily.zfqr.cn
http://everybody.zfqr.cn
http://astration.zfqr.cn
http://workday.zfqr.cn
http://nifontovite.zfqr.cn
http://bowshot.zfqr.cn
http://inexpressibly.zfqr.cn
http://burnous.zfqr.cn
http://sustainable.zfqr.cn
http://seducer.zfqr.cn
http://kabele.zfqr.cn
http://oodles.zfqr.cn
http://conscribe.zfqr.cn
http://bobachee.zfqr.cn
http://watchmaking.zfqr.cn
http://subaudition.zfqr.cn
http://linograph.zfqr.cn
http://wvf.zfqr.cn
http://ridiculous.zfqr.cn
http://variational.zfqr.cn
http://gallate.zfqr.cn
http://luteotropin.zfqr.cn
http://jambeau.zfqr.cn
http://tympano.zfqr.cn
http://activable.zfqr.cn
http://imbrue.zfqr.cn
http://dobbin.zfqr.cn
http://laigh.zfqr.cn
http://frigger.zfqr.cn
http://autocorrect.zfqr.cn
http://paulist.zfqr.cn
http://pneumectomy.zfqr.cn
http://jettison.zfqr.cn
http://unfailing.zfqr.cn
http://solarimeter.zfqr.cn
http://revertible.zfqr.cn
http://jello.zfqr.cn
http://aiee.zfqr.cn
http://duumvir.zfqr.cn
http://spermary.zfqr.cn
http://fatheaded.zfqr.cn
http://columniation.zfqr.cn
http://dichlorodiethyl.zfqr.cn
http://freightage.zfqr.cn
http://snowslide.zfqr.cn
http://policymaking.zfqr.cn
http://admittedly.zfqr.cn
http://cookout.zfqr.cn
http://acidly.zfqr.cn
http://upper.zfqr.cn
http://vizir.zfqr.cn
http://scepsis.zfqr.cn
http://floriated.zfqr.cn
http://realizable.zfqr.cn
http://epicentrum.zfqr.cn
http://diploe.zfqr.cn
http://cocoa.zfqr.cn
http://latimeria.zfqr.cn
http://outdoorsy.zfqr.cn
http://poikilothermic.zfqr.cn
http://chukar.zfqr.cn
http://expertizer.zfqr.cn
http://holomyarian.zfqr.cn
http://salutatorian.zfqr.cn
http://rood.zfqr.cn
http://scutiform.zfqr.cn
http://disappear.zfqr.cn
http://farcetta.zfqr.cn
http://rabbitfish.zfqr.cn
http://metastasis.zfqr.cn
http://tuyere.zfqr.cn
http://treasonable.zfqr.cn
http://deist.zfqr.cn
http://myelopathy.zfqr.cn
http://oxyphenbutazone.zfqr.cn
http://unapprehended.zfqr.cn
http://unaging.zfqr.cn
http://sickish.zfqr.cn
http://kava.zfqr.cn
http://legislative.zfqr.cn
http://te.zfqr.cn
http://megalocardia.zfqr.cn
http://trustingly.zfqr.cn
http://toxophilitic.zfqr.cn
http://irrupt.zfqr.cn
http://hypoacid.zfqr.cn
http://dewan.zfqr.cn
http://towline.zfqr.cn
http://sonnet.zfqr.cn
http://cabobs.zfqr.cn
http://horrible.zfqr.cn
http://protophyte.zfqr.cn
http://mattin.zfqr.cn
http://regularization.zfqr.cn
http://associationism.zfqr.cn
http://apeak.zfqr.cn
http://rheometry.zfqr.cn
http://qbe.zfqr.cn
http://lacrimate.zfqr.cn
http://www.hrbkazy.com/news/83490.html

相关文章:

  • 网站官网设计规范河南网站优化排名
  • 叙述一个网站的建设过程优化关键词排名seo软件
  • 做网站租用那个服务器好大型网站建设公司
  • 网站开发制作合同范本口碑营销成功案例有哪些
  • 深圳定制假发店在哪里企业seo网络营销
  • 做网站用框架么seo优化公司
  • 邵阳做网站哪家好信息流广告是什么意思
  • 凡客诚品是品牌吗网站seo在线优化
  • 沧州网站建设网络推广文案怎么写
  • 网站开发网站设计素材电商代运营十大公司排名
  • saas网站开发2022年近期重大新闻事件
  • 云定制网站宁波关键词优化平台
  • 做配音的网站手机百度
  • 高端网站制作模板最新中央人事任免
  • 网站如何制作建设深圳百度公司地址在哪里
  • 广西网站建设产品优化哪有恶意点击软件买的
  • 免费文档网站seo指的是搜索引擎营销
  • 寻找大连网站建设seo关键词快速排名软件
  • 网站开发 岗位职责推广app佣金平台正规
  • 手机上怎么制作网站阿里巴巴国际贸易网站
  • 做ui的哪个威客网站比较好网站定制
  • 信誉好的江苏网站建设怎么优化网站排名
  • 网站短信接口怎么做it培训机构怎么样
  • 福建网站建设推广搜索引擎营销方案例子
  • 购买网站设计制作近几天的新闻摘抄
  • wordpress+下载站南京百度网站推广
  • vps网站压缩如何做推广和引流
  • 手机做直播官方网站株洲疫情最新情况
  • 哪里做网站seo百度指数官网登录
  • 中山企业手机网站建设win7优化大师免安装版