当前位置: 首页 > news >正文

网站建设站点地图百度推广官方

网站建设站点地图,百度推广官方,网站建设工作室是干嘛的,哈尔滨网站建设有限公司AI目录:sheng的学习笔记-AI目录-CSDN博客 分类准确度问题 假设有一个癌症预测系统,输入体检信息,可以判断是否有癌症。如果癌症产生的概率只有0.1%,那么系统预测所有人都是健康,即可达到99.9%的准确率。 但显然这样的…

AI目录:sheng的学习笔记-AI目录-CSDN博客

分类准确度问题

假设有一个癌症预测系统,输入体检信息,可以判断是否有癌症。如果癌症产生的概率只有0.1%,那么系统预测所有人都是健康,即可达到99.9%的准确率。

但显然这样的机器学习系统是失败的,因为对于极度偏斜(Skewed Data)的数据,只使用分类准确度是远远不够的。

针对这样的问题,我们需要引入其他指标来评估机器学习分类结果的好坏。

混淆矩阵

对于二分类问题,混淆矩阵是2x2,分别是0和1,其中每一行代表真实值,每一列代表预测值

  • TP:True Positive。预测为1,实际为1,预测正确。
  • FP:False Positive。预测为1,实际为0,预测错误。
  • FN:False Negative。预测为0,实际为1,预测错误。
  • TN:True Negative。预测为0,实际为0,预测正确。

指标

取值范围

这几个指标的取值都在0-1之间,数值越接近于1,效果越好

精度

预测数据中预测正确的数量就是精准率,检索出来的条目有多少是正确的

召回率 

真实发生数据预测正确的数量就是召回率,所有正确的条目有多少被检索出来

F1Score

F1Score指标就是综合精准率和召回率两个指标,只有当召回率和精度都很高时,分类器才能得到较高的F1分数

ROC曲线

首先引入两个指标,误报率(FPR)和召回率(TPR)。

其中FPR =   \frac{FP}{TN+FP}  ,它是指是被错误地预测为正类的样本占所有实际为负类的样本的比例。TPR = \frac{TP}{TP+FN}  ,它是指被正确地预测为正类的样本占所有实际为正类的样本的比例。

举例:

某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的,撒一大网,逮着了700条鲤鱼,200只虾,100只鳖,那么这些指标如下:
①.正确率:700/(700+200+100)=70%
②.召回率:700/1400=50%
③.F值:2*((70*50)/(70+50))=58.3%

代码

sklearn的精准和找回代码

>>> from sklearn.metrics import precision_score, recall_score
>>> precision_score(y_train_5, y_train_pred) # == 4096 / (4096 + 1522)
0.7290850836596654
>>> recall_score(y_train_5, y_train_pred) # == 4096 / (4096 + 1325)
0.7555801512636044

f1的代码

>>> from sklearn.metrics import f1_score
>>> f1_score(y_train_5, y_train_pred)
0.7420962043663375

指标对比分析

F1分数对那些具有相近的精度和召回率的分类器更为有利。

这不一定能一直符合你的期望:在某些情况下,你更关心的是精度,而另一些情况下,你可能真正关心的是召回率。

例如,假设你训练一个分类器来检测儿童可以放心观看的视频,那么你可能更青睐那种拦截了很多好视频(低召回率)​,但是保留下来的视频都是安全(高精度)的分类器,而不是召回率虽高,但是在产品中可能会出现一些非常糟糕的视频的分类器(这种情况下,你甚至可能会添加一个人工流水线来检查分类器选出来的视频)​。

反过来说,如果你训练一个分类器通过图像监控来检测小偷:你大概可以接受精度只有30%,但召回率能达到99%(当然,安保人员会收到一些错误的警报,但是几乎所有的窃贼都在劫难逃)​。遗憾的是,鱼和熊掌不可兼得,你不能同时增加精度又减少召回率,反之亦然。这称为精度/召回率权衡。

由于ROC曲线与精度/召回率(PR)曲线非常相似,因此你可能会问如何决定使用哪种曲线。有一个经验法则是,当正类非常少见或者你更关注假正类而不是假负类时,应该选择PR曲线,反之则是ROC曲线。

参考文章:

机器学习评估分类结果——精准率、召回率、F1Score_f1 score-CSDN博客

第三章.逻辑回归—正确率/召回率/F1指标,非线性逻辑回归代码_正确率 召回率-CSDN博客

蜥蜴书:机器学习实战

http://www.hrbkazy.com/news/3437.html

相关文章:

  • 房产网站源码wordpress济南seo排名搜索
  • 部署在本地的wordpressseo是什么意思蜘蛛屯
  • 移动网站建设2021最近比较火的营销事件
  • 抖音小程序变现真的能赚钱吗淘宝关键词排名优化技巧
  • 做网站大约需要多少钱百度竞价广告投放
  • wordpress app开发深圳网站优化网站
  • 如何做一个商城类型的网站宁波网络推广优化方案
  • wordpress 文章页面显示全部讯展网站优化推广
  • 做网站发票东莞做网站的公司有哪些
  • 坪山新区城市建设局网站长沙百度推广排名
  • 第一次做网站做什么比较好金昌网站seo
  • 门户网站做安阳seo
  • wordpress 主题工具潍坊seo招聘
  • 做装修那个网站好开网店怎么推广运营
  • 工信部备案查询网站优化排名金苹果系统
  • 公司企业网站搭建拉新十大推广app平台
  • 番禺网站制作技术微信营销软件排行榜
  • wordpress仿站header免费推广网站地址大全
  • 网站建设总体需求报告seo搜索引擎优化推广专员
  • 网站内容做淘宝店铺链接影响排名吗sem数据分析
  • mac本地搭建wordpress南昌seo公司
  • 做网站要钱的吗优化seo方法
  • 动画制作软件免费佛山外贸seo
  • 做八年级题目的网站打开网站搜索
  • 上海找工作网站谷歌浏览器下载
  • 没有网站怎么做CPC网络营销的方式包括
  • 公司年会活动方案策划农大南路网络营销推广优化
  • 如何建设数据库搜索网站企业网页设计与推广
  • 微信网站开放哪些平台可以免费发布产品
  • 软文营销网站网站运营方案