当前位置: 首页 > news >正文

国外网站icp备案搜狗站长平台

国外网站icp备案,搜狗站长平台,怎么做展示型网站,创新设计方案文章目录 介绍 概率计算 逻辑回归的损失函数 单个实例的成本函数 整个训练集的成本函数 鸢尾花数据集上的逻辑回归 Softmax回归 Softmax回归数学公式 Softmax回归损失函数 调用代码 参数说明 结语 介绍 作用:使用回归算法进行分类任务 思想:…

文章目录

介绍

概率计算

逻辑回归的损失函数

单个实例的成本函数

整个训练集的成本函数

鸢尾花数据集上的逻辑回归

Softmax回归

Softmax回归数学公式

Softmax回归损失函数

调用代码

参数说明

结语


介绍

作用:使用回归算法进行分类任务

思想:将回归值转为概率值,然后找到一个适当的数值,当概率大于这个值时,归为一类,当小于这个值时,归为另一类


概率计算

p=\sigma (x^{T}w)

函数的输入值为特征的加权和 x^{T}w

\sigma是sigmoid函数,公式为

\sigma(t) =\frac{1}{1+e^{(-t)}}

函数图像为

可见它输出一个0-1的值,我们可以将这个值当作概率 

则我们可以通过这个概率来分类,设定一个值,在这个值的两端进行分类


逻辑回归的损失函数

单个实例的成本函数

当p>=0.5时

c(w)=-log(p)

当p<0.5时

c(w)=-log(1-p)


整个训练集的成本函数

J(w)=\frac{1}{m}\sum_{i=1}^{m}[y^{i}log(p^{i})+(1-y^{i})log(1-p^{i})]

这个损失函数也是一个凸函数,可以使用梯度下降法使损失最小化


鸢尾花数据集上的逻辑回归

鸢尾花数据集是机器学习中一个经典的数据集,它有花瓣和花萼的长和宽,任务是用它们来判断鸢尾花的种类

看代码和效果

from sklearn import datasets
from sklearn.linear_model import LogisticRegression
import matplotlib.pyplot as plt
import numpy as npiris = datasets.load_iris()x = iris["data"][:, 3:]
y = (iris["target"] == 2)model = LogisticRegression()
model.fit(x, y)x_new = np.linspace(0, 3, 1000).reshape(-1, 1)
y_proba = model.predict_proba(x_new)
plt.plot(x_new, y_proba[:, 1], "g-", label="Iris virginica")
plt.plot(x_new, y_proba[:, 0], "b--", label="Not Iris virginica")plt.xlabel("Petal width")
plt.ylabel("probability")plt.legend()
plt.show()

可以看见,当花瓣长度变化的时候,两种花种类的概率随之变化

简单介绍一下新的代码,predict.proba方法返回样本为可能的两种花的概率。


Softmax回归

上述方法主要用于二分类任务,我们再来看一种多分类方法,Softmax回归


Softmax回归数学公式

Softmax(s_{i})=\frac{e^{s_{i}}}{\sum_{j=1}^{n}e^{s_{j}}}

Softmax函数也叫指数归一化函数,它对x进行指数处理再进行归一化得出一个概率

这个函数的自变量为一个分数s,这个s由我们的数据的转置矩阵与一个参数相乘得来

s = x^{T}\theta

对于不同的类,参数\theta都不相同,模型训练的任务就是拟合这个参数


Softmax回归损失函数

L = -\frac{1}{m}\sum_{i=1}^{m}\sum_{K}^{k=1}y_{k}^{i}log(p_{k}^{i})

当k=2时(二分类),此成本函数等于sigmoid逻辑回归的成本函数


调用代码

model = LogisticRegression(multi_class="multinomial", solver="lbfgs", C=10)
model.fit(x, y)

参数说明

multi_class="multinomial": 表示采用多类别分类,即多类别的逻辑回归问题,与二元逻辑回归不同。

solver="lbfgs": 表示使用LBFGS(Limited-memory Broyden–Fletcher–Goldfarb–Shanno)优化算法进行求解。

C=10: 表示正则化参数,控制模型的正则化强度,C值越小,正则化强度越高。


结语

逻辑回归是一种简单的分类方法,二分类任务就用第一种方法,多分类任务就用第二种方法

http://www.hrbkazy.com/news/54905.html

相关文章:

  • 快站是个什么平台自动点击器永久免费版
  • 推广赚钱的软件排行太原seo霸屏
  • doooor国外设计网站互联网营销方法有哪些
  • 网站开发的整个流程网页设计素材网站
  • 无锡网站制作网站建设企业培训课程种类
  • 做奶茶吧店网站ui设计培训班哪家好
  • 建设一个网站需要线上推广渠道有哪些
  • 中文企业网站html模板网站seo链接购买
  • 网站关键字怎么写外链推广是什么意思
  • 合肥公司建设网站制作网络推广服务商
  • wordpress pro版电商seo名词解释
  • 网站后台html深圳产品网络推广
  • 做网站设计的都转行干啥了惠州seo计费
  • 浙江做网站网络营销最主要的工具是
  • 吴忠住房和城乡建设网站佛山百度seo代理
  • 公司开发网站建设价格廊坊关键词优化平台
  • 宁夏银川做网站的公司怎么进行网络推广
  • node做网站后台快速刷排名的软件最好
  • 国外视频设计网站谷歌排名规则
  • 本地网站建设信息大全个人网页免费域名注册入口
  • qq空间可以做网站吗郑州网站优化渠道
  • 网友要求你帮助他在某网站做测试爱站网关键词
  • wordpress文章自动生成标签关键词优化公司费用多少
  • 政府网站集约化建设讲座PPT软文100字左右案例
  • 公司网站建设需求书百度网址大全电脑版旧版本
  • 万全网站建设品牌营销推广要怎么做
  • 长春市住房建设局网站个人博客登录入口
  • 适合这手机浏览器主页的网站网站优化排名易下拉稳定
  • 个人做网站要买什么域名广州seo推广
  • discuz主题搜索引擎优化是免费的吗