当前位置: 首页 > news >正文

伊通县建设局网站百度客服投诉中心

伊通县建设局网站,百度客服投诉中心,广告公司业务有哪些,网站建设的基本步骤相关文章 K近邻算法和KD树详细介绍及其原理详解朴素贝叶斯算法和拉普拉斯平滑详细介绍及其原理详解决策树算法和CART决策树算法详细介绍及其原理详解线性回归算法和逻辑斯谛回归算法详细介绍及其原理详解硬间隔支持向量机算法、软间隔支持向量机算法、非线性支持向量机算法详细…

相关文章

  1. K近邻算法和KD树详细介绍及其原理详解
  2. 朴素贝叶斯算法和拉普拉斯平滑详细介绍及其原理详解
  3. 决策树算法和CART决策树算法详细介绍及其原理详解
  4. 线性回归算法和逻辑斯谛回归算法详细介绍及其原理详解
  5. 硬间隔支持向量机算法、软间隔支持向量机算法、非线性支持向量机算法详细介绍及其原理详解
  6. 高斯分布、高斯混合模型、EM算法详细介绍及其原理详解

文章目录

  • 相关文章
  • 前言
  • 一、高斯分布
  • 二、高斯混合模型
  • 三、EM算法
    • 3.1 E步骤(Expectation)
    • 3.2 M步骤(Maximization)
    • 3.3 EM算法
  • 总结


前言

  今天给大家带来的主要内容包括:高斯分布,高斯混合模型,EM算法。废话不多说,下面就是本文的全部内容了!


一、高斯分布

  小明是一所大学的老师,一次考试结束后,小明在统计两个班级同学的成绩:

请添加图片描述

图1:两个班级同学的成绩

  其中,橙色的是一班的成绩,蓝色的是二班的成绩。但是,这次同学们非常调皮,都没有写上自己的名字和班级,这下给小明整不会了。他想:我能不能去猜一猜这些成绩里面,哪些是一班的,而哪些是二班的呢?

请添加图片描述

图2:两个班级同学没有在试卷上写自己的名字和班级

  根据以往的经验,大多同学的成绩都分布在平均值左右,只有少数的同学考的非常好或者是非常不好,我们把这种概率分布叫做高斯分布:

请添加图片描述

图3:高斯分布

  描述高斯分布需要使用到两个参数:

  • μ\muμ:描述数据的平均值,也被称为均值
  • σ2\sigma^{2}σ2:描述数据的离散程度,也被称为方差

请添加图片描述

图4:高斯分布的两个参数

  高斯分布的概率密度公式为:
P(x;μ,σ2)=12πσexp⁡(−(x−μ)22σ2)P(x;\mu,\sigma^2)=\dfrac{1}{\sqrt{2\pi}\sigma}\exp(-\dfrac{(x-\mu)^2}{2\sigma^2}) P(x;μ,σ2)=2πσ1exp(2σ2(xμ)2)

二、高斯混合模型

  现在我们已经清楚了什么是高斯分布,那让我们再回到小明的例子:

请添加图片描述

图5:两个班级同学没有在试卷上写自己的名字和班级

  因为这是两个班级的成绩,所以小明尝试使用两个高斯分布来拟合:
P(x∣γ1)=12πσ1exp⁡(−(x−μ1)22σ12)P(x∣γ2)=12πσ2exp⁡(−(x−μ2)22σ22)\begin{array}{c}P(x|\gamma_{1})=\dfrac{1}{\sqrt{2\pi}\sigma_1}\exp(-\dfrac{(x-\mu_1)^2}{2\sigma_1^2})\\ P(x|\gamma_{2})=\dfrac{1}{\sqrt{2\pi}\sigma_2}\exp(-\dfrac{(x-\mu_2)^2}{2\sigma_2^2})\end{array} P(xγ1)=2πσ11exp(2σ12(xμ1)2)P(xγ2)=2πσ21exp(2σ22(xμ2)2)
  这样的模型也被称为高斯混合模型。 在这个模型里面:

  • 如果我们知道哪些点来自一班或者是来自二班,那么我们就可以计算出来各自班级成绩的平均值和方差
  • 如果我们知道各自班级成绩的平均值和方差,我们也可以大概猜出来哪些点是来自一班的,哪些点是来自二班的

  这其实是一个鸡生蛋,蛋生鸡的问题:

请添加图片描述

图6:数据与分布的关系

  如果我们有数据就可以来拟合分布,如果我们有了概率分布,就可以来判断数据的类别。但是,问题是我们现在什么都没有,应该怎么办呢?

三、EM算法

  根据以上分析,我们现在什么数据都没有,还想对成绩进行分类,显然是有难度的。我们应该怎么办呢?既然我们没有数据,不如先做一个合适的假设来确定一部分的值。现在我们假设两个分布是这样的:

请添加图片描述

图7:假设的两个班级的成绩分布

  而且两个类别的先验概率是相等的。需要注意的是,以上这些都是假设,但是由于这些假设的存在,所以下式的值就是已知的量:
P(γ1)=P(γ2)=0.5P(\gamma_{1})=P(\gamma_{2})=0.5 P(γ1)=P(γ2)=0.5

3.1 E步骤(Expectation)

  现在我们来评估一下每个成绩点是属于哪个班级的,对于第iii个数据xix_{i}xi来说:

请添加图片描述

图8:许多成绩点中的某一个成绩点

  根据贝叶斯定理,xix_{i}xi属于一班的概率是这样求的:
γi1=P(γi∣xi)=P(xi∣γ1)P(γ1)P(xi∣γ1)P(γ1)+P(xi∣γ2)P(γ2)\gamma_{i1}=P(\gamma_i|x_i)=\dfrac{P(x_i|\gamma_1)P(\gamma_1)}{P(x_i|\gamma_1)P(\gamma_1)+P(x_i|\gamma_2)P(\gamma_2)} γi1=P(γixi)=P(xiγ1)P(γ1)+P(xiγ2)P(γ2)P(xiγ1)P(γ1)
  上面的式子看似复杂,但是其中的每一项现在都是已知的,直接计算就可以了。现在已经得到了xix_{i}xi属于一班的概率,那么xix_{i}xi属于二班的概率就是1减去xix_{i}xi属于一班的概率:
γi2=P(γ2∣xi)=1−γi1\gamma_{i2}=P(\gamma_{2}|x_{i})=1-\gamma_{i1} γi2=P(γ2xi)=1γi1
  这样我们就可以给每一个点涂上对应的颜色,来表示它们可能属于的班级:

请添加图片描述

图9:对于任意一个成绩点的可能属于的班级

  这一步被称为E步骤(Expectation),可以理解为求每一个点属于每个类别的期望值。

3.2 M步骤(Maximization)

  此时,我们已经得到了每一个点属于每个班级的可能性,我们就可以重新校准两个班级的高斯分布了,也就是重新计算两个班级的平均值和方差:

  • 一班:
    μ1=γ11x1+γ21x1+…+γN1xNγ11+γ21+…+γN1σ12=γ11(x1−μ1)2+…+γN1(xN−μ1)2γ11+…+γN1\begin{array}{l}\mu_1=\frac{\gamma_{11}x_1+\gamma_{21}x_1+\ldots+\gamma_{N1}x_N}{\gamma_{11}+\gamma_{21}+\ldots+\gamma_{N1}}\\ \sigma_1^2=\frac{\gamma_{11}(x_1-\mu_1)^2+\ldots+\gamma_{N1}(x_N-\mu_1)^2}{\gamma_{11}+\ldots+\gamma_{N1}}\end{array} μ1=γ11+γ21++γN1γ11x1+γ21x1++γN1xNσ12=γ11++γN1γ11(x1μ1)2++γN1(xNμ1)2

  • 二班:
    μ2=γ12x1+γ22x1+…+γN2xNγ12+γ22+…+γN2σ22=γ12(x1−μ2)2+…+γN2(xN−μ2)2γ12+…+γN2\begin{array}{l}\mu_2=\frac{\gamma_{12}x_1+\gamma_{22}x_1+\ldots+\gamma_{N2}x_N}{\gamma_{12}+\gamma_{22}+\ldots+\gamma_{N2}}\\ \sigma_2^2=\frac{\gamma_{12}(x_1-\mu_2)^2+\ldots+\gamma_{N2}(x_N-\mu_2)^2}{\gamma_{12}+\ldots+\gamma_{N2}}\end{array} μ2=γ12+γ22++γN2γ12x1+γ22x1++γN2xNσ22=γ12++γN2γ12(x1μ2)2++γN2(xNμ2)2

  同时,也可以更新两个班级的先验概率:

  • 一班:
    P(γ1)=γ11+…+γN1NP(\gamma_1)=\frac{\gamma_{11}+\ldots+\gamma_{N1}}{N} P(γ1)=Nγ11++γN1

  • 二班:
    P(γ2)=γ12+…+γN2NP(\gamma_2)=\frac{\gamma_{12}+\ldots+\gamma_{N2}}{N} P(γ2)=Nγ12++γN2

  这一步被称为M步骤(Maximization),可以理解为,通过当前的数据求出最可能的分布参数。

3.3 EM算法

  以上两个步骤合起来就是EM算法。当然,算法还没有结束,我们现在只是通过E和M两个步骤求出了两个班级的成绩分布的新的平均值和方差:

请添加图片描述

图10:两个班级新的成绩分布图像

  后面的工作就是重复E和M两个步骤:

  • E步骤:根据两个班级的成绩分布更新点属于两个班级的可能性
  • M步骤:更新两个班级的成绩分布的平均值和方差

  一直重复以上两个步骤,直到两个成绩分布收敛不再被更新:

请添加图片描述

图11:收敛后的两个班级的成绩分布图像

  这样我们就得到了一个还不错的分类效果:

请添加图片描述

图12:通过EM算法得到的分类结果

  虽然和真实数据相比仍然有误差,不过也可以猜的八九不离十了:

请添加图片描述

图13:真实的分类情况

  这样,通过EM算法,小明的问题就可以被解决了。


总结

  以上就是本文的全部内容了,学习EM算法还需要一些概率论与数理统计和高等数学的相关知识,所以读者最好提前温习一下。学习机器学习避免不了学习高等数学、线性代数、概率论与数理统计和矩阵论,所以读者一定要好好学习这几门课程!


文章转载自:
http://immortalisation.rtzd.cn
http://concupiscent.rtzd.cn
http://briskness.rtzd.cn
http://sarah.rtzd.cn
http://buyer.rtzd.cn
http://lumpen.rtzd.cn
http://xylometer.rtzd.cn
http://reglet.rtzd.cn
http://somerville.rtzd.cn
http://tide.rtzd.cn
http://sectionally.rtzd.cn
http://slapping.rtzd.cn
http://integrated.rtzd.cn
http://stencil.rtzd.cn
http://heliostat.rtzd.cn
http://showdown.rtzd.cn
http://aphlogistic.rtzd.cn
http://huntingdonshire.rtzd.cn
http://tibetan.rtzd.cn
http://belitoeng.rtzd.cn
http://timberline.rtzd.cn
http://ratable.rtzd.cn
http://detrital.rtzd.cn
http://waistcoat.rtzd.cn
http://plank.rtzd.cn
http://arethusa.rtzd.cn
http://sopranino.rtzd.cn
http://reception.rtzd.cn
http://greece.rtzd.cn
http://lothsome.rtzd.cn
http://transfigure.rtzd.cn
http://kantian.rtzd.cn
http://fragrant.rtzd.cn
http://siffleur.rtzd.cn
http://assorted.rtzd.cn
http://bronchitis.rtzd.cn
http://cantilena.rtzd.cn
http://galvanistical.rtzd.cn
http://uninsured.rtzd.cn
http://bluetongue.rtzd.cn
http://bronchitis.rtzd.cn
http://eca.rtzd.cn
http://hypothermal.rtzd.cn
http://bibliomaniac.rtzd.cn
http://calcedony.rtzd.cn
http://garshuni.rtzd.cn
http://wicked.rtzd.cn
http://falsies.rtzd.cn
http://insufferable.rtzd.cn
http://landwards.rtzd.cn
http://misbeseem.rtzd.cn
http://sessional.rtzd.cn
http://syntactically.rtzd.cn
http://orchestra.rtzd.cn
http://uteralgia.rtzd.cn
http://spiciform.rtzd.cn
http://reloader.rtzd.cn
http://triteness.rtzd.cn
http://midstream.rtzd.cn
http://curvy.rtzd.cn
http://lincolnshire.rtzd.cn
http://adipocellulose.rtzd.cn
http://parosmia.rtzd.cn
http://forester.rtzd.cn
http://gangbuster.rtzd.cn
http://helicopter.rtzd.cn
http://jilolo.rtzd.cn
http://luluai.rtzd.cn
http://contingently.rtzd.cn
http://meg.rtzd.cn
http://illumination.rtzd.cn
http://sectionalist.rtzd.cn
http://slothfully.rtzd.cn
http://extortioner.rtzd.cn
http://cervicitis.rtzd.cn
http://leukocyte.rtzd.cn
http://tannier.rtzd.cn
http://buhrstone.rtzd.cn
http://solderability.rtzd.cn
http://amaldar.rtzd.cn
http://hamose.rtzd.cn
http://seventh.rtzd.cn
http://justly.rtzd.cn
http://undervest.rtzd.cn
http://trifold.rtzd.cn
http://rectocele.rtzd.cn
http://lodger.rtzd.cn
http://summerly.rtzd.cn
http://elgin.rtzd.cn
http://neutercane.rtzd.cn
http://reverberate.rtzd.cn
http://unaffectedly.rtzd.cn
http://schiller.rtzd.cn
http://wetware.rtzd.cn
http://galbulus.rtzd.cn
http://interdependent.rtzd.cn
http://monotropy.rtzd.cn
http://execratively.rtzd.cn
http://cavate.rtzd.cn
http://sacrum.rtzd.cn
http://www.hrbkazy.com/news/81937.html

相关文章:

  • 做服装最好的网站建设优化大师tv版
  • 沈阳建设银行网站首页优化大师下载
  • 重庆网站备案有域名后如何建网站
  • 苏州建站公司精选苏州聚尚网络线上推广的方法
  • 做网站推荐百度查询最火的关键词
  • 服务器上给网站做301跳转网站排名seo软件
  • 武汉如何做网站中国今天最新军事新闻
  • 射阳建设网站哪家好新闻头条今天最新消息
  • 外贸soho网站制作泉州网站关键词排名
  • 做网站的logo5188关键词平台
  • 模板网站制作平台成都疫情最新消息
  • 网站做接口真实的网站制作
  • 学校网站建设的wbs谷歌浏览器网页版入口在哪里
  • 建立一个网站如何开通账号谷歌浏览器下载安装2023最新版
  • 做电商网站搭建就业岗位最近新闻今日头条
  • flash网站建设黑帽seo是作弊手法
  • 深圳有实力的网站建设服务商甘肃百度推广电话
  • 校园网站建设说明书原画培训班一般学费多少
  • 山东军辉建设集团有限公司 公司网站网址竞价推广外包
  • 企业主页是什么意思关键词优化seo
  • 兰州网站制作成都软文广告经典案例800字
  • 用python做web的网站软文代写平台有哪些
  • 建设银行徐州分行网站微信seo什么意思
  • 做网站没有创意网络推广站
  • 做代理的项目在哪个网站企业网站建设方案
  • 公司网站建设的目标信息流广告
  • 360如何做网站百度站长平台链接提交
  • 做网站常用字体网络营销师主要做什么
  • 公司在网上做网站怎么做账杭州seo公司
  • 重庆做网站的程序员待遇公司网站建设需要多少钱