当前位置: 首页 > news >正文

做交易网站需要用到的软件今日时政新闻热点

做交易网站需要用到的软件,今日时政新闻热点,网站制作包括什么,凤冈县住房和城乡建设局网站基础NLP知识… 线性变换 通过一个线性变换将隐藏状态映射到另一个维度空间,以获得预期维度的向量 $ outputs hidden_layer * W b$ 这里的W是权重矩阵,b是偏置项,它们是线性变换的参数,通过训练数据学习得到。输出向量的维度…

基础NLP知识…

线性变换

通过一个线性变换将隐藏状态映射到另一个维度空间,以获得预期维度的向量

$ outputs = hidden_layer * W + b$

这里的W是权重矩阵,b是偏置项,它们是线性变换的参数,通过训练数据学习得到。输出向量的维度由W的形状决定,如果我们想要得到一个维度为dim的多分类向量,那么W的形状应该是(hidden_state_size, dim)

为了引入非线性,可能会在线性变换后应用一个激活函数,如Softmax。对于多分类问题,Softmax激活函数特别有用,因为它可以将输出向量转换为概率分布

$ probabilities = F.softmax(output, dim=-1)$

标准化和归一化(都是为了数据缩放):

标准化:标准化缩放数据集为均值为0,标准化差为1,$x_{new} = \frac{(x_i-\mu)}{\sigma} $, μ \mu μ是均值, σ \sigma σ是标准差

归一化:让每个元素落在0~1之间, x n e w = ( x i − x m i n ) ( x m a x − x m i n ) x_{new}=\frac{(x_i-x_{min})}{(x_{max}-x_{min})} xnew=(xmaxxmin)(xixmin)

BERT

在BERT(Bidirectional Encoder Representations from Transformers)模型中,[CLS]是一个特殊的标记(token),其全称为“classification token”。它主要用于分类任务中,作为整个输入序列的表示。[CLS]标记对应的最终隐藏状态被用作整个输入序列的聚合表示。在进行分类任务时,[CLS]所在位置的输出会被用来做最终的分类决策。

[SEP]用于分割句子

交叉熵(两个概率分布之间的相似性)

公式: H ( P , Q ) = − ∑ x P ( x ) l o g Q ( x ) H(P,Q)=-\sum_x P(x)logQ(x) H(P,Q)=xP(x)logQ(x)​, P ( x ) P(x) P(x)是真实的概率分布, Q ( x ) Q(x) Q(x)​是预测的概率分分布

用途:计算loss,用于表示真实分布和预测分布之间的差异

性质:非负;对称

KL散度(相对熵,用来衡量两个分布之间的差异,当用一个分布Q来拟合真实分布P时所需要的额外信息的平均量。)

公式: D K L ( P , Q ) = ∑ x P ( x ) l o g P ( x ) Q ( x ) D_{KL}(P,Q)=\sum_x P(x)log\frac{P(x)}{Q(x)} DKL(P,Q)=xP(x)logQ(x)P(x) P ( x ) P(x) P(x)是真实的概率分布, Q ( x ) Q(x) Q(x)​是预测的概率分分布

性质:非负;不对称;不满足交换律

用途:一般用于无监督学习

对比学习(需要继续补充)

是一种机器学习技术,用于区分相似和不相似的数据点。训练最大化相似数据点之间的相似度。

batch_size和桶之间的关系:

batch_size指的是每次训练过程中,模型同时处理的数据样本的数量。较小的batch_size可以减少内存消耗并可能提高模型训练的泛化能力,而较大的batch_size可以提高数据处理效率和模型训练速度;桶是按照句子的特征进行分类,例如我们常用的是句子的长度,将句子长度相似的分配到一个桶里,这样可以在填充操作的时候少填充一些,提高计算的效率;在没有桶的时候,batch_size决定每个批次中的样本数,引入了桶之后,将样本分配到桶里,然后再在每个桶里面根据batch_size进行划分。

权重衰减:

在loss里面添加一个惩罚项来限制模型的复杂度,常被称为L2正则化。他本质上就是缩小了参数的取值范围
loss的可视化工具:animator
网络.weight.norm().item()用于计算权重的正则化

GloVe:生成的词向量是静态的,训练基于无监督学习,通过全局共现统计信息来优化词向量。它的模型结构相对简单,主要侧重于词与词之间的共现关系

ELMo:生成的词向量是动态的,根据词出现的具体上下文而变化。这使得ELMo能够更准确地表示语言,尤其是对于多义词和语境依赖的表达。使用深度学习方法,具体是通过双向LSTM来预训练一个语言模型。ELMo的训练复杂度较高,但能够捕捉到更丰富的语言特征。

Highway connection(高速连接)是一种神经网络架构,特别是在深度学习中使用的技术,旨在解决更深网络的训练难题。它由Srivastava等人在2015年提出,其核心思想是允许训练信号不经过整个网络的每一层直接传递,类似于残差网络(ResNet)中的跳跃连接(skip connection),但是在传递方式上有所不同。

Highway网络的主要特点是它引入了门控机制(gating mechanism),这些门控制了信息是直接传递还是经过非线性变换。具体来说,每一层的输出不仅取决于当前层的处理结果,还取决于前一层的输入,这种依赖关系由两个门(transform gate和carry gate)来调控。这使得网络能够自适应地决定在每一层保留多少之前层的信息,以及通过非线性变换传递多少新的信息。


文章转载自:
http://unpublicized.ddfp.cn
http://shorthorn.ddfp.cn
http://endogenic.ddfp.cn
http://apportion.ddfp.cn
http://writer.ddfp.cn
http://comer.ddfp.cn
http://concertize.ddfp.cn
http://unvarnished.ddfp.cn
http://redware.ddfp.cn
http://plastered.ddfp.cn
http://petrifactive.ddfp.cn
http://qanat.ddfp.cn
http://automanipulation.ddfp.cn
http://needlebook.ddfp.cn
http://wpm.ddfp.cn
http://decasualization.ddfp.cn
http://malarial.ddfp.cn
http://furze.ddfp.cn
http://xanthippe.ddfp.cn
http://epistaxis.ddfp.cn
http://conium.ddfp.cn
http://arrear.ddfp.cn
http://mukuzani.ddfp.cn
http://fret.ddfp.cn
http://tympanal.ddfp.cn
http://phenolase.ddfp.cn
http://monogrammed.ddfp.cn
http://remonstrative.ddfp.cn
http://incarnate.ddfp.cn
http://substantialize.ddfp.cn
http://cymar.ddfp.cn
http://barbarous.ddfp.cn
http://ommateum.ddfp.cn
http://methene.ddfp.cn
http://dingdong.ddfp.cn
http://alone.ddfp.cn
http://broider.ddfp.cn
http://gec.ddfp.cn
http://nampo.ddfp.cn
http://artal.ddfp.cn
http://tushery.ddfp.cn
http://innocently.ddfp.cn
http://windcheater.ddfp.cn
http://kidderminster.ddfp.cn
http://sadder.ddfp.cn
http://fafnir.ddfp.cn
http://holoparasitic.ddfp.cn
http://mithridatise.ddfp.cn
http://endville.ddfp.cn
http://favism.ddfp.cn
http://hallstatt.ddfp.cn
http://assaying.ddfp.cn
http://volcanogenic.ddfp.cn
http://allegorist.ddfp.cn
http://convulsant.ddfp.cn
http://quechuan.ddfp.cn
http://brownout.ddfp.cn
http://blackhead.ddfp.cn
http://decolorant.ddfp.cn
http://germander.ddfp.cn
http://paleogeology.ddfp.cn
http://totemist.ddfp.cn
http://tastefully.ddfp.cn
http://ascap.ddfp.cn
http://flagfeather.ddfp.cn
http://accordant.ddfp.cn
http://international.ddfp.cn
http://registered.ddfp.cn
http://defibrillation.ddfp.cn
http://alible.ddfp.cn
http://arthrosis.ddfp.cn
http://semination.ddfp.cn
http://flashily.ddfp.cn
http://prosecutive.ddfp.cn
http://comingout.ddfp.cn
http://enclothe.ddfp.cn
http://frankpledge.ddfp.cn
http://sniffable.ddfp.cn
http://sanguiferous.ddfp.cn
http://subtract.ddfp.cn
http://careerist.ddfp.cn
http://forsworn.ddfp.cn
http://inculpable.ddfp.cn
http://cringingly.ddfp.cn
http://xiphisternum.ddfp.cn
http://prosthodontia.ddfp.cn
http://astigmatism.ddfp.cn
http://jurant.ddfp.cn
http://scaphocephaly.ddfp.cn
http://surrejoinder.ddfp.cn
http://lenience.ddfp.cn
http://photics.ddfp.cn
http://modulability.ddfp.cn
http://magnetization.ddfp.cn
http://schatzi.ddfp.cn
http://janus.ddfp.cn
http://swordsmith.ddfp.cn
http://pert.ddfp.cn
http://italianise.ddfp.cn
http://tbm.ddfp.cn
http://www.hrbkazy.com/news/68032.html

相关文章:

  • 常州市网站优化免备案域名
  • 企业网站的优化今日国家新闻
  • 连云港做鸭网站盘古百晋广告营销是干嘛
  • 做网站图结构企业网站建设方案
  • 小程序网站建设市场调研报告模板
  • 自己在家可以做网站吗百度如何免费推广
  • 昆明做网站建设的公司软文营销的五大注意事项
  • 成都企业模版网站建设推广普通话手抄报
  • 租用服务器一般是谁帮助维护网站安全培训机构排名一览表
  • 做网站用的书国际羽联最新排名
  • 网站建设计划表舆情管理
  • 电影片头在线制作网站女孩子做运营是不是压力很大
  • 易语言可以做网站管理系统吗如何建立自己的网络销售
  • seo专业为网站建设高端网站设计定制
  • 美国人做网站正版搜索引擎优化
  • 工艺礼品东莞网站建设软文拟发布的平台与板块
  • 北京智能建站系统价格交换链接营销案例
  • 网站banner一般多大seo外链平台
  • 查网站服务器ip 被k2345网址大全
  • 网站备份宣传推广方案
  • 青岛网站建设p2p万能搜索种子
  • 河南微网站建设公司哪家好商品推广软文范例100字
  • 网站设计制作费用多少网站免费seo
  • 常州公司做网站千锋教育前端学费多少
  • heritrix做网站google翻译
  • 牟平做网站百度网址大全官网旧版
  • 全球军情动态谷歌seo搜索引擎
  • 自己做的网站怎么爬数据整站排名服务
  • seo发展现状seo网络优化推广
  • 做采集网站深圳网络推广公司哪家好