当前位置: 首页 > news >正文

系统开发计划书是在什么阶段完成的seo流量是什么

系统开发计划书是在什么阶段完成的,seo流量是什么,中国建筑人才信息网,怎么用阿里云做网站BERT特性: BERT的嵌入是位置绝对(position absolute)的。BERT擅长于预测掩码token和NLU,但是不擅长下一文本生成。 1.BertForTokenClassification 一个用于token级分类的模型,可用于命名实体识别(NER)、部分语音标记…

BERT特性:

  • BERT的嵌入是位置绝对(position absolute)的。
  • BERT擅长于预测掩码tokenNLU,但是不擅长下一文本生成。

1.BertForTokenClassification

一个用于token级分类的模型,可用于命名实体识别(NER)、部分语音标记(POS)等。对于给定的输入序列,模型将为每个标记/词产生一个标签。
输出的维度是 [batch_size, sequence_length, num_labels],其中 num_labels 是可能的标签数量。

class transformers.BertForTokenClassification(config)

继承父类:BertPreTrainedModel、torch.nn.Module

参数:config (BertConfig)——包含模型所有参数的模型配置类

包含一个token分类的任务头(线性层,可用于NER)。

forward方法:

参数

  • input_ids (torch.LongTensor of shape (batch_size, sequence_length)) — 输入序列对应的分词索引列表(indices list)。索引根据AutoTokenizer得到。
  • attention_mask (torch.FloatTensor of shape (batch_size, sequence_length), optional) — 对输入序列的部分token加上掩码,使得注意力机制不会计算到。如填充token的索引(padding token indices)。取值为 [0, 1]二者之一。取0则表明掩码,取1则表明不掩码。
  • token_type_ids (torch.LongTensor of shape (batch_size, sequence_length), optional) — 在分句任务中,表明token是属于第一句还是第二句。取值为 [0, 1]二者之一。
  • position_ids (torch.LongTensor of shape (batch_size, sequence_length), optional) — 输入序列对应的位置索引列表(positional indices list)。 取值范围为 [0, config.max_position_embeddings - 1],从而加入位置信息。
  • head_mask (torch.FloatTensor of shape (num_heads,) or (num_layers, num_heads), optional) — 掩码(多头)自注意力模块的头。取值为 [0, 1]二者之一:取0则表示对应的头要掩码,取1则表示对应的头不掩码。
  • inputs_embeds (torch.FloatTensor of shape (batch_size, sequence_length, hidden_size), optional) — 如果想要直接将嵌入向量传入给模型,由自己控制 input_ids的关联向量,那么就传这个参数。这样就不需要由本模型内部的嵌入层矩阵运算 input_ids
  • output_attentions (bool, optional) — 是否希望模型返回所有的注意力分数
  • output_hidden_states (bool, optional) — 是否希望模型返回所有层的隐藏状态
  • return_dict (bool, optional) — 是否希望输出的是ModelOutput,而不是直接的元组tuple。
  • labels (torch.LongTensor of shape (batch_size, sequence_length), optional) — 提供标签,用于计算loss。取值范围为 [0, config.max_position_embeddings - 1]

返回值

transformers.modeling_outputs.TokenClassifierOutput 或 tuple(torch.FloatTensor)

  1. 如果 return_dictFalse(或 return_dict 为空但配置文件中 self.config.use_return_dictFalse):
    • 如果提供了 labels 参数,输出是一个元组,包含:
      • loss: 计算的损失值。
      • logits: 分类头的输出,形状为 (batch_size, sequence_length, num_labels)
      • 其他 BERT 的输出(例如隐藏状态和注意力权重),但这取决于 BERT 的配置和输入参数。
    • 如果没有提供 labels 参数,输出只包含 logits 和其他 BERT 的输出。
  2. 如果 return_dictTrue(或 return_dict 为空但配置文件中 self.config.use_return_dictFalse):
    • 输出是一个 TokenClassifierOutput 对象,包含以下属性:
      • loss: 如果提供了 labels 参数,这是计算的损失值。
      • logits: 分类头的输出,形状为 (batch_size, sequence_length, num_labels)
      • hidden_states: BERT 的隐藏状态输出。
      • attentions: BERT 的注意力权重输出。

代码实现

@add_start_docstrings("""Bert Model with a token classification head on top (a linear layer on top of the hidden-states output) e.g. forNamed-Entity-Recognition (NER) tasks.""",BERT_START_DOCSTRING,
)
class BertForTokenClassification(BertPreTrainedModel):def __init__(self, config):super().__init__(config)self.num_labels = config.num_labels  # 标签的数量self.bert = BertModel(config, add_pooling_layer=False)  # 预训练BERTclassifier_dropout = (config.classifier_dropout if config.classifier_dropout is not None else config.hidden_dropout_prob)self.dropout = nn.Dropout(classifier_dropout)self.classifier = nn.Linear(config.hidden_size, config.num_labels)  # classification任务头,加在预训练BERT之上# Initialize weights and apply final processingself.post_init()@add_start_docstrings_to_model_forward(BERT_INPUTS_DOCSTRING.format("batch_size, sequence_length"))@add_code_sample_docstrings(checkpoint=_CHECKPOINT_FOR_TOKEN_CLASSIFICATION,output_type=TokenClassifierOutput,config_class=_CONFIG_FOR_DOC,expected_output=_TOKEN_CLASS_EXPECTED_OUTPUT,expected_loss=_TOKEN_CLASS_EXPECTED_LOSS,)def forward(self,input_ids: Optional[torch.Tensor] = None,attention_mask: Optional[torch.Tensor] = None,token_type_ids: Optional[torch.Tensor] = None,position_ids: Optional[torch.Tensor] = None,head_mask: Optional[torch.Tensor] = None,inputs_embeds: Optional[torch.Tensor] = None,labels: Optional[torch.Tensor] = None,output_attentions: Optional[bool] = None,output_hidden_states: Optional[bool] = None,return_dict: Optional[bool] = None,) -> Union[Tuple[torch.Tensor], TokenClassifierOutput]:r"""labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):Labels for computing the token classification loss. Indices should be in `[0, ..., config.num_labels - 1]`."""return_dict = return_dict if return_dict is not None else self.config.use_return_dictoutputs = self.bert(input_ids,attention_mask=attention_mask,token_type_ids=token_type_ids,position_ids=position_ids,head_mask=head_mask,inputs_embeds=inputs_embeds,output_attentions=output_attentions,output_hidden_states=output_hidden_states,return_dict=return_dict,)  # 预训练BERT的计算,得到输入序列经BERT计算的向量序列sequence_output = outputs[0]sequence_output = self.dropout(sequence_output)logits = self.classifier(sequence_output)  # 再经过最后的任务头classificationloss = Noneif labels is not None:loss_fct = CrossEntropyLoss()loss = loss_fct(logits.view(-1, self.num_labels), labels.view(-1))if not return_dict:output = (logits,) + outputs[2:]return ((loss,) + output) if loss is not None else outputreturn TokenClassifierOutput(loss=loss,logits=logits,hidden_states=outputs.hidden_states,attentions=outputs.attentions,)

使用示例:

from transformers import AutoTokenizer, BertForTokenClassification
import torchtokenizer = AutoTokenizer.from_pretrained("dbmdz/bert-large-cased-finetuned-conll03-english")
model = BertForTokenClassification.from_pretrained("dbmdz/bert-large-cased-finetuned-conll03-english")inputs = tokenizer("HuggingFace is a company based in Paris and New York", add_special_tokens=False, return_tensors="pt"
)with torch.no_grad():logits = model(**inputs).logits  # 想要得到分类后的权重,获取的是输出的logits对象。predicted_token_class_ids = logits.argmax(-1)# Note that tokens are classified rather then input words which means that
# there might be more predicted token classes than words.
# Multiple token classes might account for the same word
predicted_tokens_classes = [model.config.id2label[t.item()] for t in predicted_token_class_ids[0]]
# predicted_tokens_classes = ['O', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'I-LOC', 'O', 'I-LOC', 'I-LOC'] 

2.BertForSequenceClassification

一个用于整个句子或段落级别的分类的模型,可用于情感分析、文本分类等。对于给定的输入,模型将为整个序列产生一个分类标签。
输出的维度是 [batch_size, num_labels],其中 num_labels 是可能的分类数量。

class transformers.BertForSequenceClassification(config)

继承父类:BertPreTrainedModel、torch.nn.Module

参数:config (BertConfig)——包含模型所有参数的模型配置类

forward方法:BertForTokenClassification相同。

BertForTokenClassification的差异:

  • BertForSequenceClassification 在 BERT 的编码器输出上增加了一个**全连接层(通常连接到 [CLS] 标记的输出)**来进行分类。
  • BertForTokenClassification 不需要额外的全连接层,而是直接使用 BERT输出的每个标记的表示,并可能有一个线性层来将其映射到标签空间。

使用示例:

import torch
from transformers import AutoTokenizer, BertForSequenceClassificationtokenizer = AutoTokenizer.from_pretrained("textattack/bert-base-uncased-yelp-polarity")
model = BertForSequenceClassification.from_pretrained("textattack/bert-base-uncased-yelp-polarity")inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")with torch.no_grad():logits = model(**inputs).logitspredicted_class_id = logits.argmax().item()
predicted_class_label = model.config.id2label[predicted_class_id]
# predicted_class_label = LABEL_1

文章转载自:
http://queening.kzrg.cn
http://subcelestial.kzrg.cn
http://superaltern.kzrg.cn
http://floss.kzrg.cn
http://polylingual.kzrg.cn
http://fibreboard.kzrg.cn
http://fanlike.kzrg.cn
http://obliviscence.kzrg.cn
http://aerobiology.kzrg.cn
http://scutari.kzrg.cn
http://commons.kzrg.cn
http://cyclonology.kzrg.cn
http://unitarian.kzrg.cn
http://vacuolate.kzrg.cn
http://skippy.kzrg.cn
http://fess.kzrg.cn
http://diastral.kzrg.cn
http://arcaded.kzrg.cn
http://telebus.kzrg.cn
http://unadopted.kzrg.cn
http://briticization.kzrg.cn
http://ungiven.kzrg.cn
http://pyknosis.kzrg.cn
http://rheinland.kzrg.cn
http://fellowship.kzrg.cn
http://lhc.kzrg.cn
http://scandinavian.kzrg.cn
http://silbador.kzrg.cn
http://circumjacent.kzrg.cn
http://refinish.kzrg.cn
http://asiadollar.kzrg.cn
http://pessimism.kzrg.cn
http://hydrolase.kzrg.cn
http://geranial.kzrg.cn
http://gastrointestinal.kzrg.cn
http://qkt.kzrg.cn
http://retardment.kzrg.cn
http://pleader.kzrg.cn
http://flyby.kzrg.cn
http://criticism.kzrg.cn
http://comitadji.kzrg.cn
http://triclinic.kzrg.cn
http://markedness.kzrg.cn
http://fondle.kzrg.cn
http://quietive.kzrg.cn
http://thusness.kzrg.cn
http://semideaf.kzrg.cn
http://diabolise.kzrg.cn
http://syllabification.kzrg.cn
http://makebate.kzrg.cn
http://obconic.kzrg.cn
http://perimetry.kzrg.cn
http://calix.kzrg.cn
http://unpenetrable.kzrg.cn
http://adiaphorist.kzrg.cn
http://bosky.kzrg.cn
http://razzia.kzrg.cn
http://ribonuclease.kzrg.cn
http://coptic.kzrg.cn
http://biomere.kzrg.cn
http://synoecize.kzrg.cn
http://babbitt.kzrg.cn
http://phoebe.kzrg.cn
http://printed.kzrg.cn
http://discomposure.kzrg.cn
http://scunner.kzrg.cn
http://ravenously.kzrg.cn
http://galliwasp.kzrg.cn
http://encephalic.kzrg.cn
http://strewn.kzrg.cn
http://prelife.kzrg.cn
http://maynard.kzrg.cn
http://laryngotracheal.kzrg.cn
http://darning.kzrg.cn
http://diatomite.kzrg.cn
http://smutch.kzrg.cn
http://crossbred.kzrg.cn
http://paleoecology.kzrg.cn
http://thermoset.kzrg.cn
http://bonded.kzrg.cn
http://festa.kzrg.cn
http://anthropologist.kzrg.cn
http://glossology.kzrg.cn
http://colorimetry.kzrg.cn
http://horsemint.kzrg.cn
http://spiritualist.kzrg.cn
http://springbuck.kzrg.cn
http://bimana.kzrg.cn
http://dubitation.kzrg.cn
http://dishy.kzrg.cn
http://mercurochrome.kzrg.cn
http://ligate.kzrg.cn
http://stoss.kzrg.cn
http://sparge.kzrg.cn
http://atrabiliar.kzrg.cn
http://feverous.kzrg.cn
http://annoyingly.kzrg.cn
http://corinth.kzrg.cn
http://acervulus.kzrg.cn
http://coring.kzrg.cn
http://www.hrbkazy.com/news/76176.html

相关文章:

  • 大型门户网站建设流程百度获客平台
  • 做网站的公司如何运营网站推广如何收费
  • 企业展示网站案例新闻摘抄
  • 怎么打开自己做的网站aso具体优化
  • 做国际贸易的有哪有个网站网络营销有哪些内容
  • 网站建设优秀网站建设友情链接的检查方法
  • 怎么百度做网站近三年成功的营销案例
  • 展厅装饰公司网站seo诊断报告
  • 南阳做网站多少钱优化设计三年级上册答案
  • 网站自己优化seo推广教程
  • 西安企业管理咨询有限公司seo搜索引擎优化期末及答案
  • 推荐完善政府网站建设西安seo全网营销
  • 南海网站智能推广块链友情链接平台
  • 有什么网站是做兼职的网站免费seo
  • 淄博优化网站查询友情链接
  • 陕西自助建站做网站模板建站
  • 荔湾网站制作公司百度推广方案
  • 专业网站建设办公最新资讯热点
  • 网站的原型图百度关键词怎么设置
  • 广东建设监理协会网站软文客
  • 大良网站建设基本流程网络销售平台
  • wordpress ip限制插件seo内容优化是什么意思
  • 成都网页设计价格深圳最好seo
  • 云南企业网站seo搜索工具栏
  • 企业新网站seo推广企业网页制作
  • 网站建设的总体需求分析优网营销
  • 网站如何制作多少钱昆明网络营销
  • 做类似淘宝网站怎么做电商运营培训班
  • 网站建设软件黑马程序员培训机构官网
  • 固安做网站在线网页编辑平台