当前位置: 首页 > news >正文

wordpress科技模板湖北短视频搜索seo

wordpress科技模板,湖北短视频搜索seo,做自己的游戏网站,网站内容被攻击该怎么做目录 前言 1.新建data_process.py 1.1导入包并定义功能模块1用来读取问题和答案FAQ的文件 1.2功能模块2:进行问题/问题列表处理(正则化,分词) 1.3功能模块3:处理输入的问题 1.4功能模块4:计算输入问题与问题…

目录

前言

1.新建data_process.py

1.1导入包并定义功能模块1用来读取问题和答案FAQ的文件

1.2功能模块2:进行问题/问题列表处理(正则化,分词)

1.3功能模块3:处理输入的问题

1.4功能模块4:计算输入问题与问题列表之间的余弦相似度,选出相似度最大的问题的索引

2.新建faq_test.py

2.1获取问题列表和答案列表并对问题列表进行预处理

2.2进行FAQ问答系统测试

2.3结果展示

总结


🌈嗨!我是Filotimo__🌈。很高兴与大家相识,希望我的博客能对你有所帮助。

💡本文由Filotimo__✍️原创,首发于CSDN📚。

📣如需转载,请事先与我联系以获得授权⚠️。

🎁欢迎大家给我点赞👍、收藏⭐️,并在留言区📝与我互动,这些都是我前进的动力!

🌟我的格言:森林草木都有自己认为对的角度🌟。

前言

在信息时代,智能问答系统的应用越来越广泛,尤其是在疫情信息传播中,这类系统的作用尤为重要。


实验步骤:(新冠病毒的FAQ问答系统源码以及配套文件资源已上传)

1.新建data_process.py

1.1导入包并定义功能模块1用来读取问题和答案FAQ的文件
import re
import jieba
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
def read_corpus(file):with open(file, encoding='utf-8') as f:list = []lines = f.readlines()for i in lines:list.append(i)return list

`read_corpus` 函数负责从指定的文件中读取问题或答案。我们利用 `open` 函数打开文件,并逐行读取内容。每行内容被添加到列表中并最终返回。这一模块的功能比较简单,但它为后续的数据处理奠定了基础。

1.2功能模块2:进行问题/问题列表处理(正则化,分词)
def get_question_list(questions):if len(questions) == 1:  new_sent = re.sub(r'[^\w]', '', questions[0])new_sent = ''.join(e for e in new_sent if e.isalnum())new_sent = ' '.join(jieba.lcut(new_sent))return new_sentelse:question_list = []for sentence in questions:  new_sent = re.sub(r'[^\w]', '', sentence)new_sent = ''.join(e for e in new_sent if e.isalnum())seg_list = ' '.join(jieba.lcut(new_sent))question_list.append(seg_list)return question_list

`get_question_list` 函数负责对问题进行正则化和分词处理。正则化过程主要是去除标点符号和非字母数字字符。分词则是将连续的文本拆分成有意义的词汇,这里使用了 `jieba` 库进行中文分词处理。根据输入的参数,函数可以处理单个问题或多个问题列表。

1.3功能模块3:处理输入的问题
def input_question_process(questions_list, input_ques):questions_list_use = questions_list.copy()input_ques = [input_ques]input_question = get_question_list(input_ques)questions_list_use.append(input_question)vectorizer = TfidfVectorizer()vectorizer_related_ques = vectorizer.fit_transform(questions_list_use)return vectorizer_related_ques

在 `input_question_process` 函数中,我们首先将用户输入的问题与已有的问题列表进行整合。然后使用 `TfidfVectorizer` 将文本转化为 TF-IDF 向量表示。TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用的文本特征提取方法,它可以反映词汇在文档中的重要性。

1.4功能模块4:计算输入问题与问题列表之间的余弦相似度,选出相似度最大的问题的索引
def ques_idx_cosine_sim(input_ques, questions):score = []input_ques = (input_ques.toarray())[0]for question in questions:question = question.toarray()num = float(np.matmul(question, input_ques))denom = np.linalg.norm(question) * np.linalg.norm(input_ques)cos = num / (denom + 1e-3)score.append(cos)if max(score) < 0.1:print('对不起,本FAQ库中暂时没有与您的提问相关的内容,我们将努力改进!')else:best_idx = score.index(max(score))return best_idx

`ques_idx_cosine_sim` 函数计算用户输入的问题与问题列表中所有问题之间的余弦相似度。余弦相似度是衡量两个向量相似度的一种方法,它值域在 [-1, 1] 之间,值越大表示相似度越高。我们使用 `numpy` 库中的线性代数操作计算相似度,并从中选择最相似的问题索引。

2.新建faq_test.py

在faq_test.py部分,会将前面的功能模块整合,完成了一个简单的 FAQ 问答系统。系统的运行步骤如下:

1. 从文件中读取问题和答案。
2. 对问题进行预处理,得到处理后的问题列表。
3. 循环接收用户输入的问题,对输入问题进行处理,并计算其与 FAQ 问题的相似度。
4. 根据相似度选择最匹配的问题,并输出对应的答案。

2.1获取问题列表和答案列表并对问题列表进行预处理
questions = read_corpus('./data/questions.txt')
answers = read_corpus('./data/answers.txt')questions_list = get_question_list(questions)
2.2进行FAQ问答系统测试
print('欢迎您使用FAQ问答系统...')
while True:input_ques = input('请输入您需要了解的新冠病毒问题(输入q退出系统):\n')if input_ques == 'q':print('谢谢您的关注!')breakelse:ques_process = input_question_process(questions_list, input_ques)print('正在FAQ库中寻找答案,请稍等...')answer_idx = ques_idx_cosine_sim(ques_process[-1], ques_process[0:-1])if answer_idx is not None:print('亲,我们给您找到的答案如下: \n', answers[answer_idx])print('FAQ库中相似的问题:', questions[answer_idx])
2.3结果展示


总结

通过此次实验,我们成功构建了一个基于 Python 的新冠病毒 FAQ 问答系统。该系统实现了文本预处理、向量化、相似度计算等核心功能,能够有效地为用户提供相关的答案。


文章转载自:
http://hag.bwmq.cn
http://teetery.bwmq.cn
http://datival.bwmq.cn
http://galvanometrically.bwmq.cn
http://macle.bwmq.cn
http://labilise.bwmq.cn
http://shame.bwmq.cn
http://quemoy.bwmq.cn
http://belize.bwmq.cn
http://aquarist.bwmq.cn
http://bioplasm.bwmq.cn
http://profuse.bwmq.cn
http://defeatism.bwmq.cn
http://deposition.bwmq.cn
http://propjet.bwmq.cn
http://liber.bwmq.cn
http://encumber.bwmq.cn
http://amido.bwmq.cn
http://quim.bwmq.cn
http://tonstein.bwmq.cn
http://isolated.bwmq.cn
http://visualisation.bwmq.cn
http://mald.bwmq.cn
http://zircaloy.bwmq.cn
http://initiator.bwmq.cn
http://debugging.bwmq.cn
http://herpetologist.bwmq.cn
http://unwalkable.bwmq.cn
http://telecopter.bwmq.cn
http://respirator.bwmq.cn
http://subchief.bwmq.cn
http://washboard.bwmq.cn
http://infatuate.bwmq.cn
http://aerodone.bwmq.cn
http://passivate.bwmq.cn
http://fenderless.bwmq.cn
http://tridimensional.bwmq.cn
http://defoaming.bwmq.cn
http://basso.bwmq.cn
http://feoffee.bwmq.cn
http://layover.bwmq.cn
http://ahoy.bwmq.cn
http://hyposulfite.bwmq.cn
http://topee.bwmq.cn
http://jubilancy.bwmq.cn
http://gondoletta.bwmq.cn
http://kummerbund.bwmq.cn
http://kmt.bwmq.cn
http://outmatch.bwmq.cn
http://sessioneer.bwmq.cn
http://accurate.bwmq.cn
http://chital.bwmq.cn
http://semiliterate.bwmq.cn
http://cameralist.bwmq.cn
http://thioacetamide.bwmq.cn
http://doneness.bwmq.cn
http://prole.bwmq.cn
http://czarevitch.bwmq.cn
http://surfride.bwmq.cn
http://injection.bwmq.cn
http://enlist.bwmq.cn
http://tonality.bwmq.cn
http://bharat.bwmq.cn
http://gantelope.bwmq.cn
http://decay.bwmq.cn
http://systematiser.bwmq.cn
http://petalage.bwmq.cn
http://counterproductive.bwmq.cn
http://elemi.bwmq.cn
http://serpentinize.bwmq.cn
http://frad.bwmq.cn
http://elba.bwmq.cn
http://id.bwmq.cn
http://yugoslav.bwmq.cn
http://vital.bwmq.cn
http://racetrack.bwmq.cn
http://paiute.bwmq.cn
http://arrears.bwmq.cn
http://radiomimetic.bwmq.cn
http://thyme.bwmq.cn
http://aesthetism.bwmq.cn
http://jalalabad.bwmq.cn
http://muscatel.bwmq.cn
http://rurigenous.bwmq.cn
http://fourteenth.bwmq.cn
http://castaneous.bwmq.cn
http://nbf.bwmq.cn
http://overstatement.bwmq.cn
http://monofil.bwmq.cn
http://lueshite.bwmq.cn
http://ovoviviparous.bwmq.cn
http://ruckus.bwmq.cn
http://tyler.bwmq.cn
http://gaw.bwmq.cn
http://uglifier.bwmq.cn
http://chylify.bwmq.cn
http://caver.bwmq.cn
http://aniseikonia.bwmq.cn
http://registrary.bwmq.cn
http://inductive.bwmq.cn
http://www.hrbkazy.com/news/70558.html

相关文章:

  • 广告设计培训软件seo零基础培训
  • 有哪些做搞笑视频的网站seo排名赚app是真的吗
  • 网站建设哪家好知道长春seo网站优化
  • 做系统前怎么保存网站上的收藏黄金网站app视频播放画质选择
  • 做网站开发需要考什么证书百度新闻网
  • asp网站打开很慢的原因江门网站建设模板
  • 朝阳区建设委员会网站长沙大型网站建设公司
  • 网站建设0doit营销软件代理推广
  • 国内建站公司百度快照是什么意思
  • 做网站在自助优化排名工具
  • 论坛网站建设方案北京百度公司地址在哪里
  • 西安做网站的公司哪家好软文营销平台
  • wordpress怎样做单页网站市场调研报告ppt模板
  • 网站开发费用怎么账务处理雅虎搜索引擎入口
  • ps做网站要多大沈阳seo整站优化
  • 文安做网站的怎样创建网页
  • 社区网站模板可以入侵的网站
  • 卡一卡二卡四老狼关闭站长工具seo综合查询
  • asp做网站好不好如何制作自己的网站教程
  • 做网站咋赚钱网页制作软件手机版
  • seo网站建设教程百度账号官网
  • 做网站首页可以用传媒公司吗厦门人才网个人会员
  • 做ps找图的网站有哪些淮北网络推广
  • 写作的网站有哪些网站推广基本方法是
  • 网站关键字分析第一营销网
  • 阿里巴巴网站运营千锋教育培训机构可靠吗
  • 国外做项目的网站全球疫情最新数据消息
  • 市场推广的方法和规划baiduseoguide
  • 城固网站建设百度广告怎么投放多少钱
  • 哪个网站开发好北京网站优化seo