当前位置: 首页 > news >正文

wordpress在线搭建西安百度首页优化

wordpress在线搭建,西安百度首页优化,江西小程序开发,盐城做网站的公司搜索引擎架构 整个搜索引擎分为三个系统 爬虫系统 索引系统 线上搜素服务 爬虫系统 爬虫分为两个阶段: 第一阶段:根据目标网站的列表页,爬对应的文档 URL 第二阶段:根据文档 URL,下载文档内容 触发器&#xff1…

搜索引擎架构

整个搜索引擎分为三个系统

  1. 爬虫系统

  2. 索引系统

  3. 线上搜素服务

爬虫系统

爬虫分为两个阶段:

  1. 第一阶段:根据目标网站的列表页,爬对应的文档 URL

  2. 第二阶段:根据文档 URL,下载文档内容

触发器:

  • 定时任务触发

  • 消息触发

  • 管理后台手动触发某一个爬虫任务

文件服务器:

  • 存储图片和视频文件

索引系统

索引系统主要数据依赖:内容库和文件服务

依赖服务:

  1. 分词服务

  2. NLP 服务

    1. 同义词扩展

    2. 生成文档摘要

    3. 抽取文档标签

    4. 图片、文本、视频生成向量

    5. ....

  3. PageRank 服务

在线搜索服务

在线服务的主要模块:

  1. Query 理解

  2. 召回

  3. 排序

当欠召回时:

  1. 在线服务会将当前 Query 发送给离线索引系统的消息队列,让其为该 Query 完善索引数据。

  2. 索引系统收到消息后,会使用第三方搜索引擎进行检索,并且将检索的内容解析出 URL,发给爬虫系统,进行数据的补充。

  3. 如果第三方搜索引擎也没有检索到数据,可以通过 LLM 进行生成内容,将生成的内容写入 ES 索引

http://www.hrbkazy.com/news/11512.html

相关文章:

  • 网站建设协议书如何自己开发一个平台
  • 信息网站建设费使用年限百度top排行榜
  • 手机做任务赚钱的网站河南优化网站
  • 商城网站建设报价单毛戈平化妆培训学校官网
  • 免费个人网站模板下载重庆百度推广排名
  • 备案个人网站名称大全搜索引擎哪个好用
  • 网站网址注册磁力蜘蛛种子搜索
  • 我们一起做网站百度竞价广告推广
  • 做网站需要多少兆专线seo sem
  • 从零开始网站建设网站关键字优化
  • 自己做港澳台照片回执网站百度推广公司
  • 传单设计网站seo优化名词解释
  • 视频网站开发与制作免费网站服务器
  • 金华市住房建设局网站广告推广的软件
  • 扫描网站特征dede软文世界
  • 做精美ppt的网站黑帽seo技术有哪些
  • java可以做网站吗产品推广营销方案
  • 短视频素材库大全百度的搜索引擎优化
  • 重庆专业微网站建设国外搜索引擎排名
  • 制作网页网站费用属于资本性支出吗互联网营销师考试题及答案
  • 柴油网站怎么做有效的网站推广方式
  • 凡科网建设网站如何修改源代码长沙 建站优化
  • 网站开发软件解决方案网游百度搜索风云榜
  • 网站开发属于什么模式免费p站推广网站入口
  • 网站建设课程 谷建优化网站怎么做
  • 做动态网站用什么语言公众号怎么做文章推广
  • 成都网站建设哪家公司好百度一下免费下载安装
  • 做网站服务器设计素材网站
  • 医药招商网站大全免费性能优化工具
  • 黔西南州网站建设公司torrent种子搜索引擎