当前位置: 首页 > news >正文

大连比较好的建站公司深圳网络推广哪家比较好

大连比较好的建站公司,深圳网络推广哪家比较好,怎么做棋牌网站,网站地图sitemap背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对: 1、向量维度及所需空间 向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至…

背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对:

1、向量维度及所需空间

向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至于哪个好坏,都宣称自己比较好,寡人实际应用中有实践:m3e-base似乎不错。

由于faiss需要float32的小数,根据下面试验,可以发现如果直接转成np.float32数据类型的数据然后直接进行存储(txt存储,每行进行存储),那么保留小数点后8位后存储的大小约为直接存储的数据的一半大小,同时节约了磁盘大小。在运行时,因为是大数据级别的,不建议将所有向量都求出来再进行存储,那样需要很大的内存,一般机器不支持,我这里的200G+的机器都over几次了。

存储试验:

res=np.random.randn(2,768)
with open("test768.txt","w") as f :for i in range(len(res)):tmp = res[i].astype(np.float32).tolist()# tmp = [round(i,8) for i in tmp]tmp
http://www.hrbkazy.com/news/32842.html

相关文章:

  • 网站建设实验报告总结短视频剪辑培训班速成
  • 渭南疫情最新消息新增一例郑州粒米seo顾问
  • 如何注册网页网址基本seo
  • 区块链技术和网站开发结合指数基金是什么意思
  • 移动宽带续费网上营业厅网站优化策略分析
  • 网站程序源码东莞今日新闻大事
  • wordpress超强主题宁波seo网络推广报价
  • 南宁做网站推广的公司百度人工服务热线电话
  • 使用vue做的购物网站刚刚刚刚刚刚刚刚刚刚刚刚刚刚刚
  • 怎么做律所的官方网站永久不收费免费的聊天软件
  • 江苏建设人才无纸化考核网站saas建站
  • 效果好的免费网站建设长沙seo关键词排名优化
  • 动漫视频制作软件太原seo管理
  • wordpress容器温州seo排名优化
  • 网站快照历史seo搜索引擎优化内容
  • 建网站一般用什么工具客服系统网页源码2022免费
  • 做网站有一行一行写代码的吗百度竞价托管费用
  • 网站建设推广公司需要哪些岗位seo计费系统登录
  • 正规手机网站建设平台最近的时事新闻
  • 门户网站方案产品策划推广方案
  • 阜新市城乡建设委员会网站公司网站排名
  • 做企业网站赚钱吗网站建设步骤流程详细介绍
  • 在线网站创做简历网站搭建服务
  • 做的比较唯美的网站优化游戏性能的软件
  • 万州网站建设泰安seo排名
  • 网站开发前调查重庆专业做网站公司
  • 体检中心 网站建设方案广告文案
  • 网站建设中 html5网络营销的四大基础理论
  • 企业网站建设须知如何发布自己的广告
  • 权威数据统计网站长沙网站推广有哪些啊