当前位置: 首页 > news >正文

佛山外贸建站公司八百客crm登录入口

佛山外贸建站公司,八百客crm登录入口,网站配置到iis后读不了数据,网站如何备案背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对: 1、向量维度及所需空间 向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至…

背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对:

1、向量维度及所需空间

向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至于哪个好坏,都宣称自己比较好,寡人实际应用中有实践:m3e-base似乎不错。

由于faiss需要float32的小数,根据下面试验,可以发现如果直接转成np.float32数据类型的数据然后直接进行存储(txt存储,每行进行存储),那么保留小数点后8位后存储的大小约为直接存储的数据的一半大小,同时节约了磁盘大小。在运行时,因为是大数据级别的,不建议将所有向量都求出来再进行存储,那样需要很大的内存,一般机器不支持,我这里的200G+的机器都over几次了。

存储试验:

res=np.random.randn(2,768)
with open("test768.txt","w") as f :for i in range(len(res)):tmp = res[i].astype(np.float32).tolist()# tmp = [round(i,8) for i in tmp]tmp
http://www.hrbkazy.com/news/5337.html

相关文章:

  • 会议响应式网站开发深圳网站设计公司
  • 纯静态网站索引怎么做自动seo系统
  • 怎么在住房公积金网站做减员操作石家庄seo结算
  • 做机械设备哪个网站好百度指数分析
  • 医疗网站织梦seo竞价
  • 黑龙江生产建设兵团知青网站seo赚钱培训课程
  • 有关网站建设的网站hao123网址之家官网
  • 云服务器网站解析怎么做自己的网页
  • 做网站免费新闻稿
  • 安徽省住建厅网站官网热搜榜百度一下你就知道
  • 做网站公司哪好全网营销与seo
  • wordpress源码类主题windows优化大师可靠吗
  • 汽车网站推广策略营销图片素材
  • 网站整站模板优化大师最新版下载
  • 做网站和谷歌推广一共多少钱基本seo
  • 网站开发公司地址电子商务seo实训总结
  • 单页面 网站 模板seo排名优化是什么意思
  • 武汉网站建设 网站制作b2b平台推广网站
  • 庆阳市人大常委会网站建设企业网站管理系统怎么操作
  • 怎做网站太原免费网站建站模板
  • 如何查看用wordpress建的站点站长之家工具查询
  • 做网站需要哪几个板块百度手机助手免费下载
  • 自己怎么做网站游戏市场营销培训课程
  • 葫芦岛网站制作做网站推广的公司
  • 网站建设在开封找谁做专业拓客团队怎么收费
  • 合肥住房和城乡建设局网站关键词优化推广哪家好
  • 网站页面优化方案seo怎么做?
  • 情侣博客 wordpressseo推广技巧
  • 网站里滚动的图片怎么做的优秀营销软文范例500字
  • 如何维护网站的运营网络推广公司介绍