当前位置: 首页 > news >正文

建设教育网站灰色行业关键词优化

建设教育网站,灰色行业关键词优化,秦皇岛今日头条新闻,虚拟主机子网站文章目录数据文件准备wav.scputt2spkspk2utttext相关代码根据文件生成 utt2spk 和 wav.scputt2spk -- spk2utt 转换数据文件准备 在训练/解码中: 有三个文件是必要的: wav.scp 语音编号 – 路径信息utt2spk 语音编号 – 说话人编号spk2utt 说话人编号 …

文章目录

    • 数据文件准备
      • wav.scp
      • utt2spk
      • spk2utt
      • text
    • 相关代码
      • 根据文件生成 utt2spk 和 wav.scp
      • utt2spk -- spk2utt 转换


数据文件准备

在训练/解码中:
有三个文件是必要的:

  1. wav.scp 语音编号 – 路径信息
  2. utt2spk 语音编号 – 说话人编号
  3. spk2utt 说话人编号 – 说话人的语音编号;可以根据 spk2utt 生成,下面将会介绍

一个标注文件用于测试的:
text


这里以 aishell 为例:

wav.scp

结构

[utterance] [wav_path]

BAC009S0002W0122 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0122.wav
BAC009S0002W0123 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0123.wav
BAC009S0002W0124 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0124.wav

utt2spk

结构:

[utterance] [speaker]

BAC009S0002W0122 S0002
BAC009S0002W0123 S0002

spk2utt

结构:

[speaker] [utterance]

S0002 BAC009S0002W0122 BAC009S0002W0123 BAC009S0002W0124 BAC009S0002W0125 BAC009S0002W0126 BAC009S0002W0127 BAC009S0002W0128 BAC009S0002W0129 BAC009S0002W0130 BAC009S0002W0131 BAC009S0002W0132 ...
S0003 BAC009S0003W0121 BAC009S0003W0122 BAC009S0003W0123 BAC009S0003W0124 BAC009S0003W0125 BAC009S0003W0126 BAC009S0003W0127 BAC009S0003W0128 BAC009S0003W0129 BAC009S0003W0130 BAC009S0003W0131  ...
S0004 BAC009S0004W0121 BAC009S0004W0123 BAC009S0004W0124 BAC009S0004W0125 BAC009S0004W0126 BAC009S0004W0127 BAC009S0004W0128 ...

text

[utterance] [transcript]

BAC009S0002W0122 而 对 楼市 成交 抑制 作用 最 大 的 限 购
BAC009S0002W0123 也 成为 地方 政府 的 眼中 钉
BAC009S0002W0124 自 六月 底 呼和浩特 市 率先 宣布 取消 限 购 后
BAC009S0002W0125 各地 政府 便 纷纷 跟进
BAC009S0002W0126 仅 一 个 多 月 的 时间 里

相关代码

根据文件生成 utt2spk 和 wav.scp

假设文件按 说话人–音频 排列,可以使用下属代码生成 utt2spk 和 wav.scp 文件

import osdata_root_dir = 'data'
utt2spk_path = 'utt2spk'
wav_scp_path = 'wav.scp'for speaker in os.listdir(data_root_dir):if speaker.startswith('.'):continuespearker_dir = os.path.join(data_root_dir, speaker)for wav in os.listdir(spearker_dir):if wav.startswith('.'):continuewav_path = os.path.join(spearker_dir, wav)wav_id = f'{speaker}_{wav}' with open(wav_scp_path, 'a') as fa:fa.write(wav_id + ' ' + wav_path + '\n')with open(utt2spk_path, 'a') as fa:fa.write(wav_id + ' ' + speaker + '\n') 

utt2spk – spk2utt 转换


你可以使用代码 将 utt2spk 转为 文件:

kaldi_root/egs/wsj/s5/utils/utt2spk_to_spk2utt.pl  utt2spk > spk2utt

utt2spk 文件内不能有空行,否则可能报错


同样,你也可以使用 spk2utt_to_utt2spk.pl 反向将 spk2utt 生成 utt2spk


伊织 2023-02-09 (四,晴)

http://www.hrbkazy.com/news/8897.html

相关文章:

  • 建设银行网站个人中心百度人工客服电话是多少
  • 电子商务网站的规划与分析搜索引擎优化的简称是
  • 中高端网站建设关键词全网搜索
  • 做h5那个网站好什么叫seo优化
  • 厚街h5网站建设广告推广文案
  • 有哪些做设计交易网站有哪些内容资深seo顾问
  • 全国 网站备案 数量原画培训班一般学费多少
  • 如何制作公司免费网站太原百度快速排名提升
  • 会网站建设好吗培训网
  • 做网站哪个公司好熊猫关键词工具
  • 做风险代理案源的网站网站怎么被百度收录
  • 灯具网站模板网站优化 推广
  • 信阳市商务局网站加油站建设公告重大新闻事件
  • 专业做网站公司排名网络推广和运营的区别
  • 大良营销网站建设策划惠州seo招聘
  • 变更网站怎么做百度知道网址
  • 南宁建设信息网站舟山seo
  • 怎样用网站做淘宝客哈尔滨优化网站方法
  • 阳江市住房和城乡建设局网站网络营销项目策划
  • 烟台网站制作企业企业网站模板免费下载
  • 百度做网站靠什么收费站长工具端口扫描
  • 中英文网站建设方案网站结构优化的内容和方法
  • 用易语言做抢购网站软件官网seo哪家公司好
  • 北京网站建设制作方案搜索引擎优化趋势
  • 枣庄高端网站建设网络营销推广技术
  • 建设一批适合青少年的网站许昌seo公司
  • 网站公司建立seo推广策略
  • 青岛建站seo公司网络营销策划ppt范例
  • 北京建网网站快速排名优化价格
  • 帮公司做网站重庆森林电影完整版