• 外语配音软件“布谷鸟配音“和ffmepg转换软件的使用以及SYD_Calculator提取文件到C语言


    外语配音软件"布谷鸟配音"和ffmepg转换软件的使用以及CAL文件提取到C语言

    布谷鸟配音缺点

    因为现在要使用意大利语的语音,所以原来的文字转语音工具不能够使用了,然后采用了"布谷鸟配音"这个软件,可以输出很多个语言:
    在这里插入图片描述
    但是布谷鸟配音软件有个问题,它输出的WAV文件不是标准的RIFF文件,所以之前的CAL转换方式(看文章https://blog.csdn.net/chengdong1314/article/details/124027262)就不行了,再深入研究发现布谷鸟配音输出的是S16 16K的音频格式,也就是16BIT 16KHZ,所以没有办法引入ffmepg来转换wav文件为8Bit的格式以方便给后面的单片机引用.

    ffmepg软件安装

    ffmepg软件请看如下文章的说明:https://zhuanlan.zhihu.com/p/324472015
    安装成功可以输入如下指令来查看版本号:

    F:\download>ffmpeg -version
    ffmpeg version 5.1.1-essentials_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
    built with gcc 12.1.0 (Rev2, Built by MSYS2 project)
    configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libmfx --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
    libavutil      57. 28.100 / 57. 28.100
    libavcodec     59. 37.100 / 59. 37.100
    libavformat    59. 27.100 / 59. 27.100
    libavdevice    59.  7.100 / 59.  7.100
    libavfilter     8. 44.100 /  8. 44.100
    libswscale      6.  7.100 /  6.  7.100
    libswresample   4.  7.100 /  4.  7.100
    libpostproc    56.  6.100 / 56.  6.100
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    转换WAV文件为8KHZ 16BIT

    安装好后使用如下命令转换布谷鸟输出的wav(重命名布谷鸟生成的wav为"1.wav"并且放在F:\download目录下),其实我最终需要的是8KHZ 8BIT的:

    F:\download>ffmpeg -i 1.wav -ar 8000 1_16BIT8KHZ.wav
    ffmpeg version 5.1.1-essentials_build-www.gyan.dev Copyright (c) 2000-2022 the FFmpeg developers
      built with gcc 12.1.0 (Rev2, Built by MSYS2 project)
      configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libmfx --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
      libavutil      57. 28.100 / 57. 28.100
      libavcodec     59. 37.100 / 59. 37.100
      libavformat    59. 27.100 / 59. 27.100
      libavdevice    59.  7.100 / 59.  7.100
      libavfilter     8. 44.100 /  8. 44.100
      libswscale      6.  7.100 /  6.  7.100
      libswresample   4.  7.100 /  4.  7.100
      libpostproc    56.  6.100 / 56.  6.100
    [aac @ 0000023ac14ab700] Estimating duration from bitrate, this may be inaccurate
    Input #0, aac, from '1.wav':
      Duration: 00:00:02.28, bitrate: 65 kb/s
      Stream #0:0: Audio: aac (LC), 22050 Hz, mono, fltp, 65 kb/s
    Stream mapping:
      Stream #0:0 -> #0:0 (aac (native) -> pcm_s16le (native))
    Press [q] to stop, [?] for help
    Output #0, wav, to '1_16BIT8KHZ.wav':
      Metadata:
        ISFT            : Lavf59.27.100
      Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 8000 Hz, mono, s16, 128 kb/s
        Metadata:
          encoder         : Lavc59.37.100 pcm_s16le
    size=      36kB time=00:00:02.27 bitrate= 128.3kbits/s speed= 526x
    video:0kB audio:36kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.214227%
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    SYD_Calculator提取文件到C语言

    WAV文件的再次转换和使用SYD_Calculator软件来转换wav,这里一步到位直接替换文件里面的数组内容,非常实用快捷
    因为单片机使用的是8KHZ 8BIT的文件,所以ffmpeg生成的wav还是不能够直接使用,没办法只能够再次用,请看如下文章:
    https://blog.csdn.net/chengdong1314/article/details/126885337
    实验测试过程的资料如下:https://download.csdn.net/download/chengdong1314/86540409

  • 相关阅读:
    使用Matplotlib画多y轴图
    九、iOS原生应用(宿主App)与uni小程序间的通讯
    STM32CubeMX学习笔记(47)——USB接口使用(MSC基于内部Flash模拟U盘)
    SpringMVC ---- SpringMVC的视图
    Cell 重磅丨不依赖泛素蛋白酶降解途径的新型 PROTAC - MCE
    屏幕显示技术进化史
    普通二本+转专业学计算机是什么感受
    Linux修改主机名
    ASPICE标准快速掌握「5.2. ASPICE与V模型」
    【数据结构】链表经典oj
  • 原文地址:https://blog.csdn.net/chengdong1314/article/details/126885415