自建 LocalAI，本地使用 ai 模型 - 文字轉語音

Posted Mar 11, 2024 Updated Mar 8, 2026

By Cooper

1 min read

前言

這是 LocalAI 系列的第三篇文章，要來介紹如何將文字轉成語音，以及切換不同的模型

首先可以看到官網的使用方式，有很多模型可以切換，這邊推薦兩個

Bark，轉換後的文字是帶有情緒的
Piper，更成熟的模型，基於 Piper 訓練的中文模型也很多

相較於情緒、背景音等元素，我更看重產出速度，所以選擇了這個模型 zh_CN-huayan-medium.onnx

我們一樣先將模型下載下來，並放進 models 資料夾中

wget https://huggingface.co/csukuangfj/vits-piper-zh_CN-huayan-medium/blob/main/zh_CN-huayan-medium.onnx?download=true -O zh_CN-huayan-medium.onnx

接著重啟容器

docker-compose restart

然後就可以拿這個模型來試試看產出效果啦

  
curl --location 'http://127.0.0.1:8080/tts' \
--header 'Content-Type: application/json' \
--data '{
  "model": "zh_CN-huayan-medium.onnx",
  "backend": "piper",
  "input":"觀自在菩薩。行深般若波羅蜜多時。照見五蘊皆空。度一切苦厄。舍利子。色不異空。空不異色。色即是空。空即是色。受想行識。亦復如是。"
  }'

等待 3 秒鐘左右，就可以產出中文語音啦

AI, LocalAI

如果你覺得此文章對你有幫助的話，可以請我喝杯咖啡

前言

Trending Tags