Skip to content

kinokonoyama/ACT.TTSYukkuri

 
 

Repository files navigation

ACT.TTSYukkuri

概要

ACTのTTSをゆっくりさんに置き換えます

使い方

  1. 準備
    .NET Framework 4.6 をインストールします。
    ※TTSYukkuri の動作には. NET Framework 4.6 以降が必要です。

  2. インストール
    OpenJTalk\
    ACT.TTSYukkuri.dll
    ACT.TTSYukkuri.TTSServer.Core.dll
    ACT.TTSYukkuri.TTSServer.exe
    ACT.TTSYukkuri.TTSServer.exe.config
    NAudio.dll
    をACTのインストールディレクトリにコピーします
    その後、プラグインとしてACT.TTSYukkuri.dllを追加してください

ディレイ読上げ

/wait 1,ゆっくりです
読上げのテキストに上記のように記述すると、トリガー検出から1秒後に「ゆっくりです」を読上げます

TTS対応状況

下記のTTSに対応しています

AquesTalk(ゆっくり)

ニコニコ動画の「ゆっくり実況」で有名なTTSエンジン。
ゲームのアラートとして使用する場合は読上げ速度を早めにしておくのがオススメです。
また、ゆっくりに喋らせる場合は句読点を多めに記述すると比較的自然な喋りになります。

Open JTalk(MEI)

名工大が開発したオープンソースのTTSエンジン。
男性の声と「MEI(メイ)」という女性の声が使えます。
これを使う場合はあまり句読点を入れないほうが自然に喋るような気がします。
おまけで初音ミクの声から合成したボイスデータも同梱しています(type-α, type-β)が、元々が歌うためのものなのでかなり聞き取りづらいです。

Voice Text Web API

HOYAサービス株式会社が提供しているWeb経由で使用できるTTSエンジン。
ユーザ登録をしてAPIKey(アプリケーションからアクセスするためのパスワードのようなもの)を発行して貰う必要がありますが無料で使えます。
テレ東の「モヤモヤさまぁ~ず」のナレーションの「ショウ」君が有名です。
発声の際にWebにアクセスするためレスポンスは非常に悪いですが、同じ文章の2回目以降の発声はローカル側のキャッシュを利用するため気にならなくなります。
音声やイントネーション等の品質は非常に高いと思います。

※注意
パーティメンバのパラメータを数値等の代名詞付きで読上げているような場合は使用しないほうが良いです。
毎回読上げる文章の内容が変化するためキャッシュが効きません。

CeVIO Creative Studio(さとうささら)※ただし製品版が必要

別途、有償のソフトが必要です。
有償なだけあって高品質なTTSエンジンです。

棒読みちゃん

棒読みちゃんに読上げてもらいます。
棒読みちゃんには文章だけを連携して、文章の解析、速度・ピッチ等の調整、TTSの再生等は棒読みちゃん側の制御になります。
当プラグイン側で再生していないため、TTSに対するサウンドデバイスの変更や再生方式の変更は効きません。

VOICEROIDシリーズ等を使いたい場合は、棒読みちゃん+棒読みちゃんのプラグインとこのモードを使用して再生することになります。

※VOICEROIDも直接使えるようにできないの?
残念ながら対応する予定はありません。棒読みちゃん経由で利用して下さい。
VOICEROIDには外部のアプリケーションから呼出す機能(API)がありません。よって連携するためにはかなりの作業量が必要になります。
その内容は棒読みちゃんのVOICEROID連携プラグインと同様の内容になります。
であれば既存のものをそのまま使って貰うほうが良いだろうということです。

タイムラインでも使いたい

こちらの改造版タイムラインをどうぞ

ゆっくりが喋らない?

ゆっくりは読める文字に制限があります
文章の中に読めない文字が「一文字でも」混じっていると文章そのものを読みません

以下、文字の対応状況です
漢字 → よめます。ただしIMEで変換できる範囲です
ひらがな → よめます
カタカナ → よめます
数字 → 読めます
記号 → 一部読めません
アルファベット → 英単語としては読めません。「えー」「びー」「しー」という風になります
句読点 → 区切りとして読上げに間が開くようになります。読点は多めに入れるほうが自然な読上げになります

TimeLineから使った時にwaveが既定のデバイスからしかならない

TimeLineから普通にwaveを鳴らすとTTSYukkuri経由ではなくTimeLine本体がwaveを再生します
TimeLine本体には再生デバイスを選ぶ機能がないため、既定のデバイスでの再生となります
下記の例のようにwave再生の指定を変更してTTSYukkuri経由で再生するように変更してください

例) TTSYukkuri経由でwaveを再生させる
alertall アトミックレイ before 1 speak "TTSYukkuri" "se_maoudamashii_chime10.wav"
※ ゆっくりに喋らせる文字列としてファイル名を指定します

再生方式について

環境に合わせて再生方式を選べるようになっています

WaveOut

Windowsの伝統的なAPIによる再生。
可もなく不可もなくといったところ。ほとんどの環境で動作すると思われる。

DirectSound

Windowsのゲーム用のAPIによる再生。
ゲーム向けであるため低遅延及び同時再生に強いのが特徴。

WASAPI(デフォルト)

Windows Vista から搭載された新しいAPIによる再生。
WaveOut同様に可もなく不可もなく動作する。XPでは動かないのでご注意。

ASIO

高級サウンドカード等が対応している高品質な汎用API。
テストは出来ていませんが対応するサウンドカードを使っている人は使ってみるといいかもしれない。

遅延やノイズについて

DirectSound <<<< WASAPI < WaveOut
計測してみた結果、喋りだしまでの時間は上記のとおりでした(左ほど高速)。
DirectSoundは、処理時間の桁が違います(WASAPIに対して6倍程度高速)。
WASAPIは、WaveOutと比較して2倍程度高速でした。
ASIOは環境が無いため試せていません。

ただし、OSやPCのスペック、サウンドデバイス等の様々な外部要素の影響によってDirectSoundではノイズが発生する場合があります。
自身の環境で動かしてみてマッチするものを選んで下さい。
テストはカスタムトリガに適当な文章を記載して再生ボタンを連打する方法が良いと思います。
体感できる差がないという場合は、DirectSoundを選択しておけば理論上は最速になります。
WaveOutとWASAPIで迷う場合は、WASAPIを選択しておけば理論上はより高速に動作します。

最新リリース

こちらからダウンロードしてください

ライセンス

三条項BSDライセンス
Copryright (c) 2014, anoyetta
https://github.com/anoyetta/ACT.TTSYukkuri/blob/master/LICENSE

NAudio

本ソフトは、NAudioライブラリを使用しており、その著作権はMark Heath氏に帰属します。
配布元: http://naudio.codeplex.com/
ライセンス: http://naudio.codeplex.com/license

AquesTalk(いわゆる、ゆっくりボイス)

本ソフトは、(株)アクエストの音声合成ライブラリAquesTalkを使用しており、その著作権は同社に帰属します。
営利目的での使用は当該ライブラリの使用ライセンスが必要となります。

謝辞

・GB19xx様
https://github.com/GB19xx/ACT.TPMonitor
のFF14ヘルパークラスを流用させていただきました

お問合せ

不具合報告、要望、質問及び最新版情報などはTwitterにて
GitHubと連動しているためツイートは少々五月蠅いかもしれません
https://twitter.com/anoyetta

About

ACTのTTSをゆっくりさんに置き換えるプラグイン

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • C# 100.0%