ゆかりねっと cevio。 ボイスロイドやゆっくり、CeVIOの著作権とライセンス料まとめ

ゆかりねっとコネクター で、OBSのゲーム画面に喋った内容の字幕が出せるようになりました。

ゆかりねっと cevio

2018年5月頭からゆかりねっと+VOICEROIDを使用した生放送に参加するようになり3週間が過ぎました。 ほぼ毎日何かしらのボイスチャットをVOICEROID経由で行っており 今のところあまり不便には感じておりません(むしろ地声に違和感があるレベル) ゆかりねっととVOICEROIDを使った生放送では音声のみだと情報が伝わりにくいので 字幕機能が必須ですが、ゆかりねっとを使う上でいろいろ工夫が必要です。 今回は今までの経験を踏まえそれらの考察をしたいと思います。 使用してみると分かりますが思ってる以上に自分の発声した文章を変換してくれます。 例えば検索すれば簡単に歌詞が出てくるような歌を歌ってみたりしても文章を起こしてくれます。 またゆかりねっとはプラグイン形式を取っているためVOICEROIDなど、各種ツールに音声認識したテキスト連携できることが最大の特徴です。 私は放送で東北ずん子を使っているので ゆかりねっとを使用することでずん子ちゃんになれるというのが最大の魅力ですね。 ゆかりねっとの苦手なこと 喋ってみるとわかりますが「せやなー」の長音部や「うわああああああああ」みたいな叫びや文意はうまく表現できません。 試しに疑問形でマイクに喋ってみましょう。 あなたが疑問形で発声したつもりでもゆかりねっとでは疑問文に変換できません。 また同音異義語、文意の解釈も苦手のようです。 さまざまな言葉が意図したとおりに変換されない場面が出てくるでしょう。 以下の言葉を実際に変換してみると第一変換として「復讐する」が選択されると思います。 復讐する(発音:ふくしゅうする) 復習する(発音:ふくしゅうする) これらの文が含まれた長文なら変換できるのか?というと、変換できません。 詳しい処理方法はわかりませんが文章の文節を解釈し、文節ごとに文字を起こしています。 これは前後の文字列から文意を推測するということが難しいことを意味しています。 どういうことかというと放送者が喋ろうとした内容が音韻から聞き手側が複数の意図でとれる内容だった場合、多くは字幕の誤変換が起きるということです。 学習用のコーパス(テキストや音声などデーターベース)を用いた 変換であれば、これらのような場合でも文意の類推から変換候補を絞ることができます。 そのような製品も実際にはありますので、「文意を正しく変換したい」という用途では使用しにくいのが現状です。 連携された文字列を解釈するのは受け手になる側のツールです。 あくまでゆかりねっとは音声のテキスト変換を担当するため 細かい音程の調整、字幕上での同音異義語の見分け方といったものは 放送者側がある程度、意図的に制御する必要があります。 ではどうするのか 言葉の揺らぎに弱いということは、ゆかりねっとでは制御がしづらいです。 平時からゆかりねっとで喋ってみて、自分の話し方、よく使う言葉の中で変換されづらいものを把握しておく必要があります。 これについての解決方法として大まかに4種類あります。 音声のみであれば聞き手側がある程度文意を類推・解釈できますが 文章が誤変換された場合は目に入った情報から解釈されるためそうはいきません。 回りくどいようですが、取り違えられないような言い方をするのは適切な方法だと思います。 考えながら喋るのはなかなか難しいですが、練習あるのみです。 0から正規表現を用いたフィルター機能が実装されました。 事前に設定することで文章の置換が可能です。 導入のブロマガにも書いてありますが、変換されにくい語句を絞ることである程度制御可能となります。 例えば複数のキャラクターでのやり取りや視聴者兄貴に問いかける場合など 疑問文が字幕に出ると便利ですね(末尾に「?」があると意図が伝わりやすい) ですが実際は喋ってみても「?」は表示されません。 そこで「はてなマーク」という語句を「?」に置換するフィルターを設定してみます。 ごく短い文章にほんの少し間をあけて「はてなマーク」と発生すると疑問文になります。 またVOICEROID2では感嘆符(断定表現)やポーズの長さで発音が変わります。 うまく使い分けることでより視聴者に意図が伝わりやすくなるでしょう。 ですが実際は長文の末尾に「はてなマーク」とつけて変換してみると「ハテナマーク」になることがあります。 これは単語として解釈しているか、文節として解釈しているかの違いと推測されます。 もし放送者が疑問文として「はてなまーく」という発音を使うのであれば 「はてなマーク」「ハテナマーク」の両方を「?」に変換するように設定するのが無難です。 置換で大切なのは、ある発声が指し示す語句が一意になるようにすることです。 「?」であればクエスチョンマーク、はてなマーク、疑問符という呼び方がありますが クエスションマークやハテナマークと認識されれば変換されません。 滑舌や前後の変換でうまく伝わらないことが多いので 自分がよく使う語句を踏まえて単語を置換するのがベストです。 ここまで読んで「はてな」なんて単語は普段使わないし「?」に変換すればいいのではないか、と思う人もいるかと思います。 GBのレトロゲーに「ハテナ?の大冒険」、FFの青魔法や敵の技の中に「????」が付いたものがあるのでこれらを使用することがなければ「はてな」を「?」としても問題はないでしょう。 フィルターは上から解釈されるので もし単語登録するのであれば以下の順でフィルターを設定しましょう。 例えば「はてなマークはてな」を「??」に置換するなどで代用できそうです。 一意になる、他の文章に混ざって後変換されないという前提と考えると「疑問符」を「?」とした方がこの場合は適切なような気もします。 この辺は放送者の喋り方に依存するのでいろいろ試してみると良いと思います。 例えば私はよくメタルマックスをプレイしていますが メタルマックスのS-E「サンバーンXX」は視聴者からしたら特殊兵装の武器と理解できますが、そのまま読み上げても「SE3番ダブルエックス」と変換されると思います。 慣れている視聴者兄貴たちならサンバーンXXの事だなと解るかもしれませんが メタルマックスを知らない人にはなんのこっちゃだかわかりません。 そこでフィルター群を使ってみます。 メタルマックスの用語であって普段の会話では使わないでしょうから メタルマックス用のフィルター群を作って文節ごと変換してみましょう。 まず「メタルマックス用」というフィルター群を作ります。 字幕に「S-E」と表示したいので内部のフィルターに「スペシャルイクイップメント」を「S-E」と変換するように登録します。 そしてVOICEROIDに「S-E」を「エスイー」あるいは「スペシャルイクイップメント」と単語登録して読ませる、という二段構えです。 同様に誤変換される「3番 ダブルエックス」を「サンバーンXX」と置換し、VOICEROIDに「サンバーンXX」を「サンバーンダブルエックス」と読むように登録します。 メタルマックスに関するおしゃべりをするときはフィルター群をONにし、使わないときはOFFにしておけば変換が混ざることもないかと思われます。 実際に何度か喋ってみて一意な変換になるような調整が必要ですが、少なくともよりはっきりと意図が伝わるようになります。 その他に、文字の中にはVOICEROIDが発音しないものもあります。 これらを一般的な語句を使って置換することで文章を修飾して感情表現が可能です。 以下は一例ですのでご参考ください。 キーボードを打つ手間はありますがそのままVOICEROIDに連携されるので 予め変換が困難と予測される文章は打ってしまった方が良いです。 逆に言うとキーボードで叩いたものをうまく置換できる方法がないか、考えてみましょう。 パッと思いつかない場合、それは音声認識が抱える命題でもあります。 正規表現が使えるので、あるパターンの中の一部分を差し替えることもできます。 日本語はだいぶ自由に組み替えても意味が通じてしまう言語なので正規表現で記述できるかといわれるとだいぶ難しいと思いますが、放送者側が定型句を使うことで代用できる可能性はあります。 最後に このようによく使う語句をあらかじめ字幕表示させるにはゆかりねっとのフィルターへ 発声をVOICEROIDに振り分けることで誤変換を減らせます。 誤変換が減るということは、仮に誤変換された場合でも、残りの語句から類推して 視聴者側で意味を受け取ることが可能になります。 現状放送に合わせて適切なフィルターを用いるしかありませんが よりキャラクターの表現を豊かに行うにはまだまだ試行錯誤がいります。 放送を通じてVOICEROIDの会話を聞くことができる、会話できる、というのは 放送者側にとっても視聴者にとっても夢のような出来事です。 みんなそれぞれキャラクターイメージを持っていると思いますので ぶれないように少しずつ補正していくのが寛容かと思います。 それでは良い放送ライフを! P. たまに喋ってもいない内容を変換して暴走するのは仕様なんですかね…w.

次の

FINAL FANTASY XIV, The Lodestone

ゆかりねっと cevio

かなり人間らしく喋ってくれますね。 この動画はただ文字を入れただけで、音声合成ソフトの知識が全くない素人の私でも5分かからずに作成することができました。 このように、CeVIOは割と簡単に喋らせることができます。 音声合成ソフトを用いた実況(ゆっくり実況)を製作したい場合は、 Aviutlという無料動画編集ソフトについても詳しく調べてみることをおすすめします。 CeVIOのメリットとデメリット CeVIOの最大の魅力は、ライセンスが緩く 商用利用でも問題なく使用できることです。 として以下のものがあります。 個人のクリエイターでCeVIOを使用する場合は、YouTubeで動画を収益化しても問題ない 他の音声合成ソフト(ゆっくりや結月ゆかり等のボイスロイド)だと、YouTubeで広告収入を得る場合はライセンスを取らなければなりません。 このライセンス料を取得するためには結構な金額がかかってきます。 インストール後はCeVIOのアイコンを右クリックして、「 タスクバーにピン留めする」を選択すると次回から素早く起動することができます。 CeVIO無料体験版の感想 無料体験版でも製品版とほぼ同じ機能を使用することができるのは非常に素晴らしいですね。 トーク機能とソング機能の両方を試せます。 そのおかげで、1ヶ月という無料期間でもカバー曲や実況動画を製作することができました。 ただ、無料体験版だとWAVファイルで保存ができないため注意してください。 その他無料版で出来ることと出来ないことの違いについては別途記事を公開しているので、そちらからご覧ください。

次の

FINAL FANTASY XIV, The Lodestone

ゆかりねっと cevio

うらめしやー、どうも裏飯屋です。 先日フォロワーさんのゆかりねっと導入をお手伝いしました。 が、フォロワーさんのPCが古かったりと落ちている記事では解決できず自力で解決までもって言ったので今回はその経験を元に記事を作成しました。 ゆかりねっとをインストールするためにdropboxをインストールする 2. dropboxでゆかりねっとをダウンロード、インストールする 3. NETDUETTO、 Google ChromeがPCに無ければインストール 4. ゆかりねっとをインストールするためにdropboxをインストールする ゆかりねっとが検索すれば落ちていますが DL先(配布元)がdropboxしかありません。 なのでまずはdropboxをDLしましょう。 新規で登録以外にもグーグルアカウントを持っていたらそちらで登録できます。 登録作業は画面右に名前とメールとパスワードを打ち込むだけです。 グーグルアカウントからログインする場合アカウントを選択してアカウントを登録してあげましょう。 ・ゆかりねっとのインストールはこちらのサイトから ・dropboxのインストールはこちらから 2. dropboxでゆかりねっとをダウンロードする (上記にも貼ってますが)ゆかりねっとと検索するとトップに出てくるので開いてリンクからダウンロードします。 dropboxの画面に飛ぶのでダウンロードから圧縮フォルダをダウンロード、解凍しインストールします。 これでdropboxの出番は終了ですが、 dropbox自体優秀で便利なソフトでスマホやパッドでdropboxをインストールし共有のアカウントでログインすればクラウド上でデータのやり取りができるのでいちいちPCとスマホを接続して画像のやり取りをする必要もなくなります。 PDFファイルとかも出来るのでパッドにプレゼン資料を送ったりするのにも使えます。 NETDUETTO、 Google ChromeがPCに無ければインストール これらのソフトは人やPCによっては既に入ってたりすると思うのですがもしも入っていない場合は必要なのでインストールしましょう。 Google Chromeは音声認識を行うために、 NETDUETTOはVOICELOIDでの音声出力をするために必要になります。 こちらはインストールだけでOK ・NETDUETTOのインストールはこちらのサイトから Google Chromeのインストールはこちらから 4. 必要な設定のやり方 さてこれで準備は整いました。 それでは使用できるようになるまでの設定をしていきましょう。 まずはゆかりねっとの設定、というより使い方を説明します。 ゆかりねっとを起動するとこのような画面が出てきます。 ゆかりさんかわいいですね 使いたいソフトにチェックを入れると自動的に起動してくれます。 ヘッドセットを既に繋いでいる場合、このように喋るだけで使えます。 しかしこのゆかりさんの声で出力しないと意味が無いのでその設定をVOICELOIDと Discordでしないといけません。 次に Discord側の設定です。 以上で終わりです。 これで好きなVOICELOIDの声で通話することが出来ます。 生声に戻したいときは Discord側の入力デバイスを元のマイクに戻してあげるだけでOKです。

次の