2013/05/27

ボーカロイドとその周辺で思うこと。

 最近はすっかりDAW(Digital Audio Workstation)アプリばっかりいじっていて、しかも作っているのはボーカロイド用オケばかりというヘンさ加減。さすがに打ち止め感(ネタ切れ感)が出てきても良さそうだが、どっこいそうはいかない。愛用のiPod Touchには既に1万2千曲以上入っているし、PCのハードディスクにはそれらの3倍を超える数の楽曲データが格納されている。CDやレコードの置き場所に困っても、ネタには困らないのだ。

 ボーカロイド曲を作るにしても、オリジナルソングであれば救いがある。が、少なくとも作曲の才能が無いことは大学生のころに確信してしまったし、カバーなりでいじってみたい曲にはことかかない。オリジナル用のネタはこつこつ貯めているが、曲としてまとめるというのは結構エネルギーの要る作業なので病気の身ではまだ辛い。良い歳したオヤジがおバカな感じのポップスをやろうとすれば、自分を一旦捨てるぐらいにはっちゃける必要があるのだよ。

 さて、「ボーカロイド」の登場は、20年以上にわたってリスナーに徹していた自分を「曲を組む作業」に再帰させる重要なきっかけだった。ただし、「ボーカロイド」そのもの以外には全く興味がない。最初に購入した「ボーカロイド」はSONiKA(英語)で、まず歌わせたのはKraftwerkの"The Robot"のカバーだった。歌詞の出だしはこうである。

 "We are codes and libraries, and we are installed on PCs."
 「私達は規則とライブラリ(の集まり)、私達はPCにインストールされる。」

つまり、個々のボーカロイドに「見た目などのキャラクター性を付与する」こと自体を心底小馬鹿にしているのである。商売としては間違いなく正解だが、付与されたものは私にとって何の価値もない。金銭を対価に自分のPCにインストールしたソフトウェアに過ぎない。

 ちなみにとある外国の方から面白いメールがあった。メールの送り主は、「ボーカロイドって何だ?日本の新しいアニメか?それともゲームか?キャラがいっぱいいるが一貫性はないみたいなんだが…」といった質問を何人もの知り合いから受けて閉口していたという。そこで私の"The Robot"のカバーの歌詞を印刷して読ませたりメールで送ったりして説明したところ、高確率ですんなりと「あぁ、PCアプリソフトなのね。」と納得してくれるそうな。実にイイ話じゃないですか。

 前置きが長くなったが、エントリタイトルの通り、思うところを書いておこう。
  • 「ボーカロイド」の登場は、「純粋な」人声合成を諦めた結果やに見ゆる。
    「ボーカロイド」は実在する人間の発声から抽出した音素データをライブラリとして用い、与えられた入力に対して音素データを加工、連結しているに過ぎない。声を声たらしめているフォルマント特性の生成は陽には為されていないのである。出力データが不自然に聞こえる場合は、結局フォルマントの時間変化が経験則とマッチしていないという場合が多い。

  • 純粋にフォルマント特性を合成できるならば世界中の言語で使われている母音が再現可能であり、特定の言語(すなわち限定されたフォルマント特性或いは母音しか用いない)に使用が限定される必然性はない。
    現存する言語の中にあって、日本語は最も母音が少ない(あ行の5つ)部類に入り、外国語習得のひとつの障壁となっているやに思われる。経験的に、日本語で使われない子音(残念、母音ではない)でも聞き分けることが出来るようになれば、発音もできるようになる。
    「純粋な」人声合成技術は、言語教育に大きなインパクトを与えるかもしない。赤ん坊が言語を習得する過程で、「耳」或いは人声を処理する脳機能は周囲から聞こえる人声に最適化されることは否めない。このような時期に日本語に無い様々な母音も聞かせておけば、赤ん坊の「耳」は日本語に無い母音も認識できるようになる可能性が高い。
     ここで「日本語に無い母音」の意味は、複数の母音が日本語では区別されないで用いられるということである。学校の英語の授業で「『え』の口で『あ』と発音する」とか習わなかったろうか?英語には「あ」と「え」の間にあるフォルマント特性に対応した母音があるということである。日本語に最適化された「耳」では、一般的にその母音は「あ」か「え」のどちらかでしか認識されない。
    しかし、更に母音の数が増えるとそうもいかない。幾つかの北欧の言語は母音が10以上あり、「あ」と「え」の間に3つ以上の母音がある場合もある。北欧の歌曲を聞いたとき、歌詞をカタカナですら置き下せないことを当たり前に経験する。これは、聞き手が母音を見つけることすら失敗しているということだ。ただ、この失敗はむしろポジティブに捉えるべきだ。少なくとも「日本語では使わない母音である」ことは認識できているからだ。
    言語習得の基本はやはり「ものまね」、「耳を作っておく」ことの重要性は高い。実績が確認できれば国策として制度化、義務化しても良いぐらいだ。もしそうなったら、カタカナでは書けない新しい擬音(オノマトペ)がたくさん生まれるだろう。

  • 編集できるパラメータの名称とその大まかな機能が、MIDI規格(電子音楽機器の制御のための通信規格)で定義されている送信可能なパラメータと同じとなっている。
    これを単に仕様と見なすか否かは重要だ。
    個人的には、このようなパラメータを人声合成に適用する事自体が直観に反している。つまり、これらパラメータの選択は音素データ合成というボーカロイドの仕組みの自由度を下げ、本来持ち得る機能をも封じているのではないかと思う。百歩譲ってもアフタータッチがない、エクスプレッションもない、ヴェロシティはMIDIデータにおけるそれとは別物など、欲求不満と混乱しか引き起こしていない。

  • 個人的な趣味から言えばエディターの完成度の低さはバージョン3でも噴飯もので、反応の遅さ、ダサいデザイン、論理的とは思えないメニュー構成など不満点にはきりがない。いわゆる打ちこみによる音楽データの編集は逐次的なデータ入力とリアルタイム再生を交互に行うものであり、ボーカロイドデータの編集はまさにこれにあたる。20GB近くのデータを扱いながら操作の切り替えにタイムラグを感じさせないDAWソフトウェアが実際にある以上、ボーカロイドエディターのレスポンスの悪さはどうしても目立つ。

  • 「ボカリス(Vocaloid Listener)」自体の存在意義は何処にあるのか?分析する歌唱データがあるなら、それ自体使えば良いだけの話で、ボーカロイドの出番は本来無い筈だ。

0 件のコメント:

コメントを投稿