ラベル Vocaloid の投稿を表示しています。 すべての投稿を表示
ラベル Vocaloid の投稿を表示しています。 すべての投稿を表示

2021/04/06

MAIKA、敗北す。

 MAIKAはスペイン語Vocaloid3ライブラリで、ブラジル訛りポルトガル語の大部分の発音をサポートする。が、購入直後に私の病状が悪化、放置状態が続いていた・・・いや、続いている。

 MAIKAの一つの魅力は無声口蓋垂摩擦音のサポートだ。この音はマッハ(Mach)の「ッハ」、イッヒ(ich)の「ッヒ」、ドッホ(doch)の「ッホ」などに当たる発音で、ドイツ語では必須の発音である。ネス湖を指すロッホ・ネスの「ッホ」もこの音で、スコットランドにも歴史的に残っている発音でもある。そんな訳で先の日曜日の夜、ふと思い立ってドイツ軍歌として知られる"Erika"の歌詞にMAIKAがどのくらい追従できるか簡単に調べてみた。

 辞書などでは発音記号としてIPAが広く用いられるが、英語アルファベット以外の多くの記号を含むためコンピュータ上での処理に不向きとされた。この状況を受けて開発されたのが、英文キーボードで入力可能な文字(正確にはASCII文字)を使ってIPAを書き換えたX-SAMPAだ。Vocaloidの発音指定もX-SAMPAを使う。

 "Erika"の発音をドイツ語のWikitionaryで調べると、['e: Ri ka]となる。先頭の[']はアクセントを表し、[:]は音を伸ばすことをそれぞれ表す。ローマ字読みでも「エーリカ」となりそうだが、小文字の[r]ではなく大文字の[R]となっているのが曲者だ。MAIKAがサポートしてない発音なのだ。英語Vocaloidではどうか。この場合は[e:]と[ka]の発音がサポートされない。ちなみに"Erika"をVocaloid用の英語辞書に通すと[e@ ri kV]となり、日本人の耳には区別し難そうだがかなり別物だ。

 日本語の「ア」音に相当するのは[a]だが、[@]も[V]も「ア」に近い。違いは口の開きの大きさと舌の前後位置だ。他に「ア」に近い音として[{](IPAでは/æ/)があり、僕らの世代だと中学校で「『エ』の口の形で『ア』と言いなさい」と習った音だ。英語ではありきたりの音で、"cat(猫)"の発音/kæt/で使われている。またウィキによれば、名古屋弁の「うみゃあ」は[umæ]らしい。つまり、「うみゃあ」の「あ」では舌の位置はそのままに相対的に口を開かないということのようだ。まぁ、経験的に「寒い地方での発音の訛り(厳密には、NHKアナウンサーの発音との違い)あるある」ではある。

 MAIKA敗北す。かなり妥協して発音をごまかさないと、"Erika"には使えない。

 とは言えこのままでは悔しいので、別方面を攻めてみた。「ソ連(ロシア)宇宙軍の歌」こと"Космические войска"である。WikitionaryでのIPA表記の発音をちょっと丸めると、X-SAMPAでは[k6 s mj ts\I s kI e vo j s ka]って感じになる。ここでは2文字目の[6]が曲者だ。数字の[6]だとちょっとピンとこないが、IPA表記では/ɐ/である。アルファベットの"a"が逆立ちしていて、ちょっと違う「ア」感が伝わらないだろうか。ちなみに上述のX-SAMPA表記[R]のIPA表記は/ʁ/で、「アール」っぽいけど何か別のもの感がやはり漂う。

 MAIKAも英語Vocaloidも[6]はサポートしない。困ったことに"Erika"の歌詞には頻出する、と言うかドイツ語では余りにありふれた発音のようである。歌詞冒頭の"Auf der..."→[aUf de:6...] で既にアウトだ。

 MAIKA再び敗北す。かなり妥協して発音をごまかさないと、ドイツ語にもロシア語にも使えない。

 あ、敗北したのは僕か。

2019/03/02

Madalena・・・やられてた(笑)

 体調は悪いまんま。

 Youtubeでたまたま発見、"Madalena"(楽曲名)のボーカロイドMaikaによるカバーなんですが・・・ああ、この楽曲は誰もやるまいと思って塩漬けしていたらやられてましたよ、なんか悔しい。発音が分かっている人の作らしく、少なくとも辞書レベルの知識しか無い私にもブラジルなまりに聞こえてしまいます。綴り「te」で「チ」みたいな発音になったり(しかも良く使われる)、綴り「rra」で「ハ」に近い発音になるのはブラジルならではかと思います。

 "Madalena"はブラジルの楽曲で、歌詞は当然ブラジル語(ブラジルなまりのポルトガル語)です。英語ボーカロイドで対応できるかを検討した上でカバーは一回挫折とりあえずオケだけは作っておいて寝かせていた(と言うより病気でそれどころじゃなかった(現在進行形))んですけどね。

 ちなみにMaikaはスペイン語ボーカロイド、故にブラジル語で頻出するIPAにおける[x]の音(例えばマッハ数の「ッハ」、ブラジル語では"rr"などの発音)を発音させられます・・・しかもそれ目当てに、とっくの昔に私も購入済みって言うね・・・

2015/04/19

Megpoid + Vocaloid4 Engine

 Vocaloid4 Engineを使ってMegpoid Whisperをレンダリングすると、どうも気持ち悪い高周波成分が乗る。聞いていると思わず奥歯を噛み締めてしまう。200Hz付近にも不自然な周波数成分がある。

 Vocaloid3 Engineで有効だった「耳障りを良くする方法」は全く歯が立たなくなってしまった。反面、1~5kHzあたりの周波数成分は充実していて、低周波数領域をフィルターで削っても音痩せしにくい(か細い音になり難い)。だが、Megpoid Whisperに限ってはむしろ音痩せしてくれた方が個人的には嬉しい、いやはや。

2015/03/14

PCをアップデートするよ!

 これでも8年前まではPCは自作していた。コンバット・フライトシミュレータとかやっていたから、今で言うところのゲーミングPCでも上のレベルの性能を追求した。CPUのオーバークロックは当たり前、CPUを買うにも製造番号(同じCPUでも製造工場によってオーバークロック耐性が違っていたりしたから)までチェックしていた。

 が、歳をとってゲームをしなくなり、また自作することによるコストメリットも薄れて来たあたりで「DELLで良いや」って感じになってしまった。今使っているPCはDELLのデスクトップで、7年間以上トラブルらしいトラブルもないまま現在に至っている。欠点と言えばハードディスクのデータ転送速度が元々低かったことで、メモリ増設である程度はカバーできたもののボトルネックであることには変わりない。ちなみになぜDELLかと言うと、「DELLは10年後もPCビジネスをやっている」という根拠無き直観に基づくもので、少なくとも8年は直観通りだったということだ。

 さて、車もそうだったのだが、それなりに高価な買い物は私の場合はほぼ間違いなく「半ば衝動買い」である。「半ば」という意味は、「欲しいっ!」という衝動には一切応じないが、「買うなら今だ!」と言う自分の直観(ゴーストの囁き?)には素直と言う事だ。まず「欲しいっ!」があって、それをいったん忘れて、然るべき時期が来れば虫の知らせのように「買うなら今だ!」という精神状態が突如やって来る。大抵は3~4年忘れている。

 今回のPC購入の決断も、と言うか決断すらしたのかも怪しい。会社で仕事中にふと「さぁ、PCを更新しよう」と思い、退勤後に自宅でDELLのサイトにアクセス、15分ほどで購入手続きを終えてしまった。今頃は太平洋上を日本に向かっている筈である。購入モデルの選定では、SSDドライブを使うかどうかと搭載メモリサイズの2点だけはちょっと悩んだが、それも本当にちょっとだけ。何故ちょっとかと言うと、事前に何も調べていないんだからそもそも判断基準が無い訳で、悩むこと自体が無理なのである。

 こんな調子なのだが、後で色々調べてみたらなかなか自分のニーズにマッチした構成になっているのがある意味恐ろしい。と言うか、私の人生は万事そういう感じなのである。ちなみに購入モデルは何かのキャンペーン対象品で(在庫処分扱いとは別。おそらくホビーユースには値段が高く、プロユースには性能が不足、かつDELL内のゲーミングPCブランドAlienwareとも構成が被るので売りにくい商品なのではないかと邪推)、CPU価格以上の値引きというオマケ付きだ。

 新規PCへの要求は、まず(ホビーユースの範疇で)長整数及び倍精度浮動小数点演算速度が高いCPUを搭載し、周辺機器がその足を引っ張らないことである。この要求は主に2つのニーズに対応している。

 一つめのニーズは、DAWであるCubase使用時の私へのストレスを下げること。

 使った事の無い人には分からないと思うけど、DAW起動中は常にCPUに一定以上の負荷がかかっている。音楽製作ツールであるDAWはリアルタイム音響生成・合成処理が基本で、アプリ操作者の操作に即座に反応する必要がある。リアルタイム処理という点ではソフトウェアシンセサイザーも同じで、それなりにつくり込んだデータをCubaseにロードしただけでCPU使用率60%は当たり前となる。CPU負荷を下げるため、これ以上は編集しない演奏データはフリーズ(演奏結果を音声データとしてディスクに書き出し、以降はリアルタイムの音声合成処理はせずに書き出した音声データを再生する)するのだが、ここでハードディスクのデータ転送速度が低いことが現行PCではボトルネックになっている。CPU使用率或いはディスクアクセス負荷の何れかが再生中に一瞬でも100%となると、ほぼ半々の確率でCubaseはクラッシュするし、場合によってはハードディスク上のデータまで破壊する。

 Cubase設計者も馬鹿ではないので、ハードディスクからの音声データ読み出しは巧みにスケジューリングされている。しかし、例えばPiapro Studio(ボーカロイド・エディターの一種)といったプラグインがどのタイミングでディスクからデータを読み出すかまではCubaseは知ることができない。故に、Piapro Studio上でボーカロイドデータにブレス音(息継ぎ音。ボイスバンクと呼ばれるボーカロイドの音声ライブラリには含まれず、独立した音声データファイルとして提供される)を追加した途端、クラッシュが頻発するといった状態になり得る。また、フリーズデータが大きくなれば、いずれリアルタイム処理に必要なデータ転送速度がハードディスクの最大データ転送速度を越えてしまうのも必然だ。

 上記のブレス音の件は原因究明まで時間がかかったが、色々と得るものもあった。代表的な知見は、「Piapro Studioではトラックにブレスが含まれている場合、トラックがミュート状態でもハードディスク上のブレス音データ読み出し処理をする」だ。Piapro Studioを使っていて、急にホストDAWのクラッシュが増えたり、再生時のノイズが増えたりした場合、Piapro Studio上でのブレスの使用を疑う価値がある。少なくともCubaseの場合は、ブレス音は音声ファイル自体をオーディオトラック上に置くか、Groove Agentなどのサンプラーのパッドに割り当てて使うか(大抵の場合、音声データはメモリ上にロードされる)の何れかにした方がクラッシュの防止という観点からは良い様だ。

 もう一つは、3DCGアプリであるLightwave3Dのレンダリング時間の短縮だ。レンダリングというのは、モデルを配置、照明やカメラを設定した後の「画を計算して得るプロセス」である。これはCPUの演算速度がダイレクトにモノを言う。

 現行PCのCPUはIntel Core2 Quad 2.66GHz(4スレッド=4並行処理)、現在太平洋上の新規PCのCPUはIntel Core i7 3.6GHz(4コア、8スレッド)だ。ネット上を調べると、同じデータを様々なPCやMacでレンダリングした際のレンダリング時間を互いに報告しあっている海外スレッドがあった。報告者の何人かはメールやメッセージをやり取りしたことのある人間で、カナダのVFX業界のフリーランサー達だ。さすがに飯のタネだけあって、彼らの使っているPC、と言うかWS(ワークステーション)の仕様は凄くて、8コアCPU×2=16コアはもはやお約束だ。しかも十中八九DELLだ。

 さて、フリーランサー達のWSでレンダリング時間40分のデータ、現行PCと購入PCで予測されるレンダリング時間はどうだったろうか?公平を期すためにOSはWindows 7 64-bit、メモリは16GB(新規PCのメモリ搭載量は32GB)のPCに絞って報告されているデータを集計してみた。結果は、現行PC相当の仕様のマシンで9時間~11時間30分、新規PC相当の仕様のマシンで2時間~2時間40分となった。ざっくり、1/3以下のレンダリング時間短縮が見込めるということだ。この差は実は大きい。

 もしあなたがサラリーマンなら、1日8時間程度は会社に居るだろう。現行PCで24時間かかるレンダリングを実施する場合、現行PCでは翌日にならないと結果が分からないが、新規PCなら出社時にレンダリングを開始すれば退社時に結果が確認できる。結果も見てミスを発見しても、細かなミスならば退社までにデータを手直しして再レンダリングしてしまえば、翌日の出社時には望む結果が得られているだろう。レンダリング時間の短縮はユーザーのワークフローの自由度向上に効くが、やはり1/2以下ぐらいまでは短縮されないと「劇的な効果」は得られない。

 Lightwave3Dではレンダリングに割り当てるスレッド数を制限できる。だからスレッド数は全スレッド数の半分しか割り当てないと言う様な使い方ができる。これまではレンダリングには全スレッドを割り当てていたのでレンダリング中はメールチェックぐらいしかできなかったが、新規PCではレンダリング時間を従来以下としつつ、レンダリングしながらも現行PCのフルパワー状態以上のCPUパワーが享受できると見る事ができよう。やっぱり両者の差は大きい。

 加えて、新規PCのCPUは十分な能力のグラフィックチップを内蔵している。

 3DCGのレンダリング処理は並列化処理に向いているので、やはり並列化処理に特化したグラフィックチップ(GPU)によるレンダリング演算はプロユースでは既に一般化しつつある。Lightwave3Dデータに対応したGPUレンダラーも既に存在し、レンダリング時間がCPUのみの場合の1/30以下という結果も得られている。つまり、Lightwave3Dが本格的にGPUレンダリングをサポートするようになれば、画面表示はCPUのグラフィックチップに任せ、「レンダリング演算専用のグラフィックカード(或いは一昔前のTeslaのような並列演算専用カード)」を挿す、なんて贅沢も可能となるんじゃないかなぁ…と思う。

 ちなみに新規PCのデリバリー予定は1週間後だ。来週の土日は新規PCの環境整備で潰れそうっすなぁ。

2015/03/08

VOCALOID™4 Editor for CUBASE、4.1.0アップデータで最低ライン確保か?

 VocaloidEditor for Cubase(V4EC)用のアップデータ(バージョン4.1.0)が公開されていたので、試しにV4ECを再インストールしてアップデータを当ててみた。先のエントリで「V4EC使えねぇ!」と明言した手前、この手の人柱の役割も果たしておかないと片手落ち、と言うものだろう。

 アップデートで「使えねぇ」理由のツートップが解消されたので、取り敢えず暫くインストールしたままにしておくつもりだ。「使えねぇ」理由ツートップとは以下の点だった。
  • インストールすると、V4ECを使用していなくてもダブルクリック操作にCubase 8が一切反応しなくなった。これは完全に解消されている。
  •  V4ECを使用している(インストゥルメントトラックで使う)と、再生開始がワンテンポ遅くなっていた。つまり、スペースキーを押しても直ぐに再生が開始されなかったと言う事だ。この点も解消されている。
Cubase上の操作の快適性をスポイルするようなものは問答無用に「使えねぇ」が、4.1.0アップデータの導入で取り敢えず最低ライン(本来は至極当たり前である筈)の仕様は満たしたようだ。使い心地は...これからね。

2015/03/01

「魂のルフラン」、MegpoidカバーWIP!

 Work in progress、略してWIP。要は製作途中版という事だ。

 「魂のルフラン」はけだし名曲で、かつ私的にかなり思い入れのある楽曲だから、手を出すにはかなりの度胸が個人的には必要だ。今回はarlie Rayさんの英語版カバーの歌詞を使うということでワンクッション置くこととしたが、これが一筋縄ではいきそうにない。

 arlie Rayさん版の楽曲自体はiTunes Storeで買ったので、所謂歌詞カードが無い。ネットを探すとそれっぽい歌詞は見つかるのだが、英語的にかなり????なのでそのままでは使えそうにない。そのため、ネットで拾った歌詞をベースに空耳に挑むこととした。だから、本WIP版はサビを除くとまだ[la]ばかりである。

 歌詞を追うにはコンテクスト(文脈)も考慮しなければならない。実際、歌詞のIやyouをどう位置付けるかで、空耳結果は異なってくる。現時点ではIやyouについては特定していない。故にそれっぽく歌詞が入っていてもそれはあくまで現時点での仮バージョンに過ぎない。 サビの部分も仮であり、yourが何時aやtheに代わるかは現時点では神のみぞ知るだ。

ちなみにネットで拾った歌詞の冒頭はこう。
Get back to me when you were not here.
You ruin the clear sky.
The word filled with love, dream and your tears.
Under this star you will be called again.
Recalling your memories, realise a soul.

You were scanning poly once, they are in a truly shadow...
WIP版の歌詞の冒頭はこう。
Get back to me when you were not at here.
You ruined the clear sky.
The word filled with loves, dreams and your tears.
Under this star you will be called again.
By recalling your memories, realise your soul.

You scanned polymaths, they are in a foully shadow...
 現時点では英文法からの要求と、メロディーにちゃんと載るシラブル(音節)数からの要求で全体を整えている段階だ。例えば最終行では"poly once"が"polymaths"になっている。"poly"単体では名詞となり難く、また可算名詞なら冠詞か定冠詞が必要だ、続く文ではtheyで受けられているので、"poly"の部分には可算名詞の複数形が入らなければならない、といった具合だ。"polymath"は「博識な人」を意味する比較的新しい(といっても17世紀ごろ)単語で、レオナルド・ダ・ヴィンチといったルネサンス期の傑出した才人を指すために生まれたものだ。ちなみに"foully"は副詞だからWIP版の歌詞も英文的にはまだおかしい(追記2015/3/2:取り敢えず"foggy"にしました)。

 "Full Strings Attached"はバックトラックのバージョンの仮名称で、サンダーバードなどの音楽で知られるバリー・グレイ氏の作品集アルバムタイトル"No Strings Attached"をもじったものだ。サンダーバードなどで使われた人形には多数の吊り糸(strings)が付けられている(attached)が、アルバムタイトルはそのような状況を逆手に取って付けられたと推測している。対して"Full Strings Attached"に込めた意味は、ドラム、コーラスを除いて、全てストリングス(弦楽器) のサンプリング音源のみで構成している点だ。ピアノも弦楽器だし、シンセサイザーによるシーケンスっぽい音にはバイオリンのピチカート奏法のサンプリング音を使っている。最近のサンプリング音源は弦楽器の様々な奏法の切り替えも簡単に指定できるので、左寄りに聞こえるストリングスではトレモロも含めた4種類の奏法を切り替えながら使っている。ベース音はKarplus-Strong String Synthesisという物理モデリングを用いて生成したものだ(関連エントリ)。

 あと、楽曲にエフェクトっぽい音を使う場合はコンテクストをつい持ち込んでしまうのがどうしようもない性(さが)だ。 2:42辺りの「どん」という音は木製のドアを閉じた、或いは力一杯開いた際の音をイメージしている。エヴァンゲリオンではドアの開閉やドアを介して出入りする行為を象徴的に取り扱うことが多かったので、それに倣ったという側面もある。それがシンジが閉めたドアの音か、幼少期のアスカが開いたドアの音か、それとも全く別のシチュエーションか、それはまだ定まっていない。

おまけ、なんともタイムリーな。

2015/02/22

Megpoid Whisper、「神様のいうとおり」のカバー

 「神様のいうとおり」は「四畳半襖の下張」、もとい、アニメ「四畳半神話体系」のED曲だった。原作の某先輩がらみのエピソードには無難に触れるだけで、まぁ、原作小説を上手く料理していたとの印象が強い。いやあ、これはほぼ手放しで褒めているといると言って良い。キャラクター原案はイラストレーターの中村佑介氏だが、今この文章を打っているPCのWindow起動画面、壁紙、車用のiPod Touchの壁紙も中村氏のイラストを一部加工して使わせてもらっている。もちろん、画集も持っている。

 楽曲「神様のいうとおり」には通常のバージョンと「バージョン Z80」という別ミックスがある。

 Z80はほぼ間違いなく、組み込み分野では未だその末裔が幅を利かすCPU/MPUのことだろう。私が学生のころはZ80はマイコン(今で言うところのパソコン)でも使われており、8-bit処理時代を代表するCPU/MPUのひとつと言えよう。しかし、今やPCのCPUは16bit、32bitを経て、64bit処理が当たり前となった。「バージョン Z80」の意味はおそらく古い時代の音(音色)を使っている、ということだろう。ただ、ファミコンやNEC PC-8801などのPSG音源やFM音源を思わせるような古い音色ではない。チップチューンのレベルまでは行かないという微妙なところだ。

 今回はコンセプト重視で、手順から何からそのコンセプトに沿ったアプローチを採った。これは別に自分の行為を自慢したいるとかカッコ良いとか言ういたい訳ではなく、単に「趣味でやってるんだから自由なんだよ」と言いたいだけなので為念。

 で、コンセプトとは「バージョン MOS6510」である。MOS 6510はコモドール64という古いPCに使われたCPUで、要はZ80より古いというぐらいの記号としての意味しかない。ただし、コモドール64は独自の音源チップSIDを採用しており、言わば「SIDっぽい音」というのは歴然と存在する。故に「バージョン MOS6510」とは、「SIDっぽい音」を取り込みつつ、同時発声音数も抑えた音数節約バージョンとでも言い換えられる。要は「スタイル」を理由に耳コピをサボったということだ。それと、SIDは8-bit処理チップであること、フィルタを持っていること、サンプリング(録音)とその再生ができるという点も忘れてはいけない。ちなみに完全に「SIDっぽい音」のみで構成された楽曲は一般的にチップチューンに分類される。

 バックトラックの作成手順は、コモドール社が後に発売するアミガ(アミーガ)で花咲く音楽用ファイルフォーマットmodを強く意識したものだ。modフォーマットは、サンプルした音源をも含む音色データ、と言うか波形データ群と、どの波形データをどのタイミングで、どの音程で、どの定位(左右の位置)で鳴らすかという演奏情報を含んでいる。演奏情報だけならMIDIデータもそうだろうと言う事になるが、もう一歩踏み込むと、modフォーマットでは数小節の演奏データを再生単位として、それら再生単位をどういう順番で何回再生するかという形で演奏データを管理する。

 このようなmodフォーマットのデータ管理方法を踏まえ、今回のバックトラックの音はまずソフトシンセZ3TA+2とNI Massiveで全て自分のイメージに沿って作り、wave形式で単音毎に書き出した後にサンプラーBattery4のパッドに割り当てるというとっても面倒な事をしている。つまり、3音の和音は3つの異なるwaveファイルを同時に再生(パッドをトリガーする)して作った、ということだ。もちろん、本当に面倒だから間違いなく2度とこんなことはやらない。どうせ音数節約バージョンだからやろうと思った、と言うのが本当のところだ。なお、音色作成では、使える基本波形を矩形波とノイズのみと縛ったが、フィルタやLFOによるピッチや左右の定位制御は積極的に行った。

 最後はポスト処理だ。ボーカルも加えてDAWからwave形式ファイル(ビット深度24-bit、サンプル周波数48kHz)で書きだした後、波形編集ソフトを介してビット深度8-bit、サンプル周波数22kHzのwave形式ファイルにコンバートした。本来無音となるべきところでノイズが聞こえるのは、このように意図的に音を劣化させたのが原因だ。実際のところ、ビット深度やサンプル周波数の変更はDAW上でもシミュレートできるのだが、今回ばかりはそうはしなかっただけに過ぎない。

 出来はともかく、手間だけはかかっているのだよ。

2015/02/05

Megpoid Whisper、「Dear Radio」のカバー

 ある意味懸案事項だった「Dear Radio」(作曲:佐野電磁さん、作詞:Yuraさん)のカバー。歌詞が空耳だとかはさておいても、曲中に「セリフ」という大鬼門がある。

 経験者は直ぐ分かると思うけど、Vocaloidに「しゃべらせる」のはとっても敷居が高い。試行錯誤を前提とする以上、専用エディターだけでそれっぽく編集することは言語道断なまでに効率が悪い。今回はCubase Pro8のVariAudio機能を使ってオーディオデータを直接編集(非破壊編集)、かなりピッチ(音程)やタイミングをいじったものだ。

 歌も含めて出来はもう一息、でも老い先短い身としては、100点から幾ら遠かろうとも合格点以上ならリリースせざるを得ないのが実態だ。頭はもう別の楽曲のためのアイディアでいっぱいだしね。

2015/01/25

Megpoid English、YMOの「The Madmen」カバー

 「おらといっしょにぱらいそさいくだ!」 ぼりぼり

 楽曲の元ネタというかインスパイア元は諸星大二郎氏のマンガ「マッドメン」とか。ちなみに冒頭のセリフ(うろ覚え)は同氏の別の作品(「生命の木」)からで、私の世代の伝奇マンガ好きなら必ず知っていなきゃならなかったセリフですね、あとヒルコの鳴き声とか。

2015/01/16

VOCALOID™4 Editor for CUBASEはまだ買っちゃダメ、かも。

 うちのPC環境特有かも知れないけど、VOCALOID™4 Editor for CUBASEを使うとメモリーリークかオーバーフローか何かが原因でCubase自体が落ちたり、ダブルクリック操作に一切反応しなくなったりと散々。特にクロスシンセシスを使い始めると不具合発生は必至で、VOCALOID™4 Editor for CUBASEを含むトラックの削除すらエラーで出来なくなる有様。

 VOCALOID™4 Editor for CUBASEはまだ使用に耐える仕上がりとはお世辞にも言えない。再生中には編集できないなど、仕様そのものにも疑問が残る。Piapro Studioの完成度だって今一つだが、安定性、レスポンスの良さなどはVOCALOID™4 Editor for CUBASEを遥かに凌ぐのが実態だ。VOCALOID™4 Editor for CUBASEのツールとしての生産性の低さは、ある意味驚くぐらい非常識なレベルと言って良い。

 ちなみに環境は、Windows7 64bit、Cubase Pro 8。

2014/12/22

Megpoid English、YMOの「シムーン」カバー、再び

 基本的にボーカルのミックス違い。先のバージョンはPiapro Studio(ボーカロイドエディタみたいなDAW用のプラグイン)の出力をエフェクトに通したものでしたが、今回のバージョンはCubaseのVari Audio機能を使ってピッチや発声タイミングをかなりいじってます。出来はもう一息。

2014/12/07

Megpoid English、YMOの「シムーン」カバー

 日本語では敢えて「シムーン」、アルバム「イエロー・マジック・オーケストラ(日本版)」の同曲に対する自分なりのイメージをかなり引きずった音作りになってます。最小限のリバーブ(残響をシミュレートするエフェクター)の使用と波形丸出しのシンセ音が一種のコンセプトで、ミックス名の通り、2種類のパーカッション(ジィー、チン!)を除いて、音は全てソフトシンセZ3TA+2(ゼータ・プラス・ツー)で作ってます。ドラム音とベースは正弦波とノイズだけ、風音はノイズだけ、他の音は矩形波が絶対入ってます。

 あ、DAWをCubase 7.5からCubase Pro 8にアップグレードしました。レンダリングエンジンが軽くなっている(リアルタイム再生時のCPU負荷が下がっている)のはメーカーの謳い文句通りです。ただしバッファサイズを小さくするとリアルタイム再生時にノイズが発生し易い傾向があります。

 FL StudioBitwig StudioへのDAW乗り換えも考慮しましたが、一旦使い慣れたもの変えるのはやっぱり敷居が高いですね。複数のグレードを揃えたアプリケーションであっても、欲しい機能の有無にこだわれば結局最高グレードを購入せざるを得ない訳で、導入コストも必然的に高くなります。ただ、FL Studioは無償でアップグレードし続けられるので5年単位ぐらいで見れば元は取れるでしょう。Bitwig Studioはバージョンが1.0から1.1に上がることと年末(会計年度末)ということもあってか、1月中旬まで少し安い価格で購入できるようです。円安が進行している昨今でも、国内代理店経由より海外のメーカーサイトで直接ダウンロード購入した方が安い、というのは何とも。

 Megpoid音声はエフェクトを除くとPiapro Studio出力のまま、調整は無しです。もちっと音は丸めた方が良っかなぁ。

おまけ

2014/10/26

Megpoid English、Kraftwerkの「放射能」カバー、リビジョンアップ!

 リビジョン1です。

 Native Instrument社のソフトシンセMassiveの音色作成のコツがかなり分かってきたので、Cakewalk社のソフトシンセZ3TA+2と同等に自分好みの音色を大量作成中。"Radioactivity"についてはベース音を新規音色に差し替え、バランスを取り直すために他の音源の音量や定位をかなりいじりました。ただし普通に聞く分には差は僅かでしょうね。

 あくまで「俺の中では別物」ということで。

2014/10/19

Megpoid English、Kraftwerkの「放射能」カバー

 音は全てNative Instruments社のソフトシンセMassiveで作ってやろうと。サイン波や矩形波が実にピュアでちょっとびっくりした事と、ユーザーインターフェイスが全く理解できなくて困っていたのにチュートリアルビデオを30秒ほどチラ見したら一瞬でユーザーインターフェイスの操作方法がほぼ全て分かってしまった事が発端。そうかドラッグ&ドロップすれば良い訳ね、ということ。ノイズも使い易いしね。

 あ、もちろんMassive VSTプラグインをDAWにロードしてまず実行するのは設定の初期化ですよ。この流儀はCakewalk社のZ3TA+2を使う時と全く一緒。

2014/10/12

Thatness and Thereness / feat. Avanna、肩慣らし!

 死蔵状態だったボーカロイドAvannaを使ってみる。

 音程によるフォルマント特性変化が大きく、"f"がほとんど聞こえないのに"i"がやたら大きいとか、これはこれで癖がある。Megpoid Englishの発声タイミングがエディター入力に対して遅れぎみなのに対して、Avannaはむしろ発声タイミングは早め。従って、Megpoid English様にいじり倒したデータを使うと物凄く突っ込み気味の発声になってしまう。

 SONiKAがそうであったように、英国Zero-Gのボーカロイドバンクは素人っぽいのが一つのミソ。かと言って声質は両者完全に別物で代替物にはならない。かつては海外でもSONiKAのボーカロイド3バンク待望論があったものの、 今では全く聞かなくなりましたねぇ。あと、Avannaのコンセプトは「ケルトテイスト」ということですがあくまで英語ボーカロイド(Engloid)、ゲール語系固有の音素は使えない。残念と言うより無念。

2014/10/03

Thatness and Thereness / feat. Megpoid English、リスタート!

 坂本龍一さん&ピーター・バラカンさんの楽曲、"Thatness and Thereness"は個人的に引っかかりの多いエバーグリーン。一度Vocaloid2 SONiKAでカバーをでっち上げたことがあるけれど、Megpoid Englishによる再挑戦に着手。アイディアスケッチとばかりに以前のデータは全て無視してとにかく組んでみた。関連して3DCGモデラーのリハビリもやっと本格的に始めてみたよ。

 途中から入るドラムの音が大きめなので、再生音量には要注意。

2014/09/14

"Fly me to the moon" Megpoidカバー、リビジョン0

 まずはリビジョン0です。発声タイミングはwaveファイルに書き出してからCubaseのVariAudioで徹底的に調整。

 After Effectsでタイムカウンターを作ろうしたんだけど、エクスプレッション(スクリプトですね)の書き方をすっかり忘れていてびっくり、歳やねぇ。

2014/09/07

Fly me to the moon, again

 私が初めて実用に供したPC用DAW(デジタル・オーディオ・ワークステーション)ソフトと言えば、Cakewalkの今や亡きProject5、Steinberg Cubaseに完全移行後の今でも実はPCにインストールしたままなのだ。何故かと言うと、結構スケッチ風というか、楽曲の大枠だけ組んだようなProject5データが多数あるからだ。

 かく言う本楽曲のオケも元々はProject5で組んであったものを、「Project5の画面を見ながら1日かけてCubaseで打ち込み直す」ということをやったものだ。ある程度はキーボード(鍵盤)から入力しても良いんだけど、リズム感が弱いところに来て、鍵盤を押してから発声までのレイテンシ(時間遅れ)が気になり出すともう対応できない。勢いマウスを動かした方が早いという訳だ。

 ただ一つ問題なのは、Project5上のシンセ音はほぼ全てCakewalkのソフトシンセPsyn IIで作っていること。 Psyn IIも開発終了して久しく、現在の64bit環境で動くバージョンはない。そのため、データ移植後になかなかProject5上で組んだ時のイメージが再現できなくて苦労することが多い。本楽曲に関してはCakewalkのサンプラーD-Proで大部分組まれていたので、D-Pro 64bitを使うことで音色的にはProject5上でのイメージを比較的短時間で再現できた。ベース音(2音色)だけはCakewalk Z3TA+2で元々のイメージに即した音を新たに作った。

 MegpoidパートはPiapro Studio、ほぼ「楽譜通りに打ち込んだ」に相当するもの。そのため、発声タイミングがツッコミ気味だったり、逆に遅れ気味だったりとばらつきがある。ツッコミ気味になりがちなのは、"let"、"me"、"and"、"play"とか、遅れ気味になりがちなのは"please"、"among"、"are"とかが代表的だ。"you are"のところは"are"の出だしが余りに遅いので、さすがにノートオン(発声開始)を1/64音符分前にずらしている、つーか、"You're"にしておけば良かったと今気付いたよ。発声タイミングはWaveファイルにバウンスしてから、Variaudioなどで徹底的に調整することになるだろうね。

 後、分かる人にはスペクトルの動きを見れば直ぐ分かると思うけど、Vocalodのビブラート機能は積極的に使っている。

2014/07/19

「東風」Megpoidカバーオルタナティブミックス、リビジョン0

 結局のところ先のバージョン、ミックスとの違いなんてやった人間にしか分からない。先のミックスが「オケではなくインスト有りき」だったのであれば、今回のミックスは「GUMI有りき」と言える。

 「東風」はインスト曲として既に優れているから、曲が組み上がった段階でやっぱり音や音量のバランスを取ってしまう。先のミックスは既にあるインスト曲にGUMIを被せただけ、というのが実態だった。今回のミックスでの考え方は全く逆、GUMIをどん!と中央に据えてから周囲を整えていったという訳だ。

 印象は変わらないと思うけど、音数が減っていることや、ベースやバスドラムといった低音域の音量がかなり抑えられていることはこの種の作業をしたことがある人なら直ぐ分かる筈。もうひとつ気を使ったのは「モノラルにしてもそこそこ聞けること」、AMラジオ放送でもそんなに印象が変わらないものにしたいというイメージだ。これは単なるかつてエアチェック好きだったおっさんのノスタルジーという側面だけでなく、音場を作り込み過ぎずに聞き易くするための予防線という側面をも持っている。

 あと、3:06辺りに明確な違い有り。

2014/06/18

超初心者向けCubase7.5+Vocaloid(その2)

 今回は縦方向の音の位置の話。

 音の高い/低いはピッチだけじゃなくて、音の縦方向の位置にもざっくり当てはまる。バスドラムのドン!という音は下から、ハイハットのチキチキした音は上からそれぞれ聞こえる傾向がある。では、これらの上下方向の音位置の調整はどうすればできるだろうか?

 イコライザで周波数成分をいじる、例えば上から聞こえる様にしたければ低周波成分を削り、高周波成分を強調すれば良い。が、この方法だと、人声やVocaloid音声のように幅広い周波数帯域に渡る複数の周波数成分の音量バランスが重要な音では、音の特徴そのものが変わってしまう。人声やVocaloid音声で高周波成分を削っていくと、徐々に発音が曖昧になっていく。これは所謂「フォルマント成分」まで削ってしまうためだ。

 では原音の周波数特性を変えずに音を上下方向に動かすには具体的にどうすれば良いだろう?

 一般的な方法は、リバーブエフェクトで高周波側を強調することだ。つまり原音の周囲に、原音と較べて高周波成分を多く含む音をまとわりつかせてやれば良い。Cubase7では4種類のリバーブがプリセットで用意されているが、Roomworksの場合を例に挙げよう。

 これが、"Music Plans"で「Vocaloid音声を上に上げる」ために用いたリバーブ設定。ただしこのエフェクトはセンド(音声をエフェクト用の別チャンネルに送ること、Cubaseでは「FXチャンネル」に送ること)先で利かせているので、リバーブ成分の音量は原音とは独立して調整している。ポイントは、中央左寄りの青い横向き三角形の辺りの表示。
 "Surr. Vocal Plate"を選んだ場合のデフォルト設定はこんな感じ。
先に書いたように、リバーブ成分の音量に関わる右上のMixの値は気にしないで欲しい。デフォルト設定では青い横向き三角形の上下に白い横向き直角三角形が見える。この設定では白い直角三角形の横向きの長さは同等だ。これは、高周波域(上)、低周波域(下)ともにリバーブ成分が同等に含む事を表している。

 一方、最初に示した図では、白い横向き直角三角形の横向きの長さが上下で違う、下が極端に短い。これはリバーブ成分の低周波成分(下)が短時間で減衰するということだ。結果としてリバーブ成分は原音に較べて高周波成分が卓越する。よって、原音と同時に鳴らすとリバーブ成分に引っ張られるイメージで原音もより上からに聞こえるようにできるということだ。何処をどういじれば良い感じにできるかは試行錯誤して欲しい。この種のノウハウはケースバイケースの場合が多いし、実際にやってみたことしか当人の身に付かないからね。まず白い横向きの直角三角形の長さを変える方法を確認することから始めてみて欲しい。実際、私も2年ほど前は「この表示の意味は何?」って感じだったんだから。

 ちなみに"Music Plans"ではシンセ音の定位に上記の方法を多用していたので、この方法だけではVocaloid音声の他の音との分離が十分にできなかった。そこで、ちょっと変化球を使ってみたところ意外に上手くいったのでちょっと触れておこう。「原音の高周波数成分を強調しただけでは効果が薄い」ならば、「原音に無い高周波成分を、原音を元に付け加えてみよう」という趣向だ。具体的には"Modulation"カテゴリの"Metalizer"を使ってみた。
 右端のスライダーが原音に対するエフェクト音の割合(エフェクトレベル)だ。このスライダを動かすだけで、面白いように音の聞こえる位置が上下した。"Metalizer"自身は音を強烈に歪めるエフェクタだから、バックトラック無しで聞くと音の特性が変わっている事は直ぐ分かってしまう。が、ドラムやシンセといったバックトラックと一緒に聞くと、低いエフェクトレベルでは音の特性の変化よりも音が聞こえてくる高さの変化の方が圧倒的に大きい。理詰めでいったん考えて気楽に試してみる、実際日々そんなもんですよ。