ラベル Vocaloid の投稿を表示しています。 すべての投稿を表示
ラベル Vocaloid の投稿を表示しています。 すべての投稿を表示

2013/12/21

「初音ミクV3 ENGLISH」ってば:補足の補足 or Piapro Studioがいよいよ使い物になるか?!

 Piapro Studioのバージョン1.2がリリースされて、クリプトン社以外のボーカロイドも使えるようになったよ。技術的な問題があったのか、囲い込み戦略があっさり破綻したのかは不明だが、ユーザー寄りの展開は一度は苦言を呈した手前、大歓迎だとはっきり書いとかないとね。

 以前に書いたと思うけど、初音ミクの声?質にさっぱり魅力を感じない類の人間故、Piapro Studio自体が塩漬け状態だった。最後のミックスダウンまでそのまま使うことはないと思うけど、DAW上でのラピッドプロトタイピングには重宝しそう。テンポ変更の制限が無くなるからバックトラック作成に先行する「歌先」も可能で、ワークフローを根本的に変えることになるかもしれない。

 あ、V3 Megpoidだけでなく、V3にインポート済みのV2 Sonikaも使えるようになるよ。

2013/10/20

"Bizarre Love Triangle / feat. Megpoid Eng."リボーン

 いったん終わらせたつもりの"Bizarre Love Triangle"だが、さる友人から

「この曲のベースはもっとベキベキしてるもんだろう、カバーってよりコピーに近いんだからさ」

との言葉を頂く。うむ。

 ベース音は勝手知ったる"Z3TA+2"で作っているから、「ベキベキ」させるのは非常に簡単。エンベロープ・ジェネレータ(EG)とモジュレーション・マトリクスをちょいちょいいじること3分ほどで新しいベース音は完成、むしろベース音の輪郭がはっきりした分、全体の再調整に時間がかかった。

 結局、キック(バスドラム)の音は差し替え、他の音も一部定位を縦方向でいじることになった。また、キックとベース変更に伴ってボーカロイドの発声タイミングのリズムに対するルーズさが目立つようになったので、わざとずらしている所を除いて発声タイミングを再調整することになった。

 ベース音を除けば、まぁ、ぱっと聞きでは従来バージョンとの差は分からないだろう。が、自分の中では完全に別バージョンだなのだ。

2013/10/06

アクセス解析:検索ワードラウンドアップ

 久々に当ブログのアクセス解析結果を見てみてびっくり、アクセス数が5倍以上に増えている。理由は簡単で、みんなiOS7でエラい目にあっているようです。あなたは決して一人ではないですよ。

 という訳で、当ブログのアクセス解析から分かったみんなが使う検索キーワードまとめ(ラウンドアップ)です。件数よりもインパクト重視ですけどね。
  • iPod touch iOS7 不具合 アップデート
     アクセス数増大の最大要因はiOS7。
     個人的にはiOS7.0.2はかなり良いんではないかという気がしてきました。iOS7.0は無かったことするべきです、あはは。iOS7にアップデートするとカバーフロー表示がアルバムジャケットのタイル表示に置き換えられますが、これも割と使い易い気がしてきてます。ジェスチャでジャケットの拡大・縮小もできるしね。むしろiTunesのアルバム表示も同じようにできないか(アルバムタイトルとか表示しない)っていうぐらいの気分になってます。
     ただし、iOS7ではスワイプや拡大・縮小のジェスチャとか、各画面で要求される操作が整理されていなくて、「こうしたいんだけどどうすりゃいいの?」という状態に何度も陥っています。操作に関しては仕様が論理的ではありませんし、iOS6を基準にすると直感的でもありません。Apple製品ですからそのうち良くなります、iOS8が楽しみです。
     iOS6が基本的に横スワイプとタップだけで操作するように出来ていた訳ですが、iOS7はそうじゃないということを受け入れなければなりません。今回ばかりはMicrosoftチックでもあきらめましょう。「やりたいことははっきりしているのにどう操作すれば良いか分からない」という状態を生むというのは一種の不具合ではありますが、そもそもAppleってそんなしっかりした製品作った試しは無いでしょ?いつものことです。

  • iOS702 アイコン 色
     やっぱりちょっとケバい気はしますよね。個人的にはiPod touchは音楽プレーヤーとしてしか使ってませんから、起動後2~3秒を我慢すればケバケバしい赤い文字にイライラするだけで済みますよ。

  • ios7 アップデート 音質劣化
     iOSアップデートと同時期にそれまで使っていた既に型落ちヘッドフォンを壊してしまったので、iOS変更による音質変化は分かりません。あのビットレートのAAC音源では音質なんか気にしてもしようが無いかとも思いますが如何でしょうか。

  • iPod touch ios7.0.2  右にスライドで検索
     iOS7では縦スワイプで検索です。
    3つまであるどのホーム画面からでも検索にアクセスできるようになったという意味では、こちらの方法の方が合理的ではないでしょうか。iOS6のスワイプは一次元的、iOS7のスワイプは二次元的とも言えるかもしれませんね。

  • ios7でもカバーフローを使いたいios7 横にするとアルバム画面になってしまう
     カバーフローは過去のものです。ダサいです。使うべきではありません…とは言えないよなぁ。気持ちは分かります。
     iOS6でも画面を横にするとカバーフロー画面になりませんでしたっけ?

  • iPhone 脱獄 ios7.0.2
     脱獄???

  • iTunes 11.1 応答なし
     まるで潜水艦が出てくる戦争映画のタイトルみたいです。日常茶飯事なので私は全く気にしていません。
    そもそもAppleってそんなしっかりした製品作った試しは無いでしょ?いつものことです。

  • 2199*駄作、宇宙戦艦ヤマト2199 つまらない、2199 酷い
     まぁ、そうでしょう。

     2199のTV放送されたバージョンは過去のものです。ダサいです。観るべきではありません…とは言えないよなぁ。気持ちは分かります。そもそも×××ってそんなしっかりした作品作った試しは無いでしょ?いつものことです。

  • コスモタイガーⅡ 黒い部分
     確かに気になりますよね。ちなみにバンダイのEXモデルでの解釈は私は大嫌いです。
    おそらくあの部分のみだけいじっても、全体として整合性の取れる解釈は無理だろうと思いますが如何でしょうか。

  • イデオン 絶望
     どういう文脈で出てくる検索ワードなのかが全く推定できません。3日に1回はアクセスログに現れます。

  • 初音ミク V3 アクティベート
     アクティベートサーバーはまだ不調なのかな?

2013/09/30

「初音ミクV3 ENGLISH」ってば:補足

 先のエントリで、「初音ミクV3 ENGLISH」、「Megpoid ENGLISH」及び「SONiKA + V3 Vocaloid Engine」の周波数分布特性について触れたけれども、実のところ自分の耳に基づく見解だった。耳には結構自信があるから不安などは感じないものの、やっぱりちゃんと一度定量的に確認しておいた方が良い。という訳で、3つの英語ボーカロイドの同じ英語フレーズ(同じvsqxファイル)の周波数分布を調べてみた。使用したアプリは"Sound Engine FREE"、これは優れモノですよ。

 実際に周波数スペクトルの時間変化を見ても、結論は変わらなかった。赤~オレンジが音声を特徴付ける周波数成分。一番下が音程を決める周波数、下から2つ目より上がフォルマント周波数だ。

 Megpoid Eng.は音程を決める周波数より下の周波数成分が他と較べて低く、こもったような「もこもこ感」が出にくいのは明らか。またMegpoid Eng.とミクV3 Eng.の500~1kHzの中周波数成分の有無の違いは明確だ。「ミクV3では中周波数域をイコライザーで持ち上げても全然美味しくない」のはそもそもその周波数領域がスカスカだからだということが良く分かるねぇ。

 にしても、V3 Editorは何時まで待てばバグフリーになるのかねぇ…

2013/09/29

「初音ミクV3 ENGLISH」ってば

 ボーカロイド製品のアクティベーションでは専用サーバーへの接続が必要だ。

 聞くところによると昨日はそのサーバーが高負荷で落ちちゃったんだそうだ。凄いもんだね「初音ミク」は…とか書きつつも、実は私もサーバーダウンの影響を受けた一人。おそらくサーバー復旧前後に何回かアクティベートに挑んだタイミングだったようで、4回ほどネット接続エラーでアクティベーションに失敗。成功するまでに迷惑メールが11件届いちゃったよ、あ、俺のPCちゃんとネットに繋がってるじゃん、あははって感じ。

 これで一気に「初音ミク楽曲の質が向上」なんてことが「もし」起ってしまった場合、その原因分析はちょっと面白いですよ。はたして原因は「初音ミクV3」の出来の良さなのか、それともMacもサポートしたことなのか、とか。大げさに言えば、林檎使いは窓使いよりも本当にセンスが良いのかっつー話にけりがが付くかも知れんよ、ということですよ。俺みたいな元熱狂的林檎使い(SYSTEM6まで)はどっちですか?

 で、知ってる人は知ってるように、俺は基本的に「ボーカロイドはウィスパー系以外は英語バージョンしか買わないよ」という人、ということは裏を返せば「初音ミクV3 ENGLISH」は買っちゃう可能性はある訳で、ハイハイもちろん買いましたよ、と。アクティベーションの件はそういうことです。

 んで、「初音ミクV3 ENGLISH」はどうなのよ、という話なんだが、なんだかなぁ…。自分の中のベンチマークは"VOCALOID2 SONiKA+V3 Voacloid Engine"で、こいつは余裕で超えてもらわないといかんのだけれども、ん~。

 滑舌は明らかに「Megpoid Eng. > 初音ミクV3 Eng.≧ SONiKA+V3 Engine」、これはフォルマント特性とも無関係じゃない。

 "Megpoid Eng."はとにかく声がひっくり返ることが多くて難渋するが、これまで触った限りは"初音ミクV3 Eng."はほとんどひっくり返らない。と言うか、"初音ミクV3 Eng."(そしておそらく「初音ミク」自体)が「声が裏返りっぱなし」なのだろうと。なので編集しててもなかなか味が出ないと言うか、1時間も聞いているともう勘弁というか、触る度に使う気が失せるというか、少なくとも触ってても面白くはないことと、意外に「初音ミク楽曲」では声質自体がいじられてきていないのだなということを身をもって知った次第。

 周波数の話をすると、"VOCALOID2 SONiKA"自体は30Hz以下の低周波数成分が多く、かつ2kHz以上の高周波数成分が少ないので、全体としてもこもこした印象になる。低周波数成分はイコライザーで削れば良いのだが、中周波数成分とのバランスを取るために高周波数成分をイコライザーで持ち上げると音質が全体としてどうしてノイジーになり、さらに音自体が痩せてしまう。結果、「もこもこ」か「(痩せて)スカスカ」かの二者択一とならざるを得ない。"Megpoid Eng."は中~高周波数成分ともに多めで、強めにイコライザーを利かせても音が痩せにくく、声質が変わらない範囲で落とし所を見つけ易い。周波数成分分布は"Megpoid Eng."が実際の人声により近いので、人声を使う場合のノウハウがかなり活用できる。

 "初音ミクV3 Eng."は低、中周波数域ともに低く、もともとからして「痩せた」音だ。確かにこれはいじり代がない。破綻しにくいという意味では使い易いのかもしれないが、引き出しが一個しかないようなもの、というのも如何なものか。

 "VOCALOID2 SONiKA"でも、「もこもこ」と「スカスカ」を重ねて使うという奥の手が実はある。それぞれの音量とリバーブのカットオフ周波数域の設定によっては格段に聞き易い音質になるよ。

 ちなみに"初音ミクV3 Eng."で中周波数域だけ豪快に持ち上げると、個人的には何を言っているのか分からなくなる。要は重要なフォルマント成分が高周波数寄りにあるということだろう。「声が裏返りっぱなし」というのはそういうことだ。おそらく、Skypeとか通しても何を言っているのか分からなくなるんじゃなかろうか。

2013/09/25

"ENOLA GAY/OMD"ボーカロイド用試作オケ

 "Megpoid Eng."の購入を決めた際、カバーなりコピーなりしたい曲が4曲ほどあった。1曲目はすでに最初のバージョンをフィックスした"New Order"の"Bizarre Love Triangle"、そして2曲目が"OMD (Orchestral Manoeuvres in the Dark)"の"Enola Gay(1980)"だ。

 "Enola Gay"は女性の名前で、広島に原爆を投下したB-29爆撃機の愛称だ。歌詞には原爆が爆発した時間である8時15分や、広島型原爆の愛称である"Little Boy"などが散りばめられている。この曲の邦題は「エノラ・ゲイの悲劇」だが、個人的には色々思うところもあって酷い邦題という思いがぬぐえない。

 さて、試作オケだが、いつもの如く音数を節約した劣化版コピーだ。

 ベースには"SynthMaster2.6"を早速投入、さすがにまだスクラッチからの音作りはできないのでイメージに近いプリセット音を選んでフィルタ周りを中心にパラメータをいじり回った。各レイヤーで使えるエフェクター"Ensemble.(アンサンブル)"が結構強力で、少し音を広げたい(ステレオ感を付加したい)場合に実に重宝する。ドラム以外の他の音色3つは「1980年代FM音源シンセのプリセット丸出しみたいな音」という具合にイメージが明確だったので、全て"Z3TA+2"でスクラッチから作った。

 昔の自作MIDIデータも再利用し、おかげで先の連休のうちのほぼ一日で楽曲データ自体は完成した。まぁ、歌メロをボーカロイドで置き換える段階で音色、音量バランスや定位は見直さないといけないだろうけどね。

2013/09/18

"Bizarre Love Triangle / feat. Megpoid Eng."アゲイン

 先の三連休は台風のせいもあった外出のしようもなかったが、加えて身体が気圧低下に負けてぐったり。3DCGモデリングのリハビリは一向に進まず、いったんギブアップした"Bizarre Love Triangle / feat. Megpoid Eng."をちょいと見直すことに。一から組むのは大変だが、パラメータをちょくちょくいじるのならぐったり状態でもなんとかなる。

 今回は、Cubase+Vocaloid初心者ユーザー向けの覚書きです。

 前回のギブアップの主因は不自然なフォルマントが補正しきれなかったこと。今回のアプローチはフォルマント補正を一から見直し、かつ補正前の音も使うというもの。

 ボーカル音声のミキシングに「ダブリング」と呼ばれる手法がある。これは、ボーカルの別テイク(別の録音)を重ねるというもので、テイク毎の微妙な歌唱の違いで自然なコーラス感を出すことができる。一種の誤魔化しではあるのだが商品として流通している楽曲でも使われている手法であり、「ほどほど上手い歌唱」ほど味が出る可能性がある。

 Cubaseではpitchcorrectというピッチ及びフォルマント補正用VSTが使えるが、どうせならこのVSTを通した場合のボーカロイド歌唱音声と通さない場合のボーカロイド歌唱音声を別トラックで用意して、両トラックの音量バランスを変えて良い辺りを探してみよう。一本調子のつまらない歌唱スタイルにしたくない場合は試す価値は充分にあると思うよ。

 それぞれのトラックから良いとこ取りというのも一つの解だが、今回は補正済み音声をコアに、うっすらと補正前の音声を重ねてみた。もちろん、フォルマントはpitchcorrectでけっこう調整してある。2か所ほどはどうしようもなくて放置状態ではあるのだが。

2013/09/03

リビジョンアップ:時をかける少女 feat. Vocaloid3 Megpoid Native

 エントリタイトルの通りリビジョンを0から1へアップ、ステップバイステップでおそらく3までぐらいは行くと思われますデス。

 Megpoidユーザーで「あら、聞いてみたら意外に良いんじゃない」と思ったレベルの方は1ヶ月に一度くらいはここを覗いてみてくださいな、私のMegpoid理解はまだまだ道半ばだし、Tipsみたいなものはのっそり上げてくつもりだから。あと、私と同様に「うっかり/腹をくくってCubase買っちゃったけど使い方が良く分かんねぇ」って方もご一考下さいな。

 自分と同じ苦労を他人がするかも、という状況はつまんないもんね、少なくとも私にとっては。

で、

てな感じ。あはは、一日寝かせて聞き返してみるとアラだらけで自分でも笑っちゃう。聞いてみて、「けっ」と思ったり実際に口にしてしまった方は、以降は読まなくて無問題。もっとレベルの高いところを読みに行こう。

 実のところ、私は他人のボーカロイド曲はほぼ聞かないし、聞くにしてもまず真ん中あたりしか聞かない。理由は三つあって、①音程とかボーカロイドエディターの外でいじり過ぎていて、どれも同じにしか聞こえなくて面白くない場合が多々ある、②おそらく製作者の完成イメージにボーカロイド歌唱(?)が追いついていないせいで、オケに埋もれちゃうぐらいボーカロイドの音量が小さいか、リバーブ(エコー効果みたいなもの)を利かせ過ぎてやはり面白くない場合がある、③言わぬが華、だ。さらに加えると、少なくとも使用楽曲を聞く限り、メジャーどころの「初音ミク」の声にさっぱり魅力を感じない、ということも大きい。

 何れにしても、自作においては基本的に①②は禁じ手としている。もちろん「リバーブ必須」というジャンルの楽曲の場合は別だ。

 「でも上の楽曲ではボーカロイド音声にリバーブかかってるじゃないか!」と思った方は正しい。じゃぁ何処で自分の中で折り合いを付けているかというと、「中央のボーカロイド音声自体にはリバーブを全く利かせない」というところだ。

 ボーカロイド音声に関わる具体的なリバーブの使い方は以下の通りだ。Cubase固有かも知れない用語も含むとは思うけど、まぁ許して欲しい。繰り返しになるけど、下記の内容が用語も含めてスッと頭に入ってこない方は、今後このブログを「たま~に」チェックすると良いことがあるかもしれない。と言うか、私自身が大したレベルじゃないから初心者相手が精一杯ですよ。

  • ボーカロイド音声は中央に配置。これ自体にはイコライザーとコンプレッサーしか利かせていない。

  • 中央のボーカロイド音声を二つのFXトラックに送る。これらFXトラックではリバーブを利かせ、かつ出力はリバーブ成分だけとする。これはMixパラメータが100%ということで、あくまで原音は中央からしか出さないということだ。
    さらにFXトラックの定位をそれぞれ左右100%とした上で、10ms(ミリ秒)程度の時間差が左右で出る設定でシンプルなディレイを利かせる。上の楽曲でのディレイ時間は左右で530msと545msだ。

  • ミックスダウン(最終的な音声データのエクスポート)時に、出力全体にほんのちょっとだけリバーブを利かせる。オケとボーカロイド音声の馴染みを意図したもので、上の楽曲ではプレートリバーブ(というハードウェア)をシミュレートした設定で、Mixパラメータは2%とした。つまり98%は原音のままということだ。ここでMixパラメータはを4%以上とすると②に抵触してしまい、誤魔化し感が出て面白くない楽曲となっちゃう。

ちなみにCubaseにはボーカロイド音声の音程やタイミングなどを調整できるツール群がある。便利なツール達だが現時点ではまだ使わず、ボーカロイドエディター上で何処まで詰められるかがあくまで主眼だ。とは言え、タイミングは1ヶ所(ボーカロイドエディターにまで戻るのが面倒臭いから)、フォルマントも1ヶ所調整せざるを得なかった。この辺りの具体的な内容はそのうち書く予定なので、気になる方は2週間後ぐらいにまた来てね。

 今回はここまで。

2013/09/01

時をかける少女 feat. Vocaloid3 Megpoid Native

 いわゆる「時かけ」、あらためて歌詞を噛みしめながら聞くと実に切ない。映画自体は監督が大林宣彦氏だとか一部の俳優の演技に難ありだとか、まぁ色々あるのだが、捨て置けない作品ではある。原田知世さんのセリフ、

 「んも~、意地悪ゴロちゃん!」

は最高なのである。「ゴロちゃん」ではない自分だって言われたいのである。さらに「桃栗三年、柿八年、柚子は九年で成り下がる、梨の馬鹿めは十八年」というフレーズは未だ覚えているのである。とは言え、

 「土曜日の実験室~!」

というセリフは、やはり大林作品「ねらわれた学園」の

 「私は宇宙!」

には破壊力で及ばない。が、破壊する対象が映画自体だからこれは良いことだ。

 さて、オケであるが、もともとのコンセプトはカイリー・ミノーグの「ロコーモーション(1988)」風を当時自分が持っていた機材のシミュレーションでやろうと。機材と言うのはCASIOのポップキーボードSK-1とHT-700だ。幸い、SK-1のドラム音はネットからサンプル音を入手でき、またネット上に公開されているHT-700をシミュレートしたVSTi "plastique"が素晴らしい出来で、オケ自体の出来上がりがしょぼい原因の全ては自分にあるとしか言いようがない。

 が、ベース、ドラムを一旦組んだ時点でベースにディレイをかけてみたところから軌道は大きく外れ、「ロコモーション」からは実に遠いものになってしまった。しかも、イントロらしきイントロは無く、最後はフェードアウトという淡白さと相成った。

 ま、志が低いんだからしょうがない。

 で、肝心のMegpoid Nativeだが、なにせSONiKAが基準だから文句の付けようが基本的にはない。今回もボーカロイドエディターのほぼデフォルト設定で編集したものをwaveファイルでエクスポート、DAW上ではビブラートの振幅を一部小さくしただけなので、リバーブを外せばほぼボーカロイドエディターで聞ける音と同じだ。個人的にはボーカロイドなんてのはただのインストゥルメント(まぁ言えば楽器)だから、ブレスなんて入れようなんて思いもしない。

 原田さんのオリジナルを記憶の隅っこに置きつつも、ボーカルのメロディーラインはとある女友達のカラオケ歌唱時のものをなぞっている。第2コーラスの「宇宙の海よ~」あたりの節回しにはちょっと癖があるのではないかと思う。ちなみに松任谷由美さんのバージョンは未だ聞いたことがない。

 しかしながら、ボーカロイドも漠然と打ち込んだ訳ではないので、少し気にした部分にも触れておこう。ボーカロイドの歌い出しに違和感を感じたことのある人は試してみて欲しい。

 実際に人間が歌ったボーカルラインを調べてみると、歌い出しから音程がぴったり合っている例はまれだ(調べた範囲ではザ・ピーナッツはほとんど外していない)。じゃあボーカロイドではどうなっているかと言うと、少なくとも今回打ち込んだMegpoid Nativeでは、音程が高い方から入って歌い出しの本来の音程へと至る。他方、絶対音感が無くて正しい音程を探しながら歌っている人間の場合、ほぼ例外なく音程が低い方から入って歌い出しの本来の音程へと至る。だから、少なくとも他人のカラオケ歌唱の記憶と一致する「正しい音程を探しながらの歌い出し」を再現するには、歌い出しの最初の音程は実際より低い音程から入った方が良いことになる。

 そこで今回は、歌い出しの一拍前に1オクターブ低いダミー音をエディター上で入れてみた。ここでダミー音は発音される必要はなく、「発音できない発音記号」を適当に入力しておけば良い。これにより見事に歌い出しは低い音程からとなった。「正しい音程」へ向かう速度は歌唱法の設定やダミー音との距離に依存するから多少の試行錯誤は必要だけど、前述の「歌い出しの違和感」の解消には有効だと思う。

 ちなみに「あ」「ゆ」「な」「た」はMegpoid Nativeの鬼門だということが良く分かった。これは発音が不明瞭で音量も小さくなる傾向があるため、違和感の原因になり易いという意味だ。「時かけ」の歌い出しは第1コーラスが「あなた」、第2コーラスが「ゆ」で実は鬼門直撃なのだが、実際どうなのか気になる人は聞いてみて下さいな。

 ボーカロイドの音声データをいじるのはこれからですからね。

2013/08/11

近況、八度。

  • 私の居住地でもついに夏到来。午前9時半でマイカーの車内温度48℃って、あんた洒落にならないでしょーよ。開けられるところは全て開けて走ってもついに38℃を下回らず。沖合を寒流が流れるせいでこれまであんまり暑いという印象はなかった土地だが、やはりここ2年ほどは天候、気候ともにおかしい。もともと湿気は高いから、暑さが加わるのは冗談抜きでキツい。
  • 今日はちょっと仕事をしたけど、おかげで明日からは完全に夏休みで帰省。ちなみに帰省中は完全なオフライン、基本的に読書三昧の予定。書店で「TOKYO YEAR ZERO/D.ピース」「エラスムスの迷宮/C.L.アンダーソン」「ガガーリン/J.ドーラン, P.ビゾニー」「三重スパイ/J.ウォリック」の4冊を購入。あ、iPod充電しとかないと、もちろん充電器は純正品だからそうそう感電はしないよ。
  • あ~、スパムメールがここ1週間に急増、帰省中の総数は間違いなく1000通を超えるよ。私の契約先は2つ目のメールアドレスを無料で取得できるのだが、半分はそちら宛て。2つ目のメールアドレス取得の目的は実はアドレス流出元の絞り込み用なので、何処にも公開していない。ということは…
  • 今日はVocalod Megpoid Native用の「時をかける少女」のオケデータをいじる。チープな感じを狙ってドラム音を全てCASIO SK-1からのサンプリング音に置き換える。ベースの音色もあまり厚くないものに変えてからLFOとディレイを調整してみたらなんか良い感じだったので採用。もうこれ以上音は足したくないなぁ。

2013/07/28

"Bizarre Love Triangle / feat. Megpoid Eng."ギブアップ

 エントリタイトル通り、とにかくギブアップ、今はこれが精一杯。

 クリプトンがボーカロイドエディタ"Piapro Studio"を開発しているけど、ま、これは本家エディタの使いにくさ、より正確には編集・調整という手間に関するコストパフォーマンスの悪さ、へのひとつの回答だろうと思う。

 フォルマント調整にどこまで踏み込むのかは注目点、ここは本家エディタの鬼門のひとつだ。「ジェンダーファクター」とかもっともらしい呼び方をしているけれども、それは「フォルマントの自動調整技術が無いからパラメータにして誤魔化しただけだろう」というのが従来からの個人的見解だ。


2013/07/19

近況、六度。

  • 病状は安定でしばらく出社拒否なし、投薬も変更なし。来週は気の重い出張が2件入っていて、ちょっとばかりブルー、気の重さの原因は自分にはないんだけどね。
  • 頭部のMRI検査。脳は20歳代前半並みということで、医者も唸っちゃう「脳が実年齢より20歳ばかり若い」という事実。自分の経験から「人間、歳を取ると逆に無邪気になるもんだ」という感想を持っていたが、辺りを見回すと他人はそうそうそういう訳でもないみたい。どうも脳年齢の影響は無視できないやな感じ。無邪気になるためのポイントは「自分の無能さ加減の直視」かと思う。不要なプライドやこだわりを積極的に抽出、意図的に捨てることで身も心も思考も軽くなる。考えたことは人に話すのが間違いなく吉だが、話すときこそ頭をフル回転させよう。
  • フランク・ウィルチェックの「物質のすべては光」を再読中。いよいよ「質量の起源」に関する記述に突入。今度こそ内容をちゃんと「理解」せねば!頑張れ、俺の脳。
  • とある報道によると、ここ3年間(訂正:2005年以降、が正しいそうです。)の中露軍合同演習の費用は全て中国が出してるとか。また、国内向けに「ロシアからスホーイ35(ロシア軍ですら配備機数が限られている最新鋭戦闘機)を100機購入を契約」と報道しながら、この件に関するネット上の一般人による言及は完全に検閲中とか、もちろんロシアは公式に否定。輸出したスホーイ27がコピーされた上にコピー品を「中国開発機」と主張されてしまった件もあり、ロシアが中国を警戒するのも最もな話。中国(と言うか中国共産党)の意図が全く見えない恐ろしさ、「でっかい北朝鮮化」なんて上手いのかどうか分からない陰口もあったりする。
  • 暴動が頻発している新疆ウィグル自治区には人民解放軍と武装警察隊を合わせて10万人投入したという報道もあり、「中国という国を喰い物にする中国共産党」のイメージがいや増す展開。新華社通信がこの辺りについて何も報道しないってことが何気に凄い。地方政府から「自殺禁止令」が出されたってあたりに「どうしようない感」を禁じえない。単純に思うのは、「今日的に中国共産党は充分にイスラムの敵」なんじゃないの?、と。
  • 余り報道されていないみたいだけど、イスラエルは国費を投入して国内のパレスチナ人の教育レベルの向上を目指すとともに、人材と呼べるパレスチナ人は積極的に国立研究機関で採用している事実。政治参加にはまだ敷居が高いとは言え、パレスチナ人の社会進出と国力向上は切り離せないとする方向性(加えて国防費が圧縮できればなお良し)は政府閣僚の発言でも裏打ちされている。
  • ちなみにイスラエル国内で製作されたアニメーション映画は3本だけなそうな。1本目はストップモーションの人形アニメ(らしい)、2本目はFlashを使った「戦場でワルツを」。
  • 遠方のいつもの友人から「3DCGはもうやらないの?」の問い。これまではモデリングプロジェクトしかやってこなかったが、今後はムービー作成まで含めたプロジェクトへと軸足を移すのが基本的スタンスだ。いったんとりかかれば2~3年はかかるやもしれぬ故、始めるとなるとそれなりに覚悟が要るのよ。今は、「複数あるプロジェクト案を絞り込むための試作」を色々やっている段階。
  • 塩漬け状態だったVocaloid3 Megpoid Wisperの初テスト。まだ曲中のセリフというか語りはありません。歌詞の「トゥインクルスター」と「エンディングスタート」は鬼門で、「ス」の音が上手く出ないか、「ス」の音が出る代わりにその前の音が出ないかの二者択一状態。どうでもよいところは良い塩梅にどうでもよく処理してしまうのがボーカロイドの仕様のミソだが、局所的に突き詰めようとするとUTAUの方が上だったりするのは如何なものか。Vocaloid Editorは何回使っても使い勝手の悪さばかり目立つ。音程によるフォルマント変化が激しいのも辛い。
    バックトラックは耳コピ60%ぐらいで残りは印象で組んだ3種類、チップチューン風に落とす前の適当なやつ、CASIO HT-700ポップキーボード(の私の記憶における音)をシミュレートしたやつ、及びYAMAHA FB-01音源モジュール(の私の記憶における音)をシミュレートしたやつといったところ。適当なやつが一番音の切れが良い気がするのは気のせいですか?こと音楽に関してはとことん突き放した方が後で聞いても耐えられる方向に寄り易い感じ、きっとセンスが無いのな。あ、楽曲の"Dear Radio"は「電磁マシマシ」のエンディングテーマ曲でやんす。

2013/07/16

"Bizarre Love Triangle / feat. Megpoid Eng."の顛末:補足

 言わば正調版。邪道を先にやってしまうことで、逆に正調版の座りどころが自分の中に見つかると言う変な展開。フォルマントが変に変わるところを直しきれていないことと、ミックス時にバスドラ入れ忘れてる(自分でも訳分からんよ)のでVer. 0.8。ボーカルのレベルが高めのままなのもVer. 0.8。さすがに"KORG M1"(もちろんVSTi)の"Hit"を剥き身のままでは使えませんなぁ…やっぱ今では恥しい音色ですね。

2013/07/08

"Bizarre Love Triangle / feat. Megpoid Eng."の顛末

 "New Order"の"Bizarre Love Triangle"はやはり80年代を代表する名曲だと思うのだ。歌詞も「思いつめた人間の気持ち」を想像すれば何気にありそうな話にも思えるし、実際、似たような経験がない訳でもない。

 それはさておき、Vocaloid3 Megpoid English用のテストオケとして、ほぼオリジナル曲に忠実な(私の耳コピレベルではだが)シーケンスデータは作ったものの、どうもしっくりこない。Megpoidが悪いんじゃなくて、オケが文字通り単なるカラオケ曲になってしまっている時点で面白くないということ、何をやりたいのかがはっきりしないうちは基本的に「どうでも良いもの」にしかならない。故に、暫く放置状態としてきた。

 再開のきっかけは、別の曲のシーケンスを組んでいる際に頭をよぎった疑問、「私にとってチップチューンに相当するものは何か?」であった。

 元来「チップチューン」というのは、改造したゲームボーイなどの旧式の携帯ゲーム機で演奏した楽曲である。つまり、ゲームの音楽、効果音用の音源チップを楽器化するというもので、広義では旧式ゲーム機の音源をシミュレートして作った楽曲も指す。だからと言って、編曲はそのままで音色のみファミコン風の音に変えただけでは「チップチューンの心」は宿らない。音色自体のチープさをキャッチ―に変えるためには、同時発声数などの制限がある中で生み出された数々の方法論、特に特有の編曲法、音源チップのバグの活用や仕様外の使用方法などの実際にどう使われてきたかも踏まえたアプローチが必要、というのが個人的に信じるところだ。

 「チップチューン」を「チップチューン」たらしめるためには、送り手と受け手とが共通体験としての「ゲーム体験」があった方が良い。が、如何せん任天堂ファミリーコンピュータですら私の世代には遅れてきたゲーム機であり、私には共通体験たる「ゲーム体験」が欠けている。だから私には「チップチューン」はおそらく作れない、それこそ作る理由がない。では、共通体験としての「ゲーム体験」に代わるものは何か、別の言い方をすると、ある特定のハードウェアと結びついたかつては存在したが今は無い音はないか、という点に思いを巡らせた結果が"CASIO SK-1"超廉価版サンプリングキーボードや同時期のポップキーボードの音だったのだ。

 "CASIO SK-1"は8bit、9.7kHz(CDは16bit、44.1kHz)のサンプラーなので、固有の音なんて無いだろうと見做すことは八割方正しい。が、当時のポップキーボードに当たり前のように付いてきた伴奏機能、特にドラムパートの音源には製造元や機種毎に結構癖がある。先週水曜日にふと思い立ってググったところ、有難いことにSK-1のドラム音の音のサンプリングデータをアップロードしてくれている人がいた。早速データをダウンロードしてDAWのドラム音源データセットを作って使ってみたら「(曲は選ぶものの)まさにコレだ!」という感じ、探していたモノのひとつはすぐ入手できるところにあったのだ。

 出来の良し悪しはどうでも良し、ある意味「今の私だからこそできること」は80年代の自分の方法論の再現、より正確には翻案だ。そして、そのコアには「チープだけど味のあるドラム音色」をどう生かすかという課題がある。

 という訳で音色変更から、ボカロデータ作成、ムービーの背景ドローイングまで土曜日一日で力ずくでまとめちゃったのが以下のムービー。繰り返しになるけど、出来の良し悪しはどうでも良いのだ。考えていることと実際にやっていることが一致してるとか比較対象が無いとかは精神衛生上も良いのですよ。

CASIO SK-1 - like Lo-Fi Mix (8bit 9.7kHz Mix)


CASIO SK-1 Drum Mix


2013/05/27

ボーカロイドとその周辺で思うこと。

 最近はすっかりDAW(Digital Audio Workstation)アプリばっかりいじっていて、しかも作っているのはボーカロイド用オケばかりというヘンさ加減。さすがに打ち止め感(ネタ切れ感)が出てきても良さそうだが、どっこいそうはいかない。愛用のiPod Touchには既に1万2千曲以上入っているし、PCのハードディスクにはそれらの3倍を超える数の楽曲データが格納されている。CDやレコードの置き場所に困っても、ネタには困らないのだ。

 ボーカロイド曲を作るにしても、オリジナルソングであれば救いがある。が、少なくとも作曲の才能が無いことは大学生のころに確信してしまったし、カバーなりでいじってみたい曲にはことかかない。オリジナル用のネタはこつこつ貯めているが、曲としてまとめるというのは結構エネルギーの要る作業なので病気の身ではまだ辛い。良い歳したオヤジがおバカな感じのポップスをやろうとすれば、自分を一旦捨てるぐらいにはっちゃける必要があるのだよ。

 さて、「ボーカロイド」の登場は、20年以上にわたってリスナーに徹していた自分を「曲を組む作業」に再帰させる重要なきっかけだった。ただし、「ボーカロイド」そのもの以外には全く興味がない。最初に購入した「ボーカロイド」はSONiKA(英語)で、まず歌わせたのはKraftwerkの"The Robot"のカバーだった。歌詞の出だしはこうである。

 "We are codes and libraries, and we are installed on PCs."
 「私達は規則とライブラリ(の集まり)、私達はPCにインストールされる。」

つまり、個々のボーカロイドに「見た目などのキャラクター性を付与する」こと自体を心底小馬鹿にしているのである。商売としては間違いなく正解だが、付与されたものは私にとって何の価値もない。金銭を対価に自分のPCにインストールしたソフトウェアに過ぎない。

 ちなみにとある外国の方から面白いメールがあった。メールの送り主は、「ボーカロイドって何だ?日本の新しいアニメか?それともゲームか?キャラがいっぱいいるが一貫性はないみたいなんだが…」といった質問を何人もの知り合いから受けて閉口していたという。そこで私の"The Robot"のカバーの歌詞を印刷して読ませたりメールで送ったりして説明したところ、高確率ですんなりと「あぁ、PCアプリソフトなのね。」と納得してくれるそうな。実にイイ話じゃないですか。

 前置きが長くなったが、エントリタイトルの通り、思うところを書いておこう。
  • 「ボーカロイド」の登場は、「純粋な」人声合成を諦めた結果やに見ゆる。
    「ボーカロイド」は実在する人間の発声から抽出した音素データをライブラリとして用い、与えられた入力に対して音素データを加工、連結しているに過ぎない。声を声たらしめているフォルマント特性の生成は陽には為されていないのである。出力データが不自然に聞こえる場合は、結局フォルマントの時間変化が経験則とマッチしていないという場合が多い。

  • 純粋にフォルマント特性を合成できるならば世界中の言語で使われている母音が再現可能であり、特定の言語(すなわち限定されたフォルマント特性或いは母音しか用いない)に使用が限定される必然性はない。
    現存する言語の中にあって、日本語は最も母音が少ない(あ行の5つ)部類に入り、外国語習得のひとつの障壁となっているやに思われる。経験的に、日本語で使われない子音(残念、母音ではない)でも聞き分けることが出来るようになれば、発音もできるようになる。
    「純粋な」人声合成技術は、言語教育に大きなインパクトを与えるかもしない。赤ん坊が言語を習得する過程で、「耳」或いは人声を処理する脳機能は周囲から聞こえる人声に最適化されることは否めない。このような時期に日本語に無い様々な母音も聞かせておけば、赤ん坊の「耳」は日本語に無い母音も認識できるようになる可能性が高い。
     ここで「日本語に無い母音」の意味は、複数の母音が日本語では区別されないで用いられるということである。学校の英語の授業で「『え』の口で『あ』と発音する」とか習わなかったろうか?英語には「あ」と「え」の間にあるフォルマント特性に対応した母音があるということである。日本語に最適化された「耳」では、一般的にその母音は「あ」か「え」のどちらかでしか認識されない。
    しかし、更に母音の数が増えるとそうもいかない。幾つかの北欧の言語は母音が10以上あり、「あ」と「え」の間に3つ以上の母音がある場合もある。北欧の歌曲を聞いたとき、歌詞をカタカナですら置き下せないことを当たり前に経験する。これは、聞き手が母音を見つけることすら失敗しているということだ。ただ、この失敗はむしろポジティブに捉えるべきだ。少なくとも「日本語では使わない母音である」ことは認識できているからだ。
    言語習得の基本はやはり「ものまね」、「耳を作っておく」ことの重要性は高い。実績が確認できれば国策として制度化、義務化しても良いぐらいだ。もしそうなったら、カタカナでは書けない新しい擬音(オノマトペ)がたくさん生まれるだろう。

  • 編集できるパラメータの名称とその大まかな機能が、MIDI規格(電子音楽機器の制御のための通信規格)で定義されている送信可能なパラメータと同じとなっている。
    これを単に仕様と見なすか否かは重要だ。
    個人的には、このようなパラメータを人声合成に適用する事自体が直観に反している。つまり、これらパラメータの選択は音素データ合成というボーカロイドの仕組みの自由度を下げ、本来持ち得る機能をも封じているのではないかと思う。百歩譲ってもアフタータッチがない、エクスプレッションもない、ヴェロシティはMIDIデータにおけるそれとは別物など、欲求不満と混乱しか引き起こしていない。

  • 個人的な趣味から言えばエディターの完成度の低さはバージョン3でも噴飯もので、反応の遅さ、ダサいデザイン、論理的とは思えないメニュー構成など不満点にはきりがない。いわゆる打ちこみによる音楽データの編集は逐次的なデータ入力とリアルタイム再生を交互に行うものであり、ボーカロイドデータの編集はまさにこれにあたる。20GB近くのデータを扱いながら操作の切り替えにタイムラグを感じさせないDAWソフトウェアが実際にある以上、ボーカロイドエディターのレスポンスの悪さはどうしても目立つ。

  • 「ボカリス(Vocaloid Listener)」自体の存在意義は何処にあるのか?分析する歌唱データがあるなら、それ自体使えば良いだけの話で、ボーカロイドの出番は本来無い筈だ。

2013/05/20

Madalena / Kaleido+ファミコン風味 ボーカロイド用試作オケ

  Madalenaは名曲なのだが、いかんせん歌詞はブラジル-ポルトガル語。英語ボーカロイドでは直球勝負は出来ませぬ。オケの出来については0号ゆえ、ということで。耳コピ基本で4か所ほどコードが決め切れずにごにょごにょとした処理のままですが、いったんさらしておきます。

 大人の事情対策で「さとうささら」さん(CeVIO Creative Studio FREE)に再びご登場願っております。
 Kaleidoオリジナルの別バージョン。

 音はわやくちゃだけど、参考にしたバージョンに近いもの。

 忘れちゃいけない、Elis Reginaのオリジナル。こんな表現力はボーカロイドにはそうそう期待できないよね。ちなみに日本語ウィキでは「ブラジルポルトガル語での発音表記に準じるとエリス・ヘジーナ」なんて書いてあるけど、英語ウィキ記載の発音記号に基づけば「エリス・レジ―ナ」にやはり近い。「rr」みたいにrが二つ並ぶと、日本語の「ハ」に近い発音となるのは確かなんだけどね。

 はたしてお気に入りは見つかるかしらん。






  コード進行やコードの刻み方は、実はブラジル・コンテンポラリー・ミュージック(どっかで見たことあるけどどういう意味?)では比較的スタンダードなもの、海も渡ってますよ。この曲を初めて聞いたときはまず笑っちゃったけどね。

2013/04/28

Bizarre Love Triangle / New Order ボーカロイド用試作オケ

 オケは作ったもののイマイチノれず。しばらく放置かなぁ…。

 大人の事情対策で「さとうささら」さん(CeVIO Creative Studio FREE)にご登場願いました。取り合えず聞いてみて、分かる人だけ笑って頂戴。

2013/03/20

近況。

 近況です。

 年度末進行で仕事がエラいことになっているところに、名のある先生の研究室の学生がエラく困った内容のペーパーを国際会議にサブミット、とばっちりでこっちまでさらにエラいことになってます。引用文献ぐらいちゃんと全部書け!他人の論文のグラフに間違いがないか位は自分で確認しろ(電卓と時間が10分もあれば横軸の数値が間違ってることは定量的に確認できる、専門家なら縦軸か横軸の少なくとも一方がおかしいことは一目で分かる)!!査読者は何やってんだ!!!

 ま、結論はオレの考えと同じではあるのだが、ものには言い方というものがあるし、学究の場にだってそれなりに仁義の切り方というものもある。

 もはや何周遅れか?「水曜どうでしょう」の未見エピソードを友人の協力あって視聴中。面白いのだが、観て笑っているだけというのは休日の過ごし方としても余りに非生産的。とは言え、未だ投薬で気分を持ちあげている状態では、豪快に疲れる3DCGモデリングは無理。今後もしばらくは封印。

 1年ほどちまちま一から組んでいた"Bizarre Love Triangle/New Order"のオケが80%ぐらいの完成度、取り合えずVocaloid Editorを立ち上げてみよう。

2013/03/04

SONiKAユーザー向けMegpoid Englishセカンドインプレッション

 丸一日格闘しました。結論は、「英語の歌は歌わせるな。」

 いや、正確には「英語の歌を普段から英語を使っている人間が歌っている状態のシミュレートには使うな。」といったところ。出来上がりイメージとして英語ネイティブの歌唱を持っていると、何時までいじってもまとまらない。まぁ、日本語の歌詞に何気に英語が混じっている場合にワンポイントで使う、というのが本来の使い方なのだろう。

 "The Look of Love"をやらせると結構面白かったのだが、どうしても日本人の英語にしか聞こえないというのはある意味凄いことかもしれない。海外の人が何人も指摘しているが、SONiKAの発音は「実にブリティッシュ」なのだそうだ。まぁ、自分のSONiKAの使い方は自分の中のヨーロッパ風歌唱のリアライズだから、実はSONiKAの使用は正解寄りのはずだ。対して「Ja-nglish(日本語なまりの英語)の座りの悪さ」はネタとして以外は使い道が思いつかない。(文法的に正しい限り、日本語なまりの英語は非英語圏の人間にも聞き取り易いのだそうだが。)

 音がもこもこしようが、合成時にノイズが入ろうが、英語の歌を歌わせるのならやはりSONiKAの方が上(それでも曲は選ばねばならないが)、残念。