2021年9月5日
@PSGOZ さんの談義
1
PS5OZ NT-D @PSGOZMIKU

楽器演奏における身体的な制限からの解放というの、鍵盤楽器がわりといいところまで行っている気がする。結果はどうあれ

2021-09-04 10:29:53
PS5OZ NT-D @PSGOZMIKU

自分が思い描いた通りの音楽を奏でたい、というところから出発したシーケンサーというか打ち込み音楽、当初は発想を音にするまでの時間がかかり過ぎるのが問題だったけど、最近は音をどんどん提案してくる事でユーザーの発想自体を奪ってしまう戦略よな。

2021-09-04 10:35:56
PS5OZ NT-D @PSGOZMIKU

VOCALOIDなんかは身体的な制限から逃れて歌を作る事ができる仕組みなんだけど、人間の身体性を無視すると、今度はそれを聞く人間の側で「歌」と認識しなくなっていくのが面白い。

2021-09-04 11:01:04
PS5OZ NT-D @PSGOZMIKU

AIシンガーなんかは統計的に人間のやったことを再現する仕組みだから、余計に人外な事ができない。 ある個人のできる事の中での組み合わせで遊ぶしかない。

2021-09-04 11:04:51
PS5OZ NT-D @PSGOZMIKU

というわけでツールとしてはVOCALOIDとAIシンガーの上位に位置するのがSynthesizerV(脅威のテクノロジー)なんだけれども、イマイチ過小評価されているように思えて仕方がない。 twitter.com/psgozmiku/stat…

2021-09-04 11:14:35
PS5OZ NT-D @PSGOZMIKU

このボカロっぽい歌い方、将来音楽力の高い"デキる"ボーカリストが再構成して歌唱表現の一つになったとしたら胸熱だなぁとか思ったり。(多分ヨーデルに分類されると思う) twitter.com/psgozmiku/stat…

2021-09-04 11:19:46
PS5OZ NT-D @PSGOZMIKU

VOCALOIDではユーザーは歌を書く・描くという役割を担う印象だったけれども、AIシンガーはどっちかっていうとユーザーの役割は目標地点や経由地点を指定する"ナビ"(道案内)的なものなんだよ。

2021-09-04 11:31:19
PS5OZ NT-D @PSGOZMIKU

SynthesizerVの凄さについてはこの動画がわかりやすい twitter.com/psgozmiku/stat…

2021-09-04 11:34:44
PS5OZ NT-D @PSGOZMIKU

この辺りを踏まえてボカロ語りしてる人は信頼できる。(極端に少ない) twitter.com/psgozmiku/stat…

2021-09-04 12:04:11
Shigekazu Ishihara @shigekzishihara

@PSGOZMIKU 機械学習による結果を使うということの非常に的確な指摘と思います. 局所的には,ええ塩梅で補完が効く.離散的な目標を設定して,うまい具合に滑らかに最適経路を辿ることができる.一方,線形システムではないので,突如うまくいかない箇所が,問題空間中にいくつもある.そこではいうこと聞かない

2021-09-04 12:09:32
PS5OZ NT-D @PSGOZMIKU

人類が歌声を視覚的に扱う(描画する)ようになってまだ24年なんだよな。 VOCALOID以前は歌をターゲットの音高に収める(ピッチの平坦化)方向に使われていたけれども、VOCALOID以後は逸脱する方向への変化が見られる。それは収録元の歌手に気兼ねしなくなったという事が大きいように思える。

2021-09-04 12:11:51
PS5OZ NT-D @PSGOZMIKU

と書いたものの、逸脱のアイデア自体が無かったかといえば、そんな事はなかったし、表面化・普及したか否かくらいの話のような気もしてきた。

2021-09-04 12:19:38
PS5OZ NT-D @PSGOZMIKU

ワイのボカロいじりの技術の一端(DAWでのピッチチューン無し) twitter.com/psgozmiku/stat…

2021-09-04 12:25:27
PS5OZ NT-D @PSGOZMIKU

@shigekzishihara ふと、もしかして人間の学習者にも同じ事が言える??という考えが頭をよぎって消えていきましたw

2021-09-04 12:38:16
Shigekazu Ishihara @shigekzishihara

@PSGOZMIKU ある程度言えるとおもいますね.類推と,類推の限界.直感的な類推が効きにくいところを,人類は数式や,記号論理学でモデル化して,限界を押し広げてきたわけですが,全部が全部モデル化できるわけでもない.

2021-09-04 12:40:38
Shigekazu Ishihara @shigekzishihara

@PSGOZMIKU もう一つは,結晶的知能/流動的知能という,知能観の概念もそうかもしれません.知恵があるのと,その知恵を演繹外挿して,問題解決に活用できるのは,また別,みたいな.

2021-09-04 12:41:40
Shigekazu Ishihara @shigekzishihara

@PSGOZMIKU 類推を,帰納的学習,あるいは帰納的学習の結果の応用とみれば,機械学習はかなり人間と近い,という見地は,Hollandたちのアイディアに近いですね. インダクション―推論・学習・発見の統合理論へ向けて (新曜社認知科学選書) J.H. ホランド amazon.co.jp/dp/478850393X/…

2021-09-04 12:44:39
インダクション―推論・学習・発見の統合理論へ向けて (新曜社認知科学選書)

ホランド,J.H.,ニスベット,R.E.,ホリオーク,K.J.,サガード,P.R.,伸一, 市川

Eji @ejiwarp

@shigekzishihara @PSGOZMIKU SynthVは結果的こういう作りとなりました、という側面も大きいですが、クラシックな素片接続用操作体系に、ニューラルボコーダーと接続させ、ユーザーが必要だと感じる時だけピッチモデルをピックアップしてガイドを行う、というスタイルは「初音ミクが居る世界線」に最適だと思ってます。

2021-09-04 12:46:41
Eji @ejiwarp

@shigekzishihara @PSGOZMIKU この意味だと、最初のツイートにある「AIシンガーはユーザーがガイドする」というのは多少違いがあります。 twitter.com/PSGOZMIKU/stat… Sinsy系とNPSS系など、ピッチとタイミングモデルがユーザー操作をフィルタリングする系統だと、目的は大体「ユーザーが案内しない場合、勝手に本人を再現する」だと。

2021-09-04 12:48:56
Eji @ejiwarp

@shigekzishihara @PSGOZMIKU その意味では、SynthV AIはその他のAIシンガーと違って、ニューラルボコーダーがユーザーによる入力を囲んで波形を構築する。

2021-09-04 12:50:44
PS5OZ NT-D @PSGOZMIKU

@shigekzishihara 「知恵を演繹外挿」<あー!これ!創造力とかクリエイティビティとかって言葉を使っている時の私の頭の中!

2021-09-04 12:51:56
Eji @ejiwarp

@shigekzishihara @PSGOZMIKU 最低限の操作体系によって、人間は歌声を理解して、その他細かいところはAIが再現する。 これは人間が歌声を理解してちゃんと着地点を意識する同時に「解釈可能のAI」の文脈だと自分が思ってる。

2021-09-04 12:55:17
PS5OZ NT-D @PSGOZMIKU

ひー!また一万円超えの書籍が干し芋のリストにwww twitter.com/shigekzishihar…

2021-09-04 13:01:49
PS5OZ NT-D @PSGOZMIKU

@ejiwarp @shigekzishihara 人間側はもっと頑張らなくちゃなー。

2021-09-04 13:31:57
PS5OZ NT-D @PSGOZMIKU

ボカロとかいじってる日本人の多くは図の「生徒」側の波形しか学習する機会がないので、そっちが「人間らしいピッチカーブ」と思い込んでいる。「音楽的意図」から積み上げる思考は当然できないので、その周り道も出来ない。 twitter.com/psgozmiku/stat…

2021-09-04 14:48:30
PS5OZ NT-D @PSGOZMIKU

これを音で聴くとはっきりと違いがわかるのだが、これくらいの縮尺の推定ピッチのグラフで見るとほんの小さな動きや違いにしか"見えない"。これは音を視覚的に捉える際の罠のひとつだ。 twitter.com/PSGOZMIKU/stat…

2021-09-04 14:51:58
1
まとめたひと
Eji @ejiwarp

ボカロとパソコン関連など自分が気になったものをつぶやいてみる。ミク大好きです。よろしくお願いします。

コメント

コメントがまだありません。感想を最初に伝えてみませんか?