NHK技研公開2004

http://www.nhk.or.jp/strl/open2004/tenji/index.html
 先週末に見てきた展示から、いくつか。

http://www.nhk.or.jp/strl/open2004/tenji/t13.html
 出現頻度の高いフレーズには専用のリソースを用いる…という方向性は珍しくない*1と思うのですが、膨大なデータから殆ど自動*2で抽出したデータを元に、合成の単位をシームレスに変化できているのは驚きです。
 台詞の構造が安定しているほど合成から音声コラージュに近付くわけで、来世紀にドラえもん実機が出る時には、こんな仕組みで喋っているかもしれませんですねん。

  • 視線情報を利用するテレビエージェント

http://www.nhk.or.jp/strl/open2004/tenji/t14.html
 チャンネル争いは、眼力が強い方が勝つんでしょうか?
 …なんて話はさておき、アイカメラ(?)がテレビに標準装備されたら、細かいデータが集められて面白い気がしてます。視聴率ならぬ注目率を、シーンやキャラごとに調査できたり。

  • 多視点撮影システム

http://www.nhk.or.jp/strl/open2004/tenji/t16.html
 こんな手作り感ある仕掛けと知って、なんていうか「やられた」気分になりました。やはり回転は良いものですね。

  • 全方位照明による映像合成システム

http://www.nhk.or.jp/strl/open2004/tenji/t10.html

ドーム状スクリーンの周囲に投影するCG映像の明るさ自体が、全方位からの出演者への照明になります。

 ここ、いまひとつ理解できてません。たとえば「真っ暗」も「真っ黒」も同じ出力になるはずですし、反射光とは別の光源情報も受け取っているのかなあ。

*1:PC-6001mk2が「ありがとうござました」を用意していた頃から。

*2:カブりの無い音声ソース86時間分を用意するまでは手動で、そこから先のインデクス付けは自動とのこと。