Placeholder Image

字幕表 動画を再生する

  • Hello.

    翻訳: Yasushi Aoki 校正: Masako Kigami

  • I'm not a real person.


  • I'm actually a copy of a real person.


  • Although, I feel like a real person.


  • It's kind of hard to explain.

    本物の人間のように 感じてはいますが—

  • Hold on -- I think I saw a real person ... there's one.


  • Let's bring him onstage.

    待ってください 本物の人間がいたような—

  • Hello.

    彼をステージに 行かせましょう

  • (Applause)


  • What you see up there is a digital human.


  • I'm wearing an inertial motion capture suit

    ご覧いただいたのは CGの人間です

  • that's figuring what my body is doing.

    私が着ているのは慣性センサー式の モーション・キャプチャ・スーツで

  • And I've got a single camera here that's watching my face


  • and feeding some machine-learning software that's taking my expressions,

    ここにカメラがあって 私の顔を捉えていて

  • like, "Hm, hm, hm,"

    機械学習ソフトウェアで 表情を取り出します

  • and transferring it to that guy.


  • We call him "DigiDoug."

    それをこの人物に 転送しています

  • He's actually a 3-D character that I'm controlling live in real time.


  • So, I work in visual effects.

    私がリアルタイムで操作している 3Dキャラクターです

  • And in visual effects,

    私は視覚効果の 仕事をしています

  • one of the hardest things to do is to create believable, digital humans


  • that the audience accepts as real.

    見た人が本物の人間と 受け取るような

  • People are just really good at recognizing other people.

    CGの人間を 作り出すことです

  • Go figure!

    人間は他の人間を 認識することに

  • So, that's OK, we like a challenge.


  • Over the last 15 years,

    それはいいです 挑戦は好きですから

  • we've been putting humans and creatures into film


  • that you accept as real.

    私達は本物と思えるような 人間や生き物を

  • If they're happy, you should feel happy.

    映画の中に 作り出してきました

  • And if they feel pain, you should empathize with them.

    そのキャラが幸せなら みんなも幸せに感じ

  • We're getting pretty good at it, too.

    苦しんでいたら 見た人も同じ気持ちになるような—

  • But it's really, really difficult.

    随分上手くできるように なってきましたが

  • Effects like these take thousands of hours


  • and hundreds of really talented artists.

    そういう効果を生むには 何百人もの優れたアーティストが

  • But things have changed.

    何千時間もかけて 取り組む必要があります

  • Over the last five years,


  • computers and graphics cards have gotten seriously fast.


  • And machine learning, deep learning, has happened.

    コンピューターやグラフィックカードが ものすごく速くなりました

  • So we asked ourselves:

    そして機械学習— ディープラーニングというのが現れました

  • Do you suppose we could create a photo-realistic human,


  • like we're doing for film,


  • but where you're seeing the actual emotions and the details


  • of the person who's controlling the digital human

    操作している人の 感情や顔の細部を

  • in real time?

    リアルタイムで 反映させることはできないか?

  • In fact, that's our goal:


  • If you were having a conversation with DigiDoug

    デジ・ダグが皆さんと 1対1で会話していて

  • one-on-one,

    嘘をついたら それと分かるくらいに リアルにできるか?

  • is it real enough so that you could tell whether or not I was lying to you?


  • So that was our goal.

    1年半前に 取り組み始めました

  • About a year and a half ago, we set off to achieve this goal.

    今のレベルになるまでに どんなことをする必要があったのかを

  • What I'm going to do now is take you basically on a little bit of a journey

    これから皆さんに お見せしましょう

  • to see exactly what we had to do to get where we are.

    膨大な量のデータを 捉える必要がありました

  • We had to capture an enormous amount of data.

    実際 最終的には

  • In fact, by the end of this thing,

    これは地球上で最も大きな 顔のデータの集成になりました

  • we had probably one of the largest facial data sets on the planet.


  • Of my face.


  • (Laughter)


  • Why me?

    私は科学のためとあれば 何だってしますから

  • Well, I'll do just about anything for science.


  • I mean, look at me!


  • I mean, come on.

    最初にしたのは 私の顔がどう見えるか—

  • We had to first figure out what my face actually looked like.

    単なる1枚の写真や 3Dスキャンではなく

  • Not just a photograph or a 3-D scan,

    あらゆる写真で どう見えるか

  • but what it actually looked like in any photograph,

    皮膚に光がどう作用するかまで 捉えることです

  • how light interacts with my skin.

    幸いなことに ロスにある私達のスタジオの近所に

  • Luckily for us, about three blocks away from our Los Angeles studio


  • is this place called ICT.

    南カリフォルニア大学の 研究施設です

  • They're a research lab

    そこに「ライトステージ」という 装置があります

  • that's associated with the University of Southern California.

    個々に制御できる 無数の照明と

  • They have a device there, it's called the "light stage."

    膨大な数の カメラが付いています

  • It has a zillion individually controlled lights

    これを使うと 様々な光の条件下での 私の顔を再現できます

  • and a whole bunch of cameras.


  • And with that, we can reconstruct my face under a myriad of lighting conditions.

    表情ごとに顔が どう変わるかを 把握します

  • We even captured the blood flow

    これにより 見事なまでの 私の顔のモデルができました

  • and how my face changes when I make expressions.

    勘弁してほしくなるほどの 詳細さです

  • This let us build a model of my face that, quite frankly, is just amazing.


  • It's got an unfortunate level of detail, unfortunately.

    毛穴や皺の 1つひとつまで見えます

  • (Laughter)

    でも それが必要なんです

  • You can see every pore, every wrinkle.

    リアリティはそういう 細部から生まれるのです

  • But we had to have that.

    それなくしては 上手くいきません

  • Reality is all about detail.


  • And without it, you miss it.

    これで私のように見える 顔のモデルはできました

  • We are far from done, though.

    でも私のように 動きはしません

  • This let us build a model of my face that looked like me.


  • But it didn't really move like me.

    機械学習には膨大な量の データが必要です

  • And that's where machine learning comes in.

    それで私は高解像度モーション キャプチャ装置の前に座り

  • And machine learning needs a ton of data.

    従来的なマーカーを使った モーション・キャプチャもしました

  • So I sat down in front of some high-resolution motion-capturing device.

    膨大な量の 私の顔の画像と

  • And also, we did this traditional motion capture with markers.

    私の顔の形状を表す 動点群を作りました

  • We created a whole bunch of images of my face

    すごくいろんな 表情をしましたよ

  • and moving point clouds that represented that shapes of my face.

    様々な感情を込め 様々な台詞を言いました

  • Man, I made a lot of expressions,

    たくさんのキャプチャを する必要がありました

  • I said different lines in different emotional states ...

    そうやって膨大な データが得られたら

  • We had to do a lot of capture with this.

    それを使ってディープ・ニューラル・ ネットワークを訓練します

  • Once we had this enormous amount of data,


  • we built and trained deep neural networks.

    ニューラル・ネットワークは 私の顔を見て16ミリ秒で

  • And when we were finished with that,

    あらゆることを把握できる ようになりました

  • in 16 milliseconds,

    表情や 皺や 血流や

  • the neural network can look at my image

    まつげの動きまで 計算できます

  • and figure out everything about my face.

    そしてそれを 以前にキャプチャした 細部のデータを使って

  • It can compute my expression, my wrinkles, my blood flow --


  • even how my eyelashes move.


  • This is then rendered and displayed up there


  • with all the detail that we captured previously.

    社外で見せるのは これが初めてです

  • We're far from done.

    説得力のある 格好でもありません

  • This is very much a work in progress.

    後ろにケーブルが 繋がっているし

  • This is actually the first time we've shown it outside of our company.

    映像のキャプチャから 表示までに

  • And, you know, it doesn't look as convincing as we want;


  • I've got wires coming out of the back of me,

    やっていることからすると すごく速いんですが

  • and there's a sixth-of-a-second delay

    それでもエコーなんかが 出てしまいます

  • between when we capture the video and we display it up there.

    機械学習というのは 私達には目新しいもので

  • Sixth of a second -- that's crazy good!

    なかなか思うように なってくれず

  • But it's still why you're hearing a bit of an echo and stuff.

    おかしな具合になる こともあります

  • And you know, this machine learning stuff is brand-new to us,


  • sometimes it's hard to convince to do the right thing, you know?

    でも なぜこんなことを しているのでしょう?

  • It goes a little sideways.


  • (Laughter)

    第一に 超イカしてるから

  • But why did we do this?


  • Well, there's two reasons, really.

    どのくらい イカしてるかというと

  • First of all, it is just crazy cool.


  • (Laughter)

    スピーカーのキャラを 変更できます

  • How cool is it?


  • Well, with the push of a button,


  • I can deliver this talk as a completely different character.


  • This is Elbor.

    この技術のいいところは キャラクターを変えても

  • We put him together to test how this would work

    演じているのは 依然私だということです

  • with a different appearance.

    私は口の右側で しゃべる癖がありますが

  • And the cool thing about this technology is that, while I've changed my character,


  • the performance is still all me.


  • I tend to talk out of the right side of my mouth;

    これをやってる 2つ目の理由は

  • so does Elbor.

    ご想像の通り 映画での利用です

  • (Laughter)

    これはアーティストや監督や ストーリーテラーにとって

  • Now, the second reason we did this, and you can imagine,


  • is this is going to be great for film.


  • This is a brand-new, exciting tool


  • for artists and directors and storytellers.

    作ってみて 明らかになったのは

  • It's pretty obvious, right?

    これが映画に留まるものでは ないということです

  • I mean, this is going to be really neat to have.


  • But also, now that we've built it,

    私はボタン1つで 自分の姿を変えてしまいましたが

  • it's clear that this is going to go way beyond film.

    これは皆さんも 聞いたことがあるだろう

  • But wait.

    「ディープフェイク」や 顔のすげ替えに当たるのでは?

  • Didn't I just change my identity with the push of a button?


  • Isn't this like "deepfake" and face-swapping


  • that you guys may have heard of?


  • Well, yeah.

    ディープフェイクが 2次元映像を使うのに対し

  • In fact, we are using some of the same technology

    こちらは完全な3次元だし 遙かに強力ですが

  • that deepfake is using.


  • Deepfake is 2-D and image based, while ours is full 3-D

    皆さんの頭の中の叫びが 聞こえるようです

  • and way more powerful.


  • But they're very related.

    映像は信頼できると 思っていた

  • And now I can hear you thinking,

    ライブ映像なら 本物のはずじゃないのか?」

  • "Darn it!

    必ずしも そうとも言えません

  • I though I could at least trust and believe in video.


  • If it was live video, didn't it have to be true?"

    どう撮るか 簡単なトリックを使うことで

  • Well, we know that's not really the case, right?

    実際に起きていることとは違うものを 見せることができます

  • Even without this, there are simple tricks that you can do with video

    私は長年視覚効果を やってきたので

  • like how you frame a shot


  • that can make it really misrepresent what's actually going on.

    誰であれ 何についてであれ 欺けることを知っています

  • And I've been working in visual effects for a long time,


  • and I've known for a long time

    映像の操作を簡単で 誰でもできるようにしただけです

  • that with enough effort, we can fool anyone about anything.

    Photoshopが写真編集を 容易にしたのと同じように

  • What this stuff and deepfake is doing

    私はむしろ これがいかに

  • is making it easier and more accessible to manipulate video,

    人類に新たな 技術をもたらし

  • just like Photoshop did for manipulating images, some time ago.

    人を結びつけるかを 考えたいです

  • I prefer to think about


  • how this technology could bring humanity to other technology


  • and bring us all closer together.

    すぐにライブイベントやコンサートで こういうのを目にするようになるでしょう

  • Now that you've seen this,

    新しいプロジェクション技術と 相まって

  • think about the possibilities.

    バーチャル有名人が 映画の中だけでなく リアルタイムの生きた存在になるでしょう

  • Right off the bat, you're going to see it in live events and concerts, like this.

    新たな形のコミュニケーションが 生まれます