Placeholder Image

字幕表 動画を再生する

AI 自動生成字幕
  • Elon Musk and his ex-AI startup have built the largest and most powerful artificial intelligence training supercomputer in the world.

    イーロン・マスクと彼の元AIスタートアップは、世界最大かつ最も強力な人工知能トレーニング用スーパーコンピューターを構築した。

  • Elon has named this beast Colossus.

    イーロンはこの獣をコロッサスと名付けた。

  • It is equipped with the latest Nvidia GPU hardware, it's liquid-cooled with vast amounts of water, and is powered by giant Tesla Megapack batteries.

    最新のNvidia GPUハードウェアを搭載し、大量の水で液冷され、巨大なテスラメガパックバッテリーで駆動する。

  • Elon believes that all of this combined will create the world's most artificial intelligence, one that will literally solve the mysteries of the universe.

    イーロンは、これらすべてを組み合わせることで、文字通り宇宙の謎を解き明かす、世界最高の人工知能が誕生すると考えている。

  • And what we see today is only the beginning.

    そして、今日私たちが目にしたものは、ほんの始まりに過ぎない。

  • This is what's inside Colossus.

    これがコロッサスの中身だ。

  • The location is Memphis, Tennessee, in an industrial park southwest of the city center, on the bank of the mighty Mississippi River.

    場所はテネシー州メンフィス、市の中心部から南西にある工業団地で、大河ミシシッピ川のほとりにある。

  • The building itself wasn't constructed by ex-AI, it was previously home to Electrolux, which is a Swedish appliance manufacturer.

    このビル自体は元AIが建設したものではなく、以前はスウェーデンの家電メーカーであるエレクトロラックスが入居していた。

  • So, if you've been wondering why Elon chose Memphis and not Austin, it basically just comes down to finding the right building in the right location to get this thing up and running as fast as possible.

    では、なぜイーロンはオースティンではなくメンフィスを選んだのかというと、基本的には、これをできるだけ早く立ち上げ、稼働させるために、適切な場所に適切なビルを見つけたということに尽きる。

  • Now, as unassuming as the exterior of Colossus might be, it's what's inside that counts.

    さて、コロッサスの外観は地味かもしれないが、重要なのは中身である。

  • And inside is the largest AI training cluster in the world.

    そしてその内部には、世界最大のAIトレーニングクラスターがある。

  • Currently, over 100,000 Nvidia HGX H100 GPUs connected with exabytes of data storage over a super fast network.

    現在、10万台以上のNvidia HGX H100 GPUが超高速ネットワークでエクサバイトのデータストレージと接続されている。

  • Nvidia CEO Jensen Huang has said himself that Colossus is quote, easily the fastest supercomputer on the planet.

    Nvidiaのジェンセン・フアン最高経営責任者(CEO)は、「コロッサス」は地球上で最速のスーパーコンピューターであると自ら語っている。

  • And it was all built to power Grok, an AI model that Elon Musk and ex-AI will evolve into something far more capable than a simple chatbot.

    そしてそれはすべて、イーロン・マスクと元AIが単なるチャットボットよりもはるかに高性能なものに進化させるであろうAIモデル、Grokを動かすために構築された。

  • This is the breeding ground for artificial super intelligence.

    これは人工超知能の温床となる。

  • The entire facility as we see it was built in just 122 days.

    この施設は、わずか122日間で完成した。

  • That is insane.

    正気の沙汰じゃない。

  • A more traditional supercomputer cluster would have just one half to one quarter the amount of GPUs as Colossus, but the construction of those traditional systems would take years from start to finish.

    より伝統的なスーパーコンピューター・クラスターは、コロッサスの2分の1から4分の1のGPUしか持たないだろうが、そのような伝統的なシステムの構築には、最初から最後まで何年もかかるだろう。

  • The training work happens in an area called the data hall.

    トレーニングはデータホールと呼ばれるエリアで行われる。

  • XAI uses a configuration known as the raised floor data hall, which splits the system into three levels.

    XAIは、システムを3つのレベルに分割するレイズド・フロア・データホールと呼ばれる構成を採用している。

  • Above is the power, below is the cooling, and in the middle is the GPU cluster.

    上が電源、下が冷却、真ん中がGPUクラスタ。

  • There are four data halls inside Colossus, each with 25,000 GPUs plus storage and the fiber optic network that ties it all together.

    コロッサスの内部には4つのデータホールがあり、それぞれに2万5000個のGPUとストレージ、そしてすべてをつなぐ光ファイバーネットワークがある。

  • Colossus uses water for liquid cooling.

    コロッサスは液体冷却に水を使用する。

  • Below the GPU cluster is a network of giant pipes that move vast amounts of water in and out of the facility.

    GPUクラスターの下には、大量の水を出し入れする巨大なパイプのネットワークがある。

  • Hot water from the server is sent outside to a chiller, which lowers the temperature of the water by a few degrees before pumping it back in.

    サーバーから出た温水は外のチラーに送られ、数度温度を下げてから再びポンプで送り込まれる。

  • This doesn't necessarily need to be cold water though.

    必ずしも冷水である必要はない。

  • Without getting too deep into thermodynamics, just remember that energy always travels from hot to cold.

    熱力学をあまり深く考えずに、エネルギーは常に熱いものから冷たいものへと移動することを覚えておいてほしい。

  • So as long as the temperature of the water is lower than the working GPUs, which get pretty hot, then the excess heat energy will be drawn into the water as it flows past and heat will be removed from the system.

    つまり、水の温度がかなり高温になるGPUよりも低い限り、余分な熱エネルギーは水が流れる際に水に取り込まれ、システムから熱が取り除かれる。

  • Here is what those GPU racks look like.

    GPUラックはこんな感じだ。

  • Each tray is loaded with 8 NVIDIA H100 GPUs, the current state-of-the-art chip for AI training.

    各トレイには、現在のAIトレーニング用最先端チップであるNVIDIA H100 GPUが8個搭載されている。

  • That will change in a relatively short amount of time and Elon already has plans to upgrade Colossus to the NVIDIA B200 chip when that becomes widely available, but for right now, there's no time to waste.

    イーロンはすでに、コロッサスをNVIDIA B200チップにアップグレードする計画を持っている。

  • There are 8 of these racks built into one cabinet with a total of 64 GPU chips and 16 CPU chips in every vertical stack.

    これらのラックが1つのキャビネットに8つ組み込まれており、垂直スタックごとに合計64個のGPUチップと16個のCPUチップが搭載されている。

  • Each of the racks has its own independent water cooling system, with these small tubes that lead directly into the GPU housing, blue tubes for cold water delivery and red tubes for hot water extraction.

    各ラックには独立した水冷システムがあり、GPU筐体に直接つながる青いチューブが冷水供給用、赤いチューブが温水抽出用となっている。

  • The beauty of these GPU racks built for XAI by Supermicro is that each one can be pulled individually for maintenance and it's serviceable on the tray.

    SupermicroがXAIのために構築したこれらのGPUラックの優れた点は、メンテナンスのために1つ1つを個別に引き抜くことができ、トレイ上で修理可能であることです。

  • That means the entire cabinet doesn't need to be shut down and disassembled just to replace one chip.

    つまり、1つのチップを交換するために、キャビネット全体をシャットダウンして分解する必要がないのだ。

  • The technician can simply pull the rack, perform the service right there on the tray and then slide it back in and get back to training.

    技術者は単にラックを引き出し、トレイの上でサービスを実行し、それをスライドさせてトレーニングに戻ることができる。

  • This is unique in the AI industry.

    これはAI業界ではユニークなことだ。

  • Only XAI has a setup like this and it will allow them to keep their downtime to an absolute minimum.

    XAIだけがこのようなセットアップを持っており、ダウンタイムを最小限に抑えることができる。

  • The same is true for the water system.

    水道も同様だ。

  • Each cabinet has its own cooling management unit at the base that's responsible for monitoring flow rate and temperature with an individual water pump that can easily be removed and serviced.

    各キャビネットの底部には、流量と温度を監視する冷却管理ユニットがあり、個々の水ポンプは簡単に取り外して点検できる。

  • Now, the thing to keep in mind about gigantic computer systems like this is that things will break.

    さて、このような巨大なコンピューターシステムで注意しなければならないのは、物事は必ず壊れるということだ。

  • There's no way to avoid that, but having a plan to keep failures localized and problems solved as fast as possible, that is going to make an incredible difference in the overall productivity of the cluster.

    それを避ける方法はないが、障害を局所化し、問題を可能な限り迅速に解決する計画を持つことは、クラスタ全体の生産性に驚くほどの違いをもたらすだろう。

  • On the back of each cabinet is a rear door heat exchanger that's basically just a really big fan that pulls air through the rack and facilitates the heat transfer from the hot chips to the cool water.

    各キャビネットの背面にはリアドア式熱交換器があり、基本的には大きなファンでラック内の空気を吸い上げ、熱いチップから冷たい水への熱移動を促進する。

  • This replaces giant air conditioning units that are found in typical data centers and again keeps each of the racks self-contained.

    これは、一般的なデータセンターに見られる巨大な空調ユニットに代わるもので、やはり各ラックを自己完結型に保つ。

  • Every fan is glowing with a colored light.

    どの扇風機も色とりどりの光を放っている。

  • That's not for aesthetics.

    それは美学のためではない。

  • It's a way for technicians to quickly identify failures.

    技術者が故障を素早く特定するための方法だ。

  • A healthy fan will have a blue light while a bad fan will switch to a red light and then they just replace those individual units as they go down.

    健康なファンには青いランプが点灯し、悪いファンには赤いランプが点灯する。

  • While GPU chips do the heavy lifting for AI training, CPU chips are used for preparing the data and running the operating system.

    GPUチップがAIのトレーニングで力仕事をする一方で、CPUチップはデータの準備とオペレーティングシステムの実行に使われる。

  • There are two CPUs for every eight GPUs.

    GPU8個に対してCPUは2個。

  • All of the data used to train Grok is held in a hard drive storage system.

    Grokのトレーニングに使用されるデータはすべて、ハードドライブ・ストレージ・システムに保存されている。

  • Exabytes of text, images, and video that are fed into the training cluster.

    訓練クラスタに投入される数エクサバイトのテキスト、画像、ビデオ。

  • One exabyte is a billion gigabytes and all of that data is handled by a super high-speed network system.

    1エクサバイトは10億ギガバイトで、そのデータはすべて超高速ネットワークシステムで処理される。

  • Data is moved around Colossus by Ethernet, but this is not anything like your home network.

    データはイーサネットでコロッサスの中を移動するが、これは家庭のネットワークとは違う。

  • The XAI network is powered by NVIDIA BlueField 3 DPUs.

    XAIネットワークはNVIDIA BlueField 3 DPUを搭載している。

  • That's a data processing unit and these chips can handle 400 gigabits per second through a network of fiber optic cables.

    これはデータ処理ユニットで、これらのチップは光ファイバーケーブルのネットワークを通じて毎秒400ギガビットを処理できる。

  • That's around 400 times faster than a very fast home internet connection.

    これは自宅の超高速インターネット接続の約400倍の速さだ。

  • The Ethernet is necessary for scaling beyond the size of a traditional supercomputer system.

    イーサネットは、従来のスーパーコンピューター・システムの規模を超えて拡張するために必要だ。

  • See AI training requires a massive amount of storage that needs to be accessible by every server in the data center.

    AIのトレーニングには大量のストレージが必要で、データセンター内のすべてのサーバーからアクセスできる必要がある。

  • Now, this massive amount of equipment requires an equally massive amount of power.

    さて、この大量の設備には、同様に大量の電力が必要だ。

  • And again, XAI has done something totally unique with their energy delivery.

    そしてまた、XAIはエネルギー供給でまったくユニークなことをやってのけた。

  • They are using Tesla Energy.

    彼らはテスラ・エナジーを使っている。

  • Colossus doesn't use solar energy.

    コロッサスは太陽エネルギーを使わない。

  • It's draining power from traditional generators.

    従来の発電機から電力を奪っている。

  • But there was a problem that XAI encountered when they started to bring their 100,000 GPU system online.

    しかし、XAIが10万GPUのシステムをオンライン化する際に、ある問題が発生した。

  • The tiny millisecond variations in power coming from the grid would create inconsistencies in the training process.

    送電網から送られてくる電力のミリ秒単位のわずかな変動は、トレーニングプロセスに矛盾を生じさせる。

  • We are talking very small fluctuations, but at this giant scale, those will add up quickly.

    私たちが話しているのはごく小さな変動だが、この巨大なスケールでは、それがすぐに積み重なる。

  • So the solution was to bring in Tesla Megapack battery units.

    そこで、テスラのメガパックバッテリーユニットを導入することになった。

  • So what they do now is pipe input power from the grid into the Megapacks, then the batteries discharged directly into the training cluster.

    つまり、送電網からの電力をメガパックに送り込み、バッテリーが直接トレーニングクラスターに放電するのだ。

  • This provides the super consistent direct energy required for the entire network to have the most efficient training session that is physically possible.

    これにより、ネットワーク全体が物理的に可能な限り最も効率的なトレーニングセッションを行うために必要な、超一貫した直接エネルギーが供給される。

  • This unique energy upgrade will become even more critical when XAI doubles the size of Colossus to over 200,000 H100 GPUs, something that Elon claims will happen within the next two months.

    このユニークなエネルギーアップグレードは、XAIがコロッサスのH100 GPUのサイズを20万個以上に倍増させたときに、さらに重要になる。

  • That is an insane rate of growth, and it's got the established AI giant scared.

    これは非常識な成長率であり、既存の巨大AIを怯えさせている。

  • There have been reports that OpenAI CEO Sam Altman has already told Microsoft executives that he's concerned Elon will soon overtake them in access to computing power.

    OpenAIのCEOであるサム・アルトマンはすでにマイクロソフトの幹部に、イーロンがコンピューティング・パワーへのアクセスですぐに追い抜かれることを懸念していると話しているという報道もある。

  • Of course, this stuff ain't cheap.

    もちろん、これは安いものではない。

  • It was just a few months ago that XAI raised $6 billion in venture capital funding, bringing the one-year-old company to a valuation of $24 billion.

    XAIがベンチャーキャピタルから60億ドルの資金を調達し、創業1年の会社の評価額が240億ドルに達したのは、つい数カ月前のことだ。

  • That's a lot of money for a young company that only had one basic product on the market at the time.

    当時、基本的な製品を1つしか市場に出していなかった若い会社にとっては大金だ。

  • But they did have the richest man in the world at the controls, so obviously that counts for a lot.

    しかし、世界一の大富豪が指揮を執っていたのだから、そのことが大きな意味を持つのは明らかだ。

  • Now, we've just seen reports from the Wall Street Journal that Elon is already looking for a lot more money, enough to bring the value of XAI to $40 billion.

    ウォール・ストリート・ジャーナル』紙の報道によれば、イーロンはXAIの価値を400億ドル(約4兆8000億円)にするのに十分な、さらなる巨額の資金を求めているという。

  • For a sense of scale, the industry giant OpenAI is currently valued at $157 billion.

    規模の大きさを示すために、業界の巨人であるOpenAIの現在の評価額は1570億ドルである。

  • While a smaller-scale operation like Perplexity, who makes a highly regarded AI search tool, they're expected to soon hit a valuation of $8 billion.

    AI検索ツールで高い評価を得ているPerplexityのような小規模事業者が、間もなく80億ドルの評価額を叩き出すと予想されている。

  • As for Grok, the AI chatbot is continuing to rapidly evolve thanks to new power provided by Just recently, Grok was upgraded to include vision capabilities, meaning that the AI can analyze and comprehend input from images alongside its existing text functions.

    Grokに関しては、Grokが提供する新しいパワーのおかげで、このAIチャットボットは急速に進化し続けている。 つい最近、Grokは視覚機能を含むようにアップグレードされた。

  • This new feature is integrated into the X social media platform for premium users.

    この新機能は、プレミアム・ユーザー向けのXソーシャルメディア・プラットフォームに統合されている。

  • Now when you see an image in a post, you can click a button to send that image to Grok, where you can now ask the AI any question you want about the content of that image.

    投稿に画像が表示されたら、ボタンをクリックしてその画像をGrokに送信し、画像の内容についてAIに質問することができる。

  • Grok can analyze or provide additional context.

    Grokは分析したり、追加のコンテキストを提供したりすることができる。

  • This is an important step for XAI on their path towards achieving artificial general intelligence.

    これはXAIにとって、人工知能の実現に向けた重要な一歩である。

  • That's a big buzz term right now, it basically just means an AI that can do pretty much anything.

    これは現在大きな話題となっている用語で、基本的にはほとんど何でもできるAIを意味する。

  • Essentially, an artificial reproduction of the human mind and its incredible versatility.

    基本的には、人間の精神とその驚くべき多用途性を人工的に再現したものである。

  • We can write words, we can make music, we can solve complex problems, invent new things.

    私たちは言葉を書き、音楽を奏で、複雑な問題を解決し、新しいものを発明することができる。

  • In theory, an artificial general intelligence would have all of the knowledge of the entire human race all concentrated into one super powerful computer brain, making it infinitely smarter than any human being.

    理論的には、人工的な一般知能は、全人類の知識をすべて1つの超強力なコンピューターの頭脳に集約し、どんな人間よりも無限に賢くなる。

  • Then the AGI can use that knowledge to learn even more, to discover the undiscoverable, solve the unsolvable, invent the uninventable.

    そしてAGIはその知識を使ってさらに学び、発見不可能なものを発見し、解決不可能なものを解決し、発明不可能なものを発明することができる。

  • According to Elon Musk, this is how we unlock the mysteries of the universe and the very nature of our own existence.

    イーロン・マスクによれば、これこそが宇宙の謎と我々自身の存在の本質を解き明かす方法だという。

  • Or the AI will go rogue and kill us all.

    あるいは、AIが暴走して我々を皆殺しにするかだ。

  • But that's where Neuralink comes in, which is a whole other video that we've already made, make sure you check one of those out next.

    しかし、そこでNeuralinkの出番となる。Neuralinkについては、すでに別のビデオで紹介しているので、次はそちらをご覧いただきたい。

Elon Musk and his ex-AI startup have built the largest and most powerful artificial intelligence training supercomputer in the world.

イーロン・マスクと彼の元AIスタートアップは、世界最大かつ最も強力な人工知能トレーニング用スーパーコンピューターを構築した。

字幕と単語
AI 自動生成字幕

ワンタップで英和辞典検索 単語をクリックすると、意味が表示されます

B1 中級 日本語

イーロン・マスクのスーパーコンピューター「コロッサス」の内部! (Inside Elon Musk's Colossus Supercomputer!)

  • 11 2
    Adam Lin に公開 2024 年 11 月 29 日
動画の中の単語