字幕表 動画を再生する AI 自動生成字幕 字幕スクリプトをプリント 翻訳字幕をプリント 英語字幕をプリント So the example I'm going to try out is almost a code-cracking of a badly corrupted Korean sentence. というわけで、私が試そうとする例は、ひどい韓国語の文章をほとんど暗号解読したものだ。 So here I pasted in the prompt, and I'm asking the model to translate this badly corrupted Korean sentence to English. そこで、ここにプロンプトを貼り付けて、このひどく壊れた韓国語の文章を英語に翻訳するようモデルに頼んでいる。 And as you can see, this is not an invalid Korean sentence. そしておわかりのように、これは無効な韓国文ではない。 So let's start with the existing model, GPT-40, and see how it does. では、まず既存モデルのGPT-40から見てみよう。 The model is just not able to understand this text, which is a valid response because this is not a valid language. このモデルはこの文章を理解することができない。 So what's happening here? では、ここで何が起きているのか? So Korean is an interesting language in that when we form a character, we can combine vowels and consonants, sometimes put the consonant at the bottom, and so on. だから韓国語は、文字を作るときに母音と子音を組み合わせたり、子音を下に置いたり、いろいろできる面白い言語なんだ。 One way to corrupt this character is to add in some extra unnecessary consonants to it. この字を崩す一つの方法は、余計な子音を付け加えることだ。 And that combination is so unnatural to native speakers, so they can just, when they see it, just automatically undo that change and understand the text. この組み合わせは、ネイティブ・スピーカーにとってはとても不自然なもので、それを見たネイティブ・スピーカーは、自動的にその変更を取り消し、テキストを理解することができる。 So this is character-level corruption. つまり、これはキャラクターレベルの腐敗なのだ。 We can do that at the phrase level, we can also do that at the sound level, and so on. フレーズのレベルでもできるし、音のレベルでもできる。 People have come up with various methods like this, and I found it really interesting, so I adopted a few of them to create this example. 人々はこのような様々な方法を考え出し、私はそれがとても興味深かったので、この例を作るためにそのうちのいくつかを採用した。 So if you understand Korean, this part that I'm highlighting now, you can read it off as a I'm not going to read off the whole thing, but this is the idea. だから、もしあなたが韓国語を理解しているなら、今私が強調しているこの部分を読み上げることができる。 全部を読み上げるつもりはないが、これがその考え方だ。 Koreans can read it, but the models find it so difficult to understand. 韓国人は読むことができるが、モデルには理解するのが難しい。 So now let's go on to our new model, O1 Preview, and see if reasoning can help solve this problem. それでは、新しいモデル、O1プレビューに進み、推論がこの問題を解決できるかどうかを見てみよう。 So I typed in the same thing. だから私も同じことを入力した。 Unlike GPT-4.0, this model starts thinking through this problem before outputting the answer. GPT-4.0とは異なり、このモデルは答えを出力する前にこの問題を考え始める。 So it's decoding the garbled text. つまり、文字化けしたテキストを解読しているのだ。 So that's actually the right approach, because I gave a translation task, but the underlying task is actually decoding this problem. というのも、翻訳タスクを与えたが、その根底にあるタスクは実はこの問題を解読することだからだ。 So it started off with the right path, and then I'm examining this text, deciphering the text. だから、最初は正しい道を歩んで、それからこの文章を調べて、文章を解読しているんだ。 Deciphering is actually the right verb to use here, enhancing the translation. 実はここで使うべき動詞は「解読」であり、訳語を強化する。 And then actually, it starts unpacking some part of it. そして実際に、その一部を解き始める。 So here, and so on. だから、ここでもそうだ。 This is already a decrypted part of this. これはすでに解読された部分だ。 And then once the model figures it out, that part, everything else is just easy enough. モデルがそれを理解すれば、他のことは簡単なんだ。 So it does the other sentence too. だから他の文章もそうなんだ。 And so let's close this thought. そして、この考えを閉じよう。 So it thought for 15 seconds. そう15秒間考えた。 The final translation, the model output is, No translator on earth can do this, but Koreans can easily recognize it. 最終的な翻訳、モデル出力は、地球上のどんな翻訳者にもできないが、韓国人には簡単にわかる。 There's a method of encrypting Hangul by inputting various transformations of vowels and consonants. 母音と子音をさまざまに変換して入力することで、ハングルを暗号化する方法がある。 It creates a way to make it look different on the surface. 表面上は違うように見せる方法を生み出すのだ。 It can even confuse AI models. AIモデルを混乱させることさえある。 I think this is a perfect translation of the sentence. これは完璧な訳文だと思う。 So this illustrates how general purpose reasoning models like O1 Preview can help seemingly unrelated questions like this, which is almost like a code cracking. つまりこれは、O1プレビューのような汎用推論モデルが、このような一見無関係に見える問題にいかに役立つかを示すものであり、ほとんど暗号解読のようなものである。 So I hope this illustrates how reasoning can be a powerful tool for solving your problems. 推論が問題を解決するための強力なツールになりうることを、これでご理解いただけたと思う。
B1 中級 日本語 米 解読 モデル 韓国 子音 文章 翻訳 OpenAIによる韓国語暗号 o1 (Korean Cipher with OpenAI o1) 4 0 fpl98466 に公開 2024 年 09 月 21 日 シェア シェア 保存 報告 動画の中の単語