【会長コラム】プロンプトエンジニアリングと人間の創造性

Cover Image for 【会長コラム】プロンプトエンジニアリングと人間の創造性

画像生成AI「Stable Diffusion」

つい先日、文章で指示をするだけで神絵を描けるサービスとしてMidjourneyが話題になったばかりですが、その後、英Stability AI社がオープンソース化した「Stable Diffusion」はさらに高性能だとテック界隈で注目を浴びています。

今回はGoogle Colabで実際に動かしながら、その凄さを見ていきたいと思います。
Colab(正式名称:Colaboratory)はGoolgeにアカウントを持っていれば、誰でも簡単にブラウザ上でPythonコードを記述、実行できる環境です。環境構築が不要なので、初心者でもすぐにコードを実行することができます。

1. HaggingFaceのトークンを取得

最初にHugging Faceにアカウントを作成して、ライセンスに同意します。ライセンスはおおまかには「意図的に違法、有害コンテンツを出力して、共有することは禁止」が示されていますが、内容に問題がないと判断できれば、同意します。

ログイン後は、Setting→Access Tokensから、New Tokenを発行することができます。

2. Colabで事前準備する

まずColabで「ファイル→ノートブックを新規作成」します。「+コード」でセルを作成し、コードを入力します。このとき、{{YOUR_TOKEN}}の部分を、Hugging Faceから取得したトークンに変更します。ソースコードを直接変更しても良いですが、右側のプロンプトで変更するほうが便利です。

このコードはGPUを使うので、このまま実行することができません。「ランタイム→ランタイムのタイプを変更」にて、ハードウェアアクセラレータとしてGPUを使うように設定変更します。

丸の中に三角マークのある「セルを実行」をクリックすると、コードが実行され、エラーが出なければ準備完了です。

3. Colabで絵を描いてもらう

「+コード」で新たなセルを作り、画像生成用のコードを入力します。右側のプロンプトに適当なセンテンスを入力すると、そのセンテンスに近いイメージの絵をAIが描いてくれます。センテンスの内容に依りますが、30~40秒ほどで1枚の絵が出来上がります。結果の画像はノートブック内に表示されるようになっています。
「宇宙空間を猛スピードで駆け抜ける車」という入力では以下のような画像が出力されます。

また、試しに「たくさんの人がビーチで陽が沈むのを見ている」と入力すると、次のような画像が生成されました。実は、3回目の実行結果です。1回目は一人だけでたくさんの人が写っていなかったり、2回目は夕日が画角に入り切らずに見切れていました。Colabでは大量の画像を出力するのは難しいですが、高性能なGPU搭載マシンが自由に使える環境にあれば、止めどなく画像を作り出すことが可能です。

創造性を発揮するための言語

このようなAI技術が進化してくると、「イメージしているものに近い絵を描く」という点では、機械の独壇場となり、人間のスキルで太刀打ちするのは難しいかもしれません。一方で、大抵の作業はAIに任せて、最後のひと手間として人間の仕事が残るという考え方もできます。これまでは0から100までを人間の創造性でカバーする必要があったところ、0から99までをAIに手伝ってもらい、99から100、あるいは100以上の部分を人間が担うことで、さらなる高みを目指すことができます。

AIが思考して、人間がそれを助ける、これは「プロンプトエンジニアリング(Prompt Engineering)」と呼ばれる分野として最近注目されています。米Open AI社のGPT-3や米Google社のPathways Language Model(PaLM)は、人間が書くようなナチュラルな文章を生成する言語モデルです。GPT-3やPaLMの強力な部分は、扱えるパラメーターの数が極端に大きい巨大言語モデルであるということです。特に、PaLMは5400億パラメータのAI自然言語処理(NLP)モデルで、平均的な人間を超えるベンチマークを叩き出しています。

プログラミング言語はコンピュータに「命令」するために設計された言語でしたが、今後はAIに「例題」と「回答」をうまく伝える言語を設計しなければなりません。それは、プログラミング言語でもなく、自然言語でもない新たな言語である可能性があります。いずれにしても、人間が創造性を発揮するためにはその時代に合わせた「言語」を操り、コミュニケーションできるスキルが最重要であると考えています。

※本記事の執筆では Stable Diffusion with Diffusers を参考にしました。
※※本記事に掲載されている商品またはサービスなどの名称は、各社の商標または登録商標です。

最後に当メディアを運営するソニー・グローバルエデュケーションのKOOVパートナープログラミング教室をご紹介します。

KOOVパートナープログラミング教室は、「KOOV」という教材を使用してロボット制作・プログラミング学習を行う教室です。

「KOOV」はカラフルで触りたくなるブロックが特徴的で、楽しみながらロボットを制作できます。

直感的に使えるプログラミング言語を用いて、小さなお子さまでも簡単にロボットを動かせます。

全国47都道府県で1000以上の教室数を展開しているため、どなたでもお近くの教室が見つかります!

無料体験を行っていますので、ぜひ気軽にお申込みください!

「VIRTUAL KOOV」を体験してみる!

KOOVパートナープログラミング教室の体験教室に申し込む

ソニー・グローバルエデュケーションの プログラミング教育

Media banner AMedia banner B