AIゼーション vol.4

たまには息抜きということで、ワークショップで取り扱われておりました、「親父ギャグ」生成AIを紹介したいと思います。

ややエンジニアの方向けとなってしまいますが、4ステップで実装可能です(OpenAI社のAPIキー発行に、ミニマム5$かかります。私は少し昔だったからか、10$かかりました)。

https://github.com/Hendrixer/agent-from-scratch

1:上記からクローン

2:yarnコマンドを実行し、package.jsonの中身をインストール

3:.envファイル作成し、OPENAI_API_KEY='sk-xxx'を設定

4:下記コマンドを「ランダムな親父ギャグからミーム画像を作って」というメッセージを英語で添えて実行

yarn start "make me a meme image from a random dad joke"

作成されたのがトップ画像で、「ガイコツ同志はなぜケンカしないのか?それは、ガッツ(腸)がないから」という親父ギャグを見事に生成してくれました。

本当にランダムではありますが、下記サイトにネタのストックがあります。

https://icanhazdadjoke.com/search

啓示としては、自社のQAサイトを作るのに役立つかもしれません。

もちろんランダムではいけませんが、プロンプトメッセージをOpen AI社のAPI経由で渡し、類似のベクトル値を取る用意されたメッセージを返却するという形であれば、応用ができます。

ちなみに画像は、下記のDALL-E 3が担っていますので、DALL-E 3についても紹介させていただきます。

DALL-E 3は、OpenAIが2023年9月にリリースした、ChatGPT内で利用できる画像生成AIです。このツールはテキストプロンプトを入力するだけで高品質な画像を生成できる特徴があり、特にビジネスやクリエイティブの分野で注目されています。

1. DALL-E 3の特徴と料金

DALL-E 3は、ChatGPT有料版で利用できますが、MicrosoftのBing経由であれば無料で試すことも可能です。商用利用についても、ChatGPTで生成した画像はユーザーに著作権があり、販売や転載が可能ですが、Bingで生成した画像は商用利用が不可である点に注意が必要です。

2. DALL-E 3のメリット

DALL-E 3の主なメリットは次の通りです:

  • 初心者でも高品質な画像が作成可能:デザイン知識が不要で、指示を入力するだけでアート画像が完成します。
  • 新しいアイデアが生まれる:AIが独自の解釈を加えることで、固定観念に縛られない斬新なデザインが生まれることもあります。
  • ビジネス利用がしやすい:デザイン承認のプロセスを簡略化でき、迅速なアイデア実現が可能です。

3. Midjourneyとの違い

DALL-E 3とよく比較されるのが「Midjourney」という画像生成AIです。Midjourneyも高品質な画像生成が可能ですが、以下の点でDALL-E 3が優れています:

  • Discordの登録が不要で、使いやすい
  • コマンドの入力が不要で、日本語の指示にも対応
  • 初心者に向いた設計

Midjourneyは水彩画のようなタッチが好きな人や、英語のコマンド入力が苦でない人には適していますが、簡便さではDALL-E 3が勝ります。

4. DALL-E 3の使い方

有料のChatGPTでは、ChatGPTのバージョン4を選択し、作りたい画像の指示を入力するだけです。追加の指示で画像の微調整も簡単にできます。

無料のBingでは、Bing Image CreatorにMicrosoftアカウントでログインし、同様にテキストプロンプトを入力して画像を生成します。

5. DALL-E 3の活用例

DALL-E 3は以下の用途に活用できます:

  • アイディア出し:ロゴや製品デザインの初期アイディアの生成に便利
  • サムネイル作成:SNSや記事のサムネイルとして即利用可能
  • 広告作成:ポスターやバナーのデザイン作成も、AIのサポートで迅速に実現可能

DALL-E 3は、このように初心者でも簡単に画像を生成でき、ビジネスやクリエイティブな活動で幅広く活用できる便利なツールです。

それにしても、古今東西どこの国でも親父は、親父ギャグを言うものなんですね(笑)。

それではまた、ごきげんよう!