初心者エンジニアが生成AI触ってみた③ ~ Amazon Bedrock モデル比較編 ~

だしまき
2024-10-09
2024-10-09

はじめに

寒暖差がつらいです、だしまきです。

今回も生成AI全然分からない人間がBedrock使ってみるぞという事で、
前回モデルアクセス登録した基盤モデルを使って遊んでみようと思います。
前回の記事はこちら

Amazon Bedrockには比較モードとやらがあるらしい

前回も少し触れましたが、Bedrockには他には無い比較モードがあるんですね。
まずはチャットタブを開いて前回モデルアクセスを取得したTitanを呼び出してみます。

画面の右上に比較モードのボタンがあるので押してみます。

2画面に切り替わりました!
右の画面にあるオレンジ色のSelect~~を押して、Titanと同じようにモデルリクエストして承認されたAuthropicのClaude 3.5 Sonnetを呼び出してみます。
モデルリクエストの方法は前回の記事で。

2画面に別の基盤モデルが表示されましたね!
Titanは画像アップロードは対象外ですが、今回はテキストのみなので関係ないですね。
早速質問したいところですが、まず今回使用する2つの基盤モデルを簡単に調べてみました。

TitanText G1 - Express

TitanはAmazonによって開発された生成AI。
Text G1 - Expressは2023年11月にリリースされたモデルでテキスト生成用に特化したモデル。
テキストベースの質問回答、コード生成、要約など幅広い場面で役に立つ。

Claude 3.5 Sonnet

ClaudeはAnthropic社によって開発された生成AI。
Claude 3.5 Sonnetは2024年6月にリリースされた新しいモデルで、
質問回答の他にもコード生成、Webサイトの作成、アニメーションの作成など用途は多い。

ざっとこんな感じかと思います。新しさでいうとClaude 3.5 Sonnetの方が新しいですが、TitanもAmazonの25年の経験の元生まれたモデルなので比べるのが楽しみになってきました、早速やってみます!

 

比べてみよう

今回はシンプルな質問で、「自己紹介をお願いしてみます」

Claudeは自分の紹介をしてくれたのに対して、Titanは就活の自己紹介テンプレのようなものを出してくれましたね。文頭に『あなたの』を付けるとどう変化するのか見てみます。

Claudeは変わらず自分の自己紹介をしてくれました、自己紹介の内容も少し変わってますね。
対してTitan君は挨拶botになってしまった・・・
右上の設定で温度の設定というものがあるのですが、温度が高ければ高いほどランダムなレスポンスが多くなるという公式の記載がありましたので、設定で両者共に温度を共通の0.5に変更して再度実行してみます。
(ついでに応答の長さも2048⇒300にして先程のように上限まで行ってもレスポンスが速くなるようにしてみました。)

Titan君はちょっと怪しいですがそれでも先程とは内容もそれっぽくなって繰り返すことは無くなりましたね。Claude君は安定してますね、自己紹介のバリエーションが凄い。

簡単な計算の問題も出してみましたが、Titan君は圧倒的な速さで答えのみを回答してくれたのに対して、Claude君は途中の計算式や掛け算も出来るよと教えてくれました。

まだまだ少し触ったばかりなのでこれで断定は出来ませんが、それぞれの個性が出ていて面白かったです。Titanは日本語にまだ慣れきっていない感じがしたのでもう少し慣れてくれば安定感も出てくるのではないかと勝手に思っております。勝手に。

今回初めて触ってみたのですが、Claudeの回答の正確性や安定感には正直驚きました。
Claudeは最初に紹介した通り他にもできることが多いようなので次回はClaude回にしてみたいなと思っております!

ここまで読んでいただきありがとうございます。
それではまた次回でお会いしましょう!