画像解析からコード生成まで、Google Bardの新機能がすごい!

Googleの新しいAIシステムであるBardには、画像解析やコード生成など、生産性を大きく向上させる新機能が加わりましたのでご紹介します。
1. Bardの画像解析機能
Bardに画像をアップロードするだけで、グラフのデータ推移、問題の解法、イラストや写真の内容など、画像の内容をテキストで説明してくれるようになりました。完璧とは言えないものの、ある程度の画像内容理解が可能になったのは驚きです。
例えば、グラフの画像であれば、データの推移だけでなく、トレンドや要因なども説明できます。例えば、ある国の経済成長率の推移を示すグラフであれば、経済成長率が右肩上がりであることを説明するだけでなく、その要因として、輸出の拡大や内需の拡大などが挙げられる可能性があると説明できます。
下のサンプルグラフを入力して、「このグラフを解析して下さい」と入力したところ、下記のような答えが帰ってきました。

送信されたグラフは、2015年から2025年までの5年間にわたる、日本国内の訪日外国人数の推移を示しています。横軸は年、縦軸は訪日外国人数(万人)です。
グラフを見ると、2015年から2019年までは、訪日外国人数は年々増加し、2019年には3188万人に達しました。しかし、2020年には新型コロナウイルス感染症の流行により、訪日外国人数は前年比88.8%減の376万人にまで減少しました。2021年も前年比57.7%減の198万人にまで減少しましたが、2022年には前年比113.5%増の346万人にまで回復しました。2023年は前年比12.3%増の386万人と、さらに増加しています。
2019年までの増加の背景には、日本政府の訪日外国人観光客受け入れ拡大政策や、円安による訪日観光の魅力の高まりなどが挙げられます。2020年の減少は、新型コロナウイルス感染症の流行による国境閉鎖などの影響によるものです。2021年以降の回復は、新型コロナウイルス感染症の流行が収束に向かったことや、日本政府の訪日外国人観光客受け入れ再開に向けた取り組みなどが要因と考えられます。
明らかに間違った回答が出てきました。プロンプトの改善などが必要ですね。
また、問題の画像であれば、解法だけでなく、問題の意味や意図なども説明できます。例えば、ある数学の証明の画像であれば、証明のステップを説明するだけでなく、その証明の意味や、証明することによってどのようなことが分かるのかを説明できます。
下の問題を解いて下さい。と入力してみました。

問題文:
右の図で、長方形ABCDの辺BCの中点をE、AEとBDの交点をG、DEとACの交点をH、AC と BDの交点をFとする。また、BDA=30°、∠BDE=20°であるとき、
∠x と ∠y の大きさをそれぞれ求めなさい。
解答:
∠x は、∠BDE と ∠FGH の和である。
∠FGH は、∠AGD の二等分角である。
∠AGD は、長方形の内部対角線と対角線の交点の角度であるので、180° - 30° - 90° = 60°である。
したがって、∠x = 20° + 60° = 80° である。
∠y は、∠BGH と ∠GHD の和である。
∠BGH は、∠FGH の二等分角であるので、∠FGH / 2 = 30° / 2 = 15° である。
∠GHD は、長方形の内部対角線と対角線の交点の角度であるので、180° - 90° - 30° = 60°である。
したがって、∠y = 15° + 60° = 75° である。
よって、答えは、
∠x = 80°
∠y = 75°
である。
解答の解説:
∠x を求めるために、まず ∠FGH を求める必要がある。∠FGH は、∠AGD の二等分角であるので、∠AGD / 2 = 60° / 2 = 30° である。
∠y を求めるために、まず ∠BGH を求める必要がある。∠BGH は、∠FGH の二等分角であるので、∠FGH / 2 = 30° / 2 = 15° である。
最後に、∠y = 15° + 60° = 75° となる。
思いっきり間違えています。この問題は難しかったようです。
このように、Bardの画像解析機能は、画像の種類や内容に応じて、さまざまな情報を提供することができます。ただし、画像の解像度が低い場合や、画像にノイズが多い場合など、解析が難しいケースもあります。また、画像の意味や意図を正確に理解するためには、画像の背景知識や文脈なども必要になるため、画像解析機能の精度を向上させるためには、画像認識技術の進歩だけでなく、画像の意味や意図を理解するための技術の進歩も必要になります。
2. Bardのコード生成機能
Bardに、Pythonで特定のプログラムを作成するよう指示すると、その通りのPythonコードを生成してくれるようになりました。生成したコードは、リプリにエクスポートしてすぐに実行できるので、AIが正しいコードを書けたかどうか検証しやすくなります。コードの自動生成は大変便利な機能です。
例えば、コードを生成するように指示すると、以下のように生成されます。
Python
def hello_world():
print("Hello, world!")
hello_world()
このコードは、hello_world()
という関数を定義し、その関数内で「Hello, world!」と出力するものです。
また、Bardは、Pythonのほかにも、Java、C++、JavaScript、Go、Rustなど、20を超える主要なプログラミング言語に対応しています。
このように、Bardのコード生成機能は、プログラミングの初心者や、複雑なコードを効率的に作成したいプログラマーにとって、大変便利な機能です。
3. その他の新機能
Bardには他にも、文章のトーン変更、チャットの共有リンク作成、音声読み上げなど、様々な新機能が追加されています。機能面で格段に進化したと言えます。
文章のトーン変更
Bardに文章を入力すると、その文章のトーンを変更することができます。例えば、丁寧な文章をくだけた文章にしたり、逆にくだけた文章を丁寧な文章にしたりすることができます。
例えば、以下のような文章を入力すると、以下のようになります。
丁寧な文章:
株式会社〇〇の〇〇部〇〇課の〇〇です。
くだけた文章:
〇〇会社の〇〇部で〇〇やってます。
チャットの共有リンク作成
Bardのチャットを他の人と共有することができます。共有リンクを生成すると、そのリンクをクリックすることで、誰でもそのチャットに参加することができます。
例えば、以下のようになります。
共有リンク:https://bard.com/chat/123456
音声読み上げ
Bardが生成したテキストを音声で読み上げることができます。音声の速度や音量を調整することもできます。
例えば、以下のようになります。
音声読み上げ:
「株式会社〇〇の〇〇部〇〇課の〇〇です。」
まとめ
GoogleのBardには、画像解析やコード生成など、非常に便利な新機能が多数追加されました。完全には信用できない部分もあるので注意が必要ですが、これらの機能を上手に活用すれば、生産性を大きく向上できそうです。AIが持つ能力の高さには驚かされます。今後もBardの進化に期待したいと思います。