システムエンジニアとして最近の大規模言語モデル(LLM)は興味の対象として尽きないです。
最近では、ChatGPTとStable Difffusionを使って絵本を作ってAMAZONで販売するなど試験的な取り組みをしている人も沢山います。
そこまで、独創的な取り組みをしないまでもいろいろと実験してみました。
ツィッターで仲良くしてもらってる、どこいくさんにご協力いただくことにします
今回使用するのは、BARDというGoogleが提供しているAIになります。
試験運転中のサービスなのですが、創造性がChatGPTよりも高い気がします。
実験
Q:どこいくさんて誰?
ちょっと思い付きでTwitterのフォロワーさんを聞いてみたら、面白い答えが返ってきました。
調べてみたら、私のフォロワーさんとは別に同名のプロントンに乗ってあちこち行ってる人が出てきたのですが。フォロワー数が200人くらいの人でした。
Google恐るべしですね。
常に成長するのがAIの特徴です
これ面白いのが学習モデルなので、同じ答えが毎回出ない所にあります。
内部のパラメータが利用者の状況に応じて変化してより正確性を増していきます。
なので、答えが単一でない場合は質問に対しての答えが異なります。
先の質問をしてから、フォロワーさんにブログのネタに使わせて欲しいとお願いしている間に答えが変わってしまっています。
Q:どこいくさんって誰?
A:どこいくさんは、童心社の絵本「むしさん どこいくの?」の登場人物です。てんとうむしさんで、どこに行くのかを聞かれると「どこでも行くよ!」と答えます。
絵本では、てんとうむしさんが歩いて、さまざまな虫に会い、いろいろな場所を訪れます。最後には、また歩き始め、「どこでも行くよ!」と言います。
どこいくさんは、好奇心旺盛で、冒険好きで、自由な虫です。子どもたちに、夢や希望を与えてくれる絵本のキャラクターです。
実際にほんの中身が見ていないので、てんとうむしの名前がどこいくさんかはわからないですが、かなり制度が高まってるのかと思います。
この言語モデルの最大の特徴は、チャットになってるので質問をさらに積み上げる事が出来る事にあります。
Q:夏目漱石風に紹介して
A
どこいくさん、てんとうむしである。この虫は、どこへ行くのかと問われれば、「どこへでも行く」と答える。その言葉通り、どこいくさんは、どこへでも行く。
夏の草原を歩けば、蝶や蜂に出会う。森の中を歩けば、クモやカエルに出会う。山に登れば、リスやウサギに出会う。そして、海に着けば、魚や貝に出会う。
どこいくさんは、好奇心旺盛で、冒険好きだ。世界中を見て回りたいと思っている。そして、その夢を叶えようと、今日も歩き続ける。
どこいくさんは、自由な虫だ。自分の好きなように、どこへでも行ける。そして、その自由を、誰にも邪魔されたくないと思っている。
どこいくさんは、子どもたちに夢と希望を与えてくれる虫だ。子どもたちは、どこいくさんを見て、世界は広いこと、自由であること、そして、自分の夢を叶えることができることを知る。
どこいくさん、てんとうむしである。どこへでも行く、自由な虫である。そして、子どもたちに夢と希望を与えてくれる虫である。
Q 最初に行ったのはどこですか?
A
どこいくさんは、どこへでも行くので、最初に行った場所はどこなのかはわかりません。しかし、絵本の中では、草原、森、山、海など、さまざまな場所を訪れています。
質問を続けてみると、物語が生成されます。
Q 草原に行った話を夏目漱石風に教えて下さい
どこいくさんは、夏の草原を歩いていた。太陽がまぶしく、空気は乾燥していた。どこいくさんは、草の葉の間を飛び跳ねながら、楽しく歩いていた。
すると、目の前に蝶が飛んでいた。どこいくさんは、蝶を追いかけ始めた。蝶は、どこいくさんの方に向かって飛んでくる。どこいくさんは、蝶を追いかけて、草原の中を走った。
蝶は、どんどん速く飛んでいった。どこいくさんも、必死に追いかけた。しかし、蝶は追いつけなかった。蝶は、遠くに飛んで行ってしまった。
どこいくさんは、立ち止まって息を切らした。蝶を追いかけるのは、疲れた。しかし、どこいくさんは、楽しかった。蝶の自由な飛び方を、見ることができた。
どこいくさんは、また歩き始めた。草原の中を、どこまでも歩き続けた。
今の自然言語モデルは夏目漱石風にといった感じの文学者っぽい文章を書くのは得意なジャンルになります。
結局コロケーションの大規模化
ChatGPTや今回のBardは従来の自然言語モデルを大規模化によって生み出されています。(一部情報では45テラバイトとか63テラバイトと言われてる)
自然言語モデルは言葉の並びとか結びつきを確立で持っています。
簡単な例でいえば、「吾輩は」に続く言葉として「猫」は確率高いよねとか「デーモン閣下」が近くに使われる事が多いよねといった事を大量のデータを解析して確率として持っています。
その後もベイズ統計学の要領でパラメータを可変で扱うのが学習になります。
ただ、単純にスケールアップしたところでこんなにはならないのでそこは、とても頭がいい人(私の語彙力。。。)がきっといろいろと研究を重ねている事でしょう。。。
かといって現在のチューリングマシーンである限り、AIと人間が戦争するとか人類が滅ぼされるといった荒唐無稽な話にもならない。はず。。。
ただ、誰でも有名作家風の文章が書けるようにはなりそうです。