最近、ChatGPTの影響で人工知能がちょっとしたブームになっていますよね。
なんとなくマスコミの煽りが酷いのですがどうなんでしょうね。
なんとなく理解してないまま記事を書いているような気がします。
まぁマスコミなんて表面の上澄を掬い取ってなんと書く文章書いているので仕方ないのかもしれないです。・・・マスコミ嫌いバイアスかかっています(笑)
ゆるゆるっとChatGPTについて書いてみます。
ChatGPTの様な人工知能を大規模言語モデルなんて言い方をしていて、言語獲得は人工知能の一つのテーマになっています。
大規模言語モデルは昔から研究していた自然言語処理のデータを大規模化したものといった感じで考えれば良いと思います。
小規模な自然言語処理は私でも作れるのですが、プログラム世界も大規模化したらそれ応じた技術が必要になります。
言ってみたら、一軒家を建てる技術とマンションを建てる技術の違いといったところでしょうか。
似た様なところは多々ありますが、そのノウハウは異なってる感じです。
そのノウハウに関しては外部からはわからないのですが、基本的なところは共通しているのでちょっと書いてみようと思います。
そうしたら、一部マスコミが煽る様な状況にはならない事が伝わると信じています(笑)
今のAIは確率で考えている。
すごい雑に説明すると、今の人工知能は大量のデータを流し込んで、そのデータを元に確率で判断しています。
よくパソコンは1と0で作られてるなんて言いますが、完全一致しないとOKと出来ない仕組みになっています。融通が効かないんです。
例えば猫が写り込んでいる写真から猫を抽出するのに、ドットレベルで同じ写真でないと猫と判断できないです。
それを解決するために、これは猫の写真だよ、って猫が写り込んでいる写真を大量に流しこんで猫を覚えさせるって事をしたのが今のAIの仕組みになっています。
ところでなぜ猫か?
元となる論文がこちらになるのですが、ここでも研究に猫の画像を使っているからですね。
きっと猫は万物の創造主なのでしょう。
ちなみに猫がいかに優秀かはこの本を読んで是非とも学んでいただきたい。
私が定期購読している良書です。
ChatGPTに話を戻そう
ChatGPTから話がそれてしまったのですが、ChatGPTつまり自然言語処理も画像から猫を抽出するように確率で考えられています。
例えば、「吾輩はに続く言葉は何?」って聞いたら人類の9割9部の人は「猫である」そして1部の人が「デーモン閣下である」と答えるのではないかと思います。
つまり人類は猫が好き。。。。というのは冗談で、言葉には親和性が高い言葉があります。
コロケーションなんて言い方もするのですが、文学だけでなく日常会話のなかでも相性の良い言葉の組み合わせってありますよね。
自然言語処理は大量のデータを流しこんでその相性の良いを確率で覚え込ませます。
私が以前に作った時は、ニュースサイトをスクレイピングして大量の文章を流し込んで言語モデルを作ってみましたが、まぁ自然な文章を作るには至りませんでした。
目標はサラリーマン川柳を作るだったのです色々と課題が多くて難しかったです。
この話は別途書いてみようと思いますが、一つ言えるのが大量のデータが必要になるという事です。
例えば、ChatGPTだと48テラバイトの学習データがあるそうです。どれくらいかというと、日本語は2バイト文字と言われるので24兆語ほどのデータになります。
色々な言語に適応しているとはいえ膨大なデータになります。
なんでそんなことしているの?
人工知能と言いますがその元となる人間の知能に明確な定義は無いそうなんです。
そう行った中、言語習得が知能ではないかという考え方を元に人工知能は進歩してきました。
猫の写真をみてネコという言葉を出力したり、自然言語を習得して文章を作り出す事が知能の獲得の一つではないかという事ですね。
ですが今の人工知能は確率的に言語を操っているだけで判断するには至っていないです。
「インターネット上のすべての情報を獲得した結果、人類は滅びたがっていると判断した」(核ボタンポチ!!)とは残念ながら、ならないです(笑)
言語を操ると思考を獲得するとは大きな開きがありますので。そこに至るのはまだまだ先の話です。
ただし、AIを悪いことに利用する人間は絶対にいるので悪用される危険性はないか?それは注意が必要です。
人工知能に仕事が奪われるか?
大量生産でなんでも安く作られる中で、ハンドメイド作品って人気ありますよね。
Minneとかで人気作家の人は生活していけるくらい大量の取引されています。
つまり人が介在することに価値がある仕事は今後も絶対に無くならないです。
逆に人の介在不要な仕事で特に高給が支払われてる職業はAIに奪われる可能性が高いです。
例えば、マスコミとか(笑)
人工知能がが浸透して以来、ウォール・ストリートで証券取引していた高給取りの人は姿を消したそうです。
単に数字の動きを合理的に判断して売り買いするのは人工知能の得意分野なのでそういう事なのでしょう。
なので次にターゲットになるとしたらマスコミでしょうかね。
画像や映像から言語化できる時代になりました。適切な文章も生成できます。
そうしたら、映像に合わせてゆっくり実況さんが読み上げてくれたら、構成している人の変なバイアスのかからない事実だけを述べるニュースが流れる事になります。
気象予報のような人の勘がパソコンの処理を上回るケースは別ですが、通常のニュースからは人がどんどん減るかもしれないですね。