ちょっと個人的には面白いなぁって思ったので記事にしてみました。
Twitterでの話なので、ツィートを貼り付けて説明した方が良いかどうか悩んだのですが相手を貶めたりしたい話でもないのと直リンクでなければ、スクショを切りはりしても意図的に会話の流れの一部を切り取ってもわからないのでエビデンスとして意味をなさないので、今回は省略します。
あとはブロックされていました(笑)
TL;DR
いつも絡んでくれるフォロワーの皆様には本当に感謝です。
わたいもない事をダラダラと書いているので、結論まで飛んでもらっても差し支えないです。
ことの経緯
最初のツィートはこちら。。。
そういえば画像の生成AIは屁理屈並べて
「切り貼りじゃない」「画像入ってない」とか言って頑なに元データ依存であるのを認めないやんじゃあ音楽や声、文章の生成AIがどういう理屈で動いてるか教えてくれや
もちろん納得行く説明できるよな推進派ども
という、少々攻撃的だけど生成AIを理解していない文章に反応してしまい、レスポンスしたのですが、これが失敗でした。。。
私は推進派ではないですが、生成AIのデータには画像も音も文章も入ってないですよ。
単なる数字の行列が入った塊で、それを使って全てを確率的に作り出しています。
イメージ的には元データとなる沢山の画像などを溶かして、ぐちゃぐちゃに混ぜた数値の集まりみたいなものです。
技術的な話
技術的な話でいうと、生成AIはパラダイムシフトが起きていて従来のプログラミングと考え方が異なります。
従来のプログラムで作るとしたら言葉と絵を紐づけてデータベースに入れておいて、それを貼りしてします。
例えば、林檎を持ってるフリーレンというキーワードから画像生成するプログラムを作るのであれば、例えば以下の手順の取ります。
- 林檎とフリーレンの画像をたくさん用意する。
- 画像をコラージュのように貼り合わせる。
- 貼り合わせた境界をぼかして馴染ませてる。
- 色補正する
ですが、生成AIはちょっと違っていて画像データを解析して画像の特徴を数値で持つようにしています。
- 林檎とフリーレンの画像をたくさん用意する。
- 人工知能に読み込ませて、画像の特徴を学習させる(数値化)。
- 学習で得た特徴の数値から確率的に高い絵をドットの配列を出力して絵にする。
絵をコピーするというより模写すると言った方がイメージは近い気がします。*1
画像のAIは基本的な技術としてはCNN(Convolutional Neural Network)を使っています。
RBG(色の三原色)に分解したり、対象をモザイクのようにぼかしたりして、特徴を見つけ出して数値化します。*2
元は林檎の画像なのですが、赤の色だけ抽出して32ピクセル単位でぼかしてみたイメージ。
ではこの画像をデータとして持っているか?答えば否です。
この画像のを人マスごとに値にしてさらに以下の様な式に当てはめます。
※ この式は正しくないです。イメージとして捉えてください。LATEXも使いこなせてない。。。
fは関数でシグモイド関数とかRelu関数とかが使われます。
この式の中のwは重み、bがバイアスになっていて、沢山の画像を読み込ませてこの二つの値群を最適化するのがAIの学習になります。
Kには数百万入ると思っていただいて問題ありません。*3
AIではこの大量のwとbの配列を保持しております。
これが、私の書いた「沢山の画像などを溶かして、ぐちゃぐちゃに混ぜた数値の集まりみたいなものです。」になります。
会話が成立しない人がいる事はとても勉強になりました。
非技術者に説明するので、なるべく難しい要素や専門用語を排除して説明してみたのですがわかりにくかったかもしれないのですが、いただいた回答がこちらになります。
倫理的というか、盗作や盗用は人間がやってもダメだし当然そんな事やらないし転載して自作と称するやつはすぐに叩かれる 何故か生成AIというフィルターを一回通せばOKになってそれで金儲けしても何やっても自由になっとるから、法整備しろって話してる 著作権は人間の行為を前提とした物。そこに機械を入れれば話がおかしくなるからドローン法みたいに専用法作ればいい 実際EUはAIact、韓国政府も専用の法規制を決定した。米国議会やFTCもAI 詐欺行為禁止法なる物を提出したらしい こういう諸外国と同じ事すればいい 誰も「生成AIが消滅しろ」までは言ってない 「データを盗用するな」「犯罪で得たデータ使うな」しか言ってないからデータセットを作り直せばいいわけだ 逆にお前らは「無法地帯であらゆるデータを好きに利用させろ」って言ってるようなもん。他人の財産だぞ?利用するなって言われてるんだから言う事聞けよ 財産権を無視するのは共産主義者か独裁国家と同じ 基本的人権、憲法レベルの話 そこが飲めない、無法地帯のままがいい!って言うなら今すぐ北朝鮮にでも移住すべき。憲法存在する基本的人権の守られた国家にいる資格無し 以上
これは、他の人からいただいたツィートに対してのレスも含めての回答かもしれないのですがなんか、私のレスに対しての回答???となってしまいましたのでちょっと確認してみました。
一生懸命書いていただきましたが、話の論点がずれてません? 私は技術面の事を書いているだけです。 それに私は推進派でもなければ、生成AIの扱いをポジティブに評価もしていません。
そうしたら以下のような回答をいただきました。(笑)
各国の動きも知らない人間が何を語るというんだ?
国際情勢でアウトならアウト。日本は鎖国してるわけじゃない
まあ常識や倫理観ある人間はLaion-5bの時点で反対するか触れないがなんか左翼団体っぽい匂いがする。
すごく臭い。だから叩いてるだけ。
いきなり国際情勢の話を出されても困惑です国際情勢は専門では無いですし。しかも団体にされてしまうし(笑)*4
ここまでの流れで左翼団体要素ってあたっけ?それよりも、左翼団体だから叩くって1950年代アメリカの赤狩りっぽい発想はちょっと新鮮で面白かったです。
この後に、色々と罵声的な事を書かれた上に「オーバーフィッティングについて説明してみろ!!どうせ出来ないだろう」と、書かれたので技術的に点に関して回答したのですが、その流れは見つからなかったされていました。(笑)
技術的にも勘違いしているんですよね。生成AIの学習がZIP圧縮して拡張子を変えてる書いておりました。。。。はい、全然違います。かすりもしません。
あまり生成AIがどう作られてるか理解していないのだろうなぁってのが私の印象です。
わたしも、生成AIを専門にしているわけではないので理解はまだまだですが、あまりに不理解が過ぎる感じですね。
それでも、ここまで攻撃的な文章を書けるメンタルは、ある意味見習うものがあるかもしれません。
その後。。。
でも、このあとにこの人のツィートを読んでいて思いました。
きっと、何かと戦ってるのだろうと。。。*6
まぁがんばってください!!
そしてブロックされてしまいました。(笑)
親切と思い説明したのですが、自分が親切と思っても相手にとっては必ずしもそうではないのかもしれないですね。
結論
なんか引用したせいで文章が長くなってしまいましたが、結論!!
Twitterで僕と相互フォロしている人はいい人ばかりでありがたいです。
考え方が違う人もいるでしょうし、面倒なおっさんフォローしてしまったなんて思ってる人もいるかもしれないですが、そんな面倒なおっさんにもレベルを合わせてお付き合いしてくれて本当に感謝しかないです。
そのうち生成AIについてももう少し掘り下げて書いてみようと思います。
最近非エンジニアのお客様に説明を求められてお話しする機会が多いので、なるべく専門用語を使わず、または用語を理解しなくても伝わるように書いてみます。
*1:優しく書くと模写ですが言い方を変えるとトレパクです。また中身を知らない人からするとコンピュータが高性能なコピーしているのと印象は変わらないですよね。
*2:これは一例で他にも方法はあり、どの様に特徴を捉えるかがAIを提供する会社の持つノウハウになります。
*3:ちなみにChatGPTだと1750億と言われていました。すごいですね。
*4:1人で左翼団体ってどういう事ですかね?
*5:それで「間違いだらけで何から訂正したらいいかわからないけど」と枕詞つけてオーバーフィッティング(過学習)について説明したので消したのかも(笑)
*6:なんかネットフェミの人とか、反ワクチンの人とか某政治団体の支持者に雰囲気が似ているなぁって思いました。これはあくまで個人の感想です。