AIゼーション vol.13
コンピュータは0と1の世界でできていることは広く知られていますが、エンベディングとは概念を数値列に変換したもので、類似性の評価や機械学習の処理に活用されています。
例えば、以下のように言葉を3次元の数値に変換します。
犬→(1,1,9)
猿→(1,2,9)
雉→(1,3,9)
とすると、最初の1が動物ということを指し、次が種類で、最後が桃太郎に出てくることを意図する、みたいな感じです。
そうやって、言葉とベクトルをめっちゃ頑張って集めると、どんな言葉が来ても、システムはその引き出しから、それっぽい回答が導き出せるようになるという、このエンべディングがChatGPTの凄さを実現しています。
https://openai.com/index/introducing-text-and-code-embeddings/
それではまた、ごきげんよう!