AIゼーション vol.13

コンピュータは0と1の世界でできていることは広く知られていますが、エンベディングとは概念を数値列に変換したもので、類似性の評価や機械学習の処理に活用されています。

例えば、以下のように言葉を3次元の数値に変換します。

犬→(1,1,9)

猿→(1,2,9)

雉→(1,3,9)

とすると、最初の1が動物ということを指し、次が種類で、最後が桃太郎に出てくることを意図する、みたいな感じです。

そうやって、言葉とベクトルをめっちゃ頑張って集めると、どんな言葉が来ても、システムはその引き出しから、それっぽい回答が導き出せるようになるという、このエンべディングがChatGPTの凄さを実現しています。

https://openai.com/index/introducing-text-and-code-embeddings/

それではまた、ごきげんよう!