一般的な対話形式のやりとりで人工知能(AI)を利用できる生成AI「チャット(Chat)GPT」が話題になっている。個人でも無料利用できるため、いよいよAIが身近になったと感じている人も多いだろう。確かに手紙や案内文の作成などは、ChatGPTをはじめとする生成AIが的確な文章を瞬時に自動作成してくれる。
しかし、こうした汎用性の高い文章はともかく、個別の情報が必要な文章となると使い物にならないケースが多い。たとえば自分の氏名を検索する「エゴサーチ」をしてみれば、有名人でない限りとんでもない結果が出てくる。
筆者の場合、かつて在籍していた会社の社長と出てきた。しかし、同社の社長になった経験はない。しばらく経って再び調べたところ、京都大学の教員になったりイラストレーターになったりと次々と変わった。もちろん京大とは縁もゆかりもないし、仕事どころかプライベートでイラストを描いたことすらない。
なぜ、こんなことになるのか?実はChatGPTを「素」のまま使うと、ウェブ上のあらゆる情報を引っ張ってくる。つまり有名人でない人名を検索すると、その人物の情報量が少ないため、例えばウェブページに同じ人名があれば、同一ページの無関係な情報を組み合わせて情報を生成するのだ。
つまり一般的ではない「ニッチな情報」を調べた場合、ChatGPTでは多くの「ノイズ」も取り込んでしまうことになる。それを防ぐには、主に2つの方法がある。1つは自分たちが集めた、あるいは購入した、ノイズを含まない「クリーンデータ」のみでChatGPTのような対話型AIを動かすことだ。
2月3日の節分の日に食べると、福を巻き込むといわれる恵方巻に値上げの波が押し寄せている。材料となる玉子焼きや海苔、かんぴょう、穴子、まぐろなどの価格がいずれも上昇しているためだ。
「スピンオフ」の用語解説で、「スピンオフIPO」と混同した解釈をした記事をネット上で見かけるようになりました。東芝の再編が話題になっていることから、このような現象が起きているのかもしれません。
本日8月11日は「山に親しむ機会を得て、山の恩恵に感謝する」ことを目的に2016年に新設された国民の祝日「山の日」。安全に「山に親しむ機会を得る」ためには正確な登山道の整備が不可欠だ。
世間にはまだあまり浸透していないが、2018年のキーワードの一つが「明治150年」。1868年の明治元年から150年の節目を迎える。政府はしきりに旗を振るが、ムーブメントは起きるか