Creative Commons が、コンテンツを AI のトレーニングにどう利用できる/できないかを指定することを可能とするフレームワークである CC Signals を発表している。
ワタシもひと月ほど前に「AI時代の相互主義とクリエイティブ・コモンズについて」というエントリを書いているが、これは Creative Commons による AI 時代への対策というか、「相互主義」を目指した実装と言える。
なので、狙いは理解できるのだけど、これが成功するかというと難しいかもしれない。例えば、CC Signals の GitHub の Discussions をみると、「お前らの提案は根本的に間違っている。撤回しろ」とか「これはすっごく間違ってる」といった罵倒に近いタイトルのスレッドが上位にあがっており、頭を抱えてしまう。
まぁ、こういうのは極端な声が目立ちがちなものなのだけど、それだけでもないんだよね。
これも少し前に出た報告書なのだけど、AI モデルの訓練用データセットを構築するためにボットがインターネットからデータを収集する行為が、GLAM(美術館、図書館、アーカイブ、博物館)のサーバーを過負荷状態に追い込み、場合によってはそのコレクションをオフラインに追いやっていることについて扱っている。
しかも、そうした AI ボットの多くは robots.txt をガン無視している。
今だってそういう状況なのに、CC Signals のような「提案」が尊重してもらえるのか懐疑的になるのも無理からぬ話なのである。
もちろん長年クリエイティブ・コモンズの活動を支持してきたワタシとしては、これが「お気持ち表明」以上の意味を持ってほしいと願っているが。
そうそう、この報告書の著者、ワタシがかつて訳した『3Dプリンティングと著作権を考える』の著者であり、近年も「The Anti-Ownership Ebook Economy の Introduction」とか「AI企業と大手出版社のライセンス契約はたぶんマズい」を訳している Michael Weinberg である。いい仕事しているね。