当ブログは YAMDAS Project の更新履歴ページです。2019年よりはてなブログに移転しました。

Twitter はてなアンテナに追加 Feedlyに登録 RSS

メタデータの見地からみたGoogle Booksの問題点

Google Books の問題点についてはいろいろなことが言われているが、Rebecca Blood さんのところで知ったこの文章が指摘する問題は面白い。

検索結果がひどくて使えないというのだ。1950年以前に刊行された本に限定して「Internet」を検索しても500件以上ひっかかるし、ウディ・アレンが生まれる前に刊行された本に限定して彼の名前を検索して300冊以上ひっかかる。

何でこんなことが起きるのか。メタデータの扱いがなってないから、というのがカリフォルニア大学バークレー校教授 Geoffrey Nunberg の指摘である。彼は Google について以下のように分析する。

Google Books は二つの形で考えられる。一つは新しい図書館として――私はそれを「最後の図書館」と呼んでいる――世界中のすべての図書館の集合ということだ。二つ目は巨大データベースとして。Google で検索するように検索可能な情報貯蔵庫だ。その背景にある理念は、本は格納された情報に過ぎないというものだ。例えば、ルーズベルトの就任演説を誰が書いたか知りたければ、検索をすれば調べられる。

だが、これらの二つの理念は矛盾し合っているんだ。Google はそれを分かってないけどね。Google の長所は、煎じ詰めればメタデータを必要としないところだ。テキストに組み付き、欲しいものをひっぱるだけ。つまりメタデータ――そのソースとなるテキストについての情報――は、彼らの重点事項じゃなかったのだ。

このあたり、自分が昔書いたセマンティック・ウェブ再訪とGoogle幹部の懐疑の話を思い出したが、詳しくは Geoffrey Nunberg の文章(その1その2)を読むとよいだろう。

ただメタデータの重要性というのは、Google Books だけでなく『ブックビジネス2.0』に書かれるような「図書館」全般にあてはまる話だろう。

[YAMDAS Projectトップページ]


クリエイティブ・コモンズ・ライセンス
YAMDAS現更新履歴のテキストは、クリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際 ライセンスの下に提供されています。

Copyright (c) 2003-2023 yomoyomo (E-mail: ymgrtq at yamdas dot org)