源氏物語
日本のキーワードをいろいろ試してみると結構面白い。例えば源氏物語。最初の8件の検索結果からは、"源氏物語","源氏物語大成","湖月抄"。
「湖月抄」は初めて耳にしましたが、「北村季吟によって著された源氏物語の注釈書である。延宝元年(1673年)成立。」だそうです。
次の8件を加えた16件では、"源氏物語","源氏物語絵巻","源氏物語大成"。
さらに次の8件を加えた24件では、"源氏物語","源氏物語絵巻","山口伊太郎"となりました。
ウィキペディアのデータを知識として使用しているので、ちょっと比較してみましょう。例えば”源氏物語”で検索した時に返ってくるのは、次の通りです。
- 源氏物語
- 夕霧 (源氏物語)
- 玉鬘 (源氏物語)
- 浮舟 (源氏物語)
- 夕顔 (源氏物語)
- 柏木 (源氏物語)
- 若菜 (源氏物語)
- 源氏物語絵巻
- 大宮 (源氏物語)
- 少女 (源氏物語)
- 源氏物語大成
- 光源氏
- 源氏物語千年紀 Genji
- 帚木 (源氏物語)
- 朝顔 (源氏物語)
- 蜻蛉 (源氏物語)
- 葵 (源氏物語)
- 蛍 (源氏物語)
- 源氏物語年立
- 源氏物語古系図
一般的な単語ベースの検索では、似たようなものばかり並んでしまいます。今回の色検索では、”重要なトピック”を抽出しているので、類似しているものは冗長だとして省き、ユニークかつ関連性の強いものを抽出しています。
"湖月抄"、"山口伊太郎"というトピックを抽出しているのは、なかなか面白いですね。