「goo」で次世代型ブログ検索サービス「BlogRanger」の共同実験を開始 ~ブログを多角的な観点で整理すると見えなかったことが見えてくる~
平成17年12月19日
報道発表資料
日本電信電話株式会社
NTTレゾナント株式会社
「goo」で次世代型ブログ検索サービス「BlogRanger」の共同実験を開始
~ブログを多角的な観点で整理すると見えなかったことが見えてくる~
日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:和田紀夫)と、ポータルサイト「goo」を提供するNTTレゾナント株式会社(以下NTTレゾナント、本社:東京都千代田区、代表取締役社長:資宗克行)は、膨大なブログ記事の中から、利用者の検索条件に適合した多数の記事を分類・整理して利用者に提示するサービス「BlogRanger(ブログレンジャー)」を開発し、商用環境での検証・評価のための共同実験を、ポータルサイト「goo」上に開設した実験サイト「gooラボ」( http://labs.goo.ne.jp/ )で開始します。
「BlogRanger」は、NTTサイバーソリューション研究所(以下、NTT研究所)が開発した、検索結果をトピック毎に分類するトピック分類ラベル抽出技術、注目のブロガー(ブログを書く人)を抽出する情報提供者ランキング技術、記事の参照先リンクを抽出する参照先リンク抽出技術、「面白い」「便利」といった評価表現単位に記事を分類する評価表現ラベル抽出技術を利用しています。
これにより、キーワード入力によるブログ検索の際に、トピック別、ブロガー別、リンク先別、感想表現別の新たな4つの視点での提示を可能となり、多彩なブログ記事の中から利用者が探している記事を効率的に検索することは勿論のこと、思いもよらない新たな発見も期待できるようになりました。
なお、実験は本日から2006年3月31日までを予定しています。
1. 背景と目的
ブログ(blog)は、記事の編集作業が容易にできる、また、より記事の更新情報がタイムリーに通知できる等の特徴があり、個人による新しい情報発信メディアとして急速に普及しつつあります。
ブログによって配信される情報には、マスメディアでは取り上げられない情報や最新の話題、また商品・サービスの評判等の「消費者の生の声」が多く含まれており、マーケティング情報としての活用が期待され、ブログ情報をターゲットにした「ブログ検索サービス」も多数出現しています。しかし、現在の「ブログ検索システム」の多くは、日付順やアクセス頻度順等で単純にランキングされた検索結果を表示するものであり、ブログのように多種多様な情報が頻繁かつ大量に更新されるものを対象とした場合、利用者が求めている情報に辿り着くことは難しい場合もありました。
今回開発した「BlogRanger」は、キーワード入力による検索結果を、有用な4種類のフィルタを通して多角的に分類・整理して提示することで、入力したキーワード以外の視点からも情報を探し出すことを可能にしたものです。このように、あらかじめ複数のフィルタによる分類を行い、検索結果の絞込みを行うためのラベルリストを提示するサービスは、ブログ検索以外も含め、国内初の試みです。
両社は、共同実験を通じて、「BlogRanger」の技術面・運用面での実用性の検証を行い、併せてこの分野におけるNTTおよび「goo」の世界的なプレゼンスの向上を図ります。
2. 「BlogRanger」の概要
一般的な検索サービスと同様に、キーワードを入力して検索ボタンを押し、さらに4種類のフィルタ選択タブ、1) 「トピックで選ぶ」、2)「ブロガーで選ぶ」、3)「リンク先で選ぶ」、4)「感想で選ぶ」、のうち一つをクリックすることで、フィルタで分類・整理された検索結果が表示されます。
検索結果は、指定したフィルタの視点からランキングされたブログ記事が表示されるとともに、指定したフィルタが抽出した分類のためのキーワードが左側に一覧表示されます。検索結果は、提示されたキーワードの中から任意のものをクリックすることで、思いもよらないキーワードで絞り込むことができます。各フィルタの上部には、他のフィルタへ移動するタブがあり、これにより、例えば「トピックで選ぶ」で絞り込んだ後で「感想で選ぶ」、といった連携操作も可能になります。
3. 技術のポイント
(1)トピック分類ラベル抽出技術によりトピック別一覧を実現
検索結果の中から人物、組織、場所といった固有表現を抽出する技術と、抽出された固有表現の中から、記事を分類するのに適切なラベル(キーワード)を選び出すトピック分類ラベル抽出技術を使用しています。NTT研究所にて開発の技術で、既に「gooラボ」で「TopicMaster」として実験してきましたが、今回、テレビ番組名、CDタイトル、映画等といったブログで話題となる固有表現に対しても高い精度で抽出可能にしました。これにより、ワンクリックで話題語による検索結果の絞込みもが可能です。
(2)情報提供者ランキング技術により注目されているブロガー別一覧を実現
ブログの場合は、その他のホームページとは異なり、ブログ単位で同一の著者(ブロガー)が編集しているという特徴があります。NTT研究所ではこれを捉え、ブロガーが、多くの人が引用するような良い記事を書いているかどうか、また良い記事を引用しているかどうかを、ブログ記事の参照関係からそれぞれ数値化する新リンク分析アルゴリズム「EigenRumor」を開発しました。これにより、膨大な検索結果の中から信頼度の高いブロガーが書いた記事を容易に検索可能としました。
(3)参照先リンク抽出技術により話題のリンク先別一覧を実現
ブログ記事は、話題のニュースや商品紹介ページ等へのリンクを多く含み、これを集計することで話題の情報源を見つけることができますが、自動的に生成されるブログ記事内容に無関係の広告などのリンクも多く含みます。NTT研究所とNTTレゾナントは、ブログ記事の本文から参照されるリンク先のみを抽出する参照先リンク抽出技術を開発し、検索結果について参照先リンクを集計分類することで、ブログで話題となっているニュース記事や商品紹介ページを簡単に参照できるようにしました。
(4)評価表現ラベル抽出技術により感想表現別一覧を実現
ブログ記事は個人によって発信されるメディアであるため、「面白い」「素晴しい」といった評価表現を多く含みます。
NTT研究所では、これらの評価表現の中から記事の評価・選択に利用可能な表現を抽出する評価表現ラベル抽出技術を開発しました。これにより、抽出された評価表現から検索結果を絞り込むことが可能で、例えば商品やサービスがどのような言い回しで評価されているかといった抽出や集計が難しいキーワードを容易に確認できるようになりました。また、評価表現ラベルは出現頻度順にランキング表示されるため、ブログコミュニティにおいてどのような評判かを一目で見ることができます。
NTT研究所では、これらの評価表現の中から記事の評価・選択に利用可能な表現を抽出する評価表現ラベル抽出技術を開発しました。これにより、抽出された評価表現から検索結果を絞り込むことが可能で、例えば商品やサービスがどのような言い回しで評価されているかといった抽出や集計が難しいキーワードを容易に確認できるようになりました。また、評価表現ラベルは出現頻度順にランキング表示されるため、ブログコミュニティにおいてどのような評判かを一目で見ることができます。
4. 各社の役割
(1)NTT
本実験サービスに必要なNTT開発の技術を提供します。これにより、商用環境における同機能の有用性および有効性を検証します。
(2)NTTレゾナント
実験終了後の商用サービス導入に向け、利用動向や利用者のご意見を基にビジネス性を評価します。
以上
NTTレゾナント ポータル事業本部
E-mail:pr@nttr.co.jp
E-mail:pr@nttr.co.jp