「goo」で、評判に関する書き込みとQ&Aを探し出す検索サービスの実証実験を開始 ~最新の日本語処理技術で大量のウェブページから効率的な情報検索を可能に~
平成18年3月28日
報道発表資料
NTTレゾナント株式会社
「goo」で、評判に関する書き込みとQ&Aを探し出す
検索サービスの実証実験を開始
~最新の日本語処理技術で大量のウェブページから効率的な
情報検索を可能に~
NTTレゾナント(*1、本社:東京都千代田区、代表取締役社長:資宗克行)は、インターネットポータルサイト「goo」(*2) 上に開設した実験サイト「gooラボ」(http://labs.goo.ne.jp/)において、膨大なウェブページから評判に関する書き込みを検索できる「評判検索」と、知りたい事柄に近い質問文とその回答が掲載されたサイトを探し出す「Q&A検索」の商用環境での検証・評価のための実証実験を、本日から2006年6月16日まで行います。
「評判検索」と「Q&A検索」は、NTTサイバーソリューション研究所(以下、NTT研究所)が開発したウェブページを詳細且つ高速に分析して検索に活用する日本語処理技術を活用して開発されたサービスです。ブログの記事等の限られたコンテンツに対して同様の検索が可能なサービスはありますが、一般のウェブページにまで検索対象を拡大したサービスは国内初の試みです。
この技術により、インターネット上の幅広いコンテンツに対して、該当するキーワードの有無だけでなく評判やQ&Aのような文章形式といった文章の意味や表現までも検索を通じて探し出すことが可能になり、今後全く新しい日本語検索サービスの実現も可能になります。
なお、「Q&A検索」ではインターネットから収集した質問文に加え、「goo」が提供するQ&Aサイト「教えて!goo」の質問文も検索可能です。
1. 背景と目的
ウェブ検索で検索結果を絞り込む際にスペースを空けて複数のキーワードを入力しますが、ほとんどのユーザは1語から2語で検索している状況です。一方でインターネット上のウェブページの数は増加し続けており、日本語の検索サービスにとってはキーワードという限られた情報をもとに、大量の情報から検索結果をいかに絞り込むかが技術開発の大きなテーマになっています。
NTTレゾナントでは、入力されたキーワードの有無のみならずキーワードに関連する記述のある文章についてその意味までも理解し、そのキーワードが含まれる文章においてどのように評価されているかといった情報や、知りたいと思う事柄のキーワードに類似した概念の情報まで網羅して提示してくれるような、全く新しい日本語検索サービスの開発を目指してきました。
この度の実証実験では、その代表的なサービスとして「評判検索」および「Q&A検索」を提供するもので、これにより新たな日本語検索サービスの提供に向け、ユーザニーズ等を探ります。
2.評判検索の概要
「評判検索」は、ウェブサイトに書き込まれた評判を検索できるサービスです。入力されたキーワードについて、そのキーワードを含む膨大なウェブページの中から、そのキーワードに関する評判を含むものだけを探し出すことができる効率的な検索サービスです。
(1) 動作の仕組みについて
「評判検索」は、世界中にある日本語のウェブページの情報を収集して解析し、評判に関する書き込みのある文章を抽出します。抽出した文章は、何に関する評判であるかを推測し、あらかじめ検索エンジンにインデックス(データベースへの格納)します。これによりユーザは、入力したキーワードに関する評判を即座に検索することが可能になります。
(2) 検索対象について
サービス開始時点で、インターネットから収集した 1億ページについて評判を検索することが可能で、対象ページは順次拡大する予定です。
(3) 利用方法について
ウェブ検索サービスと同様に、キーワードを入力して検索ボタンを押すことによりそのキーワードに関する評判が存在するウェブページの一覧が検索結果として表示されます。
検索結果には、評判に関する文章中に登場する「良い」とか「悪い」と言った具体的な表現を、肯定的なものと否定的なものに分類して表示します。これにより評判に関する具体的表現の分類を見ながらウェブページを絞り込む事が可能です。
3.Q&A検索の概要
インターネット上には、よくある質問と回答をまとめたQ&Aが書かれたウェブページが多数存在しています。これらは非常に良質な情報源ですが、多くのQ&Aでは個々の質問文が短く、入力した検索キーワードがなかなか含まれないため求める情報を探し出すことができないケースがあります。
「Q&A」検索は、知りたいことに関するキーワードが入力されると、該当するキーワードのみならず概念的に意味が近いものを含む質問文も表示できます。また自然文の入力にも対応し、知りたいことについてその質問文が掲載されたウェブページと回答を幅広く探し出し、より効率的に回答を見つけることができます。
(1) 動作の仕組みについて
「Q&A検索」は、世界中にある日本語のウェブページの情報を収集して解析し、質問文とその回答であると推測される文章を抽出します。抽出した文章は統計処理を行い質問文の文意にあたる概念を抽出し、検索エンジンに登録します。ユーザが検索する際は、入力されたキーワードについても同様に概念を抽出し、これと似た概念を持つ質問文と回答を含むウェブページを探し出して検索結果として表示します。これにより、ユーザが入力したキーワードのみならず、キーワードが含まれていなくても概念が近いものを検索結果として表示可能になり、従来の検索サービスでは見つけることのできなかった質問とその回答を探し出すようなあいまい検索が可能です。
(2) 検索対象について
サービス開始時点で、インターネットから収集した約20万件の質問文に加え、「教えて!goo」に掲載されている約100万件以上の質問文をそれぞれ検索可能です。なお、検索対象については、「教えて!goo」とインターネットから収集した質問文とを切り替える事が可能です。
(3) 利用方法について
一般的な検索サービスと同様に、キーワードを入力して検索ボタンを押すことにより、そのキーワードに関する質問文と回答が存在すると推測されるウェブページが検索結果として表示され、キーワードだけではなく