ブログにおける映画評判の最新情報を抽出するサービス「オピニオンReader for 映画」の共同実験を開始 ~ブログ筆者自身の意見のみを自動抽出し、映画作品の評判やイメージを的確に表示~
平成18年12月18日
報道発表資料
日本電信電話株式会社
NTTレゾナント株式会社
ブログにおける映画評判の最新情報を抽出するサービス
「オピニオンReader for 映画」の共同実験を開始
~ブログ筆者自身の意見のみを自動抽出し、映画作品の評判やイメージを的確に表示~
日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:和田紀夫)と、NTTレゾナント株式会社(以下NTTレゾナント、本社:東京都千代田区、代表取締役社長:和才博美)は、引用意見や説明でなく、ブログ筆者自身の映画作品に関する意見のみをブログから抽出して、映画作品についてブログの世界で語られている評判やイメージの最新状況をお知らせするサービス「オピニオンReader for 映画」を、ポータルサイト「goo」上に開設した実験サイト「gooラボ」( http://labs.goo.ne.jp/ )で提供し、商用環境での実用性を検証するための共同実験を開始します。なお、実験期間は本日12月18日から1年間を予定しております。
1. 「オピニオンReader for 映画」の概要
「オピニオンReader for 映画」は、NTTサイバーソリューション研究所(以下、NTT研究所)が開発した意見抽出技術を映画のジャンルで活用したサービスです。従来の評判、意見の抽出技術は感想、意見、評価だと思われるキーワードが含まれる文章をすべて抽出するというものでした。しかし、文中における筆者の意見と感じる点について独自調査したところ、日本語において筆者の意見が表現されるのは文章の文末部分であることがわかりました。今回の意見抽出技術では、主観的な記述が文末で表記されている場合にのみ抽出することで、的確に筆者の意見を抽出することができます。例えば、同じ「美しい」という表現が記述中に含まれていた場合、「その湖は美しい」という文ではブログ筆者が最も伝えたいのは「美しい」という主観的記述であるので意見として抽出する一方で、「美しい湖がある村に行った」は、「美しい」という主観的記述が付加的に現れるだけでブログ筆者が最も伝えたいのは「行った」という出来事であると判断し、意見として抽出しないようにしています。また、意見分類技術により、映画という分野に最も適した項目別に的確に分類します。例えば「とても愉快でした」という記述は、「楽しい」という映画のイメージに集計し、「女優がピカイチだった」という記述は、「出演者が好評」という項目に集計します。
「オピニオンReader for 映画」は、これらの技術により、ブログ筆者自身の真の意見を分類・集計でき、ユーザが必要とする確度の高い有益な情報を提示します。
さらに、goo映画( http://movie.goo.ne.jp/ )と連携し、作品情報とブログ筆者の意見の分類・集計結果を簡単に閲覧することができるため、ユーザは映画に関する幅広い情報を効果的に手に入れることが可能です。
「オピニオンReader for 映画」は、NTTサイバーソリューション研究所(以下、NTT研究所)が開発した意見抽出技術を映画のジャンルで活用したサービスです。従来の評判、意見の抽出技術は感想、意見、評価だと思われるキーワードが含まれる文章をすべて抽出するというものでした。しかし、文中における筆者の意見と感じる点について独自調査したところ、日本語において筆者の意見が表現されるのは文章の文末部分であることがわかりました。今回の意見抽出技術では、主観的な記述が文末で表記されている場合にのみ抽出することで、的確に筆者の意見を抽出することができます。例えば、同じ「美しい」という表現が記述中に含まれていた場合、「その湖は美しい」という文ではブログ筆者が最も伝えたいのは「美しい」という主観的記述であるので意見として抽出する一方で、「美しい湖がある村に行った」は、「美しい」という主観的記述が付加的に現れるだけでブログ筆者が最も伝えたいのは「行った」という出来事であると判断し、意見として抽出しないようにしています。また、意見分類技術により、映画という分野に最も適した項目別に的確に分類します。例えば「とても愉快でした」という記述は、「楽しい」という映画のイメージに集計し、「女優がピカイチだった」という記述は、「出演者が好評」という項目に集計します。
「オピニオンReader for 映画」は、これらの技術により、ブログ筆者自身の真の意見を分類・集計でき、ユーザが必要とする確度の高い有益な情報を提示します。
さらに、goo映画( http://movie.goo.ne.jp/ )と連携し、作品情報とブログ筆者の意見の分類・集計結果を簡単に閲覧することができるため、ユーザは映画に関する幅広い情報を効果的に手に入れることが可能です。
2. 背景
近年、一般ユーザがインターネットで自由に発信した意見は、宣伝とは異なる消費者の生の声として、インターネットユーザの行動や心理に大きな影響を与える重要な情報となっており、マーケティングやWebサービスなどビジネス面においても注目されています。特にブログは、口コミ意見の宝庫であり、商品、娯楽などの選択における判断材料や、社会現象などについての世論を調べたりする上で有用な情報源となっています。ブログの口コミ意見が注目され始めた今、ブログを対象にした、好評意見の割合や抜粋意見を提示する評判分析サービスも登場しています。
しかし、既存サービスの技術では、「美しい」のような感想や意見、評価と考えられる表現がテキストに現れていれば、無差別に意見として収集するケースがほとんどでした。そのため、提示された結果の情報源を見ると、必ずしもブログ筆者の意見とは認定できない、引用意見や説明などの場合が多くみられます。
そのような状況の中、重要な情報源であるブログから、ブログ筆者の真の意見を高精度に抽出・分類・集計することにより、さまざまな角度から有益な情報としてユーザに提示できるサービスが望まれていました。
近年、一般ユーザがインターネットで自由に発信した意見は、宣伝とは異なる消費者の生の声として、インターネットユーザの行動や心理に大きな影響を与える重要な情報となっており、マーケティングやWebサービスなどビジネス面においても注目されています。特にブログは、口コミ意見の宝庫であり、商品、娯楽などの選択における判断材料や、社会現象などについての世論を調べたりする上で有用な情報源となっています。ブログの口コミ意見が注目され始めた今、ブログを対象にした、好評意見の割合や抜粋意見を提示する評判分析サービスも登場しています。
しかし、既存サービスの技術では、「美しい」のような感想や意見、評価と考えられる表現がテキストに現れていれば、無差別に意見として収集するケースがほとんどでした。そのため、提示された結果の情報源を見ると、必ずしもブログ筆者の意見とは認定できない、引用意見や説明などの場合が多くみられます。
そのような状況の中、重要な情報源であるブログから、ブログ筆者の真の意見を高精度に抽出・分類・集計することにより、さまざまな角度から有益な情報としてユーザに提示できるサービスが望まれていました。
3.「オピニオンReader for 映画」の機能(別紙1)
1)評判ランキングの表示
上映中および今週公開の映画作品について、関連する意見が書かれた記事数を考慮した上で、好評の評判の割合が高い順にランキング表示します。
1)評判ランキングの表示
上映中および今週公開の映画作品について、関連する意見が書かれた記事数を考慮した上で、好評の評判の割合が高い順にランキング表示します。
2)イメージワードランキングの表示
上映中および今週公開の映画作品について、意見抽出技術によって抽出された「楽しい」「暖かい」などのイメージワードと合致する意見の多い順にランキング表示します。
3)評判ランキングとイメージワードランキング抜粋の表示
評判とイメージワードのランキングの一部を「オピニオンReader for 映画」のトップ画面として表示します。
4)映画作品ごとの意見の表示
映画作品ごとに、評判とイメージワードの集計結果を表示します。
5)意見内容の表示
映画の評判とイメージワードを抽出したブログから、該当する意見文の一部を表示します。意見内容の詳細を知ることができるとともに、抽出元のブログへリンクが貼られているので意見文が書かれたブログ記事を閲覧することができます。
6)goo映画( http://movie.goo.ne.jp/ )との相互参照
「オピニオンReader for 映画」で表示する映画作品名について、「goo映画」の映画作品情報を参照することが可能です。また、「goo映画」の作品情報からも「オピニオンReader for 映画」を参照することができます。
4. 技術のポイント(別紙2)
(1)意見抽出技術
意見抽出技術は、検索語句(クエリ)に関連する意見を文章単位で抽出する技術です。ブログ記事全体でなく、クエリに関連する意見を表す文のみを抽出します。主節の文末部分が主観的な記述かどうかという観点で意見かどうかの判断を行うことにより、引用意見や説明などを除外し、ブログ記事の筆者の意見のみを高精度に抽出し
(1)意見抽出技術
意見抽出技術は、検索語句(クエリ)に関連する意見を文章単位で抽出する技術です。ブログ記事全体でなく、クエリに関連する意見を表す文のみを抽出します。主節の文末部分が主観的な記述かどうかという観点で意見かどうかの判断を行うことにより、引用意見や説明などを除外し、ブログ記事の筆者の意見のみを高精度に抽出し