【ニュース】スパムブログ除去率96%を達成 業界最高性能を実現!
2009年4月20日
株式会社ブログウォッチャー
株式会社ブログウォッチャー(本社:東京都中央区 代表取締役社長:羽野仁彦)は、昨今、インターネット上で増加しているスパムブログの自動除去技術の精度向上を行いました。結果、スパムブログ除去率は96%に達し、業界最高性能(※)を実現しました。
◆開発の経緯
昨今、ブログや掲示板の発達に伴って一般ユーザーが気軽に情報発信出来る手段が増え、またそこで発せられる一般ユーザーの意見や体験談はこれまでにないタイプの情報として各方面から重視され、信頼性を得つつあります。しかし、それに伴いその手軽さと高まりつつある信頼性を悪用し、自らの利益追求のためだけにブログ閲覧者にとって何ら有用な情報をもたらさないようなブログ、いわゆるスパムブログ(迷惑ブログ)が広まりつつあります。
このような迷惑ブログの存在は、インターネットユーザーや弊社のような検索技術提供会社にとって有害なばかりでなく、現在クチコミ情報が得つつある信頼性を著しく低下させる可能性を含んでおり、非常に憂慮すべき問題となっています。
しかし、弊社のSHOOTIを含む各社のWeb/ブログ検索エンジンの目をかいくぐるために、スパムブログは複雑化・高度化し始めており、単純なルールでは検出が困難になり始めています。これまでも弊社ではスパムブログの検出・除去に励んで参りましたが、スパムの増大・高度化に伴い、これまでの技術・体制では除去が困難になってきていました。
そこで弊社ではこのような状況を打開するため、新たなスパムブログの自動検出・除去技術の開発に取り組むことといたしました。
◆弊社のスパムブログ除去技術の特徴
複雑なスパムの特徴を詳細に幅広く捉えるため、大量のブログをスパムブログと良質ブログに仕分けしていき、大量の事例データをそろえました。この仕分け作業は専門の作業者が明確な基準のもとで行ったため、ぶれのない正確なデータとなっています。
これらのデータを元に、機械学習技術を利用して、システムにスパムの詳細な傾向を覚え込ませ、除去技術を開発しました。
また、文章のみならず、デザイン・HTMLの構造等を総合的に判断し、精度向上に役立てております。
◆弊社のスパムブログ除去技術の性能
以上のような詳細な分析と緻密なデータ収集の成果によって、弊社のスパムブログ除去技術は業界最高性能(※)を達成しました。
社内における性能テストの結果
スパムブログ除去率 (スパムブログを除去できる割合)
96.00%
スパムブログ非除去率 (スパムブログを除去できず残してしまう割合)
4.00%
スパムブログ誤除去率 (非スパムブログをスパムブログと誤って除去する割合)
2.04%
また、本除去技術と平行して、これまで続けてきた検索結果の人間の監視による、新しいタイプのスパムブログの検出と、傾向把握は継続して行っていきます。
ブログウォッチャー社は、今後も弊社のブログ検索エンジンからのスパムブログ除去を続けていき、利用者の皆様へのよりよい検索結果の提供と、一般ユーザーの発信するクチコミ情報の信頼性獲得の土壌作りに貢献していきます。
※ 2009年4月20日現在 スパムブログの除去技術の性能・数値を公表している他社技術との比較に基づくもの(弊社調べ)
