edgefirstのブログ

国内新聞社を中心としたマスメディア関連のウェブサイト巡回が趣味です。業界紙的なノリでトピックスをメモしていきます。

Googleキャッシュで有料記事が丸見え 北日本新聞の「webun」(追記あり)

(追記:2010/4/11 21:07)以下の状況は現在は修正されており、キャッシュ経由による記事本文の閲覧はできなくなっているようだ。まだ閲覧可能な記事も一部残っているが、これはGoogleクローラの巡回タイミングの問題であろう。対応の速さに感心した。さすが「ウェブ新聞」と名乗るだけあり、技術的にも機動的に動けているように感じた。



 2月1日から会員制サイトに移行し、朝刊購読者および月額2,000円の県外特別会員以外には自社記事を見せなくなった北日本新聞のウェブ新聞「Webun(ウェブン)」だが、Google検索のキャッシュ経由で記事を読めてしまうことがわかった。
 例えば、現在北日本新聞のトップに掲載されている「富山県内の子ども医療費、助成拡充が加速」という記事。普通にクリックすると、「この先はログインが必要です」とい画面が出る。
20100408181249

20100408184137
 そこで、「富山県内の子ども医療費」でGoogleで検索すると、検索結果の一番上に記事が出てくる。通常のタイトル部分をクリックすると同じようにログイン画面に移るのだが、「キャッシュ」をクリックすると…
20100408222556
 なんと、Googleキャッシュで記事全文が読めてしまう。
20100408183729
 会員制サイトであってもGoogleやYahoo!などのクローラー(検索エンジンのロボット)を意図的に通すことで、「富山」に関するキーワードに引っ掛かるようにして集客を行い、自社サイトの会員新規登録の誘導につなげるというサイト運営戦略は理にかなっている。ここまであれば「上手に検索エンジンを使っているなあ」と思えてしまう。
 しかし、「自社記事が読めるのは朝刊購読者か有料会員のみ」というポリシーでやっている以上、検索エンジンにキャッシュを許可し、全文閲覧を可能にするというのはいかがなものか。
 とりあえず、早めに会員限定記事部分のページのヘッダに、

 <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">

 と書いたほうがいいのではないだろうか。
【参考】Google にキャッシュページを登録させない - Google キャッシュ機能 :: SEM R