カテゴリー「ウェブログ・ココログ関連」の記事

SEO:ブログ記事を検索結果から消さないために

当ブログを始めたのは2008年1月からですが,ブログのアクセス解析を見ると,最初は少なかったアクセス数が3月頃に増え始めて3月後半から4月前半にピークを迎えました(最も多い日で訪問者60,アクセス数90)。しかしその後がっくり落ちて,1日のアクセス数が5件にも届かなくなってしまっていました。ブログの更新頻度が低く記事の数も少なかったというのもありますが,それにしても落差がありすぎるのはなんでだろうと思っていろいろ調べてみたところ,次のようなことがわかりました。

  • 当ブログの訪問者のほとんどはGoogle検索からやってくる。
  • ブログの場合,Googleの検索結果にはGoogleブログ検索へのPingでも載るが,Pingで載った場合は一定のアクセスがある記事を除き数週間程度で検索結果から消えてしまうようだ。
  • Googleの検索からは数週間で消えるが,「Googleブログ検索」からは検索可能。しかしそもそもGoogleブログ検索からやってくる人はほとんどいない。
  • 記事のリンクがココログの「ココフラッシュ」や「瞬!コレ」などに載ることがあり,これらのページがGoogleにインデックスされてそこからアクセスしてくる人がまれにいる。しかし「ココフラッシュ」は同一カテゴリの記事の投稿があれば古いものから消えていくし,「瞬!コレ」への登録は全く制御できないので当てにはできない。
上記のうち,アップしてから一定期間が経過したブログ記事がGoogleの検索結果から消えてしまっているのを発見したときは衝撃を受けました。誰も興味を持たない話題をアップしているとか,検索結果の順位が低くてアクセス数が少ないならまだ納得がいきますが,検索結果から消えてしまっては…そりゃ誰も来ませんね。ということで,この記事ではブログ記事が検索サイトのインデックスから消えないようにするためにこちらでやってみたこと,まだやってないけど調べたことなどを紹介いたします。

ブログのURLを検索サイトに登録する
検索サイトにURLを登録することで,検索サイトにウェブクローラが巡回してほしいサイトを知らせることができます。各検索サイトへは以下から登録できます。但し登録を行ったサイトが検索結果に表示されることは保障はされていません。
 Google Web登録登録確認 ディレクトリ登録
 Yahoo! Web登録登録確認解説カテゴリ登録
 bing Web登録 解説 
goo及びBIGLOBEはGoogleのインデックスを使っているそうです。(出典1)(出典2

ウエブマスターツールに登録する
GoogleウエブマスターツールではGoogleに収集された自分のサイトについて,ウェブクロールの際に発生したエラー一覧,Google検索で自分のサイトが表示されたときの検索語一覧,インデックス情報のモニタ,robots.txtの文法チェック,サイトマップ(後述)の登録更新,削除したWebページのGoogleインデックスからのURL削除,グーグル八分になったときのサイトの再審査リクエストなどを行うことができます。
とりあえず(もっていなければ)Googleアカウントを取得して,ウエブマスターツールに自分のブログを登録してみることをお勧めします。
なお,ウェブマスターツールのすべての機能を使うには,ブログのHTMLファイルに認証コードを埋め込むか,トップディレクトリに認証ファイルを置く必要があります。
※ココログの場合,HTMLファイルを直接編集できるユーザ種別は「プロ」だけです。
Yahoo!でウェブマスターツールに相当するのが「サイトエクスプローラ」になるかと思います。サイトマップの登録もここから行います。こちらにもYahoo! JAPAN IDを取得して登録してみることをお勧めします。
Googleウェブマスターツールログインヘルプ
Yahoo!サイトエクスプローラログインヘルプ

サイトマップを作る
ウェブクローラが参照するためのTXTまたはXML形式のサイトマップを用意することで,ブログの個別の記事をウェブクローラが見つけやすくなります。ブログでサイトマップを利用するには,ブログ管理者がトップディレクトリへファイルをアップロードできる機能が提供されている必要があります。
サイトマップのファイル名は任意です。1つのサイトで複数のサイトマップを持つことができます。サイトマップは他のサイトや上位ディレクトリのURLを記述できません。

TXT形式のサイトマップは,テキストファイルにサイトを構成するページのURLを「http://」を含めて1URL1行で記述します。
XML形式のサイトマップは,各ページのURLのほかにオプションで,最終更新日(lastmod),更新頻度(changefreq),ページの優先度(priority)を記述できます。
XML形式のサイトマップの書き方についての詳細は,[Google][Yahoo!][本家sitemaps.org]を参照してください。

例:当ブログのサイトマップ(テキスト形式)
http://endeavour.cocolog-nifty.com/developer_room/index.html
http://endeavour.cocolog-nifty.com/about.html
http://endeavour.cocolog-nifty.com/developer_room/cat8156880/index.html
http://endeavour.cocolog-nifty.com/developer_room/cat8157219/index.html

(略)
注:当ブログのサイトマップは実際にはXML形式です。

例:当ブログのサイトマップ(XML形式)
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">

<url>
<loc>http://endeavour.cocolog-nifty.com/developer_room/index.html</loc>
<changefreq>weekly</changefreq>
<priority>0.3</priority>
</url>
(略)
</urlset>
作成したサイトマップをブログのトップディレクトリに保存して,検索サイトにサイトマップの登録更新を伝えます。その方法は,
  • Googleの「ウェブマスターツール」やYahoo!の「サイトエクスプローラ」でサイトマップを登録または更新する。(「サイトエクスプローラ」では「フィード」にサイトマップを登録する。)
  • 「robots.txt」に「Sitemap: http://サイトマップのURL」行を追加する。robots.txtは通常ウェブクローラに対して巡回してほしくないディレクトリパスを指定するために使いますが,サイトマップのURLを指定することもできるようになったようです。
例:上記XML形式のサイトマップを指定した当ブログのrobots.txt
User-Agent: *
Sitemap: http://endeavour.cocolog-nifty.com/endeavour_sitemap.xml

注:ココログに「Googleサイトマップ」という機能があるのを最近見つけました。
当方では自力でサイトマップを作ってしまったのでこの機能をOFFにしていますが,この機能をONにすればサイトマップの作成はGoogleに対しては必要ないかもしれません。但しYahoo!に対しては別途サイトマップの送信等の処理が必要かと思われます。ココログの「Googleサイトマップ」の設定は「ブログ」→「設定」→「更新通知」で行います。

メタ情報を設定する
ココログでは各HTMLファイルにkeywordsとdescriptionのメタタグを追加するようになりました。
ここで追加するメタタグのうち,descriptionはブログのサブタイトルがデフォルトで設定されますが,「ブログ」→「設定」→「更新通知」の「meta情報の生成」で変更することができます。
このメタタグの効果はまだよくわかりませんが,すべての記事に同じメタタグが挿入されてしまい,記事ごとの説明文を設定できないのが少々困りものです。(かといって,できたらできたで面倒くさい!となってしまいますが…笑)Googleウェブマスターツールでも「重複description」の警告が大量に出てしまいます。

ブログランキングサイトへの登録
にほんブログ村 IT技術ブログへとか人気ブログランキングへとかのことです。前者の「にほんブログ村」の場合,「トラコミュ」というブログ記事のトラックバックでコミュニティを構成する機能があり,アクセス数に左右されない外部リンクが確保できます。

これまでの成果
サイトマップの登録を8月に行ったところ,検索結果から消える現象にかなりの改善が見られました。また,これに伴いアクセス数も回復しつつあります。
ただし新たな問題も見つかっています。それは,サイト内でリンクを張っていた場合にその中の代表ページをGoogleが判断してそれ以外のページをインデックスから削っていると思われる問題です。これはこのブログの記事では「Java:CSVパーサを作る」の「その1~3」のうち,検索結果に表示されるのが「その2」だけ,といった形で現れてきています。

…あとはこのブログの記事の質と量の問題でしょうか。

■関連書籍をAmazonで検索:[SEO][Google][Yahoo!]
SEOを強化する技術 エンジニアが内側から支えるサイト設計・構築術(Kindle版)

にほんブログ村 IT技術ブログへ にほんブログ村 IT技術ブログ Webサイト構築へ 人気ブログランキングへ ←この記事が役に立ったという方はクリックお願いします。
ソニーストア

| | トラックバック (0)

ココログ入会でメールが受け取れなかった話

ココログに新規入会するとき,こちらのメールアドレスを登録する訳ですが,
そのメールアドレスを当初会社のアドレスで登録しようとしていました。

ココログへの登録がひととおり完了したあとで設定画面を見て回ったところ,
「コントロールパネル」の「概要」で登録したメールアドレスを見ることができますが,
表示されたメールアドレスのドメイン部分(@から後ろ)だけが「nifty.com」に書き換わって
全く別のメールアドレスになってしまっている…!!
ココログに入会したら,入会ありがとうメールとか送ってるのかなぁ?
もしそうだったらワタクシの入会メールは全然別の人が受け取っていることになるのか?
で,いろいろすったもんだして,結局手持ちの「@nifty.com」のアドレスに変更完了。

そのあと,自分が管理している会社のサーバ(Mac OS X Server)のメールログを確認。
すると,app.cocolog-nifty.comがこちらにメールを出そうとして,エラーコード450で弾かれているではないか。
しかしなんで弾いているのか?と調べてみて以下のことがわかりました。

うちのメールサーバ(Postfix)は接続してくるクライアントサーバに対してDNS逆引きチェックを行う設定にしています。
これは具体的には以下のチェックが行われます。
1)クライアントサーバのIPアドレスをDNSで逆引きして,ホスト名が得られるか確認する。
2)得られたホスト名をDNSで正引きしてIPアドレスを取得し,クライアントサーバのIPアドレスと等しいか確認する。

このチェックに対して,cocologのサーバは以下のような結果になりました。
1)クライアントサーバのIPアドレス「210.131.5.9」を逆引きすると「app.cocolog-nifty.com」。
2)「app.cocolog-nifty.com」を正引きすると「210.131.5.22」→あれえ?

なんだか,見てはいけないものを見てしまったのかな?(笑)

このcocolog-nifty.comからのメール,450で弾いているため何度も再送を試みているので,
サーバの設定で一時的に上記チェックをはずして受け取ってみると,内容は「メールアドレス変更の確認」
…あぁそういえば,すったもんだの間にそんなこともしたっけ。入会ありがとうメールはやはり闇の中?

目立つ力 (小学館101新書 49)

にほんブログ村 IT技術ブログへ にほんブログ村 IT技術ブログ ネットワーク・SEへ 人気ブログランキングへ ←この記事が役に立ったという方はクリックお願いします。


Bose QuietComfort 25ノートンシリーズ新登場バナー

| | トラックバック (0)