一般の方は検索サイトを利用する立場ですので検索エンジンについて詳細に知る必要はありませんが、検索サイトの仕組みとして概要を理解しておくことをおすすめします。検索サイトで表示されるデータは検索の結果偶発的に表示されいるものでなく、検索サイトまたWebページ提供者側(制作会社)で意図した順番・内容であることをご承知おきください。
検索エンジン  search engine
インターネット上で公開されているWebページの掲載情報を集めデータベース化し、そのWebページを掲載情報から検索可能にするシステムです。「サーチエンジン」とも呼ばれます。狭義ては収集プログラムのみを指しますが、収集システム全体を指すことも、「検索サイト」を技術的な観点から象徴的に呼ぶときにも使います。
Webページの情報を集めてデータベース化するやり方にはロボット型とディレクトリ型の2つがあります。最近はロボット型が主流ですが、ディレクトリ型と併用している検索サイトもあります。
ロボット型の仕組みを採用する代表的な検索サイトがGoogleです。かって、Yahoo! JAPANディレクトリ型検索サイト代表でしたが、現在はディレクトリ型とロボット型を併用しています。
ロボット型(クローラー)
インターネット上のWebページ情報を集めるときに、専用プログラムを使って定期的・自動的に集めます。集めた情報はさまざまな条件を基に検索結果の表示順序が決められ、データベース索引(インデックス)が作成されます。
ロボット型はキーワード検索による全文検索方式になります。ユーザーが入力したキーワードとデータベース索引を照合し、そのキーワードを含むWebページを表示します。ロボット型ではキーワードを含むものが多数抽出さるため、目的のものにたどり着けないという場合があります。検索方法や表示順位の問題が生じます。
ディレクトリ型
人手を介してWebページの情報を集め、一定の条件を満たすWebページを種類別に分類登録し、検索データベースを作成します。人手を介しているため、一定の条件に満たないものは登録されなかったり、申請者の意図とは異なった解釈がされたり、異なるカテゴリーに分類されたりすることもあります。
Webサイトの内容は検索サイトでチェックしているので情報信憑性はありますが、ユーザーが指定したカテゴリーとは異なるカテゴリーに登録されいるため見つからないこともあります。
人力検索
検索エンジンを使わずに人力で調べてくれるサイトです。単に、データベースから該当する用語・語句のあるページがリストアップされるのはとは異なり、検索者の意図や内容を汲んだ情報が返ってきます。「人力検索はてな」が代表的な人力検索サイトです。
検索サイトへの登録
検索サイトへの登録は申請形式と自己推薦形式があります。ディレクトリ型カテゴリー検索は申請形式で審査期間があります。審査が通れば申請したカテゴリーに登録され、検索ロボットが定期的に巡回してくるようになります。通常個人非営利は無料ですが、個人でも営業の場合と法人は有料になります。
ロボット型検索サイトへの登録は自己推薦形式です。推薦をすると一定期間内に検索ロボットが巡回してきます。巡回してきた検索ロボットが収集していくデータは、ユーザーの意図とは異なる場合もあります。
法人など有料の場合は検索サイトが指定した登録業者でおこなう場合もあります。各検索サイトで登録の方法をご確認ください。
- Googleの場合はトップページ中央下部の「Googleについて」→サイトオーナー方への「サイトの登録/削除」に
- Yahoo! JAPANはトップページの上部右端のヘルプの下に「サイトの登録」があります。
大手プロバイダのホームページサービスやレンタルサーバーを利用している場合は登録をしなくても、検索にリストアップされる場合もあります。大手プロバイダなどのWWWサーバーへは常時検索ロボットが巡回していますので、逆に、しかるべき制御コードを書き込んでおかないと予期しないページが検索サイトに登録されてしまうことがあります。
※現在は広告との関係から「登録」ということは行わくなりました。その変わりに「SEO対策」が必要ななります。
SEO対策  エスイーオー search engine optimization
「SEO」は「search engine optimization」の略で「検索エンジン最適化」と訳されます。検索サイトでの表示順位を上位にするためのWebサイト構築技術などをいいます。検索サイトでの検索結果表示順位は、上位にある方が検索サイト利用者の目につきやすく、訪問者も増えるため、企業サイトにとっては重要な意味をもちます。
検索エンジンが収集データは検索サイトのデータベースに蓄積され、ユーザーがキーワードで検索すると、該当するデータがリスト表示されます。このときのリスト表示順位は各検索エンジンの方式により異なります。
ディレクトリ型では人手で登録していますので表示順位をユーザー側で調整することは困難ですが、検索エンジンの場合は検索エンジンのシステム(プログラム群)が決めますので、このシステムの表示優先順位に適応する作り方をしたり、優先条件に合うデータを収集させるようにすれば順位を上位にすることができます。
ただし、検索サイトの表示順位の意図に反して特定のWebページが常に上位に表示されるなどの問題もあり、各検索サイトでは、検査エンジンがどのような基準で優先順位を決めているかは企業秘密になっています。
本格的なSEO対策は専門知識がないとできませんが、一般ユーザーでもできるSEO対策があります。それは正しいソースコードのWebページを作ることです。
デーダベース database
データを有効に活用するにはデータを収集・蓄積して再利用できるようにするためのシステムが必要です。デジタルデータを一定のルールに従って蓄積し、再利用(リスト表示や検索)ができるようにしたものがデータベースです。パソコンで使うデータベースシステムにはデータの管理構造からリレーショナル型、表示形式からカード型などいくつかの種類があります。最も単純な構造のデータベースは表計算ソフトで作成した住所録形式のものになります。縦横のマトリックス上に整理されたデータです。
全文検索
データベースを検索するときに、蓄積した全データを対象に目的のキーワードを探す方式のことをいいます。文書形式のデータベースでは、それぞれの文書にキーワードを付加しておき、このキーワードに基づいて検索するのが効率的ですが、どのようなキーワードをどのような方法で付加するかの問題があります。全文検索の方式では任意のキーワードを検索できますが検索に時間がかかるという問題があります。