Rank Reporter

検索エンジンテンプレート

※検索エンジンの追加方法に関してはサポート対象外とさせて頂きます。

検索エンジンテンプレートエディタは、Rank Reporterで使用する検索エンジンのクエリ方法を修正したり、削除したり、追加したりする事ができます。


検索エンジンテンプレートエディタを使用するには、「設定」メニューから、「検索エンジンテンプレートエディタ」を選択します。


検索エンジンテンプレートを変更すると、Rank Reporterの全てのプロジェクトに影響します。


検索エンジンテンプレートエディタ

現在のテンプレート

Rank Reporterで取り扱う検索エンジンが表示されます。これらのテンプレートは、システムから修正したりコピーしたり削除する事ができます。
テンプレートが削除された場合は、過去の順位履歴はそのままですが、再度同じ名前で新規テンプレートを作成しない限り、今後その検索エンジンを使用する事ができません。


テンプレート名

テンプレート名は検索エンジンの名称をつけます。(重複する名前をつける事はできません。)キーワードは内部で検索エンジンごとに蓄積され、検索エンジン名はこのテンプレート名が使用されます。その為テンプレート名はリネームする事ができません。


クエリ URL

検索エンジンに対して投げるクエリのURLを作成します。

クエリには以下の項目が含まれ、クエリを投げる際にRank Reporterによって各項目が置き換えられます。

説明
#Query# クエリテキスト (自動的に URL encodeされます。)
#Page# ページナンバー (1から始まります。 チェックするキーワードの数とページあたりの結果数により、設定されます。)
#LastResult# 前のページの結果数 (0から始まります。ページ毎の結果が10件であれば、次のクエリの値は10です。)
#NextResult# 次に予測される結果数(1から始まります。 ページ毎の結果が10件であれば、次のクエリの値は11です。)
#ResultsPerPage# サーバーから返されるページ毎の結果数。

ページ毎の結果

検索結果ページ上に表示される結果数です。検索エンジンにより10,20,50,100の結果数が表示されます。
この値は、クエリURLに返されるパターンにマッチさせる必要があります。(パフォーマンスを考慮するのであれば、ページ毎の結果は10を推奨します。)


ユーザーエージェント

この値は、Rank Reporterが検索エンジンに対して投げるクエリに付与されるユーザーエージェントの文字列です。この値は手動で編集するか、ドロップダウンリストから選択する事ができます。


空白にするとクエリにはユーザーエージェントが含まれません。ユーザーエージェント欄は、以下のヒューマンエミュレーション用の論理式の使用ができます。


説明
#OS# WindowsのOSをランダムに切り替えます。
#Plugins# ブラウザプラグインのセットをランダムに切り替えます。

パターンタイプ

ワイルドカード、正規表現、XPathのパターンのいずれかを指定します。


結果のパターン

検索エンジンの結果で実際に使用できるフォーマットです。
テンプレートは検索エンジンのHTML出力をもとに作成します。


ワイルドカード

検索結果ページに各要素が記述されている箇所を判断する為に、以下のマーカーを設定します。


説明
#URL#

(必須) 結果ページのURL箇所を指定します。順位取得時に指定されたルートURLと比較して、あなたのサイトと一致するかどうかを判断します。

#Title#

(必須) 検索結果ページで表示されるタイトル箇所

#Desc#

(必須) 検索結果に表示される紹介文(スニペット文)です。

*

HTMLタグは含まずに0または複数文字を一致させます。

{xxx,yyy}

XXXまたはyyyを一致させます。検索エンジンには付属のコンテンツが含まれる場合があります。この構文は、コンテンツがある場合と無い場合が結果により分かれる場合に使用します。
(例えば、"{<div>#desc#</div>,}"と記述すると、<div>タグで囲まれたディスクリプション箇所の値か、無い場合は無しとして処理します。)


結果パターンは半角の大文字小文字を区別しません。URL、タイトル、ディスクリプションマーカーはHTMLタグを含める事でどんな形式でも一致させる事がでます。


HTMLの開始/閉じタグ

HTMLの開始/閉じタグは、値が囲まれるように区切り文字として使用します(マーカーはパターンの冒頭、最後に使用する事はできません。)。


正規表現

正規表現は、更に幅広い方法で検索結果を取得しますが、更に複雑な構文が必要です。
正規表現のチュートリアルはこのマニュアルではカバーできません。
ウェブ上で検索すると多くのチュートリアルを見つける事ができますので、そちらをご参照ください。Rank Reporterは、.NET正規表現の構文を使用します。
正規表現を使用する際は、以下の名称と一致させます。


"URL", "Title", "Desc"


XPath

XPath はHTMLドキュメント構造を使用して検索エンジンの結果をまったく異なる方法で抽出します。
XPathを使用したテンプレートは、HTML結果の小さな変更に影響されない為、正規表現やワイルドカードよりも着実な方法です。
XPathを使用する際のオプションは以下の通りです。


Xpathの値はGoogleの提供するブラウザのChromeの機能を利用すると便利です。
Chromeのブラウザ上で、該当する検索結果の「結果」、「タイトル」、「URL」、「ディスクリプション」に該当する箇所を右クリックし、「要素を検証」をクリックします。ブラウザの画面下にHTMLコード画面が表示されますので、該当箇所で同じく右クリックし、「Copy XPath」をクリックします。
検索結果の順位ごとにこれを行い、パターンを確認しながら検索エンジンテンプレートを作成します。
初期設定で提供される検索エンジンテンプレートの内容を参考として作成する事をおすすめします。


XPath専用オプション

結果

結果全体の要素を取得する為に使用します。このクエリが実行されると、取得した結果の個々のテキスト要素に対して、タイトル、URL、ディスクリプションクエリが実行されます。
XPathクエリは、HTMLドキュメントの根本から検索結果ページの全ての結果を取得する事になります。


タイトル、URL、ディスクリプション

これらのクエリは、各結果に関連するタイトル、URL、ディスクリプションテキストを取得します。特定の属性を抽出するには、Attributeフィールドに記述します。(XPath結果の内部テキストというよりも)


スタートマーカー

任意で設定します。もしURLスターターマーカーが定義されていれば、Rank RepoterはXPathで取得したURLを探し、スタートマーカーテキストから始まる文字列の一部を抽出します。


エンドマーカー

任意で設定します。もしURLエンドマーカーが定義されていれば、Rank ReporterはXPathで取得したURLを探し、エンドマーカーテキストで終わる文字列の一部を抽出します。


デコード

チェックをつけるとRank Reporterは取得したURLを結果として蓄積する前にデコードします。

キュー

キューは任意で設定します。この設定は、どの検索エンジンにキューを一緒に出すべきかを指示します。例えばGoogleに関連する全てのテンプレートにはキューに「Google」と指定します。
この場合、Rank Reporterは、Google検索エンジンに対して1つのクエリしか実行しませんが、この用に設定する事でクエリ自動化ツールとして検知される事を防ぎます。
もし複数のプロキシを使用している場合は、キューフィールドは空欄にしてください。(各プロキシサーバを通して平行してクエリを実行する事ができます。)


ページ上部