1.

phpQueryの導入と使い方

ページの作成
テンプレートを更新

ページの作成

親となるページを選択してください。

ページは必ず何かしらの親ページに紐づきます。
親ページに紐づくページを子ページといいます。
例: 親=スポーツ, 子1=サッカー, 子2=野球

子ページを親ページとして更に子ページを作成することも可能です。
例: 親=サッカー, 子=サッカーのルール

親ページはいつでも変更することが可能なのでとりあえず作ってみましょう!

phpQueryとは?

phpで簡単にWebスクレイピングが出来るライブラリです。

こちらから最新の「phpQuery--onefile.zip」をダウンロードしましょう。

中にある「phpQuery-onefile.php」をrequire_onceすれば使えるようになります。

 

対象ページの取得

まずスクレイピングしたいページのHTMLを取得しましょう。

file_get_contentsの引数にページのURLを指定しましょう。

 

【例】

$html = file_get_contents(https://ja.wikipedia.org/wiki/ウェブスクレイピング);

$doc = phpQuery::newDocument($html);

print $doc;

これで対象ページの情報を取得できたことを確認できます。

 

 

要素を指定して取得

h1要素を取得するには以下の様にします。

※1行目と2行目どちらでもOK

print $doc['h1'];

print $doc->find('h1);

 

 

IDやクラスを指定して取得

bodyContentというIDを指定するには以下の様にします。

※1行目と2行目どちらでもOK

※クラスの場合は「#」ではなく「.」を指定

print $doc['#bodyContent'];

print $doc->find('#bodyContent');

 

 

 

子ページ
子ページはありません
同階層のページ
同階層のページはありません

最近の質問

コメント一覧

コメントがありません

ログインしなければコメント投稿はできません。