プログラミング
1889 view

[node.js]webサイトのクローリング用ライブラリ cheerio

以下のライブラリを利用する。

npm install request
npm install cheerio

requestは対象URLからのデータ取得に用いて、
cheerioはその取得したデータをDOM解析するために使用する。例えばこんな感じで使用出来る。

#!/usr/bin/env node

var request = require("request");
var cheerio = require("cheerio");

var request_url = "http://www.google.com";

request({url: request_url}, function(error, response, body)
{
  if (!error &amp;amp;&amp;amp; response.statusCode == 200) {
    $ = cheerio.load(body);

    var url = response.request.href;
    var title = $("title").text();

    console.log(url);
    console.log(title);
  } else {
    console.log(response.statusCode);
  }
});

投稿者: zuqqhi2
バックエンド, プログラミング
cheerio, javascript, node.js, request

[express][socket.io]チャットデモのコードを見てみる前の記事

[node.js]食べログAPI から得られたレストラン情報をmongoDBに入…次の記事

[node.js]webサイトのクローリング用ライブラリ cheerio

プログラミングの最近記事

C# でオブジェクトの概要を Console.WriteLine で出力する方法

コマンドで C# コンソールアプリケーションを作成する方法

PubSubClient の便利さと注意点

Java の環境構築方法メモ

PlatformIO IDE for VSCode を使用して VSCode で Ardu…

関連記事

[Javascript][Three.js][3D]OBJ形…

[API][MySQL][Ruby][JSON]ATNDから…

[Hadoop][Ruby]Hadoop Streaming…

私はこの勉強方法で GCP Professional Clo…

[Android][Scala][Windows7]Scal…

[StreamingAPI][Ruby]ストリーミングRES…