wgetコマンドでHTMLを取得!

インターネットから情報取得して、自動処理!ということをしてみたくなることがあります。その際に便利なwgetコマンドをWindowsでも使用できるようにします。

はじめに

wgetコマンドを使用してホームページ(HTML)の情報を取得します。

Windows用wgetコマンドのダウンロード

Windows用のwgetコマンドのインストーラをダウンロードしします。 ダウンロードのページでは、Complete package, except sourcesを選択します。

Windows用wgetコマンドのインストール

wgetコマンドをウィザードに従って、インストールします。
install_wget_001.png

install_wget_002.png

install_wget_003.png

install_wget_004.png

install_wget_005.png

install_wget_006.png

install_wget_007.png

install_wget_008.png

path環境変数の設定

コマンドプロンプトでwgetコマンドのフルパスを指定しなくて済むように、path環境変数に”C:\Program Files\GnuWin32\bin”を追加します。
set_wget_env_001.png

set_wget_env_002.png

set_wget_env_003.png

wgetコマンドでホームページの情報(HTML)を取得

wgetコマンドでホームページの情報を取得してみます。
<実行例>
============================================================
D:\data>”C:\Program Files\GnuWin32\bin\wget.exe” http://infotecr.seesaa.net/
SYSTEM_WGETRC = c:/progra~1/wget/etc/wgetrc
syswgetrc = C:\Program Files\GnuWin32/etc/wgetrc
–2015-04-05 10:13:36– http://infotecr.seesaa.net/
infotecr.seesaa.net をDNSに問いあわせています… 59.106.28.139, 59.106.98.139
infotecr.seesaa.net|59.106.28.139|:80 に接続しています… 接続しました。
HTTP による接続要求を送信しました、応答を待っています… 200 OK
長さ: 21301 (21K)
`index.html’ に保存中
100%[==============================================================================>] 21,301 –.-K/s 時間 0s
2015-04-05 10:13:37 (44.1 MB/s) – `index.html.1′ へ保存完了 [21301/21301]
D:\data>
============================================================

おわりに

wgetコマンドを使用することで、ホームページの情報(HTML)を取得することができるようになりました。テキスト処理と組み合わせて有効に活用することができます。

関連記事

  1. スクリプト用フォルダの作成と環境変数を設定!
  2. タスクスケジューラを使用してスクリプトを実行!
  3. Windows PowerShellを使用可に!
  4. PythonをWindowsにインストール!
  5. nkfコマンドで文字コードを変換!
  6. wgetコマンドでHTMLを取得!
DMMmobile ワイモバイル

コメントを残す

メールアドレスが公開されることはありません。

※日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)