ケチってWeb。

Opera、ローカルのHTMLも見られるから、母艦でwget -rで再帰回収したコンテンツを転送してやればオフラインブラウジングできる。でもこれ、絶対パスで画像とか貼ってあると、勝手に接続して取ってこようとする。繋ぎ放題なら別に良いんだろうけど、ウチでは従量課金されるので止めさせたい。
止めるには、絶対パスでの他サーバへのリンクを消してやればいいだけ。

#!/usr/bin/env ruby
#es用サイトダウンローダ
#wgetでミラーリング回収した後、絶対パスのリンクやimgを潰す。
require 'uri'

unless ARGV.size == 1
  puts "userge: local_web_for_es.rb download_uri"
else
  #wget実行
  system "wget -np -r -L #{ARGV[0]}"
  
  dest = URI.parse(ARGV[0]).host
  
  #リンク書き換え
  Dir::glob("#{dest}/**/*").each{|file|
    #ファイルタイプ
    type = `file "#{file}"`
    if type =~ /HTML document text/
      f = File.open(file)
      content = f.read
      content.gsub!("http://", 'file://http/')
      f = File.open(file, 'w')
      f.puts content
      f.close
    end
  }
end

これで安心してオフラインブラウジング。終わったら、WS007SHを繋いでマウントして、回収したフォルダをぼこっと投げ込んでやればOK。