lynx   »   [go: up one dir, main page]

タグ

2008年12月14日のブックマーク (2件)

  • pylori*style wiki - HTMLパーサ Hpricot

    Hpricotは Ruby用の HTML パーサです。スキャン部分は C 言語で書かれていて高速に動作します。 HTMLの解析や書き換えに威力を発揮する便利なライブラリです。 rubygemsを使うのが簡単です。 # gem install hpricot すると以下のようにプラットフォームを聞いてきます。Unix系OSであれば 1 を、mswin32 であれば 2 を選びます。 Select which gem to install for your platform (i386-freebsd6) 1. hpricot 0.4 (ruby) 2. hpricot 0.4 (mswin32) 3. Cancel installation コンパイルが始まり、インストールが行われます。 Building native extensions. This could take a while.

    showyou
    showyou 2008/12/14
    hpricot
  • Python Mechanize を使ってみる - 傀儡師の館.Python:楽天ブログ

    2006.10.15 Python Mechanize を使ってみる (1) カテゴリ:その他 mechanize (Web ブラウジングをプログラムするための Python のモジュール) を使ってみることにした。mechanize は、Andy Lester さんの WWW::Mechanize (Perl 版) を参考に Python で実装したものようだ。WWW::Mechanize の日語情報を眺めてみる。このページにあるものや、サンプルスクリプトが参考になりそうだ。file upload script for sourcefourge.jp のように Mecab の sourceforge.jp へのアップロードにも使われているようだ。これも参考になるスクリプト。 urllib を使えばページをとってきたりするのは楽にできるのだが、その後、とってきたページを解析して、そこから

Лучший частный хостинг