1. XPath のノードテスト text() でテキストを抽出する XPath で HTML のタグで囲まれたテキストを取得するには、ノードテスト text() を利用する。 XML Path Language – Wikipedia によると、 text() 全てのテキスト (文字列) ノードを指定する。例: <k>こんにちは</k> の中の 'こんにちは' 例えば、Yahoo!Pipesのテスト のページにおいて、 <div name="hogepiyofuga"> <p>ほげ</p> <p><b>ぴ</b>よ</p> <p>ふが</p> </div> 以下の XPath を指定すると、 //div[@name="hogepiyofuga"]/p/text() タグで囲まれたテキストが抽出できる。 cf. Firefox で XPath により要素を指定する - Firebug と