新しく質問する

vb2005でhtmlからテキストのみを抽出したい

役に立った:0件
  • 質問者:ok121212
  • 投稿日時:2008/06/09 14:54
  • 困り度:困ってます
  • 友達に紹介
  • ブログに書く
  • 教えて!gooお気に入り

vb2005でhtmlからテキストのみを抽出したリストを取得しようと考えています。
下記を参照してhtmlそのままのデータは取得出来たのですが、その他色々調べてもテキストの取得がわかりません。

http://www.atmarkit.co.jp/fdotnet/dotnettips/311 …

上記urlの方法以外でも構いませんので、テキストの取得方法を教えてください。

この質問に回答する
このQ&Aは役に立ちましたか?(役に立った:0件)

回答(1件)

  • 参考になった:0件
  • 回答者:todo36
  • 回答日時:2008/06/09 17:12

System.Windows.Forms.WebBrowserに読み込ませて、.Document.Body.InnerText でテキストを取得できるでしょう。

http://www.atmarkit.co.jp/fdotnet/dotnettips/687 …

または、WebBrowserを使わずにHTML解析を行う方法

http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.ph …

通報する

この回答へのお礼

ありがとうございます。
しかし、System.Windows.Formsが無いようで

Imports System.Windows.Forms

でエラーが出てしまいました。
具体的にやりたいことは下記の様なイメージです。
テキストを一行ずつ処理したいのですが、
取得方法はどのようになるかわかりますでしょうか。

-----------------------------------------------

Module Module1

Sub Main()

'ここから下がわからない

このhtmlのテキストorドキュメント?を取得 = http://www.google.co.jp/search?source=ig&hl=ja&r …

'ここから上がわからない

for each xxx このhtmlのテキストorドキュメント?を取得
Console.Write("AAA" & xxx & vbCrLf)
Next
End Sub

End Module

  
このQ&Aは役に立ちましたか?(役に立った:0件)
電話相談

【電話・メール相談特集】

様々なジャンルの専門家に電話やメールで直接相談できるサービスをご紹介。一人で考えるより、あなたの【お悩み解決】や【夢の実現】に、その分野の専門家の力を役立てましょう。

このページのトップへ

Facebook公式ページ

公式Twitter