vb2005でhtmlからテキストのみを抽出したい
vb2005でhtmlからテキストのみを抽出したリストを取得しようと考えています。
下記を参照してhtmlそのままのデータは取得出来たのですが、その他色々調べてもテキストの取得がわかりません。
http://www.atmarkit.co.jp/fdotnet/dotnettips/311 …
上記urlの方法以外でも構いませんので、テキストの取得方法を教えてください。
System.Windows.Forms.WebBrowserに読み込ませて、.Document.Body.InnerText でテキストを取得できるでしょう。
http://www.atmarkit.co.jp/fdotnet/dotnettips/687 …
または、WebBrowserを使わずにHTML解析を行う方法
http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.ph …
この回答へのお礼
ありがとうございます。
しかし、System.Windows.Formsが無いようで
Imports System.Windows.Forms
でエラーが出てしまいました。
具体的にやりたいことは下記の様なイメージです。
テキストを一行ずつ処理したいのですが、
取得方法はどのようになるかわかりますでしょうか。
-----------------------------------------------
Module Module1
Sub Main()
'ここから下がわからない
このhtmlのテキストorドキュメント?を取得 = http://www.google.co.jp/search?source=ig&hl=ja&r …
'ここから上がわからない
for each xxx このhtmlのテキストorドキュメント?を取得
Console.Write("AAA" & xxx & vbCrLf)
Next
End Sub
End Module
- 最新から表示
- |
- 回答順に表示
【電話・メール相談特集】
様々なジャンルの専門家に電話やメールで直接相談できるサービスをご紹介。一人で考えるより、あなたの【お悩み解決】や【夢の実現】に、その分野の専門家の力を役立てましょう。