見出し画像

【プログラミング不要】suumoの物件情報をスプシに一覧化する方法

IMPORTXML関数を使ってsuumoの物件情報ページをスクレイピングし、スプシに一覧化する方法をご紹介します。

suumoから引っ張ってくる情報は以下の通り。

  • 物件名

  • 価格(万円)

  • 広さ(m^2)

  • 築年(年、月)

  • 最寄り駅と駅徒歩

※友人用に作ったスプシは坪単価も出したかったので、いったんデータを引っ張ってきてからスプシ上で価格と広さのデータをこねこねしてます。これは時間あるときに追記します!


手順1:suumoで希望の条件で物件を検索する

PCでsuumoを開き、希望の条件で物件を検索します。
モバイルサイトだと後々うまくいかないのでPCで検索してください。

ここでは、青山一丁目の中古マンションを検索してみました。
デフォルトでは表示件数が30件になっているので、100件に変更します。
このときのページのURLをコピーしておきます。

画像

手順2:suumoのURLをスプシに貼り付ける

まずスプレッドシートを開いてガワを作ります。

B2セルには先ほどコピーしたsuumoのURL、B3セルには検索条件を入れておきます。なおB3セルは必須ではないですが、備忘的にあると便利なのでおすすめしてます。
4行目には、suumoから引っ張りたい情報を記入しておきます。

画像

手順3:suumoから引っ張りたい情報のXpathをコピーしてスプシに貼り付ける

ここで、5行目にIMPORTXML関数を使います。

IMPORTXML
XML、HTML、CSV、TSV、RSS フィード、Atom XML フィードなど、さまざまな種類の構造化データからデータをインポートします。

Googleドキュメントエディタヘルプ

IMPORTXML関数はWebサイトから欲しい情報を引っ張ってくる(=スクレイピング)ことができる関数で、以下の形で使います。
=IMPORTXML(”WebサイトのURL”,”Xpath”)

XPath(XML Path Language)とは、XML文書の中の特定の要素や属性を指定して、情報を取得するための言語

https://winactor.biz/use/winactor_tips/winactor_xpath.html#:~:text=XPath%E3%81%A8%E3%81%AF,%E3%82%82%E9%81%A9%E7%94%A8%E3%81%8C%E5%8F%AF%E8%83%BD%E3%81%A7%E3%81%99%E3%80%82

suumoから情報を引っ張るにはその情報のXPathが必要になるので、suumoページのデベロッパーツールを開いて探します。
デベロッパーツールは開発用のツールで、Ctrl+Shift+Iで開けます。

デベロッパーツールを開くとこんな感じ(画面右側)。

画像

で、そこから欲しい情報(ここでは物件名)が書かれている箇所を右クリックし、Copy→Copy XPathをクリック。これでXpathが取れました。

画像

スプシに戻ります。スプシのA5セルに以下の式を入力します。
=IMPORTXML(”suumoのURLを貼ったセル位置”,”さきほどコピーしたXpath”)

画像

すると、ものの1秒程度で物件名の一覧がびゃーっと出てきます。

画像


これと同じことを、価格(万円)、広さ(m^2)価格、広さ(m^2)、築年、最寄り駅と駅徒歩でもやります。

すると、こんな感じで一覧が取得できます。

画像

手順としては以上です!簡単でしょ?

汚いところは後々アップデートしますが、取り急ぎご紹介でした!
感想などなどお待ちしてます!

この記事が気に入ったらサポートをしてみませんか?

コメント

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。
SCとCISSP持ちの薄給OL
【プログラミング不要】suumoの物件情報をスプシに一覧化する方法|ハチ
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1