Scrapingしてほしいもの募集
ブログ | 2008/3/6 22:41
さくらのレンタルサーバにWeb::Scraperを入れたので何か考える。
とりあえずカープの故障者リストでもだすようにするか。
とりあえずカープの故障者リストでもだすようにするか。
タグ »
リンク元
- アーカイブ | Rottel (6)
- コメント | Rottel (2)
- ブログ | Rottel (1)
- 写真 | Rottel (1)
- 固体番号 偽装 携帯 - Google 検索 (1)
- Yahoo!検索 - 固体番号 携帯 (1)
- web::scraper RSS - Google 検索 (1)
- web::scraper RSS - Google 検索 (1)
- 座礁船のページ | 梨のつぶて (1)
- rottel - Live Search (1)
- スクレイプ Yahoo 電話 - Google 検索 (1)
- mysql longtext インデックス作成 - Google 検索 (1)
- スクレイプ google 検索 - Google 検索 (1)
imbe | 2008/03/07 11:05
さすが、説明うまいね。完全に理解しました。
で、どうやって対象ページを拾うの?
Googleとかの検索結果から該当ページをガガガーっとパースするのかな。
まあいいや、ページはすごいおしゃれなのつくるよ。
できた。
http://www.rottel.net/kuwa/5841
で、どうやって対象ページを拾うの?
Googleとかの検索結果から該当ページをガガガーっとパースするのかな。
まあいいや、ページはすごいおしゃれなのつくるよ。
できた。
http://www.rottel.net/kuwa/5841
kuwa | 編集回数: 1 | 2008/03/07 23:21
伝えるのって難しいですねぇ
たとえば
http://www.carp.co.jp/sensyu/index.h...
こういうページからがすっと選手の名前と背番号を取ってきたりするってことですよ。
deraさん>
普通の携帯会員サイトはGWのIPで制限掛けててサーバからじゃはいれないことが多いんですよねぇ。UA偽装で済む話なら楽でいいんですが。
たとえば
http://www.carp.co.jp/sensyu/index.h...
こういうページからがすっと選手の名前と背番号を取ってきたりするってことですよ。
deraさん>
普通の携帯会員サイトはGWのIPで制限掛けててサーバからじゃはいれないことが多いんですよねぇ。UA偽装で済む話なら楽でいいんですが。
imbe | 編集回数: 2 | 2008/03/10 10:09
定期更新されてるけどRSSが配信されてないページとかを取りにいくとか。
それだけでは意味ないのでどう表示するかは考えないといけないんですけどね。
のでカープの故障者リストのページとかをさくっとパースしてRSS形式にしてRSSリーダーで読んだりしたいわけなんですよ。
それだけでは意味ないのでどう表示するかは考えないといけないんですけどね。
のでカープの故障者リストのページとかをさくっとパースしてRSS形式にしてRSSリーダーで読んだりしたいわけなんですよ。
imbe | 2008/03/10 13:43
座礁したら船が見つかったら知らせて欲しいとかだとするとそうですね。
座礁船一覧ていうのがあってそれを定期的に見て更新してパースして自分のDBに登録とかするんじゃなければ必要ないですね
座礁船一覧ていうのがあってそれを定期的に見て更新してパースして自分のDBに登録とかするんじゃなければ必要ないですね
imbe | 2008/03/10 16:57



くず鉄とカープに何か関係があるのでしょうか。