ARCHIVE  ENTRY  COMMENT  TRACKBACK  CATEGORY  RECOMMEND  LINK  PROFILE  OTHERS
<< January 2019 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 >>
<< canvasでウラムの螺旋 | main | ずばりわかる!データベース >>
2016.02.05 Friday

スポンサーサイト

一定期間更新がないため広告を表示しています

2014.03.04 Tuesday

cross-domain-ajaxを使ってみました

javascriptでcross-domain-ajaxというajaxで他ドメインのページ内容を取得できるライブラリがあります。
これを使ってクライアントでスクレイピングができるというのを試してみます。

テレビ東京の「午後のロードショー」のホームページを取得して、整形するサンプル。
セガールが出る日は強調表示します。
できましたが、ちょっと時間がかかりますね。
著作権はテレビ東京に属します。

サーバプログラムの使えない環境の人が、スクレイピングしたいとしたら、こうするしかないのではないかな。
やはり、cronでデータをデータベースに格納しておき、データベースを参照してデータを表示するというのが効率的。
スクレイピング夢が広がりますね。午後ローtwitter botとか、、午後ローgoogle calとか、、

2016.02.05 Friday

スポンサーサイト

コメント
コメントする








 
この記事のトラックバックURL
トラックバック
Powered by
30days Album
PR