お世話になります。
自分のパソコンのデスクトップの
任意のフォルダに集めたいです。
プログラムはpythonで、
楽天kドリームさんのサイトを
スクレイピングしたいです。
vscodeをエディタで初めたいです。
環境設定から、スクレイピングして
データ取得完了までの流れを教えてください。
回答
dat********:
競輪の並びやレース結果の過去データには著作権は存在しませんが、Webスクレイピングで高負荷を与えるのはオススメしません
データを参照して取り込むだけならブラウザで表示させるのと同じなので、言うほど高負荷を掛ける訳でも無いですがね
python スクレイピングでAmazonで検索すれば参考になる本はいくらでも見つかります
著作物について
https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/gaiyo/chosakubutsu.html
1051010379:
匿さんがおっしゃっていますが、
WebスクレイピングはWebサーバーに過度に通信負荷をかけると威力業務妨害、また、そもそもサイトに掲載されている情報を2次利用する際には著作権等の問題がある場合があり、株価やレース結果を掲載しているサイトでは最近ではスクレイピングについての利用規約を明記しているところもあるらしく、違反すると問題になりかねません。(明記されていないからと言って無断で使用してよいわけではありません)
YouTubeに動画をあげている方が規約を守っているのか、守っていないのかは知りませんが。
以上を踏まえて、それでも良いのであれば「vscode
python」や「python Beautifulsoup」で検索すれば情報が見つかります。
そもそもPythonが入っていなければ環境構築からですね。
あくまで自己責任で、お願いします。
- 1150455755
- pythonの決まり事で
タイマーを3秒に
設定して
一つづつ情報取得する
という宣言をすれば
問題ないそうです。
確かに禁止しているサイトと
スクレイプ条件付など
ありました。
掲示してないサイトは
pythonのルールに
準ずるそうなので、
タイマー宣言を守れば
大丈夫ということでした。
重く考えてくださり、
サイト確認に関心がもてました。
ありがとうございました。
匿:
> データ取得完了までの流れを教えてください。
まずは、そのサイトをスクレイピングして良いという許可をとってください。
https://keirin.kdreams.jp/info/sitepolicy/?l-id=l-ti-directoryNav_link_sitepolicy
- 1150455755
- YouTubeに競馬のデータを
スクレイピングしてるので
競輪もスクレイピングのやり方を
教えてほしいと相談しただけです。
ありがとうございました。