pythonでRSSフィードを取得し、画像がない場合、リンク先の記事から拾う

pythonでRSSフィードを取得する。具体的にはhoge.rdfとか取得する。で、その中に画像情報が入っていない場合、リンク先の記事のまで飛んで、その中にある画像のURLを取得し、画像つき記事のみ出力してみるサンプル。

“pythonでRSSフィードを取得し、画像がない場合、リンク先の記事から拾う” の続きを読む

pythonでcsvファイルの入出力。エンコードとか改行コードとか考慮しつつ

pythonにおけるcsvファイルの入出力について。csvは単なるテキストファイルであるけれど、文字コードやら改行コードやらクォーテーションの付け方やらを考えると、色々面倒臭い。

バージョンはpython3.6.4。Pandasは使わず標準のcsvライブラリでやる。たいていの場合Pandas使ったほうが楽ではある。

“pythonでcsvファイルの入出力。エンコードとか改行コードとか考慮しつつ” の続きを読む

Pythonでファイル・ディレクトリ操作

pythonでファイルやディレクトリを扱うときに個人的によく使う操作。よく使う割によく忘れて毎回調べてしまっている…。ので、メモ。なおPython 3.6。

以下、osとshutilをインポートしつつ。「11.2. os.path — 共通のパス名操作 — Python 3.6.3 ドキュメント」とか見つつ。

“Pythonでファイル・ディレクトリ操作” の続きを読む

pythonで画像をダウンロードして、URLに応じてディレクトリ分けする

pythonで画像をダウンロードする。画像のURLに応じて、ディレクトリを分ける。たとえば、画像のURLがhttps://example.com/hoge/img/img01.jpg であったとしたら、example.com/hoge/img という階層構造ができるようにディレクトリを作成する。

“pythonで画像をダウンロードして、URLに応じてディレクトリ分けする” の続きを読む