逆引きPython

青空文庫からPythonで本文を取得したい

更新日:

青空文庫からPythonで本文を取得したい

青空文庫からPythonで本文を取得するコードです。作業ステップは以下の通りです。

① ダウンロードしたいURLのZIPを指定する。
② プログラム直下にZIPディレクトリを作成し解凍する。
③ ZIPディレクトリ配下のテキストファイルを読み込む
④ テキストファイルのルビや注釈などを削除して本文のみを取得する。

青空文庫URL:https://www.aozora.gr.jp/

サンプルとして青空文庫の三国志をダウンロードしてみます。

※使用する際には青空文庫の利用規約に基づき使用してください。

コード

 

-逆引きPython
-

Copyright© AI人工知能テクノロジー , 2019 All Rights Reserved.