HYT MachineWorks

やったこととか思いついたことをメモしておくブログです。

BeautifulSoup

自然言語処理100本ノックをWindows/Python3で 第9章: ベクトル空間法 (I)を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第九章をこなしました。

urllib3を使ってWikipediaから国名一覧を取得してJSONで保存する Python3 windows10 64bit

Web スクレイピングの例としてWikipediaから情報収集をする ここでは、英語版wikipediaの国の一覧と海外領土・自治領の一覧からhtmlを取得して国名の一覧を取得することを目的にする。 それと、これは自然言語処理100本ノックの81問で使用する国名リストの取…

自然言語処理100本ノックをWindows/Python3で 第6章: 英語テキストの処理を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第六章をこなしました。