HYT MachineWorks

やったこととか思いついたことをメモしておくブログです。

自然言語処理100本ノック

自然言語処理100本ノックをWindows/Python3で 第10章: ベクトル空間法 (II)を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いてついに、最終章である第十章をこなしました。

自然言語処理100本ノックをWindows/Python3で 第9章: ベクトル空間法 (I)を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第九章をこなしました。

自然言語処理100本ノックの第9章ベクトル空間法 (I) 第80問~第85問を1/10サンプリングのデータをThinkPad X1 (2011)で解いてみた

自然言語処理100本ノックの第9章ベクトル空間法 (I) 第80問~第85問とは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集で、その中で唯一この章だけ問題の注釈として なお,問題83を素直に実装すると,大量(約7GB)の主記憶が必要にな…

urllib3を使ってWikipediaから国名一覧を取得してJSONで保存する Python3 windows10 64bit

Web スクレイピングの例としてWikipediaから情報収集をする ここでは、英語版wikipediaの国の一覧と海外領土・自治領の一覧からhtmlを取得して国名の一覧を取得することを目的にする。 それと、これは自然言語処理100本ノックの81問で使用する国名リストの取…

自然言語処理100本ノックをWindows/Python3で 第8章: 機械学習を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第八章をこなしました。

自然言語処理100本ノックをWindows/Python3で 第7章: データベースを解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第七章をこなしました。

Flaskで、Pythonを使ってwebアプリを作る Windows10 64bit (自然言語処理100本ノック7章 69番を解く)

Flaskとは? http://flask.pocoo.org/ Pythonをベースに作られた軽量webフレームワークです。一から頑張らなくても比較的カンタンにwebアプリが作れます。 これを使って簡単なwebアプリを作って見たのでメモ。正確には、自然言語処理100本ノックの7章 69番の…

自然言語処理100本ノックをWindows/Python3で 第6章: 英語テキストの処理を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第六章をこなしました。

自然言語処理100本ノックをWindows/Python3で 第5章: 係り受け解析を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第五章をこなしました。

自然言語処理100本ノックをWindows/Python3で 第4章: 形態素解析を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第四章をこなしました。

Windows Subsystem for Linux上のUbuntuでmecabとcabochaを使う

Windows Subsystem for Linuxとは Windows上に直接Linuxの実行環境を作るものです。CreaterUpdateでは、Bash on Ubuntu on Windowsとして搭載されましたが、この度Windows10で、アップストアからubuntuとして利用可能になりました。これを使って、これまで仮…

自然言語処理100本ノックをWindows/Python3で 第3章: 正規表現を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第三章をこなしました。

Pythonの正規表現で、括弧に囲まれた括弧を取る方法

カッコに囲まれたカッコとは <あか<abcdef>さたな><はま<abcdef>やらわ> みたいな文から <あか<abcdef>さたな> <はま<abcdef>やらわ> を取り出したいと言うことです。簡単そうに見えてハマったのでメモ。</abcdef></abcdef></abcdef></abcdef>

自然言語処理100本ノックをWindows/Python3で 第2章: UNIXコマンドの基礎を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。 www.cl.ecei.tohoku.ac.jp 前回に引き続いて第二章をこなしました。

自然言語処理100本ノックをWindows/Python3で 第1章: 準備運動を解く

自然言語処理100本ノックとは、 東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。初歩的な内容から応用的な内容まで含まれているのでこれをこなしてみることにしました。*1。ただ、OSを*NIXを使う前提っぽい感じがあってWindowsでやる…