HYT MachineWorks

やったこととか思いついたことをメモしておくブログです。

WindowsでPythonからMongoDB(DocumentStore)を使ってみる

 MongoDBとは?

所謂、NoSQLの一種で、Document Storeと言われるタイプのデータベースです。

エクセルで例えると、行をJSONで表現して、表全体をJSONの集まりとして表現したようなものです、そんな感じです。

JSONで扱えるので、そのまま辞書型に変換して、終わったらJSONで戻すって使えるからすごいかもと思ってPythonで使ってみましたのでメモ。

 

本記事では、ver 3.6を使用しています。(現時点2018/08/03最新 ver4.0)

www.mongodb.com

続きを読む

Windows10 64bit + Miniconda 上でcondaからpycryptoのインストールにハマった件

pycryotoとは

指定した文字列を色々な暗号化アルゴリズムで暗号化できるパッケージpycrypto

pypi.org

conda でもpipを使わなくてもインストールできて

>conda install pycrypto

でインストールされたように見えます。でも、使えないのです。その解決法*1

*1:ちなみに、Anacondaの場合はじめからインストールされているから無関係と思う、多分、MinicondaやAnacondaで意図的に削除した場合の話

続きを読む

WindowsでPythonからRedis(KVS)を使ってみる

Redisとは?

所謂、NoSQLの一種で、KVS(Key Value Store)と言われるタイプのデータベースです。

Key:「正解は?」

Value:「越後製菓!」

みたいに、キーと値を結びつけて管理するタイプになってます。これをPythonから使ってみたのでメモ。

https://redis.io/

github.com

他にもKVSはいろいろあったんですが、Windowsで、Visual Studio Communityを使わないで導入することを考えるとRedisしか見つからなかったというのが正直なところ。

続きを読む

PyCharm64bitで4GB以上のメモリを使う方法

 以前取り上げた、PyCharmを64bitで使う方法ですが。。。

hytmachineworks.hatenablog.com

現時点のversion17.3だとインストーラで途中で64bitかどうか聞かれてYESと答えれば何もしなくても使えるよう様になったみたいです。

ですが、それだけでは、750MBしか使えません。

それを、もっと使える方法が分かったのでメモ

続きを読む

自然言語処理100本ノックをWindows/Python3で 第六章を解く

自然言語処理100本ノックとは、

東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。

www.cl.ecei.tohoku.ac.jp

前回に引き続いて第六章をこなしました。

続きを読む

networkxとpygraphvizを使って日本語を含むグラフを作画する(Python3, Windows7 64bit)

networkxとpygraphvizを使ってネットワークの作画

python向けのネットワーク解析パッケージであるnetworkxとその作画にgraphvizを用いる際のラッパーであるpygraphvizを組み合わせてグラフを作図してみました。その際に日本語を豆腐にしないで表示する方法のメモです

続きを読む

Stanford NLPを使う (Windows7 64bit)

Stanford NLPとは、

Stanford大学の自然言語処理グループが開発した多言語(でも、日本語には対応してない)に対応した自然言語処理用パッケージです。他言語版MeCab+CaboChaみたいなものです。

インストールと、使用方法で手間取ったんでメモ

続きを読む

Gephiが動かない原因がわかった(Windows)

Gephiとは?

Gephiは、オープンソースのグラフ可視化・操作ソフトウエアで、超かっこいいグラフが書けちゃうソフトです。ですが、インストールしても、起動中の表示が出るものの立ち上がらない・・・

いろいろ、やって解決したのでメモします。

oss.infoscience.co.jp

続きを読む

自然言語処理100本ノックをWindows/Python3で 第五章を解く

自然言語処理100本ノックとは、

東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。

www.cl.ecei.tohoku.ac.jp

前回に引き続いて第五章をこなしました。

続きを読む

自然言語処理100本ノックをWindows/Python3で 第四章を解く

自然言語処理100本ノックとは、

東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。

www.cl.ecei.tohoku.ac.jp

前回に引き続いて第四章をこなしました。

続きを読む

forで、apendしたり、forにforしてネストが深くなる問題を回避する

forで、apendしたり、forにforをしてネストが深くなる問題とは

Pythonで色々処理をするときに、listを forでループさせることや、forでリストを作ったりすることがあると思います。いろいろ組み合わせたくてforにforを重ねてどんどんネストが深くなってしまったりすると思います。

それを回避する技とまではいかないけど方法をメモ

続きを読む

Windows Subsystem for Linux上のUbuntuでmecabとcabochaを使う

Windows Subsystem for Linuxとは

Windows上に直接Linuxの実行環境を作るものです。CreaterUpdateでは、Bash on Ubuntu on Windowsとして搭載されましたが、この度Windows10で、アップストアからubuntuとして利用可能になりました。これを使って、これまで仮想マシンと行ったり来たりをしながらしていたLinuxのソフトを直接使うことが出来ます。

続きを読む

自然言語処理100本ノックをWindows/Python3で 第三章を解く

自然言語処理100本ノックとは、

東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。

www.cl.ecei.tohoku.ac.jp

前回に引き続いて第三章をこなしました。

続きを読む

Pythonの正規表現で、括弧に囲まれた括弧を取る方法

カッコに囲まれたカッコとは

<あか<abcdef>さたな><はま<abcdef>やらわ>

みたいな文から

  1. <あか<abcdef>さたな>
  2. <はま<abcdef>やらわ>

を取り出したいと言うことです。簡単そうに見えてハマったのでメモ。

続きを読む