HYT MachineWorks

やったこととか思いついたことをメモしておくブログです。

自然言語処理100本ノックをWindowsで 第一章を解く

自然言語処理100本ノックとは、

東北大学の乾・岡崎研究室にて公開されている自然言語処理の問題集です。初歩的な内容から応用的な内容まで含まれているのでこれをこなしてみることにしました。*1。ただ、OSを*NIXを使う前提っぽい感じがあってWindowsでやる場合の注意点とかハマったポイントを一章こなす毎にメモをしていこうと思います。

さっそくですが、第一章をこなしました。

www.cl.ecei.tohoku.ac.jp

*1:ちょうど、処理の前提がPythonなのでちょうどよかったってのもあったり

続きを読む

PowerShellでadmin権限無しでcondaで仮想環境の切替や、proxy越しにcondaやpipを使う

PowerShellとは

Windowsに搭載されている、コマンドプロンプトに変わる次世代のシェル環境になります。以前紹介した、msys2を使ってcondaやpipを使う方法を思いついた際は、管理者権限を持っていないと出来ないと思っていましたができる方法が分かったのでメモします。

hytmachineworks.hatenablog.com

続きを読む

Windows Helloを設定して生体認証で三倍早くログインする

Windows Helloとは

これまで、windows7の頃に買ったパソコンについていた指紋認証は、メーカ純正のソフトで行っていました。それをWindowsの標準の機能としてwindows10に搭載された新機能です。マイクロソフト曰く

Windows Hello なら、Windowsバイスに 2 秒未満でログインできます。これは、パスワードによるログインの 3 倍の速さです1。顔認証のためにカメラを使用するか、指紋リーダー8で指紋を読み取ります。どちらの場合でも、Windows Hello で認証が一瞬で完了します。バックアップとして PIN を常に用意しておくことができます。

Windows Hello | Windows 10 | Microsoft

 三倍ですって、すごいですね。そんな訳でセットアップしたのでメモ

続きを読む

ExcelのVLOOKUPを使ったかんたんなデータ集計入門

2つのシートに以上にまたがる情報をコピペ無しで集計したい

みんな、大好きエクセル。気合でコピペで切り貼りしたりしてませんか?気合を入れて集計して、終わる瞬間に元データ更新したから作り直してとか言われてイライラしませんか?そんなあなたに送る関数の使い方メモです。

続きを読む

VirtualBoxを使ってwindows7のマシン1台でmecab-ipadic-neologdをインストールする

mecab-ipadic-neologdのコンパイルを1台のマシンで済ませたい 

以前、mecab-pythonmecab-ipadic-neologdのインストールをメモしたが、mecab-ipadic-neologdを別のlinuxマシンでコンパイルしてインストールしていた。VirtualBoxを使い、ホストOSとゲストOSの共有フォルダを使うことで1台で完結する方法を考えたのでメモ

hytmachineworks.hatenablog.com

続きを読む

GitBucketをTomcatを使わずサービス化してプライベートGitを構築

社内ネットワークで分散バージョン管理に取り組む

プログラミングだけでなく何かを作ろうとした時に、困るのはバージョン管理だと思おいます。

  • プログラム.py
  • プログラム_途中.py
  • プログラム_最新.py
  • プログラム_最新20170604.py

みたいな感じで何がなんだかわからなく成ることが多いと思います。そこでGitHubクローンであるGitBucketを使ってプライベートなGitサーバを立ち上げてみたいと思います。

続きを読む

Google Noto Fontsを使ってmatplotlibとseabornでNo 豆腐する(文字化け回避)(Windows)

より良いmatplotlibとseabornでの文字化け回避の方法

以前、ライブラリの大本のフォント設定を変える方法での対応をメモした。

hytmachineworks.hatenablog.com

だが、Google様とAdobe様がフリーの豆腐をなくすためのフォントを公開してくださったので、システムにフォントをインストールし、使用する方法に変えたのでそれをメモする

続きを読む

python-igraphをwindowsにインストールする(python3)

ネットワーク分析パッケージpython-igraph

pythonではnetworkxのほうが有名っぽいですがigraphにしか実装されていない機能もあったりしたのでインストールしてみました。思いの外めんどかったのでメモ*1

*1:Rだと超簡単なのにね・・・

続きを読む

pycairoをwindowsでインストールする(python3)

windowsにpycairoを入れるには課題が

 cairoのpythonバインディングであるpycairoのインストールですが、流れとしては以下の流れで入るのですが

  1. cairoをインストー
  2. pycairoを非公式バイナリを落としてインストールです。

ただ、cairoのインストールに引っかかったのでメモします

続きを読む

決定版 汚れて臭くなった安全靴を手軽に洗ってみた

普通に洗っただけだとすぐ臭くなる安全靴

労働の相棒安全靴ですが、鉄をも通さないハードさが魅力的ですが。通気性が皆無なのも厄介です。そんな安全靴が臭かったので洗ってみた。というかこれまで何度も洗ってきて一番いい方法にたどり着いたのでメモする

この方法で、物を壊したり、靴が壊れたり、自分が怪我しても自己責任でよろしくお願いします。

続きを読む

リストで順序を維持したまま重複を削除する(Python3)

Pythonのリストを順序を維持したまま重複を削除する方法

よく下のようなやり方をネット上で見かけます。

a = ["b", "c", "a", "f", "c", "d"]
b = sorted(set(a), key=a.index)
print(b)

>>>> ['b', 'c', 'a', 'f', 'd']

これでいいと思っていたんですが、最近UpgradeしたPyCharmCommunityEdition2017.1だとkey=a.indexのところにエラーというか警告が出る。その対策法を考えたのでメモ

続きを読む

seabornとmatplotlibで豆腐を回避(文字化け回避)して日本語を表示する

 

seabornとmatplotlibで豆腐を回避とは?

matplotlibやそのラッパーであるseabornでは、デフォルトの環境で日本語を軸や凡例に用いると

日本語 → 

という風に文字化けする。その文字の見た目から豆腐とも呼ばれる。その回避方法をバージョンupと入れ直す度に忘れて焦るのでメモする。

続きを読む