St_Hakky’s blog

プログラミング/心理学/人事/留学/データサイエンス/機械学習/Deep Learning/バイオインフォマティクス/日頃思ったこと/人事のデータサイエンスしてみたい

[Deep Learning] Batch sizeをどうやって決めるかについてまとめる

こんにちは。Deep Learningを自分でゼロから組んで(fine tuningとかではなく)、全部ゼロから学習させるのって大変ですよね。特に、ハイパーパラメーターの設定にすごく悩みます。トップカンファレンスに出されているような高精度の論文では、そういうハイパ…

Pythonのクラスメソッド(class method)の定義の仕方とstaticmethodとの違い

こんにちは。今日は上の件について書きます。 ○クラスメソッド (class method) とは クラスメソッドとは、クラス内で定義されたメソッドで、インスタンス化しなくても呼び出すことができるメソッドのことです。これは、インスタンスではなくて、クラスそのも…

PandasのDataFrame / Seriesでリスト内の要素にマッチする or しない行 (row) だけ取り出す

こんにちは。今日はpandasのメモを。 〇やりたいこと listとかでよくやる以下みたいな判定をやりたいんです。 list_data = [1,2,3,4,5] if 1 in list_data: print('あります') else: print('ありませんでした') このような、in演算子を用いて、リスト内に含…

chardetを使って文字コードを判定する

こんにちは。今日は文字コードの判定について書きます。 ◯文字コードの識別 もう基本UTF-8にしろよって感じなんですけど、たまにアップロードされたファイルの文字コードがなにか知りたいとかっていうシーンがあります。今回はそれをPythonでやろうというも…

Centosでの作業したメモとか

こんにちは。以下、Centosでよく行う作業のメモです。 〇Centosの環境 CentOS Linux release 7.3.1611 (Core) 〇Centosのバージョンの確認とOSが32bitか64bitかの確認 バージョンの確認は以下の通りで行えます。 cat /etc/redhat-release32bitか64bitかの確…

「Xception: Deep Learning with Depthwise Separable Convolutions」を読んで勉強したので参考になった資料とかまとめておく

こんにちは。今Deep Learningの論文紹介をやっているのですが、僕が紹介しようかなと思った論文がKerasの作者でもある@fcholletさんのCVPRの論文でした。It's official: my paper "Xception: Deep Learning with Depthwise Separable Convolutions" was acce…

「API Blueprint」を使ってWeb APIの仕様書を書くことになったのでその時に調べたこととかをまとめる

こんにちは。APIの仕様書をチームで書いて、その仕様書を元にガリガリ実装していくことになったのですが、今回「API Blueprint」というものを初めて使ったので、その時に調べたこととか参考になったサイトとかをまとめます。 〇本家のサイト 本家のサイトは…

sshfsを使ったのでまとめる(Centos 7)

こんにちは。sshfsをCentos7で使って、リモートのサーバーにあるファイルをマウントする処理を行おうと思い、やりましたのでメモしておきます。 〇Centosの環境 $ cat /etc/redhat-release CentOS Linux release 7.3.1611 (Core) 〇sshfsのインストール 世の…

GPUを使用する時によく使うコマンドとかまとめた

こんにちは。 ○GPUの種類の確認 lspci | grep -i nvidia ■参考 GPU関連でよく使うコマンドまとめ - Qiita ○nvidia driverのバージョン確認コマンド cat /proc/driver/nvidia/version ○nvidia-smiコマンド オプションはたくさんあります。よく使うコマンドと…

Neural Networkで使う活性化関数について調べたのでまとめてみた

こんにちは。ニューラルネットワークでは活性化関数を設定する必要があるわけなんですが、その活性化関数の種類は知っていてもどんなときにどんなものを使うといいか、なんかそのイメージがぱっとわくものがないかなぁと思って、調べてみました。 ○活性化関…

keras(tensorflow/theano/cntk)でGPUをnvidia-dockerから使ってみた (+αでLasagneも入れた)

こんにちは。今回は、主にDeep LearningをGPUで実行できる環境をDockerで作ってみました。主に入れたものは以下のものです。 keras=2.0.8 tensorflow_gpu=1.3.0 theano=0.10.0beta3 # 特定のチャンネル内に存在するパッケージ。理由は下記参照。 cntk=2.1 la…

Ubuntu16.04にRとRstudioをインストールしたのでその作業メモ

こんにちは。 ○環境 DISTRIB_ID=Ubuntu DISTRIB_RELEASE=16.04 DISTRIB_CODENAME=xenial DISTRIB_DESCRIPTION="Ubuntu 16.04.3 LTS" ○Rのインストール 本家のサイトに従い、インストールを進めていきます。 ■/etc/apt/sources.listを編集 まず、Ubuntuのバー…

データフロー図(Data Flow Diagram, DFD)をAtom上でMarkdownで書く方法を調べたのでまとめた(mermaid.js)

こんにちは。今やっているデータ分析のデータフローが結構ややこしいので、しっかりとDFDを作ることにしました。とはいえオブジェクトをGUIでグリグリ編集するのめんどくせぇので、Atomで書けるツールみたいなので、Markdownとかで気軽に編集できるものがな…

pyenvメモ(Anaconda/virtualenvとの違いについても比較してみた)

こんにちは。僕は圧倒的Anaconda派閥なのですが、ドキュメントにpyenvを使えというお達しがあったので、「郷に入っては郷に従え」の名のもとに、使います笑。存在や機能は知っていたのですが、正直真面目につかったことがなかったので、入門します。 ◯そもそ…

社会にも出てない大学生だけどITベンチャー企業の人事(採用)は難しいというのを痛感しているのでまとめた

こんにちは。今日は、タイトルにある通りな話を書こうと思います。 ◯お前は何か書ける程なにかしているのか していません(笑)。一応人事っぽいことはしていますし、勉強はしていますが、こんなことは僕みたいなミーハー野郎が書くべきものでもないのですし、…

マーケット感覚を身につけよう---「これから何が売れるのか?」わかる人になる5つの方法を読んだ

こんにちは。最近、本を貪っているのですが、今日は以下の本を読んだので、そのことについて書きます。 ◯読んだ本 読んだ本は、以下の「マーケット感覚を身につけよう---「これから何が売れるのか?」わかる人になる5つの方法」という本。別にこの本は関係な…

Ubuntu 16.04でDocker CEをインストールしてNVIDIA DriverとNVIDIA Dockerを入れるまでやった作業メモ

こんにちは。今日は研究でGPUを使うことになったので、Dockerでやるかと思い、この記事を作業メモとして残す意味を込めて書こうと思います。 ○なぜDockerでGPUを動かすのか ガチでやると設定が面倒な記憶しかない。 ミスって時間を潰している人生の余裕がな…

「DIET NETWORKS: THIN PARAMETERS FOR FAT GENOMICS」の論文を読んだ

こんにちは。今日は別の研究室とうちの研究室で合同でやっているDeepLearning勉強会があり、そこで「DIET NETWORKS: THIN PARAMETERS FOR FAT GENOMICS」の論文について発表したので、その際に作った発表資料とかメモとかを投稿しようと思います。概要とか途…

Webpackを使う関係で勉強しましたのでまとめる[随時更新]

こんにちは。Webpackをガリガリ使うようなプロジェクトにかかわる事になったので、勉強しました。そのメモです。 〇環境 Centos7, 64bit 〇本家のサイト 正直、こういうの勉強するときに英語さえ読めれば本家のサイトをめんどくさいけど読んだ方が最終的には…

Centos7にNode.jsをインストール

こんにちは。Centos7にNode.jsをインストールしたので、その作業メモを残しておこうかと思います。 〇環境 Centos7, 64bit 〇参考資料 正直、この手のインストールネタは直に意味をなさなくなるのと、もう既に良いサイトがたくさんあるので、そちらをみまし…

Pythonにおけるコーディングスタイルまとめ

こんにちは。pythonのコーディングスタイルについて調べてみたのでまとめました。 ○コーディングスタイルでやりたいこと コーディングスタイル(なんていうめんどくさいのもの)を考えてやりたいことは幾つかありますが、以下のところかと思います。 複数人で…

Centos7にDockerをインストールしたのでメモ

こんにちは。僕はいま諸事情があり、Windowsを使っているんですが、もう耐えられないのでCentos7に逃げてます(笑)今日はDockerをいれたので、そのメモを残しておきます。 〇環境と入れるもの DockerのCEを今回はいれます。Centos7, 64bit 〇Prerequisites Do…

pythonでファイルとかディレクトリ操作【随時更新】

こんにちは。個人的によくつかうものとかを気づいたらまとめていこうかと思います。 ファイルの操作 〇ファイル名の取得 import ntpath file_name = os.path.basename("hoge/hoge.txt") # hoge.txt ◯ファイルの存在確認 import os path = "hoge/hoge.txt" os…

SSHポートフォワーディングでMySQLに接続する方法

SSHポートフォワーディングでMySQLに接続する方法を調べたので、まとめておきます。 ○SSHポートフォワーディングでMySQLに接続する方法 まず、ポートフォワーディングを実行します。 ssh -f -N -C -L 10000:localhost:3306 user@nantoka.com -p 22以下、説明…

「日本の人事を科学する 因果推論に基づくデータ活用」を読んだ

こんにちは。お盆を利用して、前から気になっていた「日本の人事を科学する」という本を読んでみましたので、その感想とかを書いておきたいと思います。 ◯読んだ本 今回読んだのは以下の本です。この本は前から気になっていて、というか僕自身も人事はもっと…

sqlalchemyのインストール

こんにちは。sqlalchemyをつかうことになったので、その環境のセットアップなどについてまとめました。 ◯環境 python3.5以上 Windows10 64bit / Centos7 ◯インストール ■pipからインストール pip install sqlalchemy ■condaからインストール conda install s…

SQLAlchemyを使っていて勉強したこととか便利なTipsとかをまとめた

こんにちは。SQLAlchemyを使っていてわかったこととか勉強になったことをまとめました。 ◯環境構築 以下の記事にまとめました。st-hakky.hatenablog.com ◯DatabaseのURLの指定方法 Databaseに接続するためにURLを指定する必要があるのですが、そのURLの指定…

MySQL:文字コードについて

こんにちは。MySQLで取り扱う文字コードについて色々調べたこととかについてまとめたので、以下備忘録として残しておきたいと思います。 ○文字コードの変更 以下の様な感じのエラーが出た時の対処方法 sqlalchemy.exc.InternalError: (pymysql.err.InternalE…

MySQL:Databaseのセットアップ

こんにちは。MySQLを最近頻繁に使うので、その際にセットアップでやったこととかのメモをまとめておきました。 ○環境 Windows 10(64bit)Windowsだけど、コマンドとかに関しては多分一緒な感じだと思う。ところどころCentos7でも同じようなことをやって、環境…

DockerをWindowsにインストールしようと思ったらハマったのでメモ

こんにちは。僕の愛するMacがお亡くなりになられてからというものWindowsと過ごしているのですが、先日開発でDockerを使うためにインストールしようと思ったら色々ハマったのでそのメモをします。 ◯WindowsでDockerって無料だとアレなのね(泣) Docker for WI…