St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

社会にも出てない大学生だけどITベンチャー企業の人事(採用)は難しいというのを痛感しているのでまとめた

こんにちは。今日は、タイトルにある通りな話を書こうと思います。 ◯お前は何か書ける程なにかしているのか していません(笑)。一応人事っぽいことはしていますし、勉強はしていますが、こんなことは僕みたいなミーハー野郎が書くべきものでもないのですし、…

マーケット感覚を身につけよう---「これから何が売れるのか?」わかる人になる5つの方法を読んだ

こんにちは。最近、本を貪っているのですが、今日は以下の本を読んだので、そのことについて書きます。 ◯読んだ本 読んだ本は、以下の「マーケット感覚を身につけよう---「これから何が売れるのか?」わかる人になる5つの方法」という本。別にこの本は関係な…

Ubuntu 16.04でDocker CEをインストールしてNVIDIA DriverとNVIDIA Dockerを入れるまでやった作業メモ

こんにちは。今日は研究でGPUを使うことになったので、Dockerでやるかと思い、この記事を作業メモとして残す意味を込めて書こうと思います。 ○なぜDockerでGPUを動かすのか ガチでやると設定が面倒な記憶しかない。 ミスって時間を潰している人生の余裕がな…

「DIET NETWORKS: THIN PARAMETERS FOR FAT GENOMICS」の論文を読んだ

こんにちは。今日は別の研究室とうちの研究室で合同でやっているDeepLearning勉強会があり、そこで「DIET NETWORKS: THIN PARAMETERS FOR FAT GENOMICS」の論文について発表したので、その際に作った発表資料とかメモとかを投稿しようと思います。概要とか途…

Webpackを使う関係で勉強しましたのでまとめる[随時更新]

こんにちは。Webpackをガリガリ使うようなプロジェクトにかかわる事になったので、勉強しました。そのメモです。 〇環境 Centos7, 64bit 〇本家のサイト 正直、こういうの勉強するときに英語さえ読めれば本家のサイトをめんどくさいけど読んだ方が最終的には…

Centos7にNode.jsをインストール

こんにちは。Centos7にNode.jsをインストールしたので、その作業メモを残しておこうかと思います。 〇環境 Centos7, 64bit 〇参考資料 正直、この手のインストールネタは直に意味をなさなくなるのと、もう既に良いサイトがたくさんあるので、そちらをみまし…

Pythonにおけるコーディングスタイルまとめ

こんにちは。pythonのコーディングスタイルについて調べてみたのでまとめました。 ○コーディングスタイルでやりたいこと コーディングスタイル(なんていうめんどくさいのもの)を考えてやりたいことは幾つかありますが、以下のところかと思います。 複数人で…

Centos7にDockerをインストールしたのでメモ

こんにちは。僕はいま諸事情があり、Windowsを使っているんですが、もう耐えられないのでCentos7に逃げてます(笑)今日はDockerをいれたので、そのメモを残しておきます。 〇環境と入れるもの DockerのCEを今回はいれます。Centos7, 64bit 〇Prerequisites Do…

pythonでファイルとかディレクトリ操作【随時更新】

こんにちは。個人的によくつかうものとかを気づいたらまとめていこうかと思います。 ◯ファイルの存在確認 import os path = "hoge/hoge.txt" os.path.isfile(path) # True => ある, False => ない ■参考 pythonでファイルの存在を確認する - Qiita ◯ディレク…

SSHポートフォワーディングでMySQLに接続する方法

SSHポートフォワーディングでMySQLに接続する方法を調べたので、まとめておきます。 ○SSHポートフォワーディングでMySQLに接続する方法 まず、ポートフォワーディングを実行します。 ssh -f -N -C -L 10000:localhost:3306 user@nantoka.com -p 22以下、説明…

「日本の人事を科学する 因果推論に基づくデータ活用」を読んだ

こんにちは。お盆を利用して、前から気になっていた「日本の人事を科学する」という本を読んでみましたので、その感想とかを書いておきたいと思います。 ◯読んだ本 今回読んだのは以下の本です。この本は前から気になっていて、というか僕自身も人事はもっと…

sqlalchemyのインストール

こんにちは。sqlalchemyをつかうことになったので、その環境のセットアップなどについてまとめました。 ◯環境 python3.5以上 Windows10 64bit / Centos7 ◯インストール ■pipからインストール pip install sqlalchemy ■condaからインストール conda install s…

SQLAlchemyを使っていて勉強したこととか便利なTipsとかをまとめた

こんにちは。SQLAlchemyを使っていてわかったこととか勉強になったことをまとめました。 ◯環境構築 以下の記事にまとめました。st-hakky.hatenablog.com ◯DatabaseのURLの指定方法 Databaseに接続するためにURLを指定する必要があるのですが、そのURLの指定…

MySQL:文字コードについて

こんにちは。MySQLで取り扱う文字コードについて色々調べたこととかについてまとめたので、以下備忘録として残しておきたいと思います。 ○文字コードの変更 以下の様な感じのエラーが出た時の対処方法 sqlalchemy.exc.InternalError: (pymysql.err.InternalE…

MySQL:Databaseのセットアップ

こんにちは。MySQLを最近頻繁に使うので、その際にセットアップでやったこととかのメモをまとめておきました。 ○環境 Windows 10(64bit)Windowsだけど、コマンドとかに関しては多分一緒な感じだと思う。ところどころCentos7でも同じようなことをやって、環境…

DockerをWindowsにインストールしようと思ったらハマったのでメモ

こんにちは。僕の愛するMacがお亡くなりになられてからというものWindowsと過ごしているのですが、先日開発でDockerを使うためにインストールしようと思ったら色々ハマったのでそのメモをします。 ◯WindowsでDockerって無料だとアレなのね(泣) Docker for WI…

Gradient Boostingについて調べたのでまとめる

こんにちは。Gradient Boostingについて調べたのでまとめました。その他の手法やBoostingってそもそも何的な説明は以下の記事でしています。st-hakky.hatenablog.com ◯Gradient Boostingとは Gradient Boostingの誕生の経緯とかはこちらに書かれているので、…

AdaBoostについて調べたのでまとめる

こんにちは。今日はAdaBoostについて書きます。Boostingってそもそも何っていうのとか他のBoostingの手法については以下の記事をどうぞ。st-hakky.hatenablog.com ◯AdaBoostとは AdaBoostは"Adaptive Boosting"の略でBoostingのアルゴリズムとしては最初に出…

Boosting(ブースティング)について調べたのでまとめる:AdaBoost / Gradient Boosting / XGBoostなど

こんにちは。最近、アンサンブル学習について勉強しているんですが、この記事ではBoostingについて調べたことを書きます。以下がその他のアンサンブル学習とか全般的な話とかについて書いた記事なので、バギングとか知りたい人は以下の記事をどうぞ。st-hakk…

Bagging(バギング)について調べたのでまとめた:Out-of-Bag(OOB) / Random Forest / Decision Jungles / Deep Forest(gcForest)

こんにちは。Kaggleをやるにあたって(というかふつうに勉強したかったのもある)、アンサンブル学習の方法は勉強しておく必要があるようなーと思って、勉強してみました。他のブースティングやスタッキング、アンサンブル学習全般については以下の記事をどう…

いちいち覚えていられないしもうよく使うMySQLのコマンドとかやることとかをまとめておく

こんにちは。最近SQLのコマンドとかよくつかうんですけど、たまーーーーーーにつかうものとか、びみょーーーーーに覚えにくいやつとか、いちいち調べていてまじで時間もったいないのでまとめておきます。まぁ覚えろよってことなんですけど、なんかこの手のコ…

「会う人すべてがあなたのファンになる 一流の魅せ方」という本を読んだ

こんにちは。最近はぼちぼちいろんな本を読んでいるわけなんですが、一つ一つ印象に残ったところをメモしておかないと全部忘れちゃいますね。ってことで書きます。 ◯読んだ本 以下の本を読みました。 ◯本の概要と感想 この本は、筆者が議員秘書の経験や選挙…

Julia入門

こんばんは。最近、そろそろ違うプログラミング言語を勉強したいなぁと思っていて、この夏はC++とJuliaを触りたいなーと。Web開発はするので、Javascriptとかもガンガン触ることになりそう。2ヶ月でどこまで触れるかって感じですね。さて、データサイエンス…

アンサンブル学習について勉強したのでまとめました:Bagging(Random Forest / Decision Jungles / Deep Forest) / Boosting(AdaBoost / Gradient Boosting / XGBoost) / Stacking

こんにちは。今、KaggleのRestaurant Revenue Predictionをやっていて、その中でアンサンブル学習について再度学習してみたので、まとめました。結構ながくなっちゃったかもですが、頑張って参考文献に飛ばしたりとかしてまとめました(笑) アンサンブル学習…

Windowsで形態素解析ツールMecab入れるのが面倒だったので、Janome使ってみた

こんにちは。僕の愛するMacがぶち壊れて、Windowsで開発をここ最近しているのですが、Mecab入れるときの手順がもうクソめんどくさくて、「あぁ、、、またやるのかこれ、、、」ってなってたところに、Janomeと出会いました。笑調べている過程で知ったんですが…

【PyCon2017】Pythonで使う可視化ライブラリまとめ

こんにちは。PyCon2017のビデオを全部ではないですが、気になったタイトルのものだけ見ているんですけど、その中で面白いものをみつけたので紹介します。 PyCon2017:Python's Visualization Landscape Pythonにはめちゃめちゃ沢山の可視化ライブラリがあり…

Kaggleを始める際に知っておくべきTipsをまとめてみた

こんにちは。今パソコンがぶっ壊れて絶賛セットアップ中なんですが、Kaggleの準備するがてらまとめておこうかと。 【Kaggleを始めるにあたって知っておくべきことリスト】 ・Kaggleとは ・Kaggleのアカウントの作成 ・コンペティションを選んで参加する ・Ka…

時系列解析:自己相関係数, 定常性, White Noise, AR, MA, ARMA, ARIMA, ARIMAXについて【調べたら随時追加】

こんにちは。最近時系列解析をすることになり、AR, MA, ARMA, ARIMA, ARIMAXあたりについて勉強したので、それについてまとめておこうかと思います。ぶっちゃけいろんなところにもうすでに解説は出ているので、これは調べている過程で参考になったリンクまと…

Macでscreenを使うときのインストールからコマンドまでのまとめ

Mac

こんにちは。以下、自分用のメモです。 ○Screenとは 仮想的に複数の端末を起動させて、いろんな作業を同時にやっちゃおうっていうことをしたり、画面を分割したりできる便利なやつです。 ○Homebrewでインストール 普通にHomebrewでインストール可能です。た…

「職場の問題地図 ~「で、どこから変える?」残業だらけ・休めない働き方」を読んだ

こんばんは。最近はデータ解析系の本(これは論文の方が多いかも)から、プログラミング、ビジネス書までとにかく読んで読んで読みまくっているんですが、「職場の問題地図 ~「で、どこから変える?」残業だらけ・休めない働き方」をかいつまんで(全部は読んで…

Effective python シリーズ7:Use List Comprehensions Instead of map and filter

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ6:Avoid Using start, end, and stride in a Single Slice

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ5:Know How to Slice Sequences

こんにちは。少し日が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良…

「採用学」を読んだ

こんにちは。「採用学」という本を読んだので、その本についてまとめておく。 ○読んだ本:「採用学」 今回読んだのはこの本。 ○本の内容と感想 この本は、採用を科学するという立場をとって研究をされている服部先生の本で、中身もできる限り事実を元に説明…

勾配降下法について調べてまとめてみた

こんにちは。今までなんとなくなーなーで勉強していたGradient Descentですが、ちゃんと調べて見ました。OverViewの論文があって(元はブログの投稿なので、これはそうというのかわからないけど)、今回それを読みつついろんな資料を漁る方式で勉強しました。 …

Effective python シリーズ4:Write Helper Functions Instead of Complex Expressions

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ3:Know the Differences Between "bytes", "str", and "unicode"

こんにちは。ちょっと期間が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読…

Effective python シリーズ2:Follow the PEP 8 Style Guide

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ1:Know Which Version of Python You’re Using

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective pythonを勉強します【これはまとめページ】

こんばんは。Pythonを猛烈に使うので、一回Pythonしっかり勉強しようと思いまして、Effective pythonっていう本が研究室にあって何気なくパラパラめくったら「おぉ…いい本だ…!!!」ってなったので、読むがてら自分で調べたこともまとめておこうかなーと。w…

データ分析をするときのフォルダ構成をどうするのか問題について

こんにちは。今回は、データ分析をするときのフォルダ構成をどうするのか問題について、ちょっと調べてみたので、自分のこれまでやってきたことを振り返りつつ、まとめます。 ○調べた動機 某データサイエンス系のインターンシップでの反省点でもあり、これは…

KPIについてぼんやりしかわかってなかったので、本を2つ読んで見た

こんばんは。2月に行ったとある某企業のインターンシップであったり、今運営しているメディアであったりで、KGI/KPIを使って目標や成果の管理をしているのですが、webにある断片的な情報だけで運営していました。メディアのようにPVとか離脱率とか、そういう…

「すみません」よりも意義のある言葉を

こんにちは。 「すみません」「申し訳ございません」 これらは割とよく日本人が使う言葉なのかなぁと思います。今日はこれについて書きます。 ○謝っても気持ち的な意味以外の状況は一ミリも改善されない これは最近、僕の身の回りのいくつかの団体で発生して…

他人からの感情的ラベリングによる再帰型自己陶酔と他者への攻撃的ランク付け増大効果

こんにちは。最近、これについて考える機会が多かったので、書きまする。それはそうと、意味のわからないタイトルすぎて草ですよね、全く。一つ一つ説明するスタイルで書こうと思います。以下の順番で行きます。 他人からの感情的ラベリング 再帰型自己陶酔 …

何故求職者の情報は開示要求があるのに面接者の情報は開示されていないのか問題に対して

こんばんは。今日は、「企業の求職者の情報をインターネット上で確認する」という行為について、そういえばと思ったことがあるので書く。 ○そういえば何故面接官の情報は開示されないのか? 採用面接のシーンにおいて、求職者の情報は開示され、面接官は準備…

推薦システムについて調べたのでまとめる

○推薦システムとは 推薦システムとは、特定のユーザーに対して、アイテムへの嗜好を予測し、提示すべきアイテムを決定するシステムのことを指す。また、Konstanの定義によれば以下のようなものが紹介されていた。 Recommenders: Tools to help identify wort…

協調フィルタリングについて調べたのでまとめる

協調フィルタリングについて調べる機会があったので、まとめておきます。 ○協調フィルタリングとは ○導入時に考慮するべきこと 協調フィルタリングを導入する際に考慮するべき点について考える。 1. レコメンデーションシステムの導入形態(SaaS vs パッケー…

Rで協調フィルタリングをやってみた

こんにちは。実際のレコメンドシステムでは、こういったパッケージを利用するのではなく、独自アルゴリズムなどを開発して自社パッケージとして持っておくのが普通かなぁと思う。んだけど、PoC(Proof of Concept)の段階、つまりレコメンドを実業務に導入する…

Rでアソシエーション分析:アプリオリアルゴリズム編

こんにちは。 ○arulesを使ってアソシエーション分析 ■arules関係のパッケージ 以下のサイトにまとまっている。lyle.smu.edu ■参考サイト ・CRAN - Package arules ・Reference manual : arules.pdf ■インストールと読み込み # “arules”のインストール instal…

MacへのRstanのインストール

以下の本を読んでいます。この本では、OSがwindows対象なので、Macとの差分を書いて行こうかと。あと、余力があればPythonでstanを用いた場合のコードとかも書いていく。インストール方法は、すぐに廃れてしまいますが、以下のような感じで行うというのをメ…