St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

Windowsで形態素解析ツールMecab入れるのが面倒だったので、Janome使ってみた

こんにちは。僕の愛するMacがぶち壊れて、Windowsで開発をここ最近しているのですが、Mecab入れるときの手順がもうクソめんどくさくて、「あぁ、、、またやるのかこれ、、、」ってなってたところに、Janomeと出会いました。笑調べている過程で知ったんですが…

【PyCon2017】Pythonで使う可視化ライブラリまとめ

こんにちは。PyCon2017のビデオを全部ではないですが、気になったタイトルのものだけ見ているんですけど、その中で面白いものをみつけたので紹介します。 PyCon2017:Python's Visualization Landscape Pythonにはめちゃめちゃ沢山の可視化ライブラリがあり…

Kaggleを始める際に知っておくべきTipsをまとめてみた

こんにちは。今パソコンがぶっ壊れて絶賛セットアップ中なんですが、Kaggleの準備するがてらまとめておこうかと。 【Kaggleを始めるにあたって知っておくべきことリスト】 ・Kaggleとは ・Kaggleのアカウントの作成 ・コンペティションを選んで参加する ・Ka…

時系列解析:自己相関係数, 定常性, White Noise, AR, MA, ARMA, ARIMA, ARIMAXについて【調べたら随時追加】

こんにちは。最近時系列解析をすることになり、AR, MA, ARMA, ARIMA, ARIMAXあたりについて勉強したので、それについてまとめておこうかと思います。ぶっちゃけいろんなところにもうすでに解説は出ているので、これは調べている過程で参考になったリンクまと…

Macでscreenを使うときのインストールからコマンドまでのまとめ

Mac

こんにちは。以下、自分用のメモです。 ○Screenとは 仮想的に複数の端末を起動させて、いろんな作業を同時にやっちゃおうっていうことをしたり、画面を分割したりできる便利なやつです。 ○Homebrewでインストール 普通にHomebrewでインストール可能です。た…

「職場の問題地図 ~「で、どこから変える?」残業だらけ・休めない働き方」を読んだ

こんばんは。最近はデータ解析系の本(これは論文の方が多いかも)から、プログラミング、ビジネス書までとにかく読んで読んで読みまくっているんですが、「職場の問題地図 ~「で、どこから変える?」残業だらけ・休めない働き方」をかいつまんで(全部は読んで…

Effective python シリーズ7:Use List Comprehensions Instead of map and filter

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ6:Avoid Using start, end, and stride in a Single Slice

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ5:Know How to Slice Sequences

こんにちは。少し日が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良…

「採用学」を読んだ

こんにちは。「採用学」という本を読んだので、その本についてまとめておく。 ○読んだ本:「採用学」 今回読んだのはこの本。 ○本の内容と感想 この本は、採用を科学するという立場をとって研究をされている服部先生の本で、中身もできる限り事実を元に説明…

勾配降下法について調べてまとめてみた

こんにちは。今までなんとなくなーなーで勉強していたGradient Descentですが、ちゃんと調べて見ました。OverViewの論文があって(元はブログの投稿なので、これはそうというのかわからないけど)、今回それを読みつついろんな資料を漁る方式で勉強しました。 …

Effective python シリーズ4:Write Helper Functions Instead of Complex Expressions

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ3:Know the Differences Between "bytes", "str", and "unicode"

こんにちは。ちょっと期間が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読…

Effective python シリーズ2:Follow the PEP 8 Style Guide

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ1:Know Which Version of Python You’re Using

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective pythonを勉強します【これはまとめページ】

こんばんは。Pythonを猛烈に使うので、一回Pythonしっかり勉強しようと思いまして、Effective pythonっていう本が研究室にあって何気なくパラパラめくったら「おぉ…いい本だ…!!!」ってなったので、読むがてら自分で調べたこともまとめておこうかなーと。w…

データ分析をするときのフォルダ構成をどうするのか問題について

こんにちは。今回は、データ分析をするときのフォルダ構成をどうするのか問題について、ちょっと調べてみたので、自分のこれまでやってきたことを振り返りつつ、まとめます。 ○調べた動機 某データサイエンス系のインターンシップでの反省点でもあり、これは…

KPIについてぼんやりしかわかってなかったので、本を2つ読んで見た

こんばんは。2月に行ったとある某企業のインターンシップであったり、今運営しているメディアであったりで、KGI/KPIを使って目標や成果の管理をしているのですが、webにある断片的な情報だけで運営していました。メディアのようにPVとか離脱率とか、そういう…

「すみません」よりも意義のある言葉を

こんにちは。 「すみません」「申し訳ございません」 これらは割とよく日本人が使う言葉なのかなぁと思います。今日はこれについて書きます。 ○謝っても気持ち的な意味以外の状況は一ミリも改善されない これは最近、僕の身の回りのいくつかの団体で発生して…

他人からの感情的ラベリングによる再帰型自己陶酔と他者への攻撃的ランク付け増大効果

こんにちは。最近、これについて考える機会が多かったので、書きまする。それはそうと、意味のわからないタイトルすぎて草ですよね、全く。一つ一つ説明するスタイルで書こうと思います。以下の順番で行きます。 他人からの感情的ラベリング 再帰型自己陶酔 …

何故求職者の情報は開示要求があるのに面接者の情報は開示されていないのか問題に対して

こんばんは。今日は、「企業の求職者の情報をインターネット上で確認する」という行為について、そういえばと思ったことがあるので書く。 ○そういえば何故面接官の情報は開示されないのか? 採用面接のシーンにおいて、求職者の情報は開示され、面接官は準備…

推薦システムについて調べたのでまとめる

○推薦システムとは 推薦システムとは、特定のユーザーに対して、アイテムへの嗜好を予測し、提示すべきアイテムを決定するシステムのことを指す。また、Konstanの定義によれば以下のようなものが紹介されていた。 Recommenders: Tools to help identify wort…

協調フィルタリングについて調べたのでまとめる

協調フィルタリングについて調べる機会があったので、まとめておきます。 ○協調フィルタリングとは ○導入時に考慮するべきこと 協調フィルタリングを導入する際に考慮するべき点について考える。 1. レコメンデーションシステムの導入形態(SaaS vs パッケー…

Rで協調フィルタリングをやってみた

こんにちは。実際のレコメンドシステムでは、こういったパッケージを利用するのではなく、独自アルゴリズムなどを開発して自社パッケージとして持っておくのが普通かなぁと思う。んだけど、PoC(Proof of Concept)の段階、つまりレコメンドを実業務に導入する…

Rでアソシエーション分析:アプリオリアルゴリズム編

こんにちは。 ○arulesを使ってアソシエーション分析 ■arules関係のパッケージ 以下のサイトにまとまっている。lyle.smu.edu ■参考サイト ・CRAN - Package arules ・Reference manual : arules.pdf ■インストールと読み込み # “arules”のインストール instal…

MacへのRstanのインストール

以下の本を読んでいます。この本では、OSがwindows対象なので、Macとの差分を書いて行こうかと。あと、余力があればPythonでstanを用いた場合のコードとかも書いていく。インストール方法は、すぐに廃れてしまいますが、以下のような感じで行うというのをメ…

Mac上にAtomでLatex環境を整えて論文を書く

こんにちは。私も世に言う博士前期課程でして、論文を書く身分ですので、環境を整えようと思った次第です。最近は非エンジニア相手でなければ、なんでもAtomで済むことが多いので、latexもそうするかぁと思って、そうしようと思いました。そして、タイトルに…

コンピューターで「脳」がつくれるか を読んだ

こんにちは。最近研究室にあった本で気になっていた本を読んでみたので、その感想でも書きます。 ○読んだ本 「コンピューターで「脳」がつくれるか」という、以下の本を読みました。 ○本の対象読者とざっくりとした内容 この本は、ある程度予想はしていたの…

むしゃくしゃしたのでOffice 2016 for MacのPowerpointのショートカットキー一覧をまとめてみた

Mac

こんにちは。最近、パワーポイントを使うのですが、むしゃくしゃします。理由は、数式をぶち込むからです。数式をぶち込むとき、GUI(マウス)でいちいち「挿入タブ→数式」としないといけません。人生は限られています。もったいない。そう考えていたときに、…

私は気をつけようと思う人事担当者の思考と行動あるある

こんばんは。今日は、最近就活で感じた、「私は気をつけようと思う人事担当者の思考と行動あるある」について書きます。僕もいま担当している事業で採用側に立つことがあるので、以下は気をつけたいなぁと思ったことを書きます。 ○学生扱いをしない。例えば…

劣モジュラ最適化と機械学習を読んだ&輪講会をしたのでまとめておく【随時更新】

こんばんは。最近は本を読む速度、知識の吸収度が度を超えたスピードで進んでいることを感じております笑。 ○そもそも興味を持ったきっかけ 劣モジュラ最適化と機械学習について興味を持ったきっかけは、以下の動画が始まりでした。普通に数式なども出て来ず…

「続・わかりやすいパターン認識」を読んで輪講会をしたのでまとめておく

こんにちは。俗にいう続パタを読んで輪講会をしましたので、そこで使った資料などをまとめておきます。 ○読んだ本 読んだのは、以下の本。機械学習をやっている人は必ず読む、特に教師なし学習の入門書としては有名な一冊ではないかと。 ○参考になった資料ま…

エポック(epoch)数とは

こんにちは。今日はエポック数について調べましたのでそのことについて書きます。 ○エポック数とは エポック数とは、「一つの訓練データセットを何回繰り返して学習させるか」の数のことです。Deeplearningのようにパラメータの数が多いものになると、訓練デ…

スパース性に基づく機械学習の輪講会をしたのでまとめる【随時更新】

こんにちは!なんだかわからないですが、「スパース」熱いですね!その輪講会をしているので、作ったスライドなどをまとめていこうと思います(なぜかスライドが見当たらなかったので、自分たちで作ることに…でもなんとなくスライドが見当たらなかった理由が…

データ解析の実務プロセス入門を読んだ

こんばんは。年明けからコツコツ読んでいたデータ解析の実務プロセス入門を読み終えたので、感想でも簡単に書いておこうと思います。 ○読んだ本 今回読んだのは、あんちべ氏が書かれた「データ分析の実務プロセス入門」です。以下の本です。 ○ざっくりとした…

Stanについて勉強しますのでまとめておく

こんにちは。ちょっと最近気になっていたstanというプログラミング言語について勉強したいなーと思ったので、その勉強道具についてまとめておきます。 ◯Stanとは Stanとは、C++ベースのフリーソフトです。重回帰やロジスティック回帰などの基本的なモデルは…

データ解析のための統計モデリング入門を読んで輪講会した

こんにちは。年末から年始にかけて、「データ解析のための統計モデリング入門」を読んでました。今度、その輪講会をします。僕の担当は1章〜6章までだったので、「自分でスライド全部作ってるのは流石に無理んご」ってなったので、slideshareなどに上がって…

就活での会社選びの軸

こんにちは。僕も世に言う就活生なので、世間に流されて就活をするわけなのですが、就活でよく聞く「会社選びの軸は?」と良く聞かれます。また、とあるメディアを今作っているんですが、「働くって何?」を考えるに当たって、自分はどう考えて働くを選んで…

ディスプレイを買うことになったので、ディスプレイを選ぶ時に便利な記事をまとめておく

こんにちは。ディスプレイを買う必要に迫られたので、せっかくだし調べてみようと思って、調べてみました。 ○ディスプレイ選びの基準 まずは、ディスプレイを選ぶ時に出てくる用語的なところから。 ・モニター(ディスプレイ)の選び方…やっぱりポイントは大…

2016年の振り返り

こんにちは。今年は、割と多くのことをやったなぁと思います。密度が濃かった。去年もやりましたが、今年も一年の振り返りをしておこうかなぁと思います。st-hakky.hatenablog.comあと、最近いろんな人が僕のブログを見てくれているようで、ここで今年の感謝…

Kerasのインストール&Autoencoderを実装

こんばんは。もはや何番線じか分からないくらいのレベルのインストールの記事。個人的に今までTensorflowを使っていたので、Kerasも使ってみようということで、めもの意味が強い。 ○Kerasとは Kerasは、ニューラルネットワークのライブラリで、Pythonで書か…

プッシュ通知施策について

こんばんは。プッシュ通知について一度真面目に考えてみたので、それをまとめておきます。 ○プッシュ通知とは みなさんご存知のプッシュ通知。スマホとかで出て来るポップアップ通知のようなものでしょうか。 プッシュ通知とは、システム側が外部のサーバー…

Rでグラフィカルモデル(ベイジアンネットワーク)を行う際に使うパッケージまとめ

こんにちは。Rでグラフィカルモデル(主にベイジアンネットワーク)を行う際に使うパッケージについてまとめておきます。基本的には、おそらく次の3つのRのパッケージで大丈夫かなぁと思います。他にもあればぜひ教えてください。・bnlearn ・deal ・catnet ○b…

GO(Gene Ontology)とは

こんにちは。いろいろ知識が増えて来たので、せっかくなのでまとめておきます。 ○GOとは GO は gene ontology のことであり、遺伝子の生物的プロセス、細胞の構成要素および分子機能に着目して、遺伝子に付けられるアノテーションです。ある遺伝子に付けられ…

データサイエンティストとは何か今一度考える - 3

こんにちは。僕が就活をしていて感じたことと、少し前の記事で以下の記事があったので、これらについて肌感覚として思っていることを書きます(なので間違っている可能性などは十分にアリエル)。tjo.hatenablog.com僕の好きなTJOさんのブログですね笑。いつも…

評価方法・評価指標についてまとめる(随時更新)

こんばんは。毎回なんだっけなーとなる評価指標についてまとめます。また、英語の文献だけならいいんですが、日本語でたまに言われると面食らうので、それについてもまとめます。 ○混同行列 少しこの評価指標全般について話す前に、混同行列について書きます…

KEGGをRから使って可視化までさせてみる - KEGGgraph

今研究関係の論文を読んでいるんですが、KEGGとか色々出てきていてそういえば一度もまとめたことがないなぁということで、まとめます。 ○KEGGとは KEGGは、端的にいうとバイオインフォマティクス研究用のデータベースです。 KEGG(Kyoto Encyclopedia of Gen…

MacのPowerPointのデフォルトのフォントを変更したい

Mac

こんばんは。最近、スライドを作る機会がまた増えて来たので、なんとなく効率化しようと思った次第でございます。 ○Microsoftよ、なぜデフォルトのフォントがヒラギノ角ゴじゃないんだ? フォントの自由っていう言葉があるように、Microsoftも多くのフォント…

機械学習アドイベントカレンダー2016をやります。

こんにちは。 ○アドイベントカレンダーやります。 もともとこのブログは思ったことを適当に呟いたり、人事系のネタを書くことを念頭に置いたりして作ったものなので、僕の本業(?)である勉強系のネタは書いてきませんでした。しかし、そろそろ書くかなと思い…

企業の人材吸引力と雇用維持能力

おはようございます。今日は、最近就活をしていて感じる企業の人材吸引力と雇用維持能力について書きたいと思います。 ○人材吸引力・雇用維持能力とは? 人材吸引力とか雇用維持能力とかは僕が勝手に使っている言葉(もしかしたらあるのかもしれないというか…