St_Hakky’s blog

Data Science / Human Resources / Web Applicationについて書きます

Data Science

Effective pythonを勉強します【これはまとめページ】

こんばんは。Pythonを猛烈に使うので、一回Pythonしっかり勉強しようと思いまして、Effective pythonっていう本が研究室にあって何気なくパラパラめくったら「おぉ…いい本だ…!!!」ってなったので、読むがてら自分で調べたこともまとめておこうかなーと。w…

データ分析をするときのフォルダ構成をどうするのか問題について

こんにちは。今回は、データ分析をするときのフォルダ構成をどうするのか問題について、ちょっと調べてみたので、自分のこれまでやってきたことを振り返りつつ、まとめます。 調べた動機 某データサイエンス系のインターンシップでの反省点でもあり、これは…

KPIについてぼんやりしかわかってなかったので、本を2つ読んで見た

こんばんは。2月に行ったとある某企業のインターンシップであったり、今運営しているメディアであったりで、KGI/KPIを使って目標や成果の管理をしているのですが、webにある断片的な情報だけで運営していました。メディアのようにPVとか離脱率とか、そういう…

Rで協調フィルタリングをやってみた

こんにちは。実際のレコメンドシステムでは、こういったパッケージを利用するのではなく、独自アルゴリズムなどを開発して自社パッケージとして持っておくのが普通かなぁと思う。んだけど、PoC(Proof of Concept)の段階、つまりレコメンドを実業務に導入する…

Rでアソシエーション分析:アプリオリアルゴリズム編

こんにちは。 ○arulesを使ってアソシエーション分析 ■arules関係のパッケージ 以下のサイトにまとまっている。lyle.smu.edu ■参考サイト ・CRAN - Package arules ・Reference manual : arules.pdf ■インストールと読み込み # “arules”のインストール instal…

MacへのRstanのインストール

以下の本を読んでいます。この本では、OSがwindows対象なので、Macとの差分を書いて行こうかと。あと、余力があればPythonでstanを用いた場合のコードとかも書いていく。インストール方法は、すぐに廃れてしまいますが、以下のような感じで行うというのをメ…

コンピューターで「脳」がつくれるか を読んだ

こんにちは。最近研究室にあった本で気になっていた本を読んでみたので、その感想でも書きます。 ○読んだ本 「コンピューターで「脳」がつくれるか」という、以下の本を読みました。 ○本の対象読者とざっくりとした内容 この本は、ある程度予想はしていたの…

「劣モジュラ最適化と機械学習」を読んだ&輪講会をしたのでまとめておく

こんばんは。最近、機械学習プロフェッショナルシリーズの「劣モジュラ最適化と機械学習」を読んで、輪講会を勉強会でしたので、スライドとか参考情報をまとめておきたいと思います。 そもそも興味を持ったきっかけ 劣モジュラ最適化と機械学習について興味…

「続・わかりやすいパターン認識」を読んで輪講会をしたのでまとめておく

こんにちは。俗にいう続パタを読んで輪講会をしましたので、そこで使った資料などをまとめておきます。 ○読んだ本 読んだのは、以下の本。機械学習をやっている人は必ず読む、特に教師なし学習の入門書としては有名な一冊ではないかと。 ○参考になった資料ま…

エポック(epoch)数とは【機械学習 / Deep Learning】

こんにちは。今日はエポック数について調べましたので、そのことについて書きます。 エポック数とは エポック数とは、「一つの訓練データを何回繰り返して学習させるか」の数のことです。Deep Learningのようにパラメータの数が多いものになると、訓練データ…

スパース性に基づく機械学習の輪講会をしたのでまとめる【随時更新】

こんにちは!なんだかわからないですが、「スパース」熱いですね!その輪講会をしているので、作ったスライドなどをまとめていこうと思います(なぜかスライドが見当たらなかったので、自分たちで作ることに…でもなんとなくスライドが見当たらなかった理由が…

データ解析の実務プロセス入門を読んだ

こんばんは。年明けからコツコツ読んでいたデータ解析の実務プロセス入門を読み終えたので、感想でも簡単に書いておこうと思います。 ○読んだ本 今回読んだのは、あんちべ氏が書かれた「データ分析の実務プロセス入門」です。以下の本です。 ○ざっくりとした…

Stanについて勉強しますのでまとめておく

こんにちは。ちょっと最近気になっていたstanというプログラミング言語について勉強したいなーと思ったので、その勉強道具についてまとめておきます。 ◯Stanとは Stanとは、C++ベースのフリーソフトです。重回帰やロジスティック回帰などの基本的なモデルは…

データ解析のための統計モデリング入門を読んで輪講会した

こんにちは。年末から年始にかけて、「データ解析のための統計モデリング入門」を読んでました。今度、その輪講会をします。僕の担当は1章〜6章までだったので、「自分でスライド全部作ってるのは流石に無理んご」ってなったので、slideshareなどに上がって…

Kerasのインストール&Autoencoderを実装

こんばんは。もはや何番線じか分からないくらいのレベルのインストールの記事。個人的に今までTensorflowを使っていたので、Kerasも使ってみようということで、めもの意味が強い。 ○Kerasとは Kerasは、ニューラルネットワークのライブラリで、Pythonで書か…

Rでグラフィカルモデル(ベイジアンネットワーク)を行う際に使うパッケージまとめ

こんにちは。Rでグラフィカルモデル(主にベイジアンネットワーク)を行う際に使うパッケージについてまとめておきます。基本的には、おそらく次の3つのRのパッケージで大丈夫かなぁと思います。他にもあればぜひ教えてください。・bnlearn ・deal ・catnet ○b…

データサイエンティストとは何か今一度考える - 3

こんにちは。僕が就活をしていて感じたことと、少し前の記事で以下の記事があったので、これらについて肌感覚として思っていることを書きます(なので間違っている可能性などは十分にアリエル)。tjo.hatenablog.com僕の好きなTJOさんのブログですね笑。いつも…

評価方法・評価指標についてまとめる(随時更新)

こんばんは。毎回なんだっけなーとなる評価指標についてまとめます。また、英語の文献だけならいいんですが、日本語でたまに言われると面食らうので、それについてもまとめます。 ○混同行列 少しこの評価指標全般について話す前に、混同行列について書きます…

機械学習アドイベントカレンダー2016をやります。

こんにちは。 ○アドイベントカレンダーやります。 もともとこのブログは思ったことを適当に呟いたり、人事系のネタを書くことを念頭に置いたりして作ったものなので、僕の本業(?)である勉強系のネタは書いてきませんでした。しかし、そろそろ書くかなと思い…

PRML輪講会合宿PART1のれぽ

こんばんは。先日、PRML輪講会の合宿を行ったので、そのレポを簡単にします。 ○開催概要など 開催概要は以下の通り。日時:日時:11/17(木) 6:00〜24:00 内容:PRML下巻(6章〜13章)全部 タイムテーブル: 5:50〜6:00 集合 6:00〜8:00 第6章:カーネル法 8:00…

データサイエンティストとは何か今一度考える - 2

こんにちは。なんか、「お前のいうデータサイエンティストってなんやねん」って言われて一言で説明するのが難しいので、ここに書いておこうと思います笑。前編はこちら。st-hakky.hatenablog.com ○10年後くらいまでは予想ができるけど、20年後はムズイから頑…

Tensorflowの勉強会で発表してきた

こんばんは。最近、機械学習をしこたま勉強しまくる毎日が続いております。インターンシップ先の企業の勉強会でTensorflowの本当に基本的な部分ですが、発表してきました。 Tensorflow from 和正 齋藤 www.slideshare.net最近は、機械学習系のこういったフレ…

【参加者募集】PRML輪講会@大阪 開催

こんばんは。機械学習などをやっている人で、PRMLを知らないなんてことはないと思うのですが、その輪講会を大阪でやります。もし以下を読んで興味がある人がいれば、ぜひ私にご連絡ください。 ○目的 PRMLを読んでは挫折を繰り広げている僕らにとって「最後ま…

データサイエンティストとは何か今一度考える - 1

こんにちは。サンディエゴに来ていろいろ刺激になり、勉強することも多いわけなんですが、正直いつも海外に行くと課題ばかり見つかって帰るような気がします。今日は、こっちに来て2週間が経ってから、悶々と考えていることについてまとめます。 ○このままで…