St_Hakky’s blog

心理学/人事/就活/留学/データサイエンス/バイオインフォマティクス/日頃思ったことについて書きます。

データサイエンス

【PyCon2017】Pythonで使う可視化ライブラリまとめ

こんにちは。PyCon2017のビデオを全部ではないですが、気になったタイトルのものだけ見ているんですけど、その中で面白いものをみつけたので紹介します。 ○PyCon2017:Python's Visualization Landscape Pythonにはめちゃめちゃ沢山の可視化ライブラリがあり…

Kaggleを始める際に知っておくべきTipsをまとめてみた

こんにちは。今パソコンがぶっ壊れて絶賛セットアップ中なんですが、Kaggleの準備するがてらまとめておこうかと。 【Kaggleを始めるにあたって知っておくべきことリスト】 ・Kaggleとは ・Kaggleのアカウントの作成 ・コンペティションを選んで参加する ・Ka…

時系列解析:自己相関係数, 定常性, White Noise, AR, MA, ARMA, ARIMA, ARIMAXについて【調べたら随時追加】

こんにちは。最近時系列解析をすることになり、AR, MA, ARMA, ARIMA, ARIMAXあたりについて勉強したので、それについてまとめておこうかと思います。ぶっちゃけいろんなところにもうすでに解説は出ているので、これは調べている過程で参考になったリンクまと…

Effective python シリーズ7:Use List Comprehensions Instead of map and filter

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ6:Avoid Using start, end, and stride in a Single Slice

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ5:Know How to Slice Sequences

こんにちは。少し日が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良…

「採用学」を読んだ

こんにちは。「採用学」という本を読んだので、その本についてまとめておく。 ○読んだ本:「採用学」 今回読んだのはこの本。 ○本の内容と感想 この本は、採用を科学するという立場をとって研究をされている服部先生の本で、中身もできる限り事実を元に説明…

勾配降下法について調べてまとめてみた

こんにちは。今までなんとなくなーなーで勉強していたGradient Descentですが、ちゃんと調べて見ました。OverViewの論文があって(元はブログの投稿なので、これはそうというのかわからないけど)、今回それを読みつついろんな資料を漁る方式で勉強しました。 …

Effective python シリーズ4:Write Helper Functions Instead of Complex Expressions

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ3:Know the Differences Between "bytes", "str", and "unicode"

こんにちは。ちょっと期間が空いてしまいましたが、今日も頑張る。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読…

Effective python シリーズ2:Follow the PEP 8 Style Guide

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective python シリーズ1:Know Which Version of Python You’re Using

こんにちは。 ○読んでいる本 以下の本を勉強がてら読んでいます。www.effectivepython.comここにある通り、Pythonプログラムを改良する59項目が掲載されています。詳細は本に書かれているので、それを読めば良しとして、大事そうなところと、これに関連して…

Effective pythonを勉強します【これはまとめページ】

こんばんは。Pythonを猛烈に使うので、一回Pythonしっかり勉強しようと思いまして、Effective pythonっていう本が研究室にあって何気なくパラパラめくったら「おぉ…いい本だ…!!!」ってなったので、読むがてら自分で調べたこともまとめておこうかなーと。w…

データ分析をするときのフォルダ構成をどうするのか問題について

こんにちは。今回は、データ分析をするときのフォルダ構成をどうするのか問題について、ちょっと調べてみたので、自分のこれまでやってきたことを振り返りつつ、まとめます。 ○調べた動機 某データサイエンス系のインターンシップでの反省点でもあり、これは…

KPIについてぼんやりしかわかってなかったので、本を2つ読んで見た

こんばんは。2月に行ったとある某企業のインターンシップであったり、今運営しているメディアであったりで、KGI/KPIを使って目標や成果の管理をしているのですが、webにある断片的な情報だけで運営していました。メディアのようにPVとか離脱率とか、そういう…

Rで協調フィルタリングをやってみた

こんにちは。実際のレコメンドシステムでは、こういったパッケージを利用するのではなく、独自アルゴリズムなどを開発して自社パッケージとして持っておくのが普通かなぁと思う。んだけど、PoC(Proof of Concept)の段階、つまりレコメンドを実業務に導入する…

Rでアソシエーション分析:アプリオリアルゴリズム編

こんにちは。 ○arulesを使ってアソシエーション分析 ■arules関係のパッケージ 以下のサイトにまとまっている。lyle.smu.edu ■参考サイト ・CRAN - Package arules ・Reference manual : arules.pdf ■インストールと読み込み # “arules”のインストール instal…

MacへのRstanのインストール

以下の本を読んでいます。この本では、OSがwindows対象なので、Macとの差分を書いて行こうかと。あと、余力があればPythonでstanを用いた場合のコードとかも書いていく。インストール方法は、すぐに廃れてしまいますが、以下のような感じで行うというのをメ…

コンピューターで「脳」がつくれるか を読んだ

こんにちは。最近研究室にあった本で気になっていた本を読んでみたので、その感想でも書きます。 ○読んだ本 「コンピューターで「脳」がつくれるか」という、以下の本を読みました。 ○本の対象読者とざっくりとした内容 この本は、ある程度予想はしていたの…

劣モジュラ最適化と機械学習を読んだ&輪講会をしたのでまとめておく【随時更新】

こんばんは。最近は本を読む速度、知識の吸収度が度を超えたスピードで進んでいることを感じております笑。 ○そもそも興味を持ったきっかけ 劣モジュラ最適化と機械学習について興味を持ったきっかけは、以下の動画が始まりでした。普通に数式なども出て来ず…

「続・わかりやすいパターン認識」を読んで輪講会をしたのでまとめておく

こんにちは。俗にいう続パタを読んで輪講会をしましたので、そこで使った資料などをまとめておきます。 ○読んだ本 読んだのは、以下の本。機械学習をやっている人は必ず読む、特に教師なし学習の入門書としては有名な一冊ではないかと。 ○参考になった資料ま…

エポック(epoch)数とは

こんにちは。 ○エポック数とは エポック数とは、「一つの訓練データセットを何回繰り返して学習させるか」の数のことです。Deeplearningのようにパラメータの数が多いものになると、訓練データセットを何回も繰り返して学習させないとパラメータがうまく学習…

スパース性に基づく機械学習の輪講会をしたのでまとめる【随時更新】

こんにちは!なんだかわからないですが、「スパース」熱いですね!その輪講会をしているので、作ったスライドなどをまとめていこうと思います(なぜかスライドが見当たらなかったので、自分たちで作ることに…でもなんとなくスライドが見当たらなかった理由が…

データ解析の実務プロセス入門を読んだ

こんばんは。年明けからコツコツ読んでいたデータ解析の実務プロセス入門を読み終えたので、感想でも簡単に書いておこうと思います。 ○読んだ本 今回読んだのは、あんちべ氏が書かれた「データ分析の実務プロセス入門」です。以下の本です。 ○ざっくりとした…

Stanについて勉強しますのでまとめておく

こんにちは。ちょっと最近気になっていたstanというプログラミング言語について勉強したいなーと思ったので、その勉強道具についてまとめておきます。 ◯Stanとは Stanとは、C++ベースのフリーソフトです。重回帰やロジスティック回帰などの基本的なモデルは…

データ解析のための統計モデリング入門を読んで輪講会した

こんにちは。年末から年始にかけて、「データ解析のための統計モデリング入門」を読んでました。今度、その輪講会をします。僕の担当は1章〜6章までだったので、「自分でスライド全部作ってるのは流石に無理んご」ってなったので、slideshareなどに上がって…

Kerasのインストール&Autoencoderを実装

こんばんは。もはや何番線じか分からないくらいのレベルのインストールの記事。個人的に今までTensorflowを使っていたので、Kerasも使ってみようということで、めもの意味が強い。 ○Kerasとは Kerasは、ニューラルネットワークのライブラリで、Pythonで書か…

Rでグラフィカルモデル(ベイジアンネットワーク)を行う際に使うパッケージまとめ

こんにちは。Rでグラフィカルモデル(主にベイジアンネットワーク)を行う際に使うパッケージについてまとめておきます。基本的には、おそらく次の3つのRのパッケージで大丈夫かなぁと思います。他にもあればぜひ教えてください。・bnlearn ・deal ・catnet ○b…

データサイエンティストとは何か今一度考える - 3

こんにちは。僕が就活をしていて感じたことと、少し前の記事で以下の記事があったので、これらについて肌感覚として思っていることを書きます(なので間違っている可能性などは十分にアリエル)。tjo.hatenablog.com僕の好きなTJOさんのブログですね笑。いつも…

評価方法・評価指標についてまとめる(随時更新)

こんばんは。毎回なんだっけなーとなる評価指標についてまとめます。また、英語の文献だけならいいんですが、日本語でたまに言われると面食らうので、それについてもまとめます。 ○混同行列 少しこの評価指標全般について話す前に、混同行列について書きます…

機械学習アドイベントカレンダー2016をやります。

こんにちは。 ○アドイベントカレンダーやります。 もともとこのブログは思ったことを適当に呟いたり、人事系のネタを書くことを念頭に置いたりして作ったものなので、僕の本業(?)である勉強系のネタは書いてきませんでした。しかし、そろそろ書くかなと思い…

PRML輪講会合宿PART1のれぽ

こんばんは。先日、PRML輪講会の合宿を行ったので、そのレポを簡単にします。 ○開催概要など 開催概要は以下の通り。日時:日時:11/17(木) 6:00〜24:00 内容:PRML下巻(6章〜13章)全部 タイムテーブル: 5:50〜6:00 集合 6:00〜8:00 第6章:カーネル法 8:00…

データサイエンティストとは何か今一度考える - 2

こんにちは。なんか、「お前のいうデータサイエンティストってなんやねん」って言われて一言で説明するのが難しいので、ここに書いておこうと思います笑。前編はこちら。st-hakky.hatenablog.com ○10年後くらいまでは予想ができるけど、20年後はムズイから頑…

Tensorflowの勉強会で発表してきた

こんばんは。最近、機械学習をしこたま勉強しまくる毎日が続いております。インターンシップ先の企業の勉強会でTensorflowの本当に基本的な部分ですが、発表してきました。 Tensorflow from 和正 齋藤 www.slideshare.net最近は、機械学習系のこういったフレ…

【参加者募集】PRML輪講会@大阪 開催

こんばんは。機械学習などをやっている人で、PRMLを知らないなんてことはないと思うのですが、その輪講会を大阪でやります。もし以下を読んで興味がある人がいれば、ぜひ私にご連絡ください。 ○目的 PRMLを読んでは挫折を繰り広げている僕らにとって「最後ま…

データサイエンティストとは何か今一度考える - 1

こんにちは。サンディエゴに来ていろいろ刺激になり、勉強することも多いわけなんですが、正直いつも海外に行くと課題ばかり見つかって帰るような気がします。今日は、こっちに来て2週間が経ってから、悶々と考えていることについてまとめます。 ○このままで…