St_Hakky’s blog

Data Science / Human Resources / Web Applicationについて書きます

【Python】Jupyter notebookのWarningを消す

こんにちは。Jupyter NotebookでWarningを見たくない時のコードを毎回調べちゃうのでメモ。 Warningを消す import warnings warnings.filterwarnings('ignore') 以上

【Python】線分交差判定のプログラムを書いた

こんにちは。仕事で「2つの線分が交差しているかどうか」を判定するプログラムを書いたのでその備忘録として書いておきます。 2つの線分が交差しているとは 2つの線分が交差しているとは、こちらのサイトによれば、 点A,Bを通る直線が線分CDと交差し、かつ …

git tag の使い方まとめ

Git

こんにちは。gitでtagを使って、バージョンを作っていくことになったので、作成・確認・共有の手順をまとめました。 本家 正直、色々なところにマニュアルとしてまとまっていますので、今更まとめる必要もないのですが、まとめた方が頭に残るし、コピペしや…

pipでキャッシュを無効にしてインストール

こんにちは。pipでキャッシュを無効にしてインストールするコマンドを久しぶりに仕事で見かけて、調べちゃったので、簡単にメモします。 キャッシュの無効化 キャッシュを無効にするには --no-cache-dir というオプションをつけるとできます。 $ pip install…

今更感あるけど決定木について調べたのでまとめる

こんにちは。本当にクソいまさらなんですけど、アンサンブル手法とか勉強していたら復習したくなってきたので、ここで復習もかねてまとめておきます。 決定木とは 決定木の概観 決定木はおそらく機械学習とかをやったことがある人なら確実に一回は見たり使っ…

【Python】Jupyter Notebookをssh経由で利用する

こんにちは。いつも調べちゃうことをメモ化することに決めた私です。今日は、Jupyter Notebookをssh経由で利用する際の設定メモです。以下のコンテンツは、Anacondaがインストール済みという前提の元作業を行なっています。 リモートの設定 notebook_config.…

【Python】Pandasで行・列で表示する文字数を指定する

こんにちは。Jupyter Notebookなどで行や列を表示した際に、結構な行数を表示させようとした時などは、「・・・」のような形で省略されて表示されてしまうと思います。これは便利な一方で、省略せずに表示してほしい場合などもあると思います。その際に、行…

【Python】loggingを複数ファイル・モジュール間で使う方法

こんにちは。今日は、loggingを複数ファイル・モジュール間で使う方法について調べたので、そのメモを書きます。ログの設定については下記に書いたので、今回は複数ファイル・モジュール間で使う方法についてだけ描きます。st-hakky.hatenablog.com やり方 …

pandas-datareader でデータをダウンロードしてみた

こんにちは。今日は、pandas-datareader を使ってデータを株価とか人口データをダウンロードしてみたので、そのことについてまとめます。 pandas-datareader とは Web上の様々なソースにアクセスできるライブラリ。か元々はPandasのライブラリの一つであった…

【Python】 Pandas-Profilingを使ってみた

こんにちは。最近Kaggleとかやっていて、EDAやるのめんどくさいとか思ったりしちゃったりした時に、ざくっと簡単に分析することができないかなぁと思って調べていたら「Pandas-Profiling」というものがあったので、実際に使ってみました。 本家のサイトなど …

【Kaggle】 Kaggle APIを使ってみる

こんにちは。今日は、Kaggle APIを使って、データのダウンロードとかしてみたので、その作業内容をまとめる。 Kaggle APIとは Pythonで実装されたコマンドラインツールを使用してアクセス可能なKaggleの公式APIのことです。Pythonのライブラリの一つなので、…

【Kaggle】「Mercari Price Suggestion Challenge」に参加したあと、改めて色々調べてみたのでまとめる

こんにちは。Mercariが主催したKaggleのコンペティションである、「Mercari Price Suggestion Challenge」について、過去に参加して色々見ていたんですが、機会があって改めて調べてみることにしたので、調べた内容とかをまとめてみました。 今回のコンペの…

【Python】時系列解析:Prophetで時系列解析してみたのでまとめる

こんにちは。最近、時系列解析が熱いですね!(ただ、仕事で使っているだけという笑)Rの方がまだ時系列解析のライブラリなどは揃っている感じはあります。Pythonでやろうと思うと、選択肢に上がってくるのは、statsmodelsなどもあると思いますが、今回はFaceb…

【Python】時系列解析:日本の休日を判定するライブラリ「jpholiday」を使ってみた

こんにちは。日本の時系列データを今仕事で扱っている関係もあり、日本の休日を判定する必要がありまして、判定するPythonのライブラリを調べて使って見ました。結構いろんなライブラリがあって、どれを使おうかなと迷ってしまうのですが、「jpholiday」とい…

他人がハマりそうな潜在的な将来の落とし穴をプロジェクトで見つけたときの自分のコントロール方法について

こんにちは。先日、某社の社員の方とお話して、とても参考になり、また腹落ちした部分があったので、そのことについて書きたいと思います。 先手を打ちたくなる気持ちをどうするか どんなプロジェクトでもいいのですが、プロジェクトマネジメントなどをして…