さえめろ の めも🐰

さえめろの備忘録です。twitter : @sae_mero_

機械学習

MNISTのスケーリングは255.0で割らないほうがいいらしい

MNIST今回の事件の舞台。 多分この記事を読んでいる方はMNISTについての説明なんていらないとは思うのですが、一応ざっくりとだけ説明。MNISTは、0〜9までの手書き文字の画像からなるデータセットです。 そしてそれぞれの画像に対し、そこに書かれている数字…

【sklearn】tf-idfを用いたテキスト分類

現在機械学習のお勉強をさせて頂いている企業さんから、sklernを使ったテキスト処理の課題を受けました。 ちょうど良かったので、tf-idfのおさらいをざっくりとしようと思います。なお、今回のモデルはsklearnの公式チュートリアル(Working With Text Data …