壁はかなり分厚い
どうも、毎朝の寒い空気と戦っているあきんどです。
いや、本当に寒いのだけはいつまで経っても克服できる気がしません。
近況としては、プログラミング学習のブランクがあったので少しずつ復習をしています。最近はPaizaの学習システムで自分のスキルを確かめたり、ポートフォリオ製作をしたりと楽しくコツコツとやっております。仕事しながらの学習はなかなか思うようにいかないものですね(言い訳)。日々勉学に励んでらっしゃる方々、心から尊敬します。もっとタイムマネジメントを意識しなければ…。
ということで、今週の学習内容を載せてみようと思います
<学習内容>
結論、わかりやすい。機械学習自体はスクールのテキストを使って学習をしていたのですが、具体的な記述方法に少しばかりか乏しい印象がありました。なので、それを埋め合わせてくれるような書籍を探していた時に出会ったのがこちらの本でした。
「機械学習ってかなり難解な数式が出てくるんとちゃうかな」と身構えていたのですが、こちらの書籍は機械学習の流れがかなり噛み砕いて記載されています。特にクラスタリング(教師なし学習)はスクールさんのテキストでは理解しきれなかったので書籍で復習しまくりました。
今回はテキストデータの前処理のパートを重点的にやりました。まだまだ理解しているとは言い難い習熟具合ではありますが、視野がかなり広がったのではないかと考えてはいます。内容としては付録のデータセットを利用して、映画のレビューが肯定的・否定的であるかを分類するというものです。いわゆる自然言語処理ってやつです。これを学習して、入力されたネガティブな言葉をポジティブな言葉に自動で変換してくれるようなアプリを作成しようかなと思っています。
書籍のサンプルコードで一連の流れを見ながら徐々に作っていってるのですが、データセットをどこから取ろうかなと悩んでおります。Wikipediaからダウンロードして使うのが一番やりやすそうなのですが、青空文庫さんのデータファイルを使うと趣のある対義語を選んでくれそうなので実用性と面白さを天秤にかけています。(両方で作ってみようかなとも思っています。)
また、これをきっかけに自然言語処理に興味が湧いてきたので、ボーナスも入ったことですし面白そうな書籍があれば買い漁ってみようかなと思います。
今買おうと考えているのはこの2冊です。
こちらは結構難しいとレビューで書かれています。ゴリゴリに数学が出てくるみたいなので、学習前に一旦復習をしてから臨みます。目標は一週間で一章を終わらせることですかね!
www.amazon.co.jp
安心安全のオライリーさん出版のディープラーニング教本。難易度がそこそこ高いことで有名みたいですね。こちらも数式がまるで夏の日の蚊のように当たり前に出てくるみたいです。ちなみにですが、こちらのシリーズの1冊目の本を買おうとしていたのですが、悩みに悩み抜いた結果半年もの月日が経っています。行動力、仕事してくれ…。
という具合にかなりのらりくらりとやっています。今のところ私は、PaizaのSランク問題をみて戦慄しています。未経験から転職するにはこれぐらいできていないと他の求職者たちに勝つことができないと思います。ただ、同じ人間が解くことのできる問題ですし、今できなくてもこれからの経験の質によってクリアできるはずですので早期でのクリアを目指して諦めずに全力を尽くしていきます。
個人的にはもっとキビキビと熟していきたいところなんですけど、最近は冬のせいか帰宅したらこたつの中で寝てしまいます。こうしてブログを書いているこの瞬間もこたつの中にいます。めっちゃやる気ないやんと思い落胆もしてしまいます。なのでまずは自分がクリアできる範囲を増やしていくことができるように少しづつやっています。たとえ仕事で疲れていても、何もやらないよりは圧倒的にマシだとは思いますので、5分、10分でもいいです。無理な目標設定はせず自分に合ったやり方でステップアップしていきましょう!
(楽しんで続けることが大事!)
最後までお読みいただきましてありがとうございました!
では!