2018-01-06

2017年導入してよかったこと

日記

新年あけました。みなさんの2017年買ったよかったものなどを見てると、自分もまとめておこうかなと思いました。

習慣
モノ
2018年の導入予定

習慣

Google Keep と Trelloと Evernoteのまとめ方が確立できた

Keepにメモを残す。その後、タスクはTrelloで管理する（To Do -> Doing -> Done -> アーカイブ）。作業内容・調べたこと・参考サイト・Tips・思ったこと等はEvernoteでまとめる。これでだいぶ落ち着きました。

ジムに通ったこと

日頃の運動不足を少しでも解消したいということで、2月から9月まで自転車でいけるジムに週1程度通いました。がっつり筋トレというより、日曜のオープンとともに、ランニングマシンでテレビをみながら5km走ったあと、その後ひととおり筋トレをして、お風呂入って帰るのみでした。時間にして、1時間〜1時間30分程度ですが、それだけで体調がなんとなくよかったのと、汗をかくことでリフレッシュできていることを実感しました。過去にも何度かジムに通ったことがありましたが、半年以上習慣かできたのははじめてです。10月からは子供が産まれたのと引越しして新しい場所に住み始めたので現在は停止中。

みてねをはじめた

mitene.us

子供が産まれたと同時に噂で聞いてたみてねを始めた。どんなもんかなと思ってやってみたが、想像以上に圧倒的によかったです。

シンプルで見やすいレイアウト
お互いの親族が遠方にいるので、すごく喜んでくれている
毎月フォトブックを自動的につくってくれて、簡単に注文できる。これでスマホが見れない親族にも送れる。

とくに、親族は毎日楽しみにしているらしく、妻は毎日写真をUPせねばとはりきるほどです。産まれたときの記録が時系列で残るってすごく良いですね。

論文を印刷して見ないようにした

重要な論文はもちろん印刷してリファーするのですが、全ての論文を印刷してるとかなりかさ張ります。PDF上でMacのプレビューでカラーラインをつけてポイントを押さえて見るようにするだけで十分な論文も多いので、そういう風に習慣化できたのは良かったです。

モノ

MTG 骨盤サポートチェア Body Make Seat Style

MTG 骨盤サポートチェア Body Make Seat Style(ボディメイクシートスタイル) ブラック【メーカー純正品 [1年保証]】

発売日: 2014/05/30
メディア: スポーツ用品

ついに導入。現在は意識的にこの上に座ってる。姿勢は昔は悪かったけど、これのおかげというより、姿勢をよくしようとという意識がついたのが大きかった。座りごこちも良いです。

BRUNO コンパクトホットプレートレッド

BRUNO コンパクトホットプレートレッド BOE021-RD

メディア: ホーム&キッチン

2,3人で使えるサイズのホットプレートを探していて、購入。見た目もよく、楽しくご飯が食べれます。長く使えるようにキレイにメンテナンスして使っています。

ビアカップ能作錫100%

ビアカップ能作「ビアカップ」錫100% 【高級】

メディア: ホーム&キッチン

誕生日プレゼントに頂きました（上記の夏限定バージョン）。冷蔵庫に一瞬で冷える（5分くらい）のと、ビールの泡がきめ細かくなる効果があります。お気に入りです。

Fire TV Stick

発売日: 2017/04/06
メディア: エレクトロニクス

Amazonのセールのときに買いました。Prime Music とビデオがテレビで見るために買いました。Prime会員は必須ではと思うほど、かなり便利です。

パナソニック 10.0kg ドラム式洗濯乾燥機（NA-VX7700L-W）

パナソニック洗濯槽自動お掃除・ヒートポンプ乾燥機能付ドラム式洗濯乾燥機[左開き] クリスタルホワイト NA-VX7800L-W

メディア:

新作が出て少ししてから、上記の1つ古いバージョンを購入しました。家電量販店に期待せずに行ったところ、たまたま最後の在庫を見つけて購入しました。そのときの価格ドットコム最安値よりも安く買えたので良かったです。洗濯物を干す作業が減り、大満足です。ただ、毎日ホコリを掃除するメンテナンスが必要なのは知りませんでしたが…。

ダイニングテーブル

もともとローテーブルしかなかったので、ついに購入。生活もさらに快適になりました。

【極厚 20mm 】やさしいジョイントマット大判

[asin:B01M18YASS:detail]

子供の遊びスペースに買ったら、思いのほか横になるのも気持ちよく、ヨガマット代わりにも使えそうです。自由にレイアウトも決めれますし、不要になれば片付けるのも楽です。これは重宝しそうです。

2018年の導入予定

Amazon Echo でのスマートな生活

招待待ちなので、はやく試してみたいです。

iPad で論文読む

論文を大量に効率よく読む方法を模索中です。色々見てると、まずはiPadでやってみようかなと思っています。

子供用の便利グッズ

子供のためのグッズ購入が増えそうな年になりそうです。

To Do ツール快適生活

新たな方法がないか思考錯誤は変わらずやっていきます。

何かで運動

ジム以外で家で運動する方法を模索中…

2017-12-31

仕事ではじめる機械学習を読んだ（1章）

読書

今年もおつかれさまでした。読みたかった本を少しずつ読んでます。

この本を読んだ動機

www.oreilly.co.jp

現在、機械学習システム（と真に呼べるものか分からないが）の運用や構築をちょくちょくしていて、ベストプラクティスを再確認したいなというのがありました。この本を手に取りました。以下は、読書メモです¹。

機械学習プロジェクトの流れ

問題を定式化する

機械学習をしないで良い方法を考える

システム設計を考える

アルゴリズムを選定する

特徴量、教師データとログの設計をする

前処理をする

学習・パラメータチューニング

システムに組み込む

1と2：問題設定
3から6：道具選びと前処理
7：モデルの作成
8：サービスへの組み込み

という4STEPの流れ。この中でデータをEDA（Exploratory Data Analysis）して可視化したりする部分は1と2に当たる部分なのかなと。つまり、自分が関わった多くのプロジェクトは3に行く前に終わったなーというのが多い…笑

おもしろいのは、明示的に 2.機械学習をしないで良い方法を考える を流れに含んでいる点。その原因はモデルのメンテナンスコストが大きいこと。以下、6つの例をあげている。

確率的な処理があるため自動テストがしにくい

長期運用しているとトレンドの変化などで入力の傾向が変化する

処理のパイプラインが複雑になる

データの依存関係が複雑になる

実験コードやパラメータが残りやすい

開発と本番の言語 / フレームワークがバラバラになりやすい

機械学習システムを維持するためのメンテナンスコストが多くある点と時間とともに変わるデータのトレンドの変化から100％正しい結果を常に出すとは限らないので、誤りを運用でカバーする仕組みが必須 というところは理解してもらわないといけない。

そういうところをちゃんと理解した上で、さらに導入をする前に、MVP(Minimum Viable Product)を作る点。これにより、本当にもっと高度な方法が必要かが明らかになる。いきなり難しいことをするのではなく、まず一番簡単なモデル（たとえば、平均値を返すモデル）でシステムの性能をチェックし、そのモデルに満足しない場合、エンジニアリング技術（次節で必須になる）とともに、改善していくのが正しい道と読めました。

実システムにおける機械学習の問題点への対処方法

その大きなメンテナンスコストに対して、著者らは以下のポイントを述べています。

人手でゴールドスタンダードを用意して、予測性能のモニタリングをする

予測モデルをモジュール化をしてアルゴリズムのA/Bテストができるようにする

モデルのバージョン管理をして、いつでも切り戻し可能にする

データ処理のパイプラインごと保存する

開発/本番環境の言語/フレームワークは揃える

とくに、機械学習システムは一度作って終わることはないので、高度なアルゴリズムを作れる人だけではなくて、エンジニアリング技術が必須になってくる というのがこのポイントからも明らか。

機械学習システムは本来アップデートが激しいところが多いはずなので、パイプライン作りとバージョン管理 も間違いなく必要になります。

さらなるベストプラクティスについてはRules of Machine Learning Best Practices for ML Engineeringを参考にあげていた。また時間あるときに読みたい。

機械学習を含めたシステムを成功させるには

重要なプレイヤーとして、4人のプレイヤーをあげている

プロダクトに関するドメイン知識を持った人

統計や機械学習に明るい人

データ分析基盤を作れるエンジニアリング能力のある人

失敗しても構わないとリスクを取ってくれる責任者

とくに、現場・分析者・エンジニアの3人＋責任者1人 の存在が必要。構築や運用ではこのとおりなんですが、その機械学習システムを作って見せる人（利用者）もプレイヤーとして出てきます。その利用者からの無茶振りも色々ある。なので、その利用者も機械学習プロジェクトの流れを理解して、長く付き合ってくれるか もありますね。その辺の説明（説得？）方法での良い資料が欲しいですね。

まとめ

読んだのは1章だけですが、道筋を明確に記述して読みやすかったです。1章だけでも、チーム全員必読してもらって、議論して理解を深めたいなと思いました。

しかし、すでに多くの方がレビューしているみたいなので、内容が被りそうですが、あまりその辺は気にしていません。↩

2015-02-26

Rstudio 0.99 がリリースされました

RStudio v0.99 Preview: Data Viewer Improvements | RStudio Blog

大きく変わったのがデータのView機能。

フィルタリングやソーティングがGUIで実行できるように。

エクセルで開く必要もなくなるかも。

2014-04-19

RのSlidifyを触ったけど、色々問題でた

RのSlidifyと言えば、

Rでパワーポイントを作成できるパッケージです。

触ってみた感想、
・ローカルのRStudioで実行したが、文字化け（SHIFT-JIS、UTF８等が混ざっている？）が激しい（結局なおらなかった）
・サーバー版のRStudioだと問題なかった
・RPubsに公開したら、あとから見れなくなった
というのに、色々ハマる。

インストールは超簡単。

・事前準備

install.packages("devtools")
library(devtools)
install_github("slidify", "ramnathv")
install_github("slidifyLibraries", "ramnathv")

・"sample"というフォルダができて、サンプルコードがでてくる。（適宣、変更して下さい）

library(slidify)
library(slidifyLibraries)
author("sample")

・好きなように編集
パッケージslidify - 浅井拓也研究室用ページパッケージslidify - 浅井拓也研究室用ページ

・実行

slidify("index.Rmd")

・出来上がるはず。このとき、ローカルなら文字化け激しかった。

・RPubsへの公開(titleの部分は適宣変更してください)

publish(title = 'test_slidify', 'index.html', host = 'rpubs')

すると、RPubsのアップロード画面に遷移する。

以上です。もう少しオプション等、見てみよう。

2011-10-06

Google Refineとか

クレンジングツールなんてあったとは…．

Google Refine便利そう．データ集めるのが簡単になるのかな．

Webに載ってるデータをコピーして処理できるっぽい．

詳しい解説ページないかな．日本語希望ｗ

■参考
『米Google、データクリーニングツール「Google Refine 2.0」をリリース』
http://sourceforge.jp/magazine/10/11/15/0514235

『Google Refineの使い方』
http://wiki.kazusa.or.jp/Google_Refine%E3%81%AE%E4%BD%BF%E3%81%84%E6%96%B9

『第7回大相撲のアノーマリー（1）』
http://www.atmarkit.co.jp/fcoding/articles/stat/07/stat07b.html

2011-08-03

クラスタリングとか

「Rで学ぶクラスタ解析」を購入した．

Rで学ぶクラスタ解析

作者: 新納浩幸
出版社/メーカー: オーム社
発売日: 2007/11/01
メディア: 単行本
購入: 9人クリック: 207回
この商品を含むブログ (29件) を見る

図書館で借りてパラパラと見ると良さ気だった．
何分，クラスタだけの本って持っておらず，Rで学べるってのも今の流行かなと思い，中古本を購入．

2000+250円でアマゾンさんでね．

届くのが楽しみです．

2011-08-01

決定木とか

今更ながら決定木強っ！って思った．

ランダムフォレストって今のところ最強の分類器じゃ…．

CHAIDとかC5.0とかCARTとか色々あるけど，どれ選べばいいのでしょうか？

CARTはジニ係数使ってて，純度で分岐点を作る．純度が増す＝ばらつきが少なくなるね．

ランダムフォレストのようなアンサンブル学習はほかの分類器にも使えるよね．計算時間やばそうだけど．

OKIYUKI99 Blog

データ分析や日常に関するブログ

2017年導入してよかったこと

習慣

Google Keep と Trelloと Evernoteのまとめ方が確立できた

ジムに通ったこと

みてねをはじめた

論文を印刷して見ないようにした

モノ

MTG 骨盤サポートチェア Body Make Seat Style

BRUNO コンパクトホットプレートレッド

ビアカップ能作錫100%

Fire TV Stick

パナソニック 10.0kg ドラム式洗濯乾燥機（NA-VX7700L-W）

ダイニングテーブル

【極厚 20mm 】やさしいジョイントマット大判

2018年の導入予定

Amazon Echo でのスマートな生活

iPad で論文読む

子供用の便利グッズ

To Do ツール快適生活

何かで運動

仕事ではじめる機械学習を読んだ（1章）

この本を読んだ動機

機械学習プロジェクトの流れ

実システムにおける機械学習の問題点への対処方法

機械学習を含めたシステムを成功させるには

まとめ

Rstudio 0.99 がリリースされました

RのSlidifyを触ったけど、色々問題でた

Google Refineとか

クラスタリングとか

決定木とか

習慣

Google Keep と Trelloと Evernoteのまとめ方が確立できた

ジムに通ったこと

みてねをはじめた

論文を印刷して見ないようにした

モノ

MTG 骨盤サポートチェア Body Make Seat Style

BRUNO コンパクトホットプレート レッド

ビアカップ 能作 錫100%

Fire TV Stick

パナソニック 10.0kg ドラム式洗濯乾燥機（NA-VX7700L-W）

ダイニングテーブル

【 極厚 20mm 】 やさしいジョイントマット 大判

2018年の導入予定

Amazon Echo でのスマートな生活

iPad で論文読む

子供用の便利グッズ

To Do ツール快適生活

何かで運動

この本を読んだ動機

機械学習プロジェクトの流れ

実システムにおける機械学習の問題点への対処方法

機械学習を含めたシステムを成功させるには

まとめ

BRUNO コンパクトホットプレートレッド

ビアカップ能作錫100%

【極厚 20mm 】やさしいジョイントマット大判