OKIYUKI99 Blog

データ分析や日常に関するブログ

2019GWにやったこと

ただのGW記です。令和になったGWは10連休ということでしたが、お互いの実家に帰省。息子と遊んだりでのんびり過ごしました。 GWは普段とは異なるインプットをしようと思い、気になってた本を読んだり、Webサーフィンして調べものをしていました。全体的にキ…

1st Shiny Contest に参加しました

Shiny Contest とは? Shinyとは、さまざまなinput形式に基づき動的にグラフを作成し、Webアプリやダッシュボードとして簡単に公開できる人気の高いRライブラリです。 Rが好きな理由の一つに、Shinyのことを言うRユーザは多いのではないでしょうか(私の希望…

2018年導入してよかったこと・振り返り

今年も終わります。昨年のまとめに続きに今年も振り返ってみます。 gingi99.hatenablog.com 昨年の導入してよかったもの+習慣とかの振り返りを追加した感じです。 習慣 ワーク管理を更新 ツールを増やして、以下で運用中。 一次受け Google Keep:すべての…

Slackを通じて正解ラベルデータを集める

分析の精度を高めるために、正解ラベルを集めるコストはなんだかんだ大きいです。 よくある話ですと、がんばってラベル付けしたデータから学習したモデルをデプロイし、日々送られてくるデータのラベルを推論します。そして、予測スコアがある閾値を超えたら…

任意の相関係数をもつデータを可視化するShinyアプリを作った

(ピアソンの積率)相関係数が0.XXのときって散布図どんなんだっけ…?とかを直感的に確かめる / 相関係数を学ぶ人向けのツールが欲しかったので、Shinyで作りました。 以下のShinyappsで公開中 Correlation Viewer コードはこちら github.com 任意の相関係数を…

「人工知能システムのプロジェクトがわかる本」を読んだ

人工知能システムのプロジェクトがわかる本 企画・開発から運用・保守まで (AI & TECHNOLOGY)作者: 本橋洋介出版社/メーカー: 翔泳社発売日: 2018/02/15メディア: 単行本(ソフトカバー)この商品を含むブログ (2件) を見る この本を読んだ目的 ML Engineer…

「データ分析・AIのビジネス導入: プロジェクト進行から組織づくりまで」を読んだ

失敗しない データ分析・AIのビジネス導入: プロジェクト進行から組織づくりまで作者: 株式会社ブレインパッド,太田満久,井上佳,今津義充,中山英樹,上総虎智,山?裕市,薗頭隆太,草野隆史出版社/メーカー: 森北出版発売日: 2018/07/13メディア: 単行本(ソフト…

KDD2018 : Customized Regression Model for Airbnb Dynamic Pricing を読んだ

論文はこちら:KDD 2018 | Customized Regression Model for Airbnb Dynamic Pricing Airbnb の Applied Data Science Track Paper。読んでみてAirbnb特有の問題でもあるのかと思いきや、価格付けをサービス事業者側から提案するアプローチは、C to Cサービ…

useR2018に参加&ポスター発表をしました

表題のとおり、useR2018@ブリスベンに参加&ポスター発表してきました。useR初参加です。 Rで分析を行っている自分たちのユースケースを発表しながら、世界のRユーザ・Rコミュニティの動向を肌で体感したいと思い参加しました。 概要 2018/7/10-13の4日間開…

社会人博士課程を修了しました

2018年3月に博士(工学)の学位を頂きました。2013年3月に修士(工学)を卒業し、2015年4月に再び同大学で社会人博士課程で入学し、ちょうど3年で卒業しました。 私の研究は、簡単にいうとデータ分析の結果をさまざまな条件下で活用するための研究になります…

ベストセラーコードを読んだ

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム作者: ジョディ・アーチャー,マシュー・ジョッカーズ,西内啓,川添節子出版社/メーカー: 日経BP社発売日: 2017/03/23メディア: 単行本この商品を含むブログ (2件) を見る ざっくり概要 機械…

WSDM2018に参加しました

2018/2/5-9のロサンゼルスで開催されるWSDM2018に参加しました。この週はニューオリンズのAAAI2018に参加・発表をしていたので、途中からこっちに向かうというスケジュールでした。 www.wsdm-conference.org WSDMはWeb Search and Data Miningの名のとおり、…

AAAI2018に参加・発表しました

2018/2/2-7でニューオリンズで開催されたAAAIに参加・発表したときの旅程も含めたメモです。 私自身は、2月5日の午前中に発表がありました。ロサンゼルスで開かれるWSDM2018に参加する予定もあったため、2/5の午後で抜けることになりました。 aaai.org 2/2 …

Amazon Echo が届いたので、生活を便利にできるか試してみた

Amazon Echo Dot がついに家に届きました。リクエストを発売日初日に出していたつもりでしたが、Amazon Echoの注文を見逃したからか、招待がキューの後ろに回されたように感じました。 Amazon Echo Dot (Newモデル)、ブラック出版社/メーカー: Amazon発売日:…

2017年導入してよかったこと

新年あけました。みなさんの2017年買ったよかったものなどを見てると、自分もまとめておこうかなと思いました。 習慣 Google Keep と Trelloと Evernoteのまとめ方が確立できた Keepにメモを残す。その後、タスクはTrelloで管理する(To Do -> Doing -> Done…

仕事ではじめる機械学習を読んだ(1章)

今年もおつかれさまでした。読みたかった本を少しずつ読んでます。 この本を読んだ動機 www.oreilly.co.jp 現在、機械学習システム(と真に呼べるものか分からないが)の運用や構築をちょくちょくしていて、ベストプラクティスを再確認したいなというのがあ…

Rstudio 0.99 がリリースされました

RStudio v0.99 Preview: Data Viewer Improvements | RStudio Blog 大きく変わったのがデータのView機能。 フィルタリングやソーティングがGUIで実行できるように。 エクセルで開く必要もなくなるかも。

RのSlidifyを触ったけど、色々問題でた

RのSlidifyと言えば、Rでパワーポイントを作成できるパッケージです。触ってみた感想、 ・ローカルのRStudioで実行したが、文字化け(SHIFT-JIS、UTF8等が混ざっている?)が激しい(結局なおらなかった) ・サーバー版のRStudioだと問題なかった ・RPubsに…

Google Refineとか

クレンジングツールなんてあったとは….Google Refine便利そう.データ集めるのが簡単になるのかな.Webに載ってるデータをコピーして処理できるっぽい.詳しい解説ページないかな.日本語希望w■参考 『米Google、データクリーニングツール「Google Refine …

クラスタリングとか

「Rで学ぶクラスタ解析」を購入した.Rで学ぶクラスタ解析作者: 新納浩幸出版社/メーカー: オーム社発売日: 2007/11/01メディア: 単行本購入: 9人 クリック: 207回この商品を含むブログ (29件) を見る図書館で借りてパラパラと見ると良さ気だった. 何分,ク…

決定木とか

今更ながら決定木強っ!って思った.ランダムフォレストって今のところ最強の分類器じゃ….CHAIDとかC5.0とかCARTとか色々あるけど,どれ選べばいいのでしょうか?CARTはジニ係数使ってて,純度で分岐点を作る.純度が増す=ばらつきが少なくなるね.ランダ…

ggplot2とか

■感想 Rで流行してるものといえば,ggplotかと思い,サンプル動かしてみた.確かに綺麗に描画されるし,シンプルに使える.レイヤーのように後からポイポイ載せていくって感じ.『ggplot2 の自分用メモ集を作ろう』はかなり詳しく紹介してくれていました.■…

hadoopとか

最近,データベースの分散処理技術について非常に流行ってる.とりまググッて色々調べたことをメモる.■背景 ・インターネットの普及により大規模データが蓄積! Webページで考えると200億ページ×20KB = 400TB 世界で作成されたデータ量 2009年:0.8ZB 2020年…

ブログ開設

最近,世の中のマイニングの認知度を調べていると,R勉強会,Web Miningの勉強会を知った。社会人の人も多く,幅広い知識を持っている印象だった。自分もそんな場に参加したいと思い,学生の間に知識を貯めていくと決意。ここからスタート。あと学生は1年9…