OKIYUKI99 Blog

データ分析や日常に関するブログ

2020年導入してよかったこと・振り返り

今年も終わります。毎年のまとめに続きに今年も振り返ってみます 今年はコロナによりリモートワーク化と次男生誕と育児休業が大きな出来事だったなーと感じる 2019年はこちら 習慣とか ワーク管理 アウトプット 英語 モノ Pixel 4a Nature スマートリモコン …

Trustworthy Online Controlled Experiments: 1 Introduction and Motivation を読んだ

gingi99.hatenablog.com Prefaceに続いて1章を読んだメモ COBOL開発者のGrace Hopper氏の言葉 アイデアの価値を評価するのは難しい 収益単体をA/BテストのOECにすることは不適切 OECの例 ParameterとVariant Data-drivenとData-informed(Data-aware) 成功す…

Trustworthy Online Controlled Experiments: Contents & Preface を読んだ

Trustworthy Online Controlled Experiments: A Practical Guide to A/B Testing を買って興味ある章を読んでいる。読んだ章のメモを残していく。今回はまず目次とPreface ちなみに、この本の著者はBigカンパニーのフェロー級のメンバーで構成されている Tru…

2019年導入してよかったこと・振り返り

今年も終わります。毎年のまとめに続きに今年も振り返ってみます 2018年 2017年 習慣とか ワーク管理 マンション・住宅購入検討 アウトプット キャッシュレス 自動化 KPT モノ 電動自転車 NAS レイコップ 大吉ブレンドドリップバッグ30枚 猿田彦監修コーヒー…

KDD2019論文読み会で発表しました

2019-10-16(水)のKDD2019論文読み会でA/Bテスト周りについて発表しました。 どの辺の研究が流行ってるのか聞けていろいろ刺激を受けました。 connpass.com togetter.com speakerdeck.com もともとの内容は以下の記事から作ってます。A/Bテスト周りの論文は興…

第81回 TokyoR Shiny特集会に参加&発表してきました

前回参加したのが覚えてないくらい(5年ぶり?くらいか)、TokyoRに参加&発表してきました tokyor.connpass.com togetter.com 今回のTokyoRはShiny特集会でした。Shinyユーザとしては発表したいと思い、運営サイドに連絡したところ、応用枠を頂きました。貴…

WSDM 2019 : How A/B Tests Could Go Wrong : Automatic Diagnosis of Invalid Online Experiments を読んだ

dl.acm.org LinkedinでInvalidなA/B テスト検知するための方法論を紹介している論文を読みました A/Bテストにおけるメトリック解析の話から、丁寧にメトリックを分解し、検知ロジックを提案しています。LinkedinのA/B テストプラットフォームで実際に動いて…

KDD 2019 : Diagnosing Sample Ratio Mismatch in Online Controlled Experiments: A Taxonomy and Rules of Thumb for Practitioners を読んだ

KDD2019な時期がきましたので、A/Bテスト系の論文あるかなと探してたときに気になった論文を読みました。 Booking.comのDirector of Experimentation のLukas Vermeer氏のツイートより Diagnosing Sample Ratio Mismatch in Online Controlled Experiments: …

Udemyの【徹底的に解説!】Djangoの基礎をマスターして、3つのアプリを作ろう!をやりました

フロントエンドの基礎周辺をなんとなく知っておきたいと思って、udemyで以下をやってました。 https://www.udemy.com/django-3app/ 個人的にはかなり良かったです。やった感想をつらつらと、 Data ScientistとしてPythonのコードは書けるくらいのレベルでし…

逐次的に検定を行っていると第一種過誤が増幅してしまう例(KDD 2017 : Peeking at A/B Tests より)

最近KDD 2017のPeeking at A/B Testsの論文を読んでいました。 www.kdd.org その論文の問題設定に関わるこの図が少し気になっていました。 これは何かというと、 このシミュレーションでは、サンプルサイズ10,000のA/B Test(仮にAが5,000、Bが5,000の対象が…

CHI 2019 : When Do People Trust Their Social Groups ? を読んだ

Facebook のグループ機能に関するデータ解析の論文を最近読みました 自分的要約 Facebookのモチベーションとしては、ユーザが安心して使うための信頼できるグループを増やしたい。じゃあ信頼できるグループってどんなのか?から入る グループを使用している1…

2019GWにやったこと

ただのGW記です。令和になったGWは10連休ということでしたが、お互いの実家に帰省。息子と遊んだりでのんびり過ごしました。 GWは普段とは異なるインプットをしようと思い、気になってた本を読んだり、Webサーフィンして調べものをしていました。全体的にキ…

1st Shiny Contest に参加しました

Shiny Contest とは? Shinyとは、さまざまなinput形式に基づき動的にグラフを作成し、Webアプリやダッシュボードとして簡単に公開できる人気の高いRライブラリです。 Rが好きな理由の一つに、Shinyのことを言うRユーザは多いのではないでしょうか(私の希望…

2018年導入してよかったこと・振り返り

今年も終わります。昨年のまとめに続きに今年も振り返ってみます。 習慣 ワーク管理を更新 論文をiPad + Papersで読むようになった 投資信託 アウトプットの習慣 転職活動した 朝型生活 LINE Pay 動画で学習 モノ Huawei p20-lite Baby Smile 電動鼻水吸引器…

Slackを通じて正解ラベルデータを集める

分析の精度を高めるために、正解ラベルを集めるコストはなんだかんだ大きいです。 よくある話ですと、がんばってラベル付けしたデータから学習したモデルをデプロイし、日々送られてくるデータのラベルを推論します。そして、予測スコアがある閾値を超えたら…

任意の相関係数をもつデータを可視化するShinyアプリを作った

(ピアソンの積率)相関係数が0.XXのときって散布図どんなんだっけ…?とかを直感的に確かめる / 相関係数を学ぶ人向けのツールが欲しかったので、Shinyで作りました。 以下のShinyappsで公開中 Correlation Viewer コードはこちら github.com 任意の相関係数を…

「人工知能システムのプロジェクトがわかる本」を読んだ

人工知能システムのプロジェクトがわかる本 企画・開発から運用・保守まで (AI & TECHNOLOGY)作者: 本橋洋介出版社/メーカー: 翔泳社発売日: 2018/02/15メディア: 単行本(ソフトカバー)この商品を含むブログ (2件) を見る この本を読んだ目的 ML Engineer…

「データ分析・AIのビジネス導入: プロジェクト進行から組織づくりまで」を読んだ

失敗しない データ分析・AIのビジネス導入: プロジェクト進行から組織づくりまで作者: 株式会社ブレインパッド,太田満久,井上佳,今津義充,中山英樹,上総虎智,山?裕市,薗頭隆太,草野隆史出版社/メーカー: 森北出版発売日: 2018/07/13メディア: 単行本(ソフト…

KDD2018 : Customized Regression Model for Airbnb Dynamic Pricing を読んだ

論文はこちら:KDD 2018 | Customized Regression Model for Airbnb Dynamic Pricing Airbnb の Applied Data Science Track Paper。読んでみてAirbnb特有の問題でもあるのかと思いきや、価格付けをサービス事業者側から提案するアプローチは、C to Cサービ…

useR2018に参加&ポスター発表をしました

表題のとおり、useR2018@ブリスベンに参加&ポスター発表してきました。useR初参加です。 Rで分析を行っている自分たちのユースケースを発表しながら、世界のRユーザ・Rコミュニティの動向を肌で体感したいと思い参加しました。 概要 2018/7/10-13の4日間開…

社会人博士課程を修了しました

2018年3月に博士(工学)の学位を頂きました。2013年3月に修士(工学)を卒業し、2015年4月に再び同大学で社会人博士課程で入学し、ちょうど3年で卒業しました。 私の研究は、簡単にいうとデータ分析の結果をさまざまな条件下で活用するための研究になります…

ベストセラーコードを読んだ

ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム作者: ジョディ・アーチャー,マシュー・ジョッカーズ,西内啓,川添節子出版社/メーカー: 日経BP社発売日: 2017/03/23メディア: 単行本この商品を含むブログ (2件) を見る ざっくり概要 機械…

WSDM2018に参加しました

2018/2/5-9のロサンゼルスで開催されるWSDM2018に参加しました。この週はニューオリンズのAAAI2018に参加・発表をしていたので、途中からこっちに向かうというスケジュールでした。 www.wsdm-conference.org WSDMはWeb Search and Data Miningの名のとおり、…

AAAI2018に参加・発表しました

2018/2/2-7でニューオリンズで開催されたAAAIに参加・発表したときの旅程も含めたメモです。 私自身は、2月5日の午前中に発表がありました。ロサンゼルスで開かれるWSDM2018に参加する予定もあったため、2/5の午後で抜けることになりました。 aaai.org 2/2 …

Amazon Echo が届いたので、生活を便利にできるか試してみた

Amazon Echo Dot がついに家に届きました。リクエストを発売日初日に出していたつもりでしたが、Amazon Echoの注文を見逃したからか、招待がキューの後ろに回されたように感じました。 Amazon Echo Dot (Newモデル)、ブラック出版社/メーカー: Amazon発売日:…

2017年導入してよかったこと

新年あけました。みなさんの2017年買ったよかったものなどを見てると、自分もまとめておこうかなと思いました。 習慣 Google Keep と Trelloと Evernoteのまとめ方が確立できた ジムに通ったこと みてねをはじめた 論文を印刷して見ないようにした モノ MTG …

仕事ではじめる機械学習を読んだ(1章)

今年もおつかれさまでした。読みたかった本を少しずつ読んでます。 この本を読んだ動機 www.oreilly.co.jp 現在、機械学習システム(と真に呼べるものか分からないが)の運用や構築をちょくちょくしていて、ベストプラクティスを再確認したいなというのがあ…

Rstudio 0.99 がリリースされました

RStudio v0.99 Preview: Data Viewer Improvements | RStudio Blog 大きく変わったのがデータのView機能。 フィルタリングやソーティングがGUIで実行できるように。 エクセルで開く必要もなくなるかも。

RのSlidifyを触ったけど、色々問題でた

RのSlidifyと言えば、Rでパワーポイントを作成できるパッケージです。触ってみた感想、 ・ローカルのRStudioで実行したが、文字化け(SHIFT-JIS、UTF8等が混ざっている?)が激しい(結局なおらなかった) ・サーバー版のRStudioだと問題なかった ・RPubsに…

Google Refineとか

クレンジングツールなんてあったとは….Google Refine便利そう.データ集めるのが簡単になるのかな.Webに載ってるデータをコピーして処理できるっぽい.詳しい解説ページないかな.日本語希望w■参考 『米Google、データクリーニングツール「Google Refine …