2017.06.28 Wed |
機械学習による予測の例ー22選
今回も前回(http://ritsuan.com/blog/6782/)同様、”Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die, Revised and Updated”(http://as.wiley.com/WileyCDA/WileyTitle/productCd-1119145678.html)とその日本語版(https://www.amazon.co.jp/%E3%83%A4%E3%83%90%E3%81%84%E7%B5%B1%E8%A8%88%E5%AD%A6-%E3%82%AB%E3%82%A4%E3%82%B6%E3%83%BC%E3%83%BB%E3%83%95%E3%82%A1%E3%83%B3%E3%82%B0/dp/4484111020)から、機械学習の実際の応用例を参照・引用してご紹介します。
【産業】
1, ハリウッドの映画会社は、脚本の内容から、その脚本で映画を撮った場合、ヒットするかを予測する。
→少し調べてみたのですが、イギリスのEpagogix(http://www.epagogix.com/)という会社の事例みたいですね。脚本を何人もの専門家に読ませて、登場人物や物語設定に関する詳細なアンケートに答えてもらって、その評価をNeural Networkに入力して、その脚本で映画を作った場合どれくらいの興行収入になるかを予測するみたいです。日本の映画の作成費用が平均3.5億円(0.1-20億円)であるのに対して、ハリウッド映画の作成費用が平均67億円かかることを考えると、ヒットするかしないかの予測はかなり重要であることが考えられます。実際、6,7割の精度でどれくらいの興行収入になるか予測できるみたいですね。(※1)
2, オーストラリアのエネルギー会社、energex (https://www.energex.com.au/)は電力需要の予測をもとに、送電網を増設する場所を決める。
3, New Yorkの電力会社Consolidated Edison(https://www.coned.com/en)は、電力消費量が増えた場合のシステム障害を予測する。
4, イギリス最大のスーパーマーケットチェーン”Tesco”は、どのクーポンが実際に使われるかを予測。13カ国に広がる店舗で年1億枚以上を顧客に合わせて発行している。予測の方法を改良したところ、クーポン使用率は、3.6倍上昇した。
5, Target.Inc(アメリカで二番目に大きな安売り小売店)は、女性が妊娠しているかどうかを、購買情報から推測し、妊娠していると推測した場合、特定の商品のクーポンを送る(無香ローション,ミネラルサプリメント,コットンボールなどを買っていたら baby gearなどのクーポンを送る) (※2)
【選挙】
6, 2012年にバラク・オバマ大統領の選挙陣営は、再選のための大統領選において、電話・戸別訪問・チラシ・テレビ広告などの選挙キャンペーンが、どの有権者にプラスにはたらき、どの有権者にマイナスに働くかを予測した。結果として、激戦区ではより多くの有権者を説得できた。
→この時の選挙では、データ分析の専門家50名以上が招集され、いまだかつてないほどデータ駆動(DataDriven)な選挙になったようです。対するロムニー陣営のデータサイエンティストは、数名でした。。厳しいですね。どのような選挙キャンペーンの戦略が取られたかについては、MIT Technology Reviews(※3)に三部構成で長文で書かれています。電話・戸別訪問・チラシ・テレビ広告などでどのような内容を伝えると、有権者の決断がどのように変わるかを調べたり、キャンペーンをうつ群と打たない群を分けて、キャンペーンの効果を測定し、一人ひとりにオバマ指示スコアなるものをつけて、期日前投票者の氏名が公表されたときに、その中にどれくらいの割合がオバマ指示スコアが高いか確認して現状把握したり、日本では少し考えられないの熱の入りようです。
【雇用】
7, ヒューレットパッカードは、全世界の従業員33万人以上の従業員一人一人について、離職する確率(逃亡リスク:flight risk)を算出しており、管理職は可能なら離職を思いとどまらせるか、離職を前提とした業務計画を立てる。flight risk導入が、欠員補充を容易にし、生産性の低下を最小限にしたことで、全世界で336億円のコストを削減したことがわかった。
→ちなみに、辞めない傾向がある社員の特徴は、給料が高い・昇給が多い・勤務評価が向上していることであり、頻繁なjob rotationも従業員を引き留めていた(マンネリ化しないためか)。蛇足で加えると、Eric Siegel氏が、他の案件(コールセンター)での離職率を調べた時は、国外の営業経験がある人はすぐに辞めない傾向があった。他にも過去10年の転職回数や応募のきっかけとなった情報源、最終学歴が、離職率に影響していた。
8, Wikipediaは、無償で働くスタッフのうちから、辞めそうな人を予測している。
【退会・退学】
9, 携帯電話会社は、電話の使用状況や請求明細、窓口への不満などの情報をもとに、顧客が他の携帯電話会社に乗り換える可能性を予測している。
10, 各種輸送業務のほか、幅広いeコマースを手掛けるFedexは、顧客がライバル会社に鞍替えする可能性を60-90%の精度で予測している。
11, 通信制大学であるAmerican Public University System (http://www.apus.edu/ )は、中途退学や落第を予測して、それを防ぐように適切に介入している。
【保険・債務】
12, 保険会社Allstate(https://www.allstate.com/auto-insurance.aspx )は、車の特徴などに基づいて、対人事故の賠償責任を予測。予測の効果は、年間4000万ドルと推計される。
13, 従来の保険数理表にとどまらず、独自に死亡リスクを算出する保険会社が増えている。
14, 債権回収代行業社は、債務不履行に陥った債権者一人一人について、どのような手法が最も多く回収できそうかを予測して、業務に優先順位をつける。
【医療】
15, ピッツバーグ大学医療センターは、現在入院している患者をすぐ退院させた場合、またすぐ病状が悪化して病院に戻ってくるかを予測し、医師が性急な退院許可を出す前に再考を促す。
16, ブリガム・ヤング大学とユタ大学の研究者は、妊娠24週目の血液検査でわかるペプチドバイオマーカーをもとに早産を80%の精度で予測する。(満期産も80%で予測)
【詐欺や犯罪への対応】
17, シチズンズ銀行は小切手詐欺による損失を、予測技術をを利用して20%減らした。
18, ヒューレットパッカードは詐欺的な保証クレームを見抜いて、6600万ドルのコスト削減を達成した。
19, 殺人の予測については、現在のところ有意な精度で予測をすることはできていないが、潜在的リスクのある集団に関する予測は効果をあげている。たとえばメリーランド州は当局の監視下にある人々のうち、誰が殺人を犯し、誰が被害者となるかを予測しいている。
20, イギリスの大手銀行は、銀行取引情報をもとに、テロ容疑者グループを発見する方法を確立した。
21, シカゴやメンフィス、バージニア州のリッチモンドの警察は、犯罪が起こると予測されたエリアを巡回する。
22, ニューヨーク州立大学バッファロー校の研究者は、目の動きだけから、82%の精度で嘘を判別するシステムを開発した。
これで今回は以上になりますが、すでに世界中で、機械学習はコスト削減や、様々な目標達成に役立っているのがご理解いただけたかと思います。
最後になりますが、このコンテンツの引用・参照元である、
Predictive Analytics(日本語訳:ヤバい予測学)(※4)は非常におすすめです!
鈴木瑞人
東京大学大学院 新領域創成科学研究科 メディカル情報生命専攻 博士課程
東京大学機械学習勉強会 代表
NPO法人Bizjapan テクノロジー部門BizXチームリーダー
※2: http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html
※3:Part1:Scores
https://www.technologyreview.com/s/508836/how-obama-used-big-data-to-rally-voters-part-1/
Part2:The Experiments
https://www.technologyreview.com/s/508851/how-obama-wrangled-data-to-win-his-second-term/
Part3: The Community
https://www.technologyreview.com/s/508856/obamas-data-techniques-will-rule-future-elections/
※4:Predictive Analytics: http://as.wiley.com/WileyCDA/WileyTitle/productCd-1119145678.html
ヤバい予測学:
https://www.amazon.co.jp/%E3%83%A4%E3%83%90%E3%81%84%E7%B5%B1%E8%A8%88%E5%AD%A6-%E3%82%AB%E3%82%A4%E3%82%B6%E3%83%BC%E3%83%BB%E3%83%95%E3%82%A1%E3%83%B3%E3%82%B0/dp/4484111020