2017.05.14 Sun |

Kaggleデータ探索(Speed Dating Experiment)その2

Front前回のKaggleデータ探索(Speed Dating Experiment)(http://ritsuan.com/blog/6387/)に引き続き、Speed Dating Experimentデータの変数の説明を行っていきます。

前回は、97列目のamb5_1までの説明が終わりました。

次は、98列目以降の、”デート”のあとに、各参加者に記入してもらったデータになります。
#dec:相手にもう一度会いたいかどうか(Yes:1,No:0,Other:NA)
#attr:相手の魅力(Attractive)を1-10(1=awful, 10=great)で評価した値
#sinc:相手の誠実さ(Sincere)を1-10(1=awful, 10=great)で評価した値
#intel:相手の知性(Intelligent)を1-10(1=awful, 10=great)で評価した値
#fun:相手の楽しさ(Fun)を1-10(1=awful, 10=great)で評価した値
#amb:相手の野心(Ambitious)を1-10(1=awful, 10=great)で評価した値
#shar:相手の野心(Shared Interests/Hobbies)を1-10(1=awful, 10=great)で評価した値
#like:相手をどれだけ好きか1-10(1=don’t like at all, 10=like a lot)
#prob:相手があなたに対してyesという可能性はどれくらいあるか1-10(1=not probable, 10=extremely probable)
#met:相手に会ったことがあるか(1=yes,2=no)
#match_es:いくつのマッチが生まれると思うか?マッチとは、あなたと相手の両方がYes(dec列)と答える場合です。

#以下ではあなたが異性に対して、今後あるかもしれないデートで、求める各要素の水準を記入してください。1-10: (1=not at all important, 10=extremely important)。
attr1_s:魅力(Attractive)
sinc1_s:誠実さ(Sincere)
intel1_s:知性(Intelligent)
fun1_s:楽しさ(Fun)
amb1_s:野心(Ambitious)
shar1_s:共通した興味と趣味(Shared Interests/Hobbies)

#以下では、あなた自身の属性について、1-10で答えてください (1=awful, 10=great)。
attr3_s:魅力(Attractive)
sinc3_s:誠実さ(Sincere)
intel3_s:知性(Intelligent)
fun3_s:楽しさ(Fun)
amb3_s:野心(Ambitious)

satis_2:あなたは、あなたが会った人に満足しましたか? (1=not at all satisfied, 10=extremely satisfied)
length:デートの4分は、Too little=1、Too much=2、Just Right=3
numdat_2:Speed “Dates”の回数は、Too few=1、Too many=2、Just right=3

#Speed Dating eventでの、あなたの決断(また会いたい、また会いたくない)を思い出して、100点を以下の6項目に分配してください。
attr7_2:魅力(Attractive)
sinc7_2:誠実さ(Sincere)
intel7_2:知性(Intelligent)
fun7_2:楽しさ(Fun)
amb7_2:野心(Ambitious)
shar7_2:共通の興味・趣味(shared interests/hobbies)

#あなたが異性に求めるものを答えてください。
Waves 1-5 と 10-21:合計点が100点になるように点数を6項目に分配せよ。
Waves 6-9:各項目を1-10 (1=not at all important, 10=extremely important)で評価せよ。
attr1_2:魅力(Attractive)
sinc1_2:誠実さ(Sincere)
intel1_2:知性(Intelligent)
fun1_2:楽しさ(Fun)
amb1_2:野心(Ambitious)
shar1_2:共通の興味と趣味(shared interests/hobbies)

#大半の異性があなたと同性の人に何を求めていると思いますか?100点を以下6項目に分配してください。
#attr4_2:魅力(Attractive)
#sinc4_2:誠実さ(Sincere)
#intel4_2:知性(Intelligent)
#fun4_2:楽しさ(Fun)
#amb4_2:野心(Ambitious)
#shar4_2:共通の興味と趣味(Shared Interests/Hobbies)

#あなたは、異性が、デートの中で何を求めていると思いますか?100点を以下6項目に分配してください。
#attr2_2:魅力(Attractive)
#sinc2_2:誠実さ(Sincere)
#intel2_2:知性(Intelligent)
#fun2_2:楽しさ(Fun)
#amb2_2:野心(Ambitious)
#shar2_2:共通の興味と趣味(shared interests/hobbies)

#あなた自身を評価してください。各項目は1-10 (1= awful and 10=great)で評価。
#attr3_2:魅力(Attractive)
#sinc3_2:誠実さ(Sincere)
#int3_2:知性(Intelligent)
#fun3_2:楽しさ(Fun)
#amb3_2:野心(Ambitious)

#他の人があなたを評価するとしたら各項目何点になるか、各項目1-10 (1=awful, 10=great)で答えよ。
#attr5_2:魅力(Attractive)
#sinc5_2:誠実さ(Sincere)
#int5_2:知性(Intelligent)
#fun5_2:楽しさ(Fun)
#amb5_2:野心(Ambitious)

被験者は、マッチ結果送付後3-4週間後、以下の項目を答えました。

#マッチの結果の中から、
#you_call:あなたがコンタクトをとった人数。
#them_cal:あなたにコンタクトをとった人数。

#date_3:マッチ結果の中からデートしましたか?(Yes=1,No=2)

#もしあなたが少なくとも一度デートした場合、以下の質問に答えてください。
#numdat_3:マッチのうち、いままでデートしたことある相手は何人いますか?
#num_in_3:マッチの結果の中からデートした相手は何人ですか?

#異性に何を求めますか?以下の6つの項目に100点を分配してください。
#attr1_3:魅力(Attractive)
#sinc1_3:誠実さ(Sincere)
#intel1_3:知性(Intelligent)
#fun1_3:楽しさ(Fun)
#amb1_3:野心(Ambitious)
#shar1_3:共有された興味と趣味(shared interests/hobbies)

#Speed Datingの時のあなたの決断(また会いたいか、そうでないか)を振り返って、100点を以下6項目に分配してください。
attr7_3:魅力(Attractive)
sinc7_3:誠実さ(Sincere)
intel7_3:知性(Intelligent)
fun7_3:楽しさ(Fun)
amb7_3:野心(Ambitious)
shar7_3:共有された興味と趣味(shared interests/hobbies)

#大半の異性が、あなたと同性の人に何を求めると思いますか?
#次の属性を1-10で評価してください。 (1=not at all important, 10=extremely important):
#attr4_3:魅力(Attractive)
#sinc4_3:誠実さ(Sincere)
#intel4_3:知性(Intelligent)
#fun4_3:楽しさ(Fun)
#amb4_3:野心(Ambitious)
#shar4_3:共通の興味と趣味(shared interests/hobbies)

#デートの最中に異性は何を求めると思いますか? 1-10で評価してください (1=not at all important, 10=extremely important)。
#attr2_3:魅力(Attractive)
#sinc2_3:誠実さ(Sincere)
#intel2_3:知性(Intelligent)
#fun2_3:楽しさ(Fun)
#amb2_3:野心(Ambitious)
#share2_3:共有された興味と趣味(shared interests/hobbies)

#あなたの属性を1-10で評価してください (1= awful and 10=great)。
attr3 _3:魅力(Attractive)
sinc3_3:誠実さ(Sincere)
intel3_3:知性(Intelligent)
fun3_3:楽しさ(Fun)
amb3_3:野心(Ambitious)

#あなたを他の人が評価するとしたらどう評価するでしょう?他の人の視点に立って各属性を1-10 (1=awful, 10=great)で評価してください。
#attr5_3:魅力(Attractive)
#sinc5_3:誠実さ(Sincere)
#int5_3:知性(Intelligent)
#fun5_3:楽しさ(Fun)
#amb5_3:野心(Ambitious)

これで、195変数すべての説明を終えました。前処理とは違った大変さがありました。
次回から集計・可視化・解析に入っていきます。

鈴木瑞人
東京大学大学院 新領域創成科学研究科 メディカル情報生命専攻 博士課程
東京大学機械学習勉強会 代表
NPO法人Bizjapan

2024.1  
給料も教育もガッツリと!メンター制度開始します  詳しく