2016.12.18 Sun |

解析事例紹介5: クラスター分析を用いた混合性結合組織病(MCTD)の細分類

今まで4回にわたって書いてきた解析事例紹介ですが、今回は第5回目です。今回はクラスター分析を用いてデータを細分類しようとした例をご紹介します。

クラスター分析は、多変量解析の重要な一角でもあり、機械学習においても教師なし学習の重要な一角を占める重要かつ有名な手法です。今回用いる手法は、ウォード法による階層クラスタリングとk-means法です。

clustering

【出典】

宮原英夫・白鷹増男(1996). 混合性結合組織病(MCTD)のクラスター分析. 行動計量学, 23(1),63-82
西間木友衛(1999).混合性結合組織病. 日本内科科学会雑誌, 88(10),1890-1895.
東條毅(1996).混合性結合組織病診断の手引き(1996年改訂版).厚生省特定疾患混合性結合組織病調査研究班, 平成7年度研究報告書, 3
Miyahara.H(1976). Cluster analysis of systematic lupus erythematosus : a case study of disease entites. In De Dombal, F.T.,et al(Eds). Decision Making and Medical Care (pp.213-224), The North Holland.
KOMPAS 慶応義塾大学病院 医療・健康情報サイト
http://kompas.hosp.keio.ac.jp/contents/000024.html

【背景】
MCTD(混合性結合組織病:Mixed Connective Tissue Disease)という疾患は、
・冷水の中に手を浸すと手先が蒼白に変わっていくレイノー現象
%e3%83%ac%e3%82%a4%e3%83%8e%e3%83%bc%e7%97%87%e5%80%99%e7%be%a4http://kompas.hosp.keio.ac.jp/contents/000024.html
・指ないし手背の膨張
・抗U1-RNP抗体陽性
・全身性エリマトーデス様所見
・強皮症用所見
・多発性筋炎様所見
など、多彩な症候を呈する症例の集合体です。MCTDと診断された症例の多くが、SLE(全身性エリマトーデス)、PSS(強皮症)、PM(多発性筋炎)などの単独膠原病の診断基準を満足します。MCTDを、うまく、再現性のあるサブグループに分けることができれば、診断精度の向上、予後の推測、治療法の選択等に生かすことができるのではないかと考えられ、ward法とkmeans法により、サブグループに分けることが試みられました。

%e7%97%85%e6%b0%97%e8%a8%ba%e6%96%ad

ちなみに、厚生労働省特定疾患混合性組織病調査班による混合性組織病診断の手引きは以下です。混合所見のところを見てもらえれば、全身性エリマトーデスと強皮症と多発性筋炎が混じった疾患ということが分かるかと思います。

ーーーーーーーーーーーーーーー

Ⅰ.共通所見
1.レイノー現象
2.指ないし手背の膨張
3.肺高血圧症
Ⅱ.免疫学的所見
抗U1-RNP抗体陽性
Ⅲ.混合所見
A.全身性エリマトーデス様所見
1.多発関節炎
2.リンパ節膨張
3.顔面紅斑
4.心膜炎または胸膜炎
5.白血球減少(4,000/µL以下)または、血小板減少(100,000/µL以下)
B.強皮症様所見
1.手先に限局した皮膚硬化
2.肺線維症、拘束性換気障害(%VC=80以下)または、肺拡散能低下(DLco=70%以下)
3.食道蠕動低下または拡張
C.多発性筋炎様所見
1.筋力低下
2.筋原性酵素(CK)の上昇
3.筋電図における筋原性異常所見
——————–

診断:
1.Ⅰの1所見以上が陽性
2.Ⅱの所見が陽性
3.ⅢのA,B,C項のうち、2項目以上につき、それぞれ1カ所以上が陽性
以上の3項目を満たす場合を混合性結合組織病と診断する。

付記:
1.抗U1-RNP抗体の検出は二重免疫拡散法あるいは、酵素免疫測定法(ELISA)のいずれでもよい。ただし、二重免疫拡散法が陽性でELISAの結果と一致しないときは、二重免疫拡散法の結果を優先する。
2.以下の疾患標識抗体が陽性の場合、混合性結合組織病の診断は慎重に行う。
1)抗SM抗体
2)高力価の抗二本鎖DNA抗体
3)抗トポイソメラーゼⅠ抗体(抗Scl-70抗体)
4)抗体Jo-Ⅰ抗体
3.肺性高血圧症を伴う、U1-RNP抗体陽性例は、臨床所見が十分にそろわなくとも、混合性結合組織病に分類される可能性が高い。

ーーーーーーーーーーーーーーー

medicine

【MCTDの治療法】
根治的治療法はなく対症療法のみとなります。
・レイノー症候群に関して
ビタミンE製剤、血管拡張作用のあるカルシウム拮抗薬、アンギオテンシンII受容体拮抗薬、プロスタグランジン製剤などの循環改善薬。
・関節炎
基本的に消炎鎮痛剤やステロイドを使用。破壊性の関節炎を認める場合には関節リウマチの治療に準じて生物学的製剤。
・内蔵病変
ステロイド薬の使用が中心。胸膜炎・心膜炎などの場合は、プレドニゾロン30mg/日程度を使用し、腎炎や間質性肺炎急性増悪、重症筋炎、血小板減少症など重症例に対してはプレドニゾロン1mg/kg/日(40~60mg/日)程度の大量ステロイド療法。効果が不十分な場合はステロイドパルス療法。またステロイドに加えて免疫抑制剤を使用する場合もあります。
・肺高血圧症
基本的には特発性肺動脈性肺高血圧症の治療を行い、肺血管拡張薬であるプロスタサイクリン製剤やエンドセリン受容体拮抗薬、ホスホジエステラーゼ5阻害薬を使用。免疫抑制療法に効果がある場合もあります。

data

【使用データ】
1993年9月から同年12月にかけて、行われた、厚生労働省研究班のMCTD患者304名(男12名、女292名)の実態調査データを使用。対象患者の年齢は5歳から70歳まで、平均39.5歳、標準偏差12.5歳。臨床所見・検査室検査所見は、MCTDの診断に必要な項目だけではなく、近縁疾患で認められるものも含めた以下です。
・レイノー現象*
・指ないし手背の膨張
・多発関節炎
・リンパ節膨張
・顔面紅斑
・心膜炎
・胸膜炎
・白血球減少
・血小板減少
・手先に限局した皮膚硬化
・肺繊維症
・肺拘束性障害
・肺拡散能低下
・食道運動低下・拡張
・筋力低下
・筋原性酵素上昇
・筋電図・筋原性パターン
・discoid疹*
・日光過敏症
・口・鼻潰瘍
・精神神経症状
・溶血性貧血*
・尿たんぱく0.5g/日以上
・細胞性円柱
・抗DNA抗体
・LE細胞
・梅毒反応偽陽性*
・蛍光抗核抗体陽性*
・近位部の皮膚強化
・指尖瘢痕
・上眼瞼部浮腫性紅斑*
・関節背面の紅斑*
・肺高血圧症
・リュウマチ因子
・骨・関節エロジオン
・Sjogren症候群
・抗U1-RNP抗体陽性*
・抗SM抗体陽性
・その他抗核抗体
・低補体血漿
の以上40項目。各項目症候あり(1)なし(0)で表した。
※(*)MCTDで出現頻度が極端に高かったもの(95%以上)と極端に低かった(5%以下)項目は使用せず。この結果*のついた8項目は使用しなかった。

【単独膠原病の診断】
単独膠原病とは、症候や臨床経過に類似性のある、SLE(全身性エリマトーデス)、PSS(強皮症)、DM(皮膚筋炎)、PM(多発性筋炎)、RA(慢性関節リュウマチ)です。RAについては、質問票の項目だけでは診断基準を満足できるかどうか判定できないので、判定の対象から除外しました。 全304例中、重複を許すと、
SLE(全身性エリマトーデス) 181例
PSS(強皮症) 160例
DM(皮膚筋炎) 6例
PM(多発性筋炎) 109例
DM疑診 8例

重複を許さないと
SLE(全身性エリマトーデス)のみに該当 50例
PSS(強皮症)のみに該当 46例
DM(皮膚筋炎)のみに該当 0例
PM(多発性筋炎)のみに該当 17例
DM疑診のみに該当 2例

2項目に同時に該当したのが、
SLE+DM 1例
SLE+DM疑診 4例
SLE+PM 33例
SLE+PSS 48例
PSS+DM 2例
PSS+PM 19例

3例に同時に該当したのが、
SLE+PSS+DM 3例
SLE+PSS+DM疑診 2例
SLE+PSS+PM 40例

【統計パッケージ】
SAS(version6)のCLUSTER、FASTCLUS Procedureをそれぞれward法、k-means法に使用。

【ward法によってできた7クラスターの解釈】
・第1群(58例):PSS(強皮症)に特徴的な肺や食道の症候が高頻度にみられる。逆にSLE(全身性エリマトーデス)に特徴的なものは、平均より低い頻度のものが多いです。よって「PSS」または「PSS+PM型」と命名。
・第2群(57例):PM(多発性筋炎)症候の出現頻度が第5,7群に次いで高く、PSS(強皮症)やSLE症候(全身性エリマトーデス)の出現頻度はあまり高くないです。よって、PM型と命名。
・第3群(73例):全平均に比べて際立って高いものはなく、各種の膠原病の症状を併有している症例が集まった「混在型」と命名。
・第4群(28例):SLE(全身性エリマトーデス)症候の出現率が高く、PMやPSSでよくみられる、筋・肺症候の出現率は低いので、「SLE型」と命名。
・第5群(27例):SLE症候とPM症候の出現頻度が高かったので、「SLE+PM型」と命名。
・第6群(35例):腎・肺症候の頻度が高く、また、SLE症候の頻度が高かったので「SLE型、特に肺・腎症候を伴うSLE型」
・第7群(26例):第3群が各種膠原病の症候を少しずつ呈している症例の集まりとすると、この群は各種膠原病の診断基準を十分に満たしている症例の集まりと考えることができ、「重複膠原病型」と命名。死亡率が35%と高いのも特徴。

【ward法とkmeas法によるクラスタリングの再現性】
6,7群のサブグループへのクラスタリングを実施した結果、初期配置によって各グループの構成メンバーや臨床的特徴が分析のたびに大きく変動することが確認されたとのことです。←(筆者コメント)ward法は配置変わっても実行ごとに値は変わらないはず。kmeansも同様。ただし、kmeansは初期値依存なので、初期値を毎回変えてしまった可能性はあります。

【まとめ】
・再現性のあるクラスタリングはできなかったものの、クラスタリング結果の臨床特徴を個別に調べてみると、MCTDのサブグループ化のヒントを与えてくれる場合が認められました。
・例えば、「PSS+PM型」(58例)、「PM型」(57例)、「混在型」(73例)、「SLE型」(28例)、「SLE+PM型」(27例)、「SLE型、特に肺・腎症候を伴うSLE型」(35例)、「重複膠原病型」(26例)。
・ward法をメインとして、各症例の連結を進め、各グループの特徴を構成メンバーの症例パターンから大胆にとらえたものの、これが臨床的にどのような意義を持つかは、今後の検討を待つ必要がありそうです。

【個人的な感想】
・結果論ですが、クラスタリングによってMCTDを細分類する意義に少し疑問を感じました。もちろん、クラスタリングが成功して、新しいサブクラスが見つかり、診断・治療に役立つ結果が得られていれば話は違ったのですが、今回のように明確にクラスターが形成されなかった場合、データの内部構造がわかったような、わからなかったような後味悪い感じで終わってしまいます。

・今後どうしてもサブクラスに分けたいのなら、クラスタリングではなく、クラスタの意味が明快な決定木の方が、今回のような診断基準の作成には適しているのではないかと思いました。目的変数は、各治療法が効く効かないの2値分類でよいと思います。

・上に挙げたように、一応、対症療法はあるみたいなので、各患者さんがどの対症療法が効果があるのか、症状や検査値から、機械学習の教師あり学習の分類アルゴリズムを用いて、各対症療法が効くか、予測モデルを作成する方がより実践的なのかなと思いました。

・軽くPubmedで調べたところ、MCTDのSNPsやCNVsはまだ見つかっていないようでした。年齢を問わず発生することや免疫抑制剤が効く場合があることから、基本自己免疫疾患系の病気みたいですが、まだまだ原因究明への手がかりが少なく、根治治療開発には時間がかかる模様です。次の段階として、epigeneticな情報かexomeを調べることが考えられますが、それで見つからなければ、厳しいですね。。結局単一因子でなく、因子の組み合わせを見つける方向にいくのではないかと思います。つまり機械学習の分類アルゴリズムです。目的変数は各種症状を発症するか、または、各種治療薬が効くかどうかでしょう。

・医療診断は、症状や検査値を用いた、病気の分類学から成り立っていますが、分類したからといって、治療法が十分に絞り込めない例は多々あります。また各治療法がどの患者さんに効くのか、少ないヒントからしか予想できないという例も多々あります。そんな時に、検査値や遺伝情報などから、作成された、治療効果予測器(アルゴリズム)があったら、治療法の選択に便利だなと思いました。こういうところで機械学習は活かせそうだなと思いました。今アメリカでは、IBMのWatsonによる、診断支援プログラムがあるそうですが、そういう枠組みで、各治療効果予測もしてくれると、医療体験の満足度が上がりそうですね。

今回はここまで。

鈴木瑞人
東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年
東京大学機械学習勉強会
NPO法人Bizjapan

entry! page top