長寿科学研究に関する情報を提供し、明るく活力ある長寿社会の実現に貢献します。

令和3年度長寿科学研究者支援事業 指定課題研究実績報告 

 本事業は、「認知症発症予防介入戦略拠点の構築のための研究」の第1段階として、認知症の全体像の把握を可能にするためのデータベースを構築することを目的とします。

指定課題研究名

認知症におけるデータベース構築手法の研究

研究代表者

  • 所属・職名:国立長寿医療研究センター 研究所長
  • 氏名:新飯田 俊平

研究期間

令和3年度~令和5年度(3年計画1年目)

助成金(実績総額)

27,253,950円

研究活動の概要

 近年、医療分野における多種のデータ統合と共有化が推進され、研究に利活用されるようになった。本研究開発課題では、国立長寿医療研究センター(以下NCGGという。)が保有する認知症に関連する情報(データ)資源を集約し、センター内外の認知症等の研究者が利活用できる統合データベース(iDDR: integrated Database for Dementia Research)を構築することを目的としている。

 NCGG病院には年間1,000人の新患が受診するもの忘れセンターがあり、研究所が運営するバイオバンクと連携して、生体試料とともに臨床情報の研究利活用が可能になっている。バイオバンクにはMCI(軽度認知障害者)症例1,700例を含む約6,800例の認知症関連の患者登録がある。一方、メディカルゲノムセンターには認知症例の登録者のゲノム情報(アジア最大級)が保存されており、両者を統合して解析する研究も進んでいる。しかしながら、臨床情報については、バイオバンクから元データを保管するもの忘れセンターの管理データベースにアクセスしてその都度データを抽出するシステム構成となっている(図1;上図)。また脳画像データにおいては、放射線科/脳機能画像研究部が独立したデータベースで管理されており、ゲノムや臨床情報との統合解析が機能しない現状である。

国立長寿医療研究センターが保有する認知症に関連するデータの共有状況について上段に現状、下段にiDDRを利用した共有のイメージを表した図
図1.バイオバンクを介したデータの共有状況。上手が現状で、下図がiDDR稼働後のデータの流れのイメージ

 NCGGの保有する認知症例のデータは国内最大であり、貴重な研究資源であることは明白である。本研究開発では、これらデータ群のICT(Information and Communication Technology)化を進め、情報の一元管理を図り、登録データを可視化するデータベースに整備するものであるが(図1;下図)、同時に既存データ、特に臨床情報のクリーニングは必須作業であり、研究1年目はこの点を中心に作業を実施した。なお、iDDRの基盤となるハードウェアはNCGGメディカルゲノムセンターが管理するデータストレージサーバーを増設して構築するもので、基礎となるハードウエア部分は構築されている。

研究の成果

 本研究課題で構築する認知症の統合データベースiDDRのコアとなる臨床情報のうち、CGAデータ(Comprehensive Geriatric Assessment=高齢者総合的機能評価)は病院のもの忘れセンターに、MRI等の脳画像情報は放射線科に保管されている。また、データ共有の基軸(Key)となるバイオバンクIDとそれに紐づくゲノム情報はメディカルゲノムセンターが管理する。このように、研究における利活用頻度の高い主要なデータ群はセンター内に分散して存在している。

 NCGGバイオバンクではすでに臨床情報等を二次活用する研究課題に対して、研究倫理審査の承認を条件に、データ提供するサービスを実施している。バイオバンクデータベースは擬似的にはiDDR化しているが、実際のデータ抽出作業は「バイオバンクID→病院ID変換」を介して、元データを管理するもの忘れセンターのCGAデータベースにアクセスして検索する。画像情報(共同研究ベースでのみ提供している)に至っては、放射線科の管理するデータベースからハードディスクにデータをコピーして共有している。このような現状を鑑み、データ活用研究のためのICT化を進める必要がある。その前提として、格納するデータ群の整理整頓と標準化、すなわち、データクリーニングが必須の課題となる。当該年度のそれぞれの作業は以下の通りである。

 CGAデータのクリーニングについては、まずクリーニングの手順書の作成を行なった。複数のスタッフが作業するため作業手順の標準化は効率化につながる。実施対象は初診時に軽度認知機能障害(MCI)と診断された症例とした。MCIのバイオバンク登録者数は2021年11月末現在で約1,700人。当該年度はこのうち489人分、件数にして2,486件のデータをクリーニングした。データは、神経心理検査(MMSE,ADAS-J-cog,論理的記憶,RCPM,FAB等)、総合機能評価(ライフスタイル,Barthel Index,Lawton Index,DBD,MNA等のアンケート調査)、身体測定、身体機能(握力,Timed Up and Go test,片脚立位時間等)など多岐にわたる。特に、対面調査などオリジナルデータを紙ベースで取得したものは、PC入力時のタイプミスが生じることがある。これらを一つ一つ確認する作業を続けている。

 画像データについては、解剖学的画像(T1)のdefacing処理とT1画像から海馬・海馬傍回の萎縮度の抽出方法について検討を行なった。T1画像のdefacingでは2種類の方法を検討した。図2にdefacingの1例を示す。図2の(B)はPython言語ベースのbidsonymで、(C)はMATLAB言語ベースのSPM(Statistical Parametric Mapping)を用いた処理である。数人の画像でテストを行い、いずれの方法もdefacingが可能であることを確認した。さらに、SPMを用い100人以上の画像でテストを行い、この方法の安定性を確認した。解析環境の設定についてはSPMがより簡単で、SPMの汎用も考慮し、来年度以降はSPMを用いたdefacing処理を進める。

画像データのdefacing処理方法について、2種類処理方法でdefacingされた画像を記載した図
図2.MRI画像のDefacingの例

 一方、海馬・海馬傍回の萎縮度を表す数値の算出については、VSRAD(voxel-based specific regional analysis system for Alzheimer's disease)を用いて行った(図3)。海馬・海馬傍回の萎縮度はアルツハイマー病の診断の他に、ゲノム情報との関係を含めた病態解析に利活用することもできる。今後はT1画像から海馬・海馬傍回の萎縮度を抽出し、iDDRに登録する予定である。

 ゲノム等のオミクス情報については、メディカルゲノムセンターがデータ取得から保存・管理までを一括して担当している。同センターではバイオバンクに登録されたゲノムDNA試料を用い、遺伝子解析等を行なっている。取得した遺伝子関連情報は、iDDRと連結可能な環境にあるデータストレージに直接格納されている。取得した遺伝子配列情報にはしばしば解析に不適切な情報が入る。当該年度は取得したデータのQC(品質管理)を継続して実施した。この作業はデータ解析において最重要の手順とされている。なお、全ての情報は基軸(Key)となるバイオバンクIDと紐づけられて管理されており、個人を特定する病院IDは秘匿される。

VSEADを用いて海馬・海馬傍回の萎縮度を表す数値を算出する様子を表した図
図3.MRI画像から、海馬・海馬傍回の萎縮度を抽出する

 一方、データベースに集積されたデータを研究に用いる際に、データの検索や絞り込みを行うが、iDDRの運用時をイメージしたインターフェイスのプロトタイプを作成した(図4)。実データを仮想ストレージに格納し、必要なデータ項目を選択できる仕組みや脳画像のビューアーを搭載したモデルを作成した。実際のiDDRのインターフェイス構築においては研究者や専門医の意見を取り入れて改良を加える予定である。

iDDRの運用時をイメージしたインターフェイスのプロトタイプを表した図
図4.もの忘れセンターと放射線科のデータを統合した診療情報データベースのプロトタイプ。必要なデータの選択や絞り込み機能を付与した画面構成になっている。

 データベース のハード・ソフトの構築については、収集したCGAの実データを用いたiDDRのユーザーインターフェイス・プロトタイプの作製を行った。格納データは、ハイパーリンク機能で関連する情報同士を結びつけて情報を整理することが得意なhtml(HyperText Markup Language)コードで閲覧できる仕組みを採用した。今後は画像データの収集も見込まれることから、さらに改良を加える予定である。

本研究開発への参加・協力部署

 本研究は以下の部署が連携して推進しています。

  • 国立長寿医療研究センター病院 もの忘れセンター
  • 国立長寿医療研究センター病院 放射線診療部
  • 国立長寿医療研究センター病院 先端医療開発推進センター医療情報室
  • 国立長寿医療研究センター研究所 メディカルゲノムセンター
  • 国立長寿医療研究センター研究所 脳機能画像診断開発部
  • 国立長寿医療研究センター研究所 予防科学研究部
  • 国立長寿医療研究センターバイオバンク

長寿科学研究者支援事業 指定課題研究について

本事業の詳細については以下のページをご覧ください。

長寿科学研究者支援事業


Acrobat Readerをダウンロード

PDFファイルをご覧いただくにはAcrobat Readerが必要です。
Acrobat Readerは、Adobe Acrobat Reader DCのサイトからダウンロードできます。
インストール方法はAdobe社のサイトで説明されています。

Acrobat及びAcrobatロゴは、Adobe Systems Incorporated(アドビ システムズ社)の商標です。