長寿科学研究に関する情報を提供し、明るく活力ある長寿社会の実現に貢献します。

令和5年度長寿科学研究者支援事業 指定課題研究実績報告 

 本事業は、「認知症発症予防介入戦略拠点の構築のための研究」の第1段階として、認知症の全体像の把握を可能にするためのデータベースを構築することを目的とします。

指定課題研究名

認知症におけるデータベース構築手法の研究

研究代表者

  • 所属・職名:国立長寿医療研究センター研究所 研究推進基盤センター長
  • 氏名:新飯田 俊平

研究期間

令和3年度~令和5年度(3年計画3年目)

助成金(実績総額)

83,557,560円

研究活動の概要

 本研究開発では、センター内外の研究者・医師らが認知症研究に活用するデータベース(iDDR: integrated Database for Dementia Research)を構築し、運用可能にすることを目標とした。格納する情報資源(データリソース)は国立長寿医療研究センター(NCGG)が保有する認知症例の臨床情報(病院が保有)と付随するゲノム等のオミクス情報(研究所が保有)とした。格納データのうちバイオバンク登録者のものは第三者による研究利用が可能である。

 本研究開発では膨大なデータのクリーニングと標準化が中心的作業となり、研究開発期間の3年間で、4,000例以上の高齢者総合的機能評価(CGA)データのクリーニングを行い、3,685例のデータをiDDRに登録した。脳画像情報については8,000枚を超える画像データのクリーニングを行なった。ゲノム情報については、約1,500例の全ゲノムデータ、約5,000例のジェノタイピングデータを対象にクオリティーチェック(QC)を実施した。登録されたCGAデータのうち3,030例が第三者利用可能で、うち2,814例(93%)には脳画像データとゲノムデータの両方が紐づいており、統合解析が可能な貴重な医療情報資源となった。

 同時に、各データ群をiDDR上で閲覧するためのインターフェイスを作製した。iDDRでは、関連する情報同士を結びつけて整理するハイパーリンク機能を活用してhtml(HyperText Markup Language)コードで閲覧できる仕組みを採用したプロトタイプを完成させた。また、将来の実運用を見据え、iDDRの利用手続き方法や広報といった事務作業に着手した。

研究の成果

 本研究開発では、NCGGバイオバンク登録(総数=13,228人)されている中から、認知症例5,368人のBiobank-IDをキーとし、バイオバンクの基本情報と脳画像やゲノムデータを紐づけるリレーショナルデータベースの構築を行なった。各データ群を関連づけるためにはデータの標準化が必須であり、当該研究開発ではデータのクリーニングに最も時間が費やされた。データのクリーニングは、オリジナルデータを保有する診療科や研究部のデータベースにアクセス出来る医師、研究者の協力を得て行い、バイオバンクと共有する作業を進めた。同時に、集約したデータを閲覧できる仕組みのプログラミングを進めた。

 認知症統合データベース、iDDRに格納したデータのうち、心理テストを含む高齢者のCGAデータは、今年度実施した2,322例を加え、研究開発期間の3年間累計で4,400例以上をクリーニングし、うち3,685例をiDDRに登録した。またMRIやSPECTなどの脳画像データについては、病院サーバーに保存されている中から、8,714枚の画像クリーニングやデフェイシング処理を行ない、共有化できるようにした。全ゲノム(WGS)情報およびSNPアレイによるジェノタイピング情報については、前者1,507例、後者5,642例のデータクオリティーチェック(QC)を終了した。これら以外にも1,380症例の血中RNAシーケンスデータのQCを行い、共有可能にした(図1)。

バイオバンクデータベースを基盤に認知症例のデータを結合したイメージを表した図
図1.バイオバンクデータベースを基盤に認知症例のデータを統合したイメージ図
(画像データについては研究用(匿名化)PACSシステムを介することで、iDDRから検索・表示が出来るようにシステムを改変した。データの一部はダウンロードできる)

 前述の脳画像のオリジナルデータは医用画像規格の一つであるDICOM(Digital Imaging and Communication in Medicine)形式で病院PACSサーバー(画像保存通信システム)にオリジナルが保存されている。この画像データを、iDDRが存在する研究系ネットワーク上で取り扱うには、(1)国が定めた情報セキュリティガイドラインを遵守すること、且つ(2)医用画像データ中の個人情報を消去し、病院IDをバイオバンクIDに置換する新たなシステムを構築することの2つの課題があることがわかった。そこで、病院で取得された医用画像を研究用として管理する既存の匿名化PACSサーバー(脳機能画像研究部管理)を仲介させることで、iDDRからデータの閲覧ができるシステムに計画を変更した(図1参照)。

 データの統合解析で核になるCGAデータ3,685例のうち、第三者利用を可能にする同意があるものは3,030例であった。そのうち、2,814例(93%)は脳画像データとゲノムデータの両方が紐づいており、データの統合解析が可能な医療情報資源となった(図2)。このデータ数は過去に実施されてきた国内の認知症例の公開データに比べても多い数字である。

CGAデータ3030例の内訳を表した図
図2.
(CGAデータのある3030例のうち、画像データが紐づいている症例は2907例、ジェノタイピングデータが紐づいている症例は2932例であった。両方のデータと紐づく症例は2814例で、全体の93%を占めた。画像やジェノタイプ情報を絡ませたCGAデータ解析やSNP情報と画像の関連研究などが可能になった)

 研究者が利用するiDDRの画面構成等については、すでに実装可能な状態に仕上げた。iDDRのトップページのメニューから「データベース」のボタンをクリックするとログイン画面に移行する(図3上図)。利用者はあらかじめ付与されたパスワードを入力し、サイトに入り、閲覧したい項目を選択したのち、「データを表示」のボタンを押すと各種データ項目が一覧になって表示される(図3下図)。

iDDRのトップ画面、ログイン画面、データの表示画面を表した図
図3.上)iDDRのトップ画面とログイン画面。下)データの表示画面

 画像データを参照する場合は、リンクボタンを押すことで、前述した脳機能画像研究部の管理する研究用PACSサーバーにある脳画像をビューワーを介して閲覧できる(図4参照)。

脳画像情報のビューワーの使用方法を説明する画面を表した図
図4.脳画像情報のビューワーの使用方法を説明する画面

 ゲノム情報は全ゲノム配列データ、ジェノタイピングデータがすでに研究利用可能であるが、iDDRの画面上では、アルツハイマー型認知症やレビー小体型認知症の強いリスク因子となっているAPOE遺伝子多型のタイプのみ閲覧可能としており、配列データそのものは閲覧できない。現時点はゲノム情報の取扱に関する国の方針の行方をみているところで、研究倫理指針も含めて、今後の課題となる。しかしながら、所定の手続きを得ることで、配列データは利用可能である。利用者はメディカルゲノムセンター内の専用端末からゲノムデータにアクセスして、臨床情報と遺伝子情報の関連性などを解析することができる。

 なお、iDDRに登録されたデータの一部(登録者の性別や年齢など)については、自動的に統計処理をしてiDDRのトップページに表示される仕組みにした(図5)。

iDDRに登録されたデータから出力されたサマリーデータを表した図
図5.
(iDDRに登録されたデータから出力されたサマリーデータ。iDDRトップページに性別の登録数や年代別のMMSE平均スコア、BMI分布、CGA検査の得点率などの掲載が可能な仕様になっている)

 一方、iDDRの利用方法についても検討を行った。当センターのバイオバンクではすでに臨床データのみの利用などに対応している。これに倣い、iDDR利用も同様の手順に沿って行うのが適当と考えている(図6参照)。現時点は混乱を避けるため、安易にオリジナルデータの転送やコピーができない仕様にする必要がある。また、アクセスに制限をかけ、公開できるものから徐々にWebで公開していくのが妥当と考えている。今後、利用ガイドラインなど、運用面のルール作りを行い、研究者や行政の認知症対策関係者に有用になるデータベースになることを期待している。

iDDRの利用手続きの流れの案を表した図
図6.iDDRの利用手続きの流れ(案)
(既存のバイオバンク利用手続きにならって申請してもらう。当面は共同研究ベースで利用。申請はウエブからもできるように進める予定)

本研究開発への参加・協力部署

 本研究は以下の部署が連携して推進しています。

  • 国立長寿医療研究センター病院 もの忘れセンター
  • 国立長寿医療研究センター病院 放射線診療部
  • 国立長寿医療研究センター病院 先端医療開発推進センター医療情報室
  • 国立長寿医療研究センター研究所 メディカルゲノムセンター
  • 国立長寿医療研究センター研究所 脳機能画像診断開発部
  • 国立長寿医療研究センター研究所 予防科学研究部
  • 国立長寿医療研究センターバイオバンク

データベースを活用した実績

Classification and deep-learning-based prediction of Alzheimer disease subtypes by using genomic data(外部サイト)(新しいウインドウが開きます)


長寿科学研究者支援事業 指定課題研究について

本事業の詳細については以下のページをご覧ください。

長寿科学研究者支援事業


Acrobat Readerをダウンロード

PDFファイルをご覧いただくにはAcrobat Readerが必要です。
Acrobat Readerは、Adobe Acrobat Reader DCのサイトからダウンロードできます。
インストール方法はAdobe社のサイトで説明されています。

Acrobat及びAcrobatロゴは、Adobe Systems Incorporated(アドビ システムズ社)の商標です。