令和5年度長寿科学研究者支援事業 指定課題研究実績報告
本事業は、「認知症発症予防介入戦略拠点の構築のための研究」の第1段階として、認知症の全体像の把握を可能にするためのデータベースを構築することを目的とします。
指定課題研究名
認知症におけるデータベース構築手法の研究
研究代表者
- 所属・職名:国立長寿医療研究センター研究所 研究推進基盤センター長
- 氏名:新飯田 俊平
研究期間
令和3年度~令和5年度(3年計画3年目)
助成金(実績総額)
83,557,560円
研究活動の概要
本研究開発では、センター内外の研究者・医師らが認知症研究に活用するデータベース(iDDR: integrated Database for Dementia Research)を構築し、運用可能にすることを目標とした。格納する情報資源(データリソース)は国立長寿医療研究センター(NCGG)が保有する認知症例の臨床情報(病院が保有)と付随するゲノム等のオミクス情報(研究所が保有)とした。格納データのうちバイオバンク登録者のものは第三者による研究利用が可能である。
本研究開発では膨大なデータのクリーニングと標準化が中心的作業となり、研究開発期間の3年間で、4,000例以上の高齢者総合的機能評価(CGA)データのクリーニングを行い、3,685例のデータをiDDRに登録した。脳画像情報については8,000枚を超える画像データのクリーニングを行なった。ゲノム情報については、約1,500例の全ゲノムデータ、約5,000例のジェノタイピングデータを対象にクオリティーチェック(QC)を実施した。登録されたCGAデータのうち3,030例が第三者利用可能で、うち2,814例(93%)には脳画像データとゲノムデータの両方が紐づいており、統合解析が可能な貴重な医療情報資源となった。
同時に、各データ群をiDDR上で閲覧するためのインターフェイスを作製した。iDDRでは、関連する情報同士を結びつけて整理するハイパーリンク機能を活用してhtml(HyperText Markup Language)コードで閲覧できる仕組みを採用したプロトタイプを完成させた。また、将来の実運用を見据え、iDDRの利用手続き方法や広報といった事務作業に着手した。
研究の成果
本研究開発では、NCGGバイオバンク登録(総数=13,228人)されている中から、認知症例5,368人のBiobank-IDをキーとし、バイオバンクの基本情報と脳画像やゲノムデータを紐づけるリレーショナルデータベースの構築を行なった。各データ群を関連づけるためにはデータの標準化が必須であり、当該研究開発ではデータのクリーニングに最も時間が費やされた。データのクリーニングは、オリジナルデータを保有する診療科や研究部のデータベースにアクセス出来る医師、研究者の協力を得て行い、バイオバンクと共有する作業を進めた。同時に、集約したデータを閲覧できる仕組みのプログラミングを進めた。
認知症統合データベース、iDDRに格納したデータのうち、心理テストを含む高齢者のCGAデータは、今年度実施した2,322例を加え、研究開発期間の3年間累計で4,400例以上をクリーニングし、うち3,685例をiDDRに登録した。またMRIやSPECTなどの脳画像データについては、病院サーバーに保存されている中から、8,714枚の画像クリーニングやデフェイシング処理を行ない、共有化できるようにした。全ゲノム(WGS)情報およびSNPアレイによるジェノタイピング情報については、前者1,507例、後者5,642例のデータクオリティーチェック(QC)を終了した。これら以外にも1,380症例の血中RNAシーケンスデータのQCを行い、共有可能にした(図1)。
前述の脳画像のオリジナルデータは医用画像規格の一つであるDICOM(Digital Imaging and Communication in Medicine)形式で病院PACSサーバー(画像保存通信システム)にオリジナルが保存されている。この画像データを、iDDRが存在する研究系ネットワーク上で取り扱うには、(1)国が定めた情報セキュリティガイドラインを遵守すること、且つ(2)医用画像データ中の個人情報を消去し、病院IDをバイオバンクIDに置換する新たなシステムを構築することの2つの課題があることがわかった。そこで、病院で取得された医用画像を研究用として管理する既存の匿名化PACSサーバー(脳機能画像研究部管理)を仲介させることで、iDDRからデータの閲覧ができるシステムに計画を変更した(図1参照)。
データの統合解析で核になるCGAデータ3,685例のうち、第三者利用を可能にする同意があるものは3,030例であった。そのうち、2,814例(93%)は脳画像データとゲノムデータの両方が紐づいており、データの統合解析が可能な医療情報資源となった(図2)。このデータ数は過去に実施されてきた国内の認知症例の公開データに比べても多い数字である。
研究者が利用するiDDRの画面構成等については、すでに実装可能な状態に仕上げた。iDDRのトップページのメニューから「データベース」のボタンをクリックするとログイン画面に移行する(図3上図)。利用者はあらかじめ付与されたパスワードを入力し、サイトに入り、閲覧したい項目を選択したのち、「データを表示」のボタンを押すと各種データ項目が一覧になって表示される(図3下図)。
画像データを参照する場合は、リンクボタンを押すことで、前述した脳機能画像研究部の管理する研究用PACSサーバーにある脳画像をビューワーを介して閲覧できる(図4参照)。
ゲノム情報は全ゲノム配列データ、ジェノタイピングデータがすでに研究利用可能であるが、iDDRの画面上では、アルツハイマー型認知症やレビー小体型認知症の強いリスク因子となっているAPOE遺伝子多型のタイプのみ閲覧可能としており、配列データそのものは閲覧できない。現時点はゲノム情報の取扱に関する国の方針の行方をみているところで、研究倫理指針も含めて、今後の課題となる。しかしながら、所定の手続きを得ることで、配列データは利用可能である。利用者はメディカルゲノムセンター内の専用端末からゲノムデータにアクセスして、臨床情報と遺伝子情報の関連性などを解析することができる。
なお、iDDRに登録されたデータの一部(登録者の性別や年齢など)については、自動的に統計処理をしてiDDRのトップページに表示される仕組みにした(図5)。
一方、iDDRの利用方法についても検討を行った。当センターのバイオバンクではすでに臨床データのみの利用などに対応している。これに倣い、iDDR利用も同様の手順に沿って行うのが適当と考えている(図6参照)。現時点は混乱を避けるため、安易にオリジナルデータの転送やコピーができない仕様にする必要がある。また、アクセスに制限をかけ、公開できるものから徐々にWebで公開していくのが妥当と考えている。今後、利用ガイドラインなど、運用面のルール作りを行い、研究者や行政の認知症対策関係者に有用になるデータベースになることを期待している。
本研究開発への参加・協力部署
本研究は以下の部署が連携して推進しています。
- 国立長寿医療研究センター病院 もの忘れセンター
- 国立長寿医療研究センター病院 放射線診療部
- 国立長寿医療研究センター病院 先端医療開発推進センター医療情報室
- 国立長寿医療研究センター研究所 メディカルゲノムセンター
- 国立長寿医療研究センター研究所 脳機能画像診断開発部
- 国立長寿医療研究センター研究所 予防科学研究部
- 国立長寿医療研究センターバイオバンク
データベースを活用した実績
長寿科学研究者支援事業 指定課題研究について
本事業の詳細については以下のページをご覧ください。