厚生労働科学研究費補助金(臨床研究等ICT基盤構築研究事業)

「カルテ情報の自動構造化システムと疾患数 理モデルの逐次的構築,及び,自動構造化機能を有した入力機構 の開発」(荒牧班)


はじめに

電子カルテ情報をセマンティクスの標準化により分析可能なデータ に変換するための研究」は,日常診療で医師が記述している電子カ ルテ文章の利活用に関する研究です.カルテの記述様式については 医師に一任されており、その表現の多様性,例えば,「むかつき」 や「吐き気」など1つの症状においても様々な表記のゆれがあり, 分析が非常に困難となっています.よって膨大な電子カルテ情報の 研究利用はほとんどなされていないのが現状です.

このような表現のゆれを持つカルテ文章を利活用するためには,医師の記述する 文章の医療表現を,標準的な用語に変換する技術が必須となります. 現在,カルテ文章から医療用語を自動抽出しWHOが策定した国際的な用語に変換できる技術,また,日本語入力とカルテシステムと融合し,カルテ文書を入力する際に標準化言語に自動変換する技術も同時開発しています.

日本の資産である過去の患者のデータを医療に活かすことは,我が国で行うべき重要な研究課題であると考え研究を進めています.

成果物の概要

本プロジェクトにより,以下の成果物が開発されました.

大規模病名辞書「万病辞書」

実際の医療現場では病名の正式名称ではなく略記や英語名を用いることが少なくありません.そこで,実際に病名を網羅するため,医療従事者が記載した電子カルテや退院サマリから, 症状や病名に関連する語を広く抽出したデータを作成しました.

日本語病名抽出システム「MedEX/J」

入力された文章から病名・症状を抽出し,ICDコーディングし,さらに,陽性か陰性かを判定するソフトウェアです.リソースとして,大規模病名辞書「万病辞書」を用いています.

患者症状抽出器「AEX(Adverse Effect eXtractor)」

Adverse Effect eXtractorは,患者の記述した文章から,症状表現を抽出し,病名コード(ICDコード)別に分類するソフトウェアです.

大規模病名辞書「万病辞書
はじめに

医療文書から病名を抽出する処理は,これまで医療言語処理分野の研究では盛んに行われてきました. 病名抽出にはICDのような標準規格で規定された標準病名を用いることがほとんどでした. しかし, 実際の医療現場では医療文書への記載の際に,標準病名ではなく略記や独自の慣用名を用いることが少なくありません. そのため,現実的には標準病名のみで当該の症状や病名に関する情報を網羅的に抽出することが難しくなります. そこで, これらの問題を解決すべく,医療従事者が記載した電子カルテや退院サマリから, 症状や病名に関連する語を広く抽出したデータリソースを作成しました.

データ構成
病名は以下の情報を含んでいます.
コードICD-10コード
病名標準病名
信頼度 S,A,B,Cからなるコードの信頼度.
よみがなよみがな
頻度使用頻度
ダウンロード

以下のサイトからダウンロードできます.

デモ

下記のフォームに, 症状や病名等を記入し, 検索ボタンを押してください. 万病辞書内のデータをオンラインで閲覧することができます.

病名を入力して下さい



日本語病名抽出システム「MedEX/J
はじめに

これまで多くの日本語形態素解析器が開発されてきましたが, 医療文章の解析においては,十分な精度が出ていませんでした. この理由の1つは,従来の形態素解析は,新聞などの汎用的な文章 を想定し,特に医療に特化していないことにあります. また,形 態素という単位が,もっぱら抽出したい対象である薬品名や病名よ りも小さく,いわゆる,細切れになってしまった医学用語の扱いが 問題となっていました. そもそも,多くの専門用語は複合名詞で あり,形態素解析のみで用語を抽出することは,無理な処理です. このような問題を解決するために,MedEX/Jは,形態素ではなく, 病名用語抽出に特化しました. また,後処理として,ICD10への標 準化,事実性判定など,臨床的に重要な処理も組み込んであります. 従来,系列ラベリングによる用語抽出は,形態素解析の後処理とし て,実装されることが多かったですが,MedEX/Jでは,これを融合 させ,単体で動作するように開発しました.

ダウンロード

以下のサイトからダウンロードできます.

患者症状抽出器「AEX(Adverse Effect eXtractor)
はじめに

(準備中)

ダウンロード

以下のサイトからダウンロードできます.

本成果を使用した研究を行う場合のお願い

本成果物を利用した研究成果を発表する際は,以下の引用をお使い下さい.

「万病辞書」
本プロジェクトについて
研究班班員
  • 荒牧英治 (研究代表者・奈良先端科学技術大学院大学)
  • 若宮翔子 (奈良先端科学技術大学院大学)
  • 河添悦昌(東京大学医学部付属病院)
プロジェクト研究員
  • 矢野憲 (奈良先端科学技術大学院大学)
協力
  • 岩尾友秀 (奈良先端科学技術大学院大学)
謝辞

本プロジェクトは主に下記の補助を受けています。

  • 厚生労働科学研究費補助金(臨床研究等ICT基盤構築研究事業), 2016年〜2017年, 「カルテ情報の自動構造化システムと疾患数 理モデルの逐次的構築,及び,自動構造化機能を有した入力機構 の開発」(荒牧班)

本プロジェクトは下記の補助を部分的に受けています。

  • 国立研究開発法人日本医療研究開発機構(AMED), 2016年〜2017年, 「人工知能による総合診療診断支援システムの開発」 (研究代表者:永井良三,研究分担者:荒牧英治)
  • 国立研究開発法人日本医療研究開発機構(AMED), 2016年〜2018年, 医薬品等規制調和・評価研究事業 「患者の自覚症状により副作用の早期発見を可能とする方策に関する研究」 (研究代表者:望月眞弓,研究協力者:荒牧英治,若宮翔子)
提供実績

プライバシーポリシー

奈良先端科学技術大学院大学ソーシャル・コンピューティング研究室(以下,本研究室)が提供する成果物のプライバシーポリシーを定めます. 使用される方は,本規約を熟読し,内容をご理解いただいた後に,使用を開始していただくようお願いいたします.

免責事項

成果物は,可能な限り細心の注意を払って開発しました. しかし,完全な信頼性や堅牢性を保証しているわけではありません. 結果的に本アプリ及びデータを使用して何らかの問題が発生した場合, 提供元である本研究室は一切の責任を負いかねます. ご使用になる場合には自己責任でご活用いただくようお願いいたします.