= ことば × いのち
MEDNLPは 京都大学デザイン学ユニットにて実施されている 医療言語処理の研究プロジェクトです

PHILOSOPHY

近年,電子カルテやインターネットに接続可能な健康器具により大量の医療データが利用可能になりつつあり,これらを活用することで,過去例を見ない大規模な統計的研究や,大規模データに基づいた医療支援システムを実現可能であるとして大きな期待がよせられています. しかし,現状では,電子化された言語データを処理する枠組みがないため,データは活用されるどころか,情報過多を起こし現場の医療者の負担をさらに増しているケースさえあります.

以上の背景のもと,本プロジェクトでは, カルテ文章について自動匿名化を行い,情報を抽出する技術を研究開発します. さらに,この技術を,ウェブ上のテキスト(ブログやソーシャルメディアなど)や患者が記述した闘病記など,電子カルテ以外のテキストにも応用します.

NEWS

  • 2014/04/23: 宮部真衣研究員が第33回医療情報学連合大会 (第14回日本医療情報学会学術大会)にて優秀論文賞を受賞しました.
  • 2014/04/09:「オイコノミア~そのデータ、どう読み解きますか?~」 (4月9日NHK Eテレにて放送予定)におきまして「インフルくん」が紹介される予定です.
  • 2014/03: 宮部真衣研究員がデータ工学と情報マネジメントに関するフォーラム(DEIM)にて最優秀インタラクティブ賞を受賞しました.


    これまでのメディアでの紹介

PUBLICATION

* 詳細な業績は PIの業績 を参照のこと.

.
原著論文 国際会議 受賞
2014年度 0編 1編 2賞
2013年度 4編 11編 4賞
2012年度 3編 6編 6賞
2011年度 2編 2編 4賞
2007年からの累計 18編 33編 21賞

MISSION

本邦最高レベルのカルテ文章の言語解析を実現するシステムの構築

電子カルテの普及により,過去例を見ない大規模な統計的研究や医療支援システムが現実のものとなりつつあります. この電子カルテデータをさらに有効に利用するために, 自動匿名化,医療表現(日付表現,疾患表現,薬品表現)の抽出, 正規化など言語処理に対する多くの需要があります. 本プロジェクトでは,自動匿名化と医療表現抽出に関して, 固有表現抽出技術を応用したシステムを開発し, 国際コンペティション(NTCIR評価型ワークショップ)にて,好成績を残しました (医療表現抽出にて22システム中1位,自動匿名化にて全15システム中3位).

研究コミュニティの確立

米国を始めとした海外では1960年代から医療分野における言語処理研究が盛んに進められています. しかしながら,他の分野と比べて進展が遅いという問題点も指摘されています. その問題の原因として,Chapman等は次の2点を挙げています: (1)入手可能なデータ(コーパス)が不足している, (2)データ(コーパス)の仕様の方針が統一されていない. 以上の背景から,本研究グループは,有志の医師により模擬病歴報告を記述し, これを配布することで,基盤となるデータを利用可能にしています.

これまで,以下のようなイベント/ワークショップを開催/共催してきました.

APPLICATION

安全な文章匿名化


医療文章などに含まれる自然言語テキストには多くの個人情報が含まれています. これを特定し自動削除する研究を行っています. 日本語の病歴報告においては,コンテストにおいて世界3位の精度で自動匿名化を実現しました [NTCIR2013].英語の退院サマリにおいても世界4位の精度で自動匿名化を実現しました [i2b2-NLP2006].

  • 本技術が「匿名化コピー」としてテレビ東京ワールドビジネスサテライトの「トレンドたまご」にて紹介されました.

Web上の医療/健康情報の収集


近年,FacebookやTwitterなどのソーシャルメディアの普及により,人々の情報が大量かつリアルタイムに利用可能です. 本プロジェクトでは感染症や花粉症に注目し,全国的な情報収集を目指しています. 大規模かつ即時的な情報は,既存の調査を上回る可能性があります.

  • 本技術の応用先の一つである 「カゼミル」 は, CLIO Healthcare Awardなど多くの賞を受賞しました.
  • 本技術はNHK「ニュース・ウォッチ9」を始め,多くの国内メディアやCCTVを始めとした海外に取り上げられてました.

共同研究のお願い

当プロジェクトは,多方面の方々より 共同研究を賜り,研究活動を推進しています. ご相談につきましては,下記よりご連絡ください.
mednlp.office@gmail.com