テキストの解析
まず,テキストエリア(下図 B)に解析したいテキストを入力します.実行ボタン(下図 A)を押すと,解析が始まります.
解析結果は,解析結果表示エリア(下図 C)に表示されます.
出力項目の編集
本システムの解析によって抽出・出力可能な項目は,以下の10項目です.- 日付
- 医院
- 症状
- 症状の類似表現
- MedDRA
- ICDコード
- ICPCコード
- 投薬
- 薬品該当表現
- 薬品一般名
解析結果の保存
本システムで解析した結果は,タブ区切りテキスト(tsvファイル)または カンマ区切りテキスト(csvファイル)として保存することができます.解析後,保存ボタン(下図 E)を押すと,ファイル保存ダイアログが表示されます. ファイル名を入力し,ファイルの種類を選択して「保存」を押すと,ファイルが生成されます.
解析用コーパスの変更
本システムでは,2種類の学習用コーパス (患者文書をもとにしたコーパスおよび医師文書をもとにしたコーパス)を用意しています. 利用するコーパスは,下図 Fのラジオボタンで変更することができます.コード付与用辞書の変更
本システムでは,テキストから抽出した症状に対し,ICDコード,ICPCコードを出力しますが, コードを付与するための辞書は,システムで用意している辞書だけでなく, ユーザの作成した辞書を使うこともできます.利用する辞書は,下図 Gのラジオボタンで変更することができます.
コード付与用辞書の編集
コード付与用辞書として「ユーザ作成辞書」を選択した際に読み込まれるファイルは, 実行ファイル(MAinNLP.exe)と同じフォルダにある,「userDict.txt」です. このファイルを編集することで,出力するコードをカスタマイズできます.userDict.txtは,タブ区切りテキストとなっており,以下のような順で保存されています.
症状名<タブ>MedDRA<タブ>ICDコード<タブ>ICPCコード
同様の形式で,1行につき1症状のデータを入力して保存すると,システム上で利用できるようになります. なお,保存する際の文字コードはUTF-8としてください.