川角 友美

環境リスクマネジメントに関するインターネット検索ロボットの構築

前田研究室   5081―3033 川角 友美

 

1.        はじめに

現在、日本リスク研究学会のメンバー参加によるミレニアムプロジェクト「環境リスクの診断・評価およびリスク対応型(risk-based)の意思決定支援システムの構築」1(以下、MPと略す)が立ち上がっている。MPは、双方向コミュニケーションを介したリスク管理の発展を目指す能動的リスク政策の形成を支援する、情報プラットフォームの構築と運用を研究課題としている。

MPの一環として、リスク・アプローチの重要な要素の1つである、リスクマネジメント(RM)を支援するコンサルティングシステムを開発することが目標にある。RMに関する情報要求者の質問に応じて適切な回答を返す、というものである。そのためには予め様々な質問を予想し、適した回答を用意しておかなければならない。そこで必要なRM情報を入手する道具としてインターネットを利用する際に、短時間でより効率の良い情報収集法を考えることが本研究のテーマである。

 

2.        環境リスク検索ロボットの特徴

検索ロボットとは、gooやinfoseekのように、wwwサーバ上にあるWebページをリンク先をたどりながら自動的に(かつ定期的に)次々と収集していき、作り上げたデータ群からユーザが望むキーワードを含むページを提供するシステムである。

本研究で構築しようとしているロボットは基本的な仕組みは既存のロボットと同じである。しかし、より良質な環境RM情報を効率良く得るという目的のため、キーワードとの照合の際にファイルの環境RMに関する情報を記録し、そのポイントに従った順位付けを定義し出力する機能を加える。ポイントは以下のように設定する。

 

Ø         環境RMに関する重要用語を多く含む。

※キーワードに対応した用語を用意。

Ø         キーワード内の単語がより近くに存在する。

 

3.        本プログラムの全体構成

おおまかに、次の3つのステップから成る。

I.         データ収集

II.      検索

III.   ランキング

図1において、各ステップの生成物を示す。

 

 

 

図1 プログラムの流れと各生成物

 

4.        結果と考察

図2 上位のサイトURL

キーワード「環境リスクマネジメント」の結果、ランキング上位は図2のようになった。

上位に挙げられたサイトは、議事録や環境基本計画等、文字数が多く、かつ専門用語が多く記述されているものが多いという傾向があった。また、上位のサイトから、初めに入力した形の「キーワード」に関する情報が必ずしも得られるというわけではなかった。

 

5.        結論

本研究で構築したロボットは、キーワードに対する「特定の情報」というよりも、キーワード単語に関する詳細な専門的知識やそれを取り巻く幅広い見解を得ることができるようである。

情報ランキングの向上を目指し、さらなる改良の必要性を挙げる。キーワード単語を2つ以上含む重要用語に優先性をつけること、重要用語ポイント、位置情報ポイントそれぞれの重み付けを行いランキングに反映させること等である。

また、プログラムをWeb上に構築し、ユーザにとって利用しやすいものにすることも今後の課題であろう。

 

 

 



1 代表者 盛岡通

URL http://risk.env.eng.osaka-u.ac.jp/