◆ 以下の文章中の「Task」のあとのアルファベット(例:Task A)は、問い合わせフォームの「依頼内容」の記号(A~Q)に対応しています。
情報収集は、プロジェクトの立案・実行・完了・結果評価に至るまで日常的に継続した実施が求められます。
一般的に、情報収集の作業は、プロジェクト実施者(専門家、研究者、技術員)が、Web検索などでテキストや文書を収集し、それらのテキストを読解する文献調査を通して行われます。
特に、学術文献には著者が得た知見(知識情報)が記載されていることから、学術文献調査により研究開発プロジェクトに関連する最新情報を取得することは不可欠な作業です。
調査対象とする情報量が膨大であるため、プロジェクトにおいて、情報収集に充てる時間・人的リソース・コストも大きく、プロジェクトの主要なボトルネックの1つとなっています。
計算機と解析手法の発展により、テキストを計算機が読解する自然言語処理(NLP:Natural Language Processing)技術が利用可能となっています。
しかし、一般的なNLPツールの多くは、計算機処理により多数の文書を高速処理ができますが、その精度や出力形式に問題があります。
たとえば、注目用語に関する情報の要約を抽出することができず、注目用語を含む英文全体を出力するに留まっているため、ユーザーは注目用語の関連情報を瞬時に把握できません。
そこで、WGIでは、遺伝子機能情報を高効率・高精度に収集することを目的とし、WGI独自のAI駆動型テキストマイニング技術(A2K技術)を開発しました。
以下、マニュアルレビューとA2K技術、LA2K技術を比較した表を示します。
この比較結果から、A2K/LA2K解析を活用することでプロジェクトを高度化できることが容易に分かります。
さらに、文献ビッグデータに対するA2K/LA2K解析結果から、目的情報に関する要約と統計解析結果(頻出用語、共起用語など)を迅速・高精度・低コストに取得し、
最新情報の概要把握を高速化できるだけではなく、専門家自身が精読すべき文書(情報源の重要文献など)も容易に把握できます。