WGIロゴ
Connect with us

ウェルグリーン・アイ株式会社

― WGIのAIテキストマイニング(A2K/LA2K)により、目的情報を迅速・正確にキャッチ ―

◆ 以下の文章中の「Task」のあとのアルファベット(例:Task A)は、問い合わせフォームの「依頼内容」の記号(A~Q)に対応しています。

◆文献調査の超高速化・高精度化・ハイスループット化
― 煩雑な文献調査をAIで実行し、膨大な種類の遺伝子・化合物・生育環境要因が関与する複雑な生命現象の理解を加速 ―
文献調査を高速かつ高精度に実行できれば、調査に費やしていた時間と労力をプロジェクト推進に振り向けることができる
◆生命科学分野のためのWGI独自のハイスループット文献調査サービス(Task B)
― A2K/LA2K技術 ―
本受託サービスにおいて自動収集・解析対象とする情報についての留意事項
◆WGI独自のA2K/LA2K技術による知識情報集約・要約・統計処理サービス

生命科学分野の知見(知識情報)の集約・統計処理を時間・労力・コスト・精度のすべての点で効率化・高精度化

◆A2K技術による生命科学の知見(知識情報)集約・要約・統計処理

WGIでは、目的情報の収集・要約のために、高精度かつ大規模な文献調査を自動実行するAIテキストマイニング技術 (A2K技術:Article to Knowledge technology)を整備し、ビッグデータからの情報収集サービスを提供しています。


生命科学分野の文献調査にA2K技術を適用することのメリット
◆LA2K技術の開発:A2K技術では遺伝子情報を包括的に収集できない

A2K解析において、遺伝子名を注目用語とする場合、遺伝子情報の包括的な集約が困難な場合があります。

この問題解決のため、WGIでは、 論文テキスト中に出現する遺伝子名を自動認識し、そのA2K Descriptionを出力する技術として ライフサイエンスA2K(LA2K)技術を開発しました。
◆LA2K技術:文章内に現れる遺伝子名をAIで自動認識

LA2K技術には、 文章中に出現する遺伝子名を自動認識するAI技術が実装されています。

◆LA2K技術を用いた解析事例

たとえば、4つの注目用語(Breast Cancer、Gene Expression Profiling、Microarray Analysis、Estrogen Receptor alpha)をLA2K技術に適用した場合の結果を示します。

An example of LA2K analysis using terms: Breast Cancer, Gene Expression Profiling, Microarray Analysis, Estrogen Receptor alpha


このように、LA2K技術を活用することで、専門家が論文読解する場合と同様に、計算機が遺伝子名を遺伝子名として認識するため、 研究者も計算機も事前に遺伝子名を知らなくても、遺伝子に関する要約・統計情報を集約できます。

引用元: Yano K, Imai K, Shimizu A, Hanashita T., Nucleic Acids Research. 2006 Mar 14;34(5):1532–9., DOI: 10.1093/nar/gkl058 / PMID: 16537840
本文の一部は、構文解析の事例紹介として再構成されており、 Creative Commons Attribution 4.0 International (CC BY 4.0) ライセンスに基づいて利用しています。
◆LA2Kの優位性と今後の展開
◆遺伝子機能情報の取得:LA2K技術 vs. 従来法

一般的に、遺伝子機能予測ではDNA/アミノ酸配列の類似性解析手法が広く用いられています。 配列類似性の情報は、分子進化や突然変異などの解析には有用ですが、 遺伝子機能推定の主要な根拠とすることは不適当です。 高い信頼性を有する遺伝子機能情報を抽出するには、文献調査が最善のアプローチです。
続きはこちら...

◆A2K/LA2K技術による従来のマニュアルレビューでは達成できない高効率・高精度な情報集積
― 膨大な文献調査時間・労力からの解放 ―

LA2KはAIによる解析技術であり、専門家による文献調査(マニュアルレビュー)と同等の精度を保証するものではありませんが、 以下の優位性から生命科学の推進のための強力なツールとなります。

その上で、LA2K技術を活用するメリット
LA2K技術は多くの研究開発・事業の現場において極めて強力なツールとなります。

◆遺伝子などの目的因子の同定を加速化するA2K/LA2K解析結果とオミックス情報解析結果の統合化

LA2K解析結果を、転写因子・シス因子情報遺伝子発現情報種内・種間ホモログ(遺伝子ファミリー)情報と併用することにより、 様々な生命活動の分子機構を解明するための情報基盤を最大化でき、研究目標達成を加速化できます。

◆A2K/LA2K技術の特性