候補遺伝子(DEG)群から形質関連遺伝子群を同定するために、遺伝子の生物学的機能情報が広く活用されています。
しかし、候補遺伝子の機能を推定する従来法には、以下の問題があります。
結果として、多くの場合、推定された遺伝子機能情報の品質・信頼性が低く、RNA-seq実験から得た多数の候補遺伝子からウェット検証実験を実施すべき遺伝子の決定が困難となっています。
候補遺伝子(DEG)群のグローバルな機能を推定するために、機能アノテーションに対するエンリッチメント解析が広く用いられています。
エンリッチメント解析では、候補遺伝子群ともう1つの遺伝子群(バックグラウンド)を用い、2群の機能アノテーションの度数分布を統計的に比較します。
ここで、エンリッチメント解析では、機能アノテーションの推定法と統計解析手法の両面に問題があります。
エンリッチメント解析では、候補遺伝子(DEG)群と比較対象(基準)とする遺伝子群(バックグラウンド)を用い、2群の機能アノテーションの度数分布を比較します。
ここで、このバックグラウンドの定義と利用に問題があります。
従来のエンリッチメント解析で用いるバックグラウンドは問題が指摘されている一方で未解決となっています。
WGIでは、RNA-seqデータ解析において、従来法の問題を回避し、形質関連遺伝子を高精度・迅速に同定するために、WGIが独自に開発・整備した最先端解析基盤と高品質ビッグデータを活用しています。