薬学および薬学研究ジャーナル オープンアクセス

抽象的な

ハイスループット LC-MS データのためのバイオインフォマティクスと統計的アプローチ

アネタ・サヴィコウスカ

ハイスループット LC-MS データの包括的なデータ分析を紹介します。多因子実験の統計分析と統合の方法を示します。サンプル データ セットは、病原体感染に対する穀物の反応と干ばつストレス下の大麦 (Hordeum vulgare) に関する研究から得たものです。一次代謝物、二次代謝物、およびタンパク質が分析されました。

データの前処理、分析、視覚化は R システムで行われました。統計分析は Genstat パッケージの手順を使用して実行されました。ネットワークによるオミクス データの統合と視覚化の方法が紹介されています。

相関ネットワークと微分相関ネットワークは、さまざまな条件下での代謝物とタンパク質の関係を比較するために構築されました。特性はノードで表され、線 (エッジ) は特性のペア間の相関に対応します。モジュール - 相関性の高い特性を持つクラスターが検出されます。多くの接続 (他の特性との相関) を持つ特性であるハブが示されます。

相関ネットワーク分析は、R の WGCNA パッケージを使用して実行され、ピアソン相関行列は累乗関数を使用して隣接行列に変換されました。モジュールはクラスタリングによって検出されました。差分相関ネットワークは、Bonferroni 補正を使用した Fisher の Z 変換に基づくテストを使用して作成されました。ネットワークの視覚化は Cytoscape で実行されました。

アルゴリズムは、あらゆる高スループット LC-MS データに適応できます。

免責事項: この要約は人工知能ツールを使用して翻訳されており、まだレビューまたは確認されていません