トップQs
タイムライン
チャット
視点

Galaxy (計算生物学)

ウィキペディアから

Galaxy (計算生物学)
Remove ads

Galaxy [2]は、プログラミング (コンピュータ)システムアドミニストレータ分野が未経験の研究者を対象とした、計算生物学の理解に役立つデジタルアーカイブプラットフォームである。[3][4]当初はゲノミクス研究のために開発されたが、現在は主にバイオインフォマティクスワークフロー管理システムとして使用されている。[5]

概要 最新版, リポジトリ ...
Remove ads

機能

科学的なワークフローシステムであり、レシピのように多段階計算解析を構築するため、通常操作するデータ、実行する手順、グラフィカルユーザーインターフェイス[6]などを表示する。

生物学データのためのデータ統合プラットフォームであり、UCSC Genome Browser、BioMart、InterMineなどのオンラインリソースから直接、利用コンピュータからのデータアップロードをURLでサポートしている。幅広く使用されているさまざまな生物学的データフォーマットとそのフォーマット間の変換に対応し、多くのテキスト操作ユーティリティにWebインターフェイスを提供しており、研究者はプログラミングを行うことなく独自の再フォーマットや操作を行える。多くの生物学的ファイルフォーマットは、ゲノム間隔データ(参照フレーム、例えば染色体またはコンティグ名、開始や停止位置)を含み、これらのデータを統合できる。

生物学的データ分析、特にゲノミクス用途で開発され、利用可能なツールセットは長年にわたって大幅に拡張された。生命科学分野での遺伝子発現配列アセンブリングプロテオーム解析トランスクリプトームや他の分野でも活用されている。 プラットフォーム自体は理論上あらゆる科学分野に適用することができ、実際に、画像解析[7]、計算化学[8]、薬物設計[9]、宇宙論、気候モデリング、社会科学[10]、言語学のためのサーバが存在する。

Remove ads

目標

アクセシビリティ

複雑なワークフロー構築を単純なユーザーインターフェイス[6]で実現している。これにより、典型的な解析を比較的簡単に作成できるが、ループ構造などの複雑なワークフローの作成は難しい。(ループをサポートするデータ駆動ワークフローシステムの例については、Apache Tavernaを参照。[11]

再現性

科学的結果が公表されるとき、出版物は他の人が実験を繰り返して同じ結果を得るのに十分な情報を含むべきであり、実験分野から計算過程分野にまで拡大するための多くの努力がなされてきたが、当初の期待より困難であることが判明した。[12]

Galaxyでは、計算分析であらゆる段階についての十分な情報を取得することで再現性をサポートしているため、分析を正確に繰り返せる。その為には、すべての初期条件、過程、および最終データセットのほか、提供されるパラメータ、および分析の各段階の順序の追跡が求められる。

透明性

研究者がGalaxy Objectsのいずれかを公開したり、特定の個人と共有することで、科学研究の透明性をサポートしている。 共有内容は詳細に調査し、自由に再実行し、仮説検証のためにコピーして修正できる。

Remove ads

実装

Pythonで実装されたオープンソースソフトウェアであり、ペンシルバニア州立大学ジョンズ・ホプキンズ大学オレゴン健康科学大学、Galaxy開発チーム[13]によって開発された。[14]

拡張性があり、新しいコマンドラインツールをGalaxy ToolShed内で統合して共有できる。[15]

拡張例としては、質量分析法ベースのプロテオミクスのためのデータ解析プラットフォームとしてカスタマイズされた、 University of Minnesota Supercomputing Instituteの Galaxy-Pがある。[16]

コミュニティ

オープンソースプロジェクトであり、コミュニティには利用者、開発者、ツール開発者が含まれる。メーリングリスト、[17]コミュニティハブ、[18]年次会議がある。[19]

脚注

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads