CoVGAS -​ コロナウイルスゲノム配列解析 専用ソフト

高速シーケンサデータから

新型コロナウイルス  ゲノム配列決定

CovGAS: Automatic Corona virus Genome Assembly Software (beta version​)

CovGAS・新型コロナウイルス(COVID-19) ゲノム配列解析ソフトウェアはゲノム配列解析に利用する高速シーケンサから出力された "COVID-19"の配列データの解析をGUI上での簡易な操作のみで利用できます。

 

コロナウイルス専用のワークフローによりシーケンサーからのデータを解析し

■ゲノム配列の決定

■参照配列に対するアミノ酸変異の検出を自動的に実施

■GISAID及びNextStrainで定義されたClade (系統群)の決定

までを自動で実施します。

 

*変異検出に使用される参照配列はNC_045512(Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1)を使用。
*ゲノム配列はNCBI Virusに登録されたCOVID19参照配列データベースから最適なウイルス株を参照配列と選択して実行されたマッピング結果をもとに作成。

CovGASではゲノム配列解析の結果として類似株の同定、S型、L型などの型判定、およびclade(系統群)表示を実行しますが、近縁株の情報も同時に表示します。

検体中に存在した新型コロナウイルスが持つゲノム配列と最も相同性が高いNCBI Virus Database登録済みのCOVID-19株に付随する情報、採取地点および採取日時情報を取得して表示します。

検体中の新型コロナウイルスの

変異・近縁株の情報(採取地点・採取日時)などを ​一覧で表示

CoVGAS

無償評価版配布開始
是非ご利用ください。
​皆さんに利用してもらいたい!
​評価版申し込みはこちら​
製品カタログ
只今準備中です
​動作環境

ハードウエア:

​CPU: Core i7以上 (4Core以上)

O  S   : Windows 10 64bit

メモリ:  16G 以上

​HDD: 1T 以上

イルミナ社 MiSeq・オックスフォードナノポア社シーケンサー対応

Windows上ですべての解析可能

​多くの施設で簡便に解析可能へ

ライセンス形態

PC 固定永久ライセンス

CovGASはIllmina MiseqをはじめとするFastq形式で出力されるシーケンスデータとOxford Nanopore社製シーケンサから出力されるFast5形式シーケンスデータの両方に対応しています。


参照配列へのアライメントにおいてはFastq形式で入力されたShort readの場合はBowtie2が、Long readの場合はMinimap2が使用されます。

FastaやFastq形式のLong readも解析に使用することが可能です。

また、CovGASは全てをWindows PC上で操作可能で、各シーケンスデータをそのままドラッグ&ドロップするだけで解析が開始され、自動的に結果が表示されます。

 

コマンド技術や難しい操作は不要です。シーケンサーをご利用の機関であればどこでも解析が可能となります。

 

*Live base-callを実施せず出力したFast5ファイルの場合や、解析時に検体ごとのBarcode分割を行いたい場合はGuppy windows版をご用意いただく必要があります

​機能一覧

  • Fastqファイル(イルミナ社 MiSeq)、またはFast5ファイル(オックスフォードナノポア社DNAシーケンサ)対応

  • 新型コロナウイルスゲノムシーケンスデータ(Fastq/Fast5)をアセンブルしゲノム配列決定、Fasta形式で出力

  • 結果はコンセンサス配列と共にNCBIに登録されている近似株のアノテーションと共に表示

  • 参照配列NC_045512に対するSNP/Deletion/Insertion/アミノ酸置換をVCF形式で出力

  • 解析結果にGISAID clade 条件を満たした場合、clade情報が表示

  • 検体中の新型コロナウイルスに最も近縁のNCBI Virus登録済みCOVID19株付属情報(採取地点・日時・GenBank Accession)を表示

  • 解析結果コンセンサス配列と近似株配列の変異個所をわかり易く表示

  • 最終コンセンサスと類似株のマッピング結果のリファレンスカバー率の表示

  • ​マッピングの平均カバレッジの表示

  • 通常はLinux上のコマンドラインで行ってるマッピングなどのコマンドをWindows上のGUIからコマ ンドを入力することなく自動的に実行

  • バイオインフォマティックスの専門知識なくコロナウイルスのゲノム解析を容易に実現

  • Fastqファイルのドラッグアンドドロップで解析開始。複数検体のバッチ処理に対応

  • データベース更新機能(予定)

  • 決定されたゲノム配列からGISAID(2020.12時点)およびNextclade(2021.1時点)で定義されたClade情報を表示

 

*当ソフトウェアに組み込まれたウイルスゲノム配列解析ワークフローは特許第6624736号に登録された方法を元に作成されています。

解析の流れ

 

シーケンスデータ

Fastq(MiSeq)またはFolder(ナノポアDNAシーケンサー)をドラッグアンドドロップ (複数選択可能)

Fast5 -> Fastq 変換(ナノポアDNAシーケンサーのみ)

QCチェック

Read dataのQuality Control (Phread scoreとRead長に基づくトリミング)の実施

 
マッピング

QCを通過した Fastqファイルを対象にNCBIより取得したリファレンス配列へマッピングを行います。

マッピングは、1stマッピング後コンセンサス配列を作成後、そのコンセンサス配列をもとに2ndマッピングを実施しています。本アルゴリズム詳細はお問い合わせ下さい。

全ゲノム配列決定・類似株判定

​上記マッピング手法で求めた方法で求めたncbiの類似株情報を表示

レポート
  • この例ではNextstrain Clade情報に20I/501Y.V1と表示されており、これは分析したウイルスが英国で発見された感染力の高いコロナウイルス株であることを示しています。

  • Referenceに表示されているMW277478は、分析したコロナウイルスのゲノム配列に最も近縁な、すでに米国NCBIのシーケンスデータベースに登録済みの既知の新型コロナウイルスに関する情報(採取された地域や時期)を表示しています。

  • 画面写真下部にあるReference Lengthの下の欄に表示されているACTTTCG~の文字列がこの時に分析されたアセンブルされたゲノム配列です。

CovGASデータ入力画面

シーケンスデータの入力画面。Illumina/MinIONを選択し、シーケンスデータをドラッグ&ドロップ

 
ダウンロード

お手数ですが下記に必要事項を記入の上お申し込みください。

は必須項目です