CINXE.COM
WGS
<!DOCTYPE html> <html lang="ja"> <head> <meta charset="UTF-8" /> <meta property="og:title" content="WGS" /> <meta property="og:url" content="https://www.ddbj.nig.ac.jp/ddbj/wgs.html" /> <meta property="og:description" content="様々な生物においてホールゲノムショットガン配列決定法(whole genome shotgun:ゲノム全体を物理的に断片化し、シークエンサで各断片の塩基配列を決..." /> <meta property6="og:image" content="/images/thumbnail/logo_ddbj_fb.png" /> <meta name="viewport" content="width=device-width, initial-scale=1.0" /> <title>WGS</title> <script async src="https://www.google-analytics.com/analytics.js"></script> <script src="https://code.jquery.com/jquery-3.5.0.js" integrity="sha256-r/AaFHrszJtwpe+tHyNi/XCfMxYpbsRg2Uqn0x3s2zc=" crossorigin="anonymous"></script> <script src="https://cdnjs.cloudflare.com/ajax/libs/jquery.hoverintent/1.10.1/jquery.hoverIntent.min.js" integrity="sha512-gx3WTM6qxahpOC/hBNUvkdZARQ2ObXSp/m+jmsEN8ZNJPymj8/Jamf8+/3kJQY1RZA2DR+KQfT+b3JEB0r9YRg==" crossorigin="anonymous"></script> <script src="https://cdnjs.cloudflare.com/ajax/libs/spin.js/4.1.0/spin.min.js" integrity="sha512-CbohqWjAgarTqRHcX1MbwkF2pujwbsCee1PABpnBWC+VqSldvlNEEI5+4OSsR/HbFQOFFpwY2YvZZNjBMxNnXg==" crossorigin="anonymous"></script> <script type="text/javascript" src="https://cdnjs.cloudflare.com/ajax/libs/jquery.colorbox/1.6.4/jquery.colorbox-min.js"></script> <script type="text/javascript" src="https://cdnjs.cloudflare.com/ajax/libs/jquery-deparam/0.5.3/jquery-deparam.min.js"></script> <script type="text/javascript" src="https://www.ddbj.nig.ac.jp/assets/js/jquery.trace.js"></script> <script type="text/javascript" src="https://www.ddbj.nig.ac.jp/assets/js/jquery.json_search.js"></script> <link rel="icon" href="https://www.ddbj.nig.ac.jp/assets/images/favicon_ddbj.ico"> <link rel="stylesheet" href="https://www.ddbj.nig.ac.jp/assets/css/colorbox.css" /> <link rel="stylesheet" href="https://www.ddbj.nig.ac.jp/assets/css/main.css" /> <link rel="alternate" type="application/rss+xml" title="My Site RSS" href="/feed.xml" /> <script src="https://www.ddbj.nig.ac.jp/assets/js/main.js"></script> </head> <body data-category="ddbj"> <script src="https://www.ddbj.nig.ac.jp/assets/js/ddbj_common_framework.js" id="DDBJ_common_framework" style="display: block; height: 40px;" data-bottom-menu="true" data-ddbj-home-page="true" data-search="true" ></script> <section class="top-news-view"> <div class="inner"> <ul> <li class="item"> <a href="https://www.ddbj.nig.ac.jp/news/ja/2024-10-22">国際塩基配列データベース「DDBJ」に対するサイバー脅迫に関するご報告</a> </li> <li class="item"> <a href="https://www.ddbj.nig.ac.jp/news/ja/2024-11-25">(12/12 8:00-12/20 12:00) DDBJ センターの登録、検索・解析サービス停止のお知らせ</a> </li> </ul> </div> </section> <div id="primary"> <header id="PageHeader"> <div class="inner"> <div class="page-title"> <p class="title -normal">DDBJ Annotated/Assembled Sequences</p> </div> <nav class="tab-menu-view"> <ul class="tabmenucontainer"> <li class=""> <a href="/ddbj/index.html">Home</a> </li> <li class=" -haschild"> <a href="/ddbj/submission.html">Submission</a> <ul> <li> <a href="/ddbj/submission.html">塩基配列の登録</a> </li> <li> <a href="/ddbj/web-submission.html">Web 版塩基配列登録システム</a> </li> <li> <a href="/ddbj/mss.html">Mass Submission System</a> </li> <li> <a href="/ddbj/update.html">登録データの修正・更新</a> </li> </ul> </li> <li class=" -haschild"> <a href="http://ddbj.nig.ac.jp/arsa/?lang=ja">Search</a> <ul> <li> <a href="http://getentry.ddbj.nig.ac.jp/top-j.html">getentry</a> </li> <li> <a href="http://ddbj.nig.ac.jp/arsa/?lang=ja">ARSA</a> </li> </ul> </li> <li class=" -haschild"> <a href="/ddbj/flat-file.html">Flat file</a> <ul> <li> <a href="/ddbj/feature-table.html">Feature Table</a> </li> <li> <a href="/ddbj/features.html">Feature key の定義</a> </li> <li> <a href="/ddbj/qualifiers.html">Qualifier key の定義</a> </li> <li> <a href="/ddbj/sequence.html">塩基配列について</a> </li> <li> <a href="/ddbj/organism.html">Organism qualifier に記載する生物名</a> </li> <li> <a href="/ddbj/identifiers.html">識別子について</a> </li> <li> <a href="/ddbj/location.html">Location の記述法</a> </li> <li> <a href="/ddbj/cds.html">タンパク質コード配列</a> </li> <li> <a href="/ddbj/geneticcode.html">The Genetic Codes</a> </li> <li> <a href="/ddbj/code.html">配列の記載に用いる略号</a> </li> <li> <a href="/ddbj/example.html">配列データ記載例</a> </li> </ul> </li> <li class=" -haschild -current"> <a href="/ddbj/data-categories.html">Data categories</a> <ul> <li> <a href="/ddbj/genome.html">Genome project のデータ登録</a> </li> <li> <a href="/ddbj/pseudohaplotype.html">Pseudohaplotype</a> </li> <li> <a href="/ddbj/wgs.html">WGS</a> </li> <li> <a href="/ddbj/finished_level_genome.html">Finished level genomic sequences</a> </li> <li> <a href="/ddbj/metagenome-assembly.html">メタゲノムアセンブリ</a> </li> <li> <a href="/ddbj/single-amplified-genome.html">Single amplified genome</a> </li> <li> <a href="/ddbj/htg.html">HTG</a> </li> <li> <a href="/ddbj/environmental.html">Environmental sample</a> </li> <li> <a href="/ddbj/env.html">ENV</a> </li> <li> <a href="/ddbj/tls.html">TLS</a> </li> <li> <a href="/ddbj/transcriptome.html">Transcriptome Project のデータ登録</a> </li> <li> <a href="/ddbj/tsa.html">TSA</a> </li> <li> <a href="/ddbj/est.html">EST</a> </li> <li> <a href="/ddbj/htc.html">HTC</a> </li> <li> <a href="/ddbj/tpa.html">Third Party Data (TPA)</a> </li> </ul> </li> <li class=""> <a href="/faq/ja/index.html?tag=ddbj">FAQ</a> </li> <li class=" -haschild"> <a href="/ddbj/index.html">Other</a> <ul> <li> <a href="/ddbj/patent-data.html">Patent</a> </li> <li> <a href="/ddbj/mga.html">MGA</a> </li> </ul> </li> </ul> </nav> </div> </header> <section id="NavigationAndMainView"> <div class="inner"> <div class="subview"> <nav id="TableOfContents" class="internal-link"> </nav> </div> <section id="MainContentView" class="mainview"> <header class="header"> <nav class="breadcrumb-view"> <ul> <li> <a href="https://www.ddbj.nig.ac.jp/index.html">ホーム</a> </li> <li> <a href="https://www.ddbj.nig.ac.jp/ddbj/index.html">ddbj</a> </li> <li><a>WGS</a></li> </ul> </nav> <h1 class="title">WGS</h1> </header> <main class="md-content"> <p>様々な生物においてホールゲノムショットガン配列決定法(whole genome shotgun: ゲノム全体を物理的に断片化し、シークエンサで各断片の塩基配列を決定した後、コンピューター・プログラムを用いて整理、アセンブルして完成させる手法)を用いて全ゲノム配列を決定するゲノムプロジェクトが進められています。</p> <p>DDBJ/ENA/GenBank では、そのようなゲノムプロジェクトに由来する、整理が不十分な段階の大量の DNA 断片の配列を、WGS データとして受け付けています。<br /> <a href="/ddbj/assembly.html">INSDC standards for genome assembly submission</a>もご参照ください。</p> <p><a href="https://ddbj.nig.ac.jp/public/ddbj_database/wgs/WGS_ORGANISM_LIST.html">公開されているWGSデータ</a></p> <p>WGSデータの登録は <a href="/ddbj/mss.html">Mass Submission System (MSS)</a> で受け付けております。</p> <h2 id="wgs-として登録可能なデータ">WGS として登録可能なデータ</h2> <dl> <dd>原則、冗長な raw read sequences ではなく、ある程度 計算機処理を経た contigs (overlapping reads) の配列を受付けます。 冗長な raw read sequences を公表することが必要な場合は、<a href="/dra/index.html">DDBJ Sequence Read Archive (DRA)</a> を御利用下さい。</dd> <dd> <ul> <li>contig (overlapping reads)、及び scaffold (assembled contigs separated by gaps) の配列を WGS entry として登録します。</li> <li>sequencing gap を連続した”n”として WGS 配列に含めて記載します。</li> </ul> </dd> </dl> <h2 id="wgs-として登録できないデータ">WGS として登録できないデータ</h2> <ul> <li>メタゲノムではない複数種の生物由来のアセンブルゲノム配列</li> <li>chromosome assembly(contigs または scaffolds)を含まない以下のケース <ul> <li>オルガネラゲノム単独の登録。</li> <li>プラスミド単独の登録。</li> </ul> </li> </ul> <h2 id="wgs-entry-の登録">WGS entry の登録</h2> <dl> <dd><a href="https://mss.ddbj.nig.ac.jp">MSS form </a>から申し込みを行います。</dd> <dd> <ul> <li>登録に先立ち、<a href="/bioproject/index.html">BioProject Database</a> と <a href="/biosample/index.html">BioSample Database</a>の登録が必要です。</li> <li>全てのタンパク質コード遺伝子とタンパク質をコードしない RNA 遺伝子の記載を希望する場合には、BioSampleの登録時に <a href="/ddbj/locus_tag.html">locus_tag prefix</a> を申請して下さい。</li> <li>サンプルアノテーション: (<a href="https://docs.google.com/spreadsheets/d/15gLGL5FMV8gRt46ezc2Gmb-R1NbYsIGMssB0MyHkcwE/edit?pli=1&gid=1134992157#gid=1134992157">WGS sample annotation)</a></li> </ul> </dd> </dl> <h2 id="flat-file">DDBJ フォーマットの例</h2> <p>WGS エントリの特徴</p> <ul> <li><a href="#AccessionA">アクセッション番号</a> は アルファベット 6 文字と数字 9 桁 (2024年1月から) 又はアルファベット 4 文字と数字 8 桁を基本とします。</li> <li><a href="#KeywordsA">KEYWORDS</a> 行には “WGS” とゲノムとしての完成度を示す規定値 (STANDARD_DRAFT, HIGH_QUALITY_DRAFT, IMPROVED_HIGH_QUALITY_DRAFT, ANNOTATION_GRADE, NON_CONTIGUOUS_FINISHED) が表示されます。各KEYWORDの定義は <a href="https://www.insdc.org/submitting-standards/methodological-keywords/">INSDC agreed methodological keywords </a>を参照。</li> <li><a href="#CommentA">COMMENT</a> にアセンブルの要約が表示されます。</li> </ul> <table> <tr> <td> タグ名 </td> <td>値(内容) </td> </tr> <tr> <td>Assembly Method </td> <td>アセンブルに使用したアルゴリズムの名称とバージョン </td> </tr> <tr> <td>Assembly Name </td> <td>生物名を含まないゲノムアセンブリの名称・バージョン。真核生物ゲノムの場合は必須 </td> </tr> <tr> <td>Genome Coverage </td> <td>ゲノム配列決定の深度、被覆度。ゲノム全体推定塩基の被覆率として算出 </td> </tr> <tr> <td>Sequencing Technology </td> <td>配列解析に使用された sequencing platform 名 </td> </tr> </table> <p><br /> <!-- end list --></p> <pre><code><a id="LocusA" href="/ddbj/flat-file#LocusB">LOCUS</a> <a id="LocusNameA" href="/ddbj/flat-file#LocusNameB">ZZZZZZ010000001</a> <a id="SequenceLengthA" href="/ddbj/flat-file#SequenceLengthB">123456 bp</a> <a id="MoleculeTypeA" href="/ddbj/flat-file#MoleculeTypeB">DNA</a> <a id="MoleculeFormA" href="/ddbj/flat-file#MoleculeFormB">linear</a> <a id="DivisionA" href="/ddbj/flat-file#DivisionB">ROD</a> <a id="ModificationDateA" href="/ddbj/flat-file#ModificationDateB">07-AUG-2024</a> <a id="DefinitionA" href="/ddbj/flat-file#DefinitionB">DEFINITION</a> Mus musculus C57BL6 DNA, EN0001. <a id="AccessionA" href="/ddbj/flat-file#AccessionB">ACCESSION</a> ZZZZZZ010000001 ZZZZZZ010000000 <a id="VersionA" href="/ddbj/flat-file#VersionB">VERSION</a> ZZZZZZ010000001.1 <a id="DblinkA" href="/ddbj/flat-file#DblinkB">DBLINK</a> BioProject:PRJDB99999 Sequence Read Archive:DRR999998, DRR999999 BioSample:SAMD99999999 <a id="KeywordsA" href="/ddbj/flat-file#KeywordsB">KEYWORDS</a> WGS; STANDARD_DRAFT. <a id="SourceA" href="/ddbj/flat-file#SourceB">SOURCE</a> Mus musculus <a id="OrganismA" href="/ddbj/flat-file#OrganismB">ORGANISM</a> Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Glires; Rodentia; Myomorpha; Muroidea; Muridae;Murinae; Mus; Mus. <a id="Reference1A" href="/ddbj/flat-file#Reference1B">REFERENCE 1</a> (bases 1 to 123456) <a id="AuthorsA" href="/ddbj/flat-file#AuthorsB">AUTHORS</a> Mishima,H. and Shizuoka,T. <a id="TitleA" href="/ddbj/flat-file#TitleB">TITLE</a> Direct Submission <a id="JournalA" href="/ddbj/flat-file#JournalB">JOURNAL</a> Submitted (01-MAY-2024) to the DDBJ/EMBL/GenBank databases. Contact:Hanako Mishima National Institute of Genetics, DNA Data Bank of Japan; Yata 1111, Mishima, Shizuoka 411-8540, Japan <a id="Reference2A" href="/ddbj/flat-file#Reference2B">REFERENCE 2</a> AUTHORS Mishima,H., Shizuoka,T. and Fuji,I. TITLE Mouse whole genome shotgun sequence JOURNAL Unpublished (2024) <a id="CommentA" href="/ddbj/flat-file#CommentB">COMMENT</a> Whole genome shotgun sequencing project. ##Genome-Assembly-Data-START## Assembly Method :: HGAP v. 1.0; Celera Assembler v. 7.0; Quiver v. 1.4.0; Sequencher v. 5.1 Assembly Name :: MusC56 v1 Genome Coverage :: 238x Sequencing Technology :: PacBio RS, Illumina GAIIx ##Genome-Assembly-Data-END## <a id="FeaturesA" href="/ddbj/flat-file#FeaturesB">FEATURES</a> Location/Qualifiers <a id="FeaturesSourceA" href="/ddbj/flat-file#FeaturesSourceB">source</a> <a href="/ddbj/location.html">1..123456</a> /<a href="/ddbj/qualifiers.html#mol_type">collection_date</a>="missing: lab stock" /<a href="/ddbj/qualifiers.html#db_xref">db_xref</a>="taxon:10090" /<a href="/ddbj/qualifiers.html#geo_loc_name">geo_loc_name</a>="Japan" /<a href="/ddbj/qualifiers.html#mol_type">mol_type</a>="genomic DNA" /<a href="/ddbj/qualifiers.html#organism">organism</a>="Mus musculus" /<a href="/ddbj/qualifiers.html#strain">strain</a>="C57BL6" /<a href="/ddbj/qualifiers.html#submitter_seqid">submitter_seqid</a>="EN0001" <a id="FeaturesCDSA" href="/ddbj/flat-file#FeaturesCDSB">CDS</a> <a href="/ddbj/location.html">complement(join(147..1241,1364..1816))</a> /<a href="/ddbj/qualifiers.html#codn_start">codon_start</a>=1 /<a href="/ddbj/qualifiers.html#locus_tag">locus_tag</a>="DDBJGEN_0001G0001" /<a href="/ddbj/qualifiers.html#product">product</a>="hypothetical protein" /<a href="/ddbj/qualifiers.html#protein_id">protein_id</a>="xxxxxxxxxx.1" /<a href="/ddbj/qualifiers.html#transl_table">transl_table</a>=1 /<a href="/ddbj/qualifiers.html#translation">translation</a>="MTEHIFEKISLNLSNIINKCVYKQTTLNDAQNE IKETMNVIINQYNHYITKDVMDEILILTSKLLYSQNIESLIIYLNKL (snipped) GFFRMYQIWNVS" <a id="Featuresassembly_gapA" href="/ddbj/flat-file#Featuresassembly_gapB">assembly_gap</a> <a href="/ddbj/location.html">2982..3269</a> /<a href="/ddbj/qualifiers.html#estimated_length">estimated_length</a>=288 /<a href="/ddbj/qualifiers.html#gap_type">gap_type</a>="within scaffold" /<a href="/ddbj/qualifiers.html#linkage_evidence">linkage_evidence</a>="paired_ends" <a id="FeaturestRNA" href="/ddbj/flat-file#FeaturestRNAB">tRNA</a> <a href="/ddbj/location.html">3569..3643</a> /<a href="/ddbj/qualifiers.html#locus_tag">locus_tag</a>="DDBJGEN_t0001G0001" /<a href="/ddbj/qualifiers.html#product">product</a>="tRNA-Ser" -- The rest is snipped -- <a id="EndA" href="/ddbj/flat-file#EndB">//</a></code></pre> </main> <aside class="related-pages"> <h2 class="caption">Related pages</h2> <div class="navigation"> <nav> <ul> <li> <a href="/ddbj/genome.html">Data Submission from Genome Project</a> </li> <li> <a href="/ddbj/con.html">CON</a> </li> <li> <a href="/ddbj/gss.html">GSS</a> </li> <li> <a href="/ddbj/htg.html">HTG</a> </li> <li> <a href="/ddbj/environmental.html">Submission of environmental sequences</a> </li> <li> <a href="/ddbj/env.html">ENV</a> </li> <li> <a href="/ddbj/tls.html">TLS</a> </li> <li> <a href="/ddbj/transcriptome.html">Data Submission from Transcriptome Project</a> </li> <li> <a href="/ddbj/tsa.html">TSA</a> </li> <li> <a href="/ddbj/est-a.html">EST</a> </li> <li> <a href="/ddbj/htc.html">HTC</a> </li> <li> <a href="/ddbj/tpa.html">Third Party Data (TPA)</a> </li> </ul> </nav> </div> </aside> </section> </div> </section> </div> <footer></footer> <div id="back-top"></div> </body> </html>