V našem dalším přehledu se dozvíte všechny potřebné pojmy související s NGS, tedy sekvenací nové generace. Pro lepší orientaci jsme pro vás veskeré termíny, včetně jejich anglických ekvivalentů, uspořádali alfabeticky. Pokud se potřebujete dozvědět více informací o NGS, nahlédněte do tohoto článku nebo nás kontaktujte skrze formulář umístěný pod přehledem.
Využijte rozcestník pro rychlou orientaci v NGS pojmech:
-
A
ADAPTÉR ADAPTER Krátký oligonukleotid připojený k DNA, která bude sekvenována. Adaptér poskytuje vazebné místo pro primery při amplifikaci a sekvenování sousední neznámé nukleové kyseliny. -
Č
ČTENÍ READS Základní jednotka výstupu po sekvenování DNA. Čtení je prezentace fragmentu DNA, který je sekvenován. U CE, v každé kapiláře probíhá jedno čtení za jeden běh. U NGS, každá jamka / polony generuje jedno čtení. -
D
DE NOVO SEKVENOVÁNÍ DE NOVO SEQUENCING Sekvenování genomu nového, dříve nesekvenovaného, organismu nebo DNA segmentu. Tento termín se také používá, když je genom (nebo soubor sekvenčních dat) sestaven ze subsekvencí pomocí překrývajících se sekvenčních přesahů bez použití známé referenční sekvence. DÉLKA ČTENÍ READ LENGTH Počet bazí v daném čtení. Typicky je udávána jako průměrná délka všech čtení v běhu. Mode (nejběžnější) RL může být více užitečný metricky, zvláště když se provádí zkracování čtení v důsledku variability v délce čtení. DLOUHÁ ČTENÍ LONG READS Sekvenační čtení, která jsou obecně dlouhá nejméně 400bp v jednom směru. Dlouhá čtení jsou vhodná pro skládání sekvence ze subsekvencí. -
E
EMULZNÍ PCR EMULSION PCR Způsob amplifikace knihovny založený na použití kuliček. Jednovláknový fragment s navázaným adaptérem je připojen k povrchu kuličky, okolo které se nachází olejová emulze obsahující potřebné reagencie pro amplifikaci. Při této metodě dochází k paralelní amplifikaci milionů jednotlivých fragmentů na kuličkách a výsledkem je knihovna připravená přímo pro sekvenování. -
H
HLOUBKA POKRYTÍ COVERAGE DEPTH Počet nukleotidů ze čtení, které jsou mapovány do dané pozice. Jedná se o průměrný počet případů, kdy je konkrétní báze sekvenována nezávislými čtení (např. 10X, 20X, 30X). -
K
KLASTR CLUSTER Mnoho kopií templátové DNA připojených blízko sebe na povrchu průtokové komory. KNIHOVNA LIBRARY Soubor DNA molekul, které mají být sekvenovány. Knihovny jsou často vytvořené fragmentací DNA a připojením známé sekvence (specifické pro platformu) ke koncům fragmentů, což umožňuje přípravu templátu a sekvenování. Metody pro přípravu knihoven se liší v závislosti na aplikaci. KONTIG CONTIG Řetězec po sobě jdoucích fragmentů DNA vytvářejících spojitou sekvenci. KRÁTKÁ ČTENÍ SHORT READS Sekvenační čtení, která jsou obecně dlouhá 150bp nebo kratší v jednom směru. Obvykle mají vyšší přesnost než dlouhá čtení. -
M
MASIVNÍ PARALELNÍ SEKVENOVÁNÍ MASSIVE PARALLEL SEQUENCING Technika, při které probíhá mnoho sekvenačních reakcí současně. MNOHONÁSOBNÁ ANALÝZA MULTIPLEXING Sloučení několika knihoven (s adaptéry a čárovými kódy) do jednoho sekvenačního běhu. Ideální pro využití kapacity NGS při použití více vzorků s krátkou sekvencí. MŮSTKOVÁ AMPLIFIKACE BRIDGE AMPLIFICATION Pre-sekvenační amplifikace fragmentů, která se používá výhradně u Illumina platforem. Povrch průtokové komory je pokryt oligonukleotidy komplementárními k oběma typům adaptérů, které byly připojeny ke koncům fragmentů v průběhu přípravy knihovny. Jednovláknové fragmenty jsou hybridizovány každým koncem k jednomu z adaptéru tak, že vytvoří „můstek“. K fragmentu je dosyntetizováno druhé vlákno a poté jsou obě vzniklá vlákna oddělena denaturací. Tento proces je opakován a výsledkem je mnoho kopií původního fragmentu, které jsou umístěných v těsných shlucích (klastrech). -
P
PÁROVÉ - KONCOVÉ SEKVENOVÁNÍ PAIRED - END SEQUENCING Sekvenování obou konců stejného fragmentu a sledování párových dat. POKRYTÍ VOVERAGE Kolikrát byl genom osekvenován danou metodou. Chcete-li vypočítat pokrytí, celková sekvenační výstupní data (v bazích) vydělte velikostí genomu, který je sekvenován. Například, lidský genom má asi 3 000 000 000 bází. Sekvenační přístroj Illumina umí vygenerovat sekvenační data o objemu 18 000 000 000 bazí v jednom běhu. Takže jeden Illumina sekvenační běh má 6-násobné pokrytí lidského genomu. PŘIŘAZENÍ ALIGNMENT Počítačový přístup pro porovnání výstupního čtení (sekvence) s referenční sekvencí a to přes vyhledávání podobné/ identické referenční sekvence. -
R
REFERENČNÍ SEKVENCE/ GENOM REFERENCE SEQUENCE/ GENOME Kompletní sekvence genomu, která může být použita pro mapování krátkých DNA sekvencí při porovnání genomů z různých jedinců. -
S
SEKVENAČNÍ BĚH SEQUENCING RUN Operační jednotka DNA sekvenátoru; typicky popisuje analýzu, která začíná aplikací reagencií a vzorků a končí výstupním čtením. SEKVENAČNÍ ČTENÍ SEQUENCE READ Sekvenační data získaná z jednotlivých molekul templátu jako je řetězec nukleotidových bází. Délka sekvenačního čtení je dána použitou technologií. Sanger čtení jsou typicky dlouhá 500 - 800 bází, Illumina čtení jsou dlouhá 25 - 300 bází. SEKVENAČNÍ METODA - VÝSTŘEL Z BROKOVNICE SHOTGUN SEQUENCING Metoda používaná pro sekvenování dlouhých řetězců DNA. Při tomto typu sekvenování je DNA náhodně rozštěpena na malé fragmenty, které jsou osekvenovány a následně jsou seřazeny do kontinuální sekvence pomocí počítačového programu. Aby bylo možné sestavení kontinuální sekvence, musí se provést fragmentace a sekvenování cílové DNA několikrát. Počítačový program pak sestavuje kompletní sekvenci na základě překrývajících se konců osekvenovaných fragmentů. SEKVENOVÁNÍ NOVÉ GENERACE NEXT GENERATION SEQUENCING (NGS) Vysokokapacitní metoda pro sekvenování, při které probíhá paralelně a mnohonásobně sekvenační proces a produkuje tisíce až miliony sekvencí najednou. SEKVENOVÁNÍ SYNTÉZOU SEQUENCING BY SYNTHESIS (SBS) Způsob sekvenování DNA, který je založen na inkorporaci nukleotidů pomocí DNA polymerázy. Zdrojem detekovaného signálu může být fluorescenčně značený nukleotid, světelná reakce řízená fosfátem nebo snímání vodíkových iontů. SKÓRE KVALITY Q SCORE Skóre jsou závislá na platformě a předpovídají skóre kvality pro každou bázi ve čtení. Podobají se Sanger "Phred scores". Při analýze může software zkrátit / "upravit" čtení na základě minimální hranice kvality skóre. SLOŽENÍ / SESTAVENÍ ASSEMBLY Přiřazení a sloučení čtení (do kontigů), aby bylo možné provést rekonstrukci původní sekvence. Složení původní sekvence může být provedeno prostřednictvím referenční sekvence nebo de novo. -
Š
ŠUM / ZKRESLENÍ BIAS Zkreslení/ nepřesnost výsledků v genomických datech v důsledku vlastních problémů samotné sekvenační technologie. Například, 454 technologie obtížně sekvenuje mononukleotidové řetězce. -
U
UNIFORMITA UNIFORMITY Variabilita v sekvenačním pokrytí mezi cílovými oblastmi. -
V
VÝTĚŽEK SEKVENAČNÍHO BĚHU RUN YIELD Celkový počet (v řádech milionů, miliard, atd.) výstupních bazí v jednom sekvenačním běhu. Určeno sečtením všech bazí ze všech čtení. Lze odhadnout pomocí # čtení * průměrná délka čtení.