Hodně velká revoluce: 1 gram DNA pojme 215 petabajtů dat. Američané staví pevný disk, který nahradí celá datacentra
Tým z University of Missouri publikoval vědecký důkaz, že data uložená v DNA lze přepsat, a číst elektrickým proudem přes nanopór.
Obsah článku
Představte si gram bílého prášku, který v sobě nese 215 000 terabajtů informací. Tolik dat by zaplnilo téměř šest tisíc nejkapacitnějších pevných disků, jaké dnes Seagate dodává do serveroven po celém světě. Číslo 215 petabajtů na gram DNA není nové, poprvé ho spočítali vědci z Kolumbijské univerzity v roce 2017 v rámci projektu DNA Fountain. Co je nové, a co posunulo debatu o kus dál, přišlo letos z Missouri. Tamní tým vedený Li-Čchünem „Andrewem“ Gu neřeší, kolik dat se do DNA vejde. Řeší něco, co obor dosud neuměl: jak ta data smazat a zapsat znovu.
DNA jako CD-R: problém, který trval dekádu
Dosavadní pokusy s ukládáním dat do DNA fungovaly v podstatě jako vypalování CD. Informace se zakódovaly do pořadí nukleotidů, syntetizovaly se příslušné řetězce a hotovo. Jednou zapsáno, navždy zamčeno. Pro archivaci to dává smysl, jenže pro cokoliv, co připomíná běžný disk, je to slepá ulička. Nikdo nechce úložiště, na které se nedá přepsat ani jediný soubor.
Microsoft Research spolu s University of Washington ukázal v roce 2019 první plně automatizovaný zápis a čtení krátkého slova „hello“ v DNA. Letos v červenci pak Microsoft v časopise Nature Communications předvedl náhodný přístup a sémantické vyhledávání v knihovně 1,6 milionu DNA vláken. Ale ani jeden z těchto milníků neřešil přepisovatelnost. Data šla zapsat, přečíst a vyhledat, ale ne změnit.
Co Missouri skutečně předvedlo
Vědecký článek týmu vyšel 5. září 2025 v recenzovaném časopise PNAS Nexus. Univerzitní popularizační zpráva pak následovala 1. března 2026. Mezi těmito dvěma daty leží podstata: jde o proof of concept, nikoli o hotový produkt.
Princip funguje takto. Na univerzální šablonu DNA jsou připravena místa, kam se napojují krátká vlákna, takzvané staples. Každá svorka kóduje buď jedničku, nebo nulu. Když chcete bit přepsat, přidáte novou svorku s „toehold“ koncem, který vytlačí tu původní mechanismem zvaným TMSD (toehold-mediated strand displacement). Bit se změní, aniž byste museli syntetizovat celou novou sekvenci.
Čtení probíhá přes nanopór. DNA prochází miniaturním otvorem, kontrolní sekvence při průchodu mění blokaci elektrického proudu a software tyto proudové stavy převádí zpět na bity. V laboratoři tým demonstroval krátké 3bitové a 8bitové paměti a čtení na delším templátu o 7 219 nukleotidech.
Háček? Rychlost čtení dosahuje přibližně 10 bitů za sekundu. Pro srovnání: běžný podnikový pevný disk Seagate Exos X20 přenáší kolem 285 megabajtů za sekundu, high-end SSD od Solidigmu pracuje v pásmu několika gigabajtů za sekundu. Rozdíl činí řádově miliardy. A s každým dalším přepisovacím cyklem rostou nároky na délku meziúsekových oblastí, což snižuje efektivní hustotu.
Cena, která zatím nedává smysl
Ekonomika DNA úložišť zůstává brutální. Wyss Institute na Harvardu uvádí současnou cenu chemické syntézy DNA kolem 3 500 dolarů (zhruba 82 000 korun) za jediný megabajt informací. Už při projektu DNA Fountain v roce 2017 stála syntéza dvou megabajtů dat asi 7 000 dolarů a čtení dalších 2 000 dolarů. Enzymatická syntéza, kterou Wyss propaguje jako cestu k dramatickému zlevnění, je zatím ve fázi výzkumu.
Pro kontext: za 82 000 korun dnes koupíte několik desítek terabajtů na běžných discích. Aby ukládání dat do DNA dávalo komerční smysl, musela by cena klesnout o mnoho řádů. Žádný veřejný harmonogram, kdy se to stane, neexistuje.
Co to znamená pro česká datacentra
V Česku se právě staví nové datové kapacity. CRA zahájila v září 2025 stavbu Prague Gateway DC na Zbraslavi, datacentra s příkonem 26 megawattů, více než 2 500 racky a ambicí obsloužit i AI zátěže včetně potenciálních vazeb na projekt AI Gigafactory. CzechInvest propaguje Česko jako lokalitu pro velké digitální infrastruktury. Poptávka míří na výpočetní výkon, nízké latence a vysokopříkonové chlazení, tedy na přesný opak toho, co úložiště DNA nabízí.
Pokud se missourský směr jednou prosadí, nepůjde o konec datacenter. Půjde o novou archivní vrstvu:
- Hot storage (SSD, NVMe): aktivní data, milisekundový přístup – zůstane beze změny.
- Teplé úložiště (HDD, páska): méně častý přístup – zůstane v dohledné době dominantní.
- Cold archive (potenciálně DNA): data, která se čtou jednou za roky, ale musí přežít dekády – tady má hustota DNA a energetická úspornost smysl.
Pro provozovatele datacenter v Česku i jinde je to téma na technologický radar, ne na příští investiční plán.
Pět překážek, které zbývají
Missourský tým má před sebou konkrétní seznam problémů: škálování z osmibitové paměti na adresovatelnou kapacitu v řádu kilobajtů a výš; spolehlivé čtení dlouhých templátů, samotný článek zmiňuje přerušení při průchodu nanopórem; návrh sekvencí bez nežádoucí samovolné hybridizace; kompromis mezi počtem přepisovacích cyklů a hustotou dat; a konečně zmenšení laboratorní sestavy do kompaktního zařízení. Gu veřejně mluví o ambicích dostat se na velikost USB flash disku, ale to je zatím vize, ne prototyp. Univerzita podala patentovou přihlášku, vynálezci jsou Gu a jeho kolega Kchaj Tchien.
Gram DNA pojme víc dat než celé patro serverovny. To je fakt starý osm let. Novinka z Missouri je skromnější, ale důležitější: poprvé někdo ukázal, že ta data nemusí být navždy zamčená. Od přepisovatelné osmibitové paměti k něčemu, co nahradí byť jen archivní patro datacentra, vede ještě velmi dlouhá cesta, ale poprvé na ní svítí světlo.