Microsoft sta acquistando 10 milioni di filamenti di oligonucleotidi, molecole di DNA artificiale con un numero massimo di 20 basi, dalla Twist Bioscience, una società di San Francisco, che solitamente fornisce i suoi prodotti ad istituti di ricerca.

Il gigante di Seattle sta analizzando la possibilità di utilizzare le molecole di DNA per l'archiviazione di grossi volumi di dati. 

La quantità di dati digitali cresce in modo inarrestabile. Ogni giorno si producono milioni di nuove immagini, si digitalizzano interi archivi cartacei, si raccolgono nuovi dati da milioni di sensori. Si stima che nel 2020 questa montagna di dati raggiungerà i 44 trilioni di gigabyte ed il problema è come archiviarli e conservarli per le generazioni a venire.

A differenza dei dischi rigidi, dei Blu-Ray o di un qualunque altro metodo di archiviazione attualmente disponibile, che garantiscono una durata massima di qualche decina d'anni, il DNA rimane inalterato e leggibile per un periodo che oscilla fra i mille e i diecimila anni. Inoltre, è una questione di spazio: con i metodi tradizionali dieci gigabyte occupano un millimetro cubo, mentre un millimetro cubo di DNA può contenere un exabyte, cioè un miliardo di gigabyte.

Il progetto è nato dalla collaborazione fra il settore ricerca della Microsoft e scienziati dell'università di Washington che, all'inizio di aprile, hanno pubblicato un documento proprio su questo argomento, nel quale viene per la prima volta descritto un sistema in grado di archiviare dati digitali sotto forma di DNA artificiale e successivamente rileggerli. Il tutto avviene in tre fasi

Nella prima fase, si tratta di tradurre il linguaggio dei computer, costituito da una sequenza di uno e di zero, in quello del DNA, cioè in una sequenza di A, C, G e T, corrispondenti alla adenina, alla citosina, alla guanina ed alla timina, le basi che lo compongono. Successivamente, i dati vengono frazionati e archiviati. La terza fase consiste nel rileggere i dati e per questo viene impiegato il sequenziamento del DNA, un metodo già utilizzato in biologia per decodificare il materiale genetico. A questo scopo si utilizza un piccolo trucco: al momento della scrittura dei dati vengono codificati anche quelli che possono essere considerati l'equivalente di codici postali e nomi delle strade, in modo da potersi poi districare in mezzo a tutti quegli A, C, G, e T.

Durante i test, i ricercatori sono riusciti in questo modo ad archiviare tre immagini senza errori: una dell'Opera di Sidney, la foto di un gatto (non poteva mancare) e un emoji, che rappresentava una scimmietta con le mani sugli occhi. Ma, nonostante il successo, prima che questa tecnologia possa essere utilizzata su larga scala, la strada è ancora lunga, sia perché la ricerca è ancora agli inizi, sia per i costi ancora troppo alti.

Tuttavia, sotto quest'ultimo aspetto, bisogna considerare che se quindici anni fa la mappatura completa del genoma di una persona costava circa 100 milioni di dollari, oggi sono sufficienti meno di mille dollari.