Trong tương lai không xa, con người có thể nghĩ đến việc lưu trữ thông tin và dữ liệu được mã hóa trên ADN. Nếu kế hoạch này thành công, con người sẽ không còn phải lo đến việc tìm kiếm nguồn lưu trữ thông tin nữa.
ADN (vật liệu di truyền) cung cấp cho các nhà khoa học một cỗ máy lưu trữ tốt nhất nhưng để lưu trữ thông tin trên ADN không hề dễ dàng. Đó là lý do tại sao các nhà khoa học đã bắt đầu nghiên cứu phương pháp lưu trữ dữ liệu trên ADN mới, giúp đơn giản hóa việc lưu trữ và tăng khối lượng lưu trữ.
Nếu có một trang web rộng lớn và có lượng dữ liệu lưu trữ khủng nhất, chúng ta không thể bỏ qua YouTube. Trang web chia sẻ video ra mắt từ năm 2005 tới nay đã trở thành một trong những thế lực thống trị Internet. Và chúng ta không thể phủ nhận rằng, YouTube thực sự là một kho lưu trữ khổng lồ.
Đó là lý do tại sao các nhà khoa học đã thực sự bị sốc khi phát hiện rằng, họ có thể lưu trữ 10 petabyte (10 triệu gigabyte) dữ liệu trong một gram vật liệu di truyền ADN. Về mặt lý thuyết, khối lượng dữ liệu khổng lồ của YouTube có thể quy ra bằng một muỗng cà phê nếu chúng được chứa trong ADN.
Các nhà nghiên cứu tại Viện Công nghệ Technion, Israel ở Haifa và Trung tâm liên ngành (IDC) Herzliya, Israel đã kiểm tra khả năng lưu trữ dữ liệu của ADN. Với việc các nền tảng đám mây ngày một phát triển, nhu cầu lưu trữ dữ liệu đám mây cũng vì thể ngày càng nở rộ. Để đáp ứng nhu cầu, các hãng công nghệ phải xây dựng các hệ thống máy chủ siêu khổng lồ. Tuy nhiên hệ thống máy chủ này đang làm dấy lên mối quan ngại liên quan đến môi trường do nhu cầu sử dụng điện lớn. Một số công ty như Microsoft đã thử nghiệm đưa máy chủ của họ xuống dưới nước để giảm thiểu nhu cầu làm mát cho máy chủ.
ADN nắm giữ những mã cực kỳ phức tạp và quan trọng với cuộc sống của con người. Điều này khiến nó có thể trở thành một nguồn lưu trữ dữ liệu tuyệt vời. Nhưng làm sao để lưu trữ cũng không hề đơn giản. Mã hóa thông tin ADN đòi hỏi một chuỗi được tạo thành từ các liên kết gọi là nucleotide. Các nucleotide này là bốn khối xây dựng lên sự sống và được đánh dấu bằng các chữ cái gồm A,C,G và T. Các chuỗi nhị phân của dữ liệu gồm 0 và 1 sau đó sẽ được dịch thành 4 chữ cái này.
Trong quá trình tổng hợp nucleotide, các phân tử ADN đại diện cho một chuỗi tương tự. Sau đó trong quá trình gọi là giải trình tự ADN, các nhà nghiên cứu sẽ tạo ra đầu sợi đại diện cho trình tự nucleotide ban đầu.
Nhóm nghiên cứu đã phải tốn rất nhiều thời gian để tìm cách đưa dữ liệu vào ADN.
Đầu tiên họ tăng số lượng chữ cái được sử dụng để mã hóa thông tin, ngoài 4 chữ cái gốc. Sau đó họ giảm đáng kể số lượng vòng tổng hợp cần thiết để lưu trữ thông tin trên ADN. Cuối cùng họ cải thiện cơ chế sửa lỗi.
Giáo sư Zohar Yakhini đến từ Viện Công nghệ Technion cho biết: “Số lượng chữ cái hiệu quả trong bốn chữ cái ban đầu giúp chúng tôi có thể mã hóa và viết từng đơn vị thông tin với ít chu kỳ tổng hợp hơn”.
Nhóm nghiên cứu có thể giảm 20% số vòng tổng hợp cần thiết cho mỗi đơn vị thông tin. Trong tương lai, nhóm hy vọng có thể giảm đến 75% số vòng tổng hợp.
Giáo sư Roee Amit, người quản lý một phòng thí nghiệm sinh học tổng hợp tại Techion cho biết: “Trong nghiên cứu này, chúng tôi đã triển khai một hệ thống lưu trữ dựa vào ADN. Nó có thể mã hóa thông tin với hiệu quả tổng hợp tốt hơn đáng kể so với phương pháp tiêu chuẩn. Nghiên cứu cũng tiến hành triển khai các kỹ thuật mã hóa mới, phục vụ lưu trữ khối lượng lớn thông tin trên các phân tử ADN và tái cấu trúc nó để thử nghiệm quy trình”.
Các nhà khoa học đang tính đến việc thử nghiệm kỹ thuật CRISPR để giúp ADN dễ dàng lưu trữ thông tin hơn vào một ngày nào đó.
Tham khảo Popular Mechanics
Trí Thức Trẻ