.
.
Tin tức

REAL-TIME DNA DIAGNOSTIC APPLICATION

Bản tóm tắt

Đào sâu hơn vào những chi tiết nhỏ nhất luôn mang lại những hiểu biết có giá trị. Điều tương tự cũng có liên quan đến Genomics, một lĩnh vực sinh học liên ngành tập trung vào cấu trúc, chức năng, đánh giá, lập bản đồ và chỉnh sửa bộ gen. Bộ gen là bộ DNA hoàn chỉnh của một sinh vật, bao gồm tất cả các gen của nó.

Thách thức chính trong Genomics hiện đại là Xử lý trình tự DNA Nanopore thời gian thực. Mặc dù có sẵn các  thiết bị trình tự DNA nanopore  mà bạn có thể mua với giá khoảng một nghìn đô la, nhưng không có phần mềm phù hợp nào có thể phân tích các mẫu DNA trong thời gian thực.

Đồng thời, các phân tích bộ gen hiện tại yêu cầu vận chuyển mẫu DNA đến một cơ sở tập trung, giải trình tự và phân tích mẫu trong một quy trình hàng loạt, mất hàng tuần và thậm chí hàng tháng. Quá trình phân tích chậm như vậy có thể phải trả giá bằng mạng sống, đặc biệt là đối với những bệnh nhân bị nhiễm trùng huyết, những người mà mỗi giờ chậm trễ sẽ làm giảm 4% cơ hội sống sót và tử vong có thể xảy ra trong 24-48 giờ.

Cốt truyện

Đào sâu hơn vào những chi tiết nhỏ nhất luôn mang lại những hiểu biết có giá trị. Điều tương tự cũng có liên quan đến Genomics, một lĩnh vực sinh học liên ngành tập trung vào cấu trúc, chức năng, đánh giá, lập bản đồ và chỉnh sửa bộ gen. Bộ gen là bộ DNA hoàn chỉnh của một sinh vật, bao gồm tất cả các gen của nó.

Thách thức chính trong Genomics hiện đại là Xử lý trình tự DNA Nanopore thời gian thực. Mặc dù có sẵn các  thiết bị trình tự DNA nanopore  mà bạn có thể mua với giá khoảng một nghìn đô la, nhưng không có phần mềm phù hợp nào có thể phân tích các mẫu DNA trong thời gian thực.

Đồng thời, các phân tích bộ gen hiện tại yêu cầu vận chuyển mẫu DNA đến một cơ sở tập trung, giải trình tự và phân tích mẫu trong một quy trình hàng loạt, mất hàng tuần và thậm chí hàng tháng. Quá trình phân tích chậm như vậy có thể phải trả giá bằng mạng sống, đặc biệt là đối với những bệnh nhân bị nhiễm trùng huyết, những người mà mỗi giờ chậm trễ sẽ làm giảm 4% cơ hội sống sót và tử vong có thể xảy ra trong 24-48 giờ.

Nó bắt đầu khi Allen Day, một nhà khoa học dữ liệu và người ủng hộ nhà phát triển cấp cao từ Google Cloud Platform, đang tìm kiếm một kiến ​​trúc sư đám mây có chứng chỉ GCP. Trong quá trình tìm kiếm, Allen đã liên lạc với chúng tôi. Sau khi anh ấy đảm bảo rằng chúng tôi có  kiến ​​trúc sư GCP được chứng nhận (Allen chỉ tìm thấy hai nhà phát triển có kinh nghiệm phù hợp), chúng tôi bắt đầu làm rõ thêm chi tiết của dự án.

Allen cần một chuyên gia như vậy cho dự án Đại học Công nghệ Queensland. Dự án nên kết hợp khả năng Học máy, công cụ Google Cloud Platform để phân tích dữ liệu và bộ dữ liệu bộ gen hiện có với phân tích dữ liệu trực tuyến.

Ban đầu, Allen chỉ cần một chuyên gia trong nhóm của chúng tôi. Tuy nhiên, theo thời gian, Allen đánh giá cao chuyên môn công nghệ, tính chủ động và tư duy sản phẩm của chúng tôi, điều này cho phép chúng tôi mở rộng nhóm phát triển lên 10 thành viên.

Ứng dụng phân tích trình tự DNA thời gian thực là gì?

Ứng dụng này phân tích các hạt nano DNA trong thời gian thực. Nó phát hiện tỷ lệ phân loại, vi rút tiềm năng và bệnh lý, gen kháng kháng sinh, v.v. Sau đó, ứng dụng sẽ trực quan hóa kết quả nhận được thông qua công cụ Sunburst tương tác. Nhờ trực quan hóa dữ liệu thuận tiện và chi tiết, các chuyên gia y tế có thể đưa ra quyết định sáng suốt về kế hoạch điều trị cho bệnh nhân.

Trình tự Nanopore DNA có nhiều ứng dụng trong ngành Y tế và Nông nghiệp:

  • Chẩn đoán nhiễm trùng từ mẫu máu và đếm phân loại
  • Theo dõi, lập hồ sơ và theo dõi sự tiến hóa của các gen kháng kháng sinh
  • Phát hiện mầm bệnh trong nước thải hoặc sức khỏe cộng đồng
  • Xác định virus trong cây sắn

Làm thế nào nó hoạt động?

Máu và các mẫu DNA khác được thu thập từ một thiết bị giải trình tự nanopore di động. Chúng tôi đã sử dụng thiết bị MinION do Oxford Nanopore Technologies phát triển. Sau đó, dữ liệu nhận được sẽ được gửi đến nền tảng và trải qua quy trình công việc sau:

  • Nhập  – các tệp được tải lên Google Cloud Platform và được truyền trực tuyến vào quy trình xử lý
  • Giai đoạn gọi cơ sở  – mô hình học máy suy ra chuỗi DNA từ tín hiệu điện
  • Giai đoạn sắp xếp  – thông qua cơ sở dữ liệu DNA, các mẫu được phân tích để tìm trình tự mầm bệnh, làm giàu phân loại và các bất thường khác
  • Giai đoạn tóm tắt  – tính toán tỷ lệ phần trăm của từng mầm bệnh trong mẫu cụ thể
  • Lưu trữ và trực quan hóa  – kết quả được lưu vào Google Firestore DB và sau đó được hiển thị trực quan trong thời gian thực với D3.js.

Mục tiêu dự án

Để phát triển một ứng dụng phân tích trình tự chuỗi hạt nano DNA, chúng tôi cần thực hiện các bước sau.

  • Điều tra các định dạng dữ liệu miền Genomics
  • Phát triển trình mô phỏng dữ liệu chuỗi thô
  • Trao quyền cho ứng dụng bằng cách đọc dữ liệu nguồn
  • Phát triển logic cho giai đoạn căn chỉnh
  • Phát triển quy trình cho giai đoạn tóm tắt
  • Tìm các giải pháp và công cụ phù hợp để lưu trữ và trực quan hóa dữ liệu đã phân tích
  • Viết tài liệu về cách sử dụng ứng dụng và cung cấp nó trên GitHub

Thách thức của chúng tôi

Trong quá trình phát triển ứng dụng giải trình tự chuỗi hạt nano DNA, chúng tôi đã đối mặt với những thách thức sau:

  • Xây dựng kiến ​​trúc hệ thống có thể mở rộng và đáng tin cậy . Nanopore Sequencer DNA Analysis là một quy trình đòi hỏi tài nguyên. Do khối lượng dữ liệu lớn và hạn chế về thời gian, hệ thống cần phải mở rộng quy mô cho phù hợp. Chúng tôi đã loại bỏ thách thức này bằng cách tận dụng các công cụ xử lý dữ liệu, lưu trữ và điện toán của Google Cloud Platform. Nhờ cách tiếp cận như vậy, chúng tôi đã đạt được khả năng mở rộng mượt mà, hợp lý hóa và đáng tin cậy cho các hoạt động xử lý dữ liệu.
  • Logic xử lý dữ liệu . Dự án yêu cầu hoạt động xử lý dữ liệu tinh chỉnh để cung cấp phạm vi kết quả rộng trong thời gian tối thiểu. Do đó, chúng tôi cần phát triển logic xử lý dữ liệu kết nối ứng dụng phân tích với nền tảng đám mây và đảm bảo luân chuyển thông tin hiệu quả. Để đạt được mục tiêu này, chúng tôi đã sử dụng thư viện Apache Beam chạy trên Google Cloud Dataflow và hỗ trợ tích hợp với các dịch vụ Google Cloud khác. Chúng tôi cũng đã tích hợp Công cụ Điện toán để xây dựng Cụm căn chỉnh tự động thay đổi quy mô trong ứng dụng.
  • Tích hợp Công cụ Phân tích DNA . Các công cụ Phân tích DNA cho máy giải trình tự Nanopore chỉ là các tiện ích dành cho máy tính để bàn, do đó chúng tôi cần điều chỉnh chúng cho các nền tảng đám mây. Chúng tôi cũng cần tích hợp các công cụ phân tích DNA trên máy tính để bàn thành một hệ thống thống nhất, có thể mở rộng. Chúng tôi đã diễn giải lại các công cụ phân tích DNA dựa trên máy tính để bàn cho định dạng HTTP và phân phối chúng dưới dạng dịch vụ web để chúng có thể xử lý lượng lớn dữ liệu trong khoảng thời gian ngắn hơn.

Chúng tôi đã làm như thế nào?

Kiến Trúc Hệ Thống

Đối với kiến ​​trúc hệ thống, chúng tôi đã áp dụng một loạt các công cụ xử lý dữ liệu của Google Cloud Platform cũng như khả năng tính toán. Dữ liệu được thu thập từ trình sắp xếp DNA nanopore sẽ có sẵn trong tệp đọc DNA mới và được tải lên bộ  chứa Lưu trữ đám mây . Khi tất cả các tệp được tải lên, chúng sẽ trải qua một quy trình công việc chuyển đổi các tệp đầu vào thành các báo cáo có thể thực hiện được.

Động cơ học máy

Ứng dụng này phải bao gồm một thuật toán máy học sẽ phân tích cơ sở dữ liệu kỹ thuật di truyền để đưa ra các kết quả xét nghiệm DNA có liên quan. Để đạt được mục tiêu này, chúng tôi đã áp dụng mô hình máy học trên TensorFlow, trước đây đã được đào tạo với một số cơ sở dữ liệu bộ gen.

Phía máy chủ

Chúng tôi cần tạo ra một phía máy chủ dành cho các nhà phát triển web và thiết bị di động. Do đó, để lưu trữ cơ sở dữ liệu và tệp, chúng tôi đã tận dụng  Firebase , một hệ thống lưu trữ tài liệu có thể biểu thị dữ liệu phân cấp, cần thiết để biểu thị các nguyên tắc phân loại sinh học.

Phía khách hàng

Mối quan tâm chính của chúng tôi là rút ngắn thời gian dữ liệu được tải lên và hiển thị trực quan từ trình sắp xếp thứ tự.

Để giữ mọi thứ nhanh nhất có thể từ phía máy khách, chúng tôi đã triển khai bảng điều khiển động với  D3.js , bảng điều khiển này thăm dò định kỳ cơ sở dữ liệu để tìm dữ liệu mới và cập nhật  trực quan hóa biểu đồ Sunburst  tương ứng.

Ngăn xếp công nghệ của chúng tôi

Ngăn xếp công nghệ:

  • JAPSA , Gói Java để phân tích trình tự.
  • TensorFlow , một thư viện nguồn mở để đào tạo thuật toán ML
  • Chiron Base Caller  để dịch tín hiệu nanopore thô
  • Các tiện ích của Samtools  để tương tác và xử lý hậu kỳ chuỗi DNA ngắn đọc sắp xếp theo định dạng SAM, BAM và CRAM
  •  Thuật toán BWA MEM để thực hiện căn chỉnh cục bộ
  • Minimap2 , một chương trình căn chỉnh trình tự linh hoạt để căn chỉnh trình tự DNA hoặc mRNA dựa trên cơ sở dữ liệu tham khảo lớn.

Công cụ đám mây của Google:

  • Google Cloud Storage  để lưu trữ và truy cập dữ liệu
  • Google Cloud PubSub  để gửi và nhận tin nhắn giữa các thành phần ứng dụng với độ trễ thấp với khả năng mở rộng theo yêu cầu
  • Google FireStore  để lưu trữ, đồng bộ hóa và truy vấn dữ liệu
  • Google Cloud Dataflow  để đơn giản hóa quá trình phát triển đường truyền dữ liệu trực tuyến với độ trễ dữ liệu thấp hơn
  • Apache Beam  để xác định và thực thi quy trình xử lý dữ liệu
  • Thư viện trực quan hóa dữ liệu D3  để tạo trực quan hóa dữ liệu động, tương tác trong trình duyệt web
  • JavaScript  để xây dựng Trực quan hóa dữ liệu

Thành phần đội

  • 2 kỹ sư dữ liệu
  • 1 Kỹ sư DevOps
  • 1 Nhà phát triển web

Kết quả và triển vọng

Chúng tôi đã phát triển trình sắp xếp trình tự DNA Nanopore giúp giảm đáng kể thời gian tạo dữ liệu trình tự DNA. Giờ đây, các chuyên gia y tế và kỹ sư bộ gen có thể nhận dữ liệu trình tự được tạo từ các mẫu (bệnh nhân, nhà máy xử lý nước thải hoặc cánh đồng trồng trọt) trong vòng vài phút.

Tiềm năng giải trình tự nanopore rất hứa hẹn. Nền tảng giải trình tự nanopore thời gian thực mà chúng tôi đã phát triển có tác động đáng kể đến chẩn đoán phân tử bệnh ở người, đặc biệt là nhiễm trùng huyết. Cùng với nhóm  Google Cloud Platform , chúng tôi đã tạo một bộ mã nguồn mở gồm các gói trình sắp xếp nanopore có sẵn trên  GitHub .

Dự án này chỉ là khởi đầu của sự hợp tác hiệu quả.

Một lần, Allen Day đến thăm văn phòng của chúng tôi ở Kyiv để tổ chức một buổi gặp mặt về Khoa học dữ liệu khá thành công giữa các nhà khoa học dữ liệu và kỹ sư dữ liệu.

Sau một năm làm việc với Allen và nhóm GCP, Giám đốc điều hành của chúng tôi, Pavel Tantsiura đã đến thăm văn phòng của Google tại Singapore để ký kết quan hệ đối tác chính thức với Google và The APP Solutions, đồng thời thảo luận về một dự án sắp tới.

Hiện tại, chúng tôi đang hợp tác với Allen trong dự án PopGen trong lĩnh vực Genomics nhằm xử lý các quần thể bộ gen. Các thư mục của dự án với các mẫu lúa và bộ gen người có sẵn trên kho lưu trữ GitHub .

Nguồn SentoApp News
Khám Phá App Finhay – Giải Pháp Đầu Tư Tài Chính Hiệu Quả và Tiện Lợi

Khám Phá App Finhay – Giải Pháp Đầu Tư Tài Chính Hiệu Quả và Tiện Lợi

Trong bối cảnh kinh tế biến đổi và thị trường tài chính phát triển, việc đầu tư và quản...

Top 5 Ứng Dụng Quét Mã Vạch Đáng Sử Dụng Cho Công Việc và Cuộc Sống Hàng Ngày

Top 5 Ứng Dụng Quét Mã Vạch Đáng Sử Dụng Cho Công Việc và Cuộc Sống Hàng Ngày

Trong thời đại số hóa ngày nay, mã vạch đã trở thành một phần không thể thiếu trong việc...

App Giao Hàng Tiết Kiệm – Đối Tác Tốt Nhất Cho Dịch Vụ Giao Hàng Nhanh Chóng và Hiệu Quả

App Giao Hàng Tiết Kiệm – Đối Tác Tốt Nhất Cho Dịch Vụ Giao Hàng Nhanh Chóng và Hiệu Quả

Trong thời đại số hóa, dịch vụ giao hàng đã trở thành một phần không thể thiếu của cuộc...

Toàn tập về thiết kế ứng dụng cho Android APP

Toàn tập về thiết kế ứng dụng cho Android APP

Người dùng Android mong muốn ứng dụng của bạn trông và hoạt động theo cách phù hợp với nền...

Ứng Dụng Livestream Là Gì? Khám Phá Cuộc Sống Trực Tiếp Qua Kỹ Thuật Số

Ứng Dụng Livestream Là Gì? Khám Phá Cuộc Sống Trực Tiếp Qua Kỹ Thuật Số

Ứng dụng livestream đã trở thành một phần không thể thiếu trong thế giới kỹ thuật số ngày nay,...

Top 10 App Livestream Phổ Biến Tại Việt Nam: Kết Nối Với Thế Giới Trực Tiếp

Top 10 App Livestream Phổ Biến Tại Việt Nam: Kết Nối Với Thế Giới Trực Tiếp

Ứng dụng livestream đã trở thành một phần không thể thiếu trong cuộc sống kỹ thuật số ngày nay,...

Top 10 công ty thiết kế Mobile App tại Hà Nội

Top 10 công ty thiết kế Mobile App tại Hà Nội

Thời đại công nghệ số đã thay đổi hoàn toàn thói quen, hành vi mua hàng của khách hàng....

Lập trình App Android & iOS dễ dàng

Lập trình App Android & iOS dễ dàng

Trong thời đại công nghệ số 4.0 hiện nay, những ngành nghề liên quan đến công nghệ thông tin...

List 5 tính năng quản lý app bán hàng tốt nhất

List 5 tính năng quản lý app bán hàng tốt nhất

Một app quản lý bán hàng sẽ phù hợp được tạo thành từ ba nhóm chính: người dùng, nhà...

Khám Phá Top 10 App Đọc Báo Phổ Biến Tại Việt Nam – Cập Nhật Tin Tức Mọi Lúc Mọi Nơi

Khám Phá Top 10 App Đọc Báo Phổ Biến Tại Việt Nam – Cập Nhật Tin Tức Mọi Lúc Mọi Nơi

Trong thời đại số hóa, việc theo dõi tin tức hàng ngày đã trở nên dễ dàng hơn bao...

Khám Phá Top 10 Ứng Dụng Giáo Dục Tại Việt Nam – Học Tập Thông Minh và Hiệu Quả

Khám Phá Top 10 Ứng Dụng Giáo Dục Tại Việt Nam – Học Tập Thông Minh và Hiệu Quả

Trong thời đại số hóa, việc sử dụng công nghệ để học tập đã trở nên phổ biến và...

Khám Phá Top 10 App Đặt Xe Phổ Biến Tại Việt Nam – Hành Trình Thuận Tiện Và An Toàn

Khám Phá Top 10 App Đặt Xe Phổ Biến Tại Việt Nam – Hành Trình Thuận Tiện Và An Toàn

Trong bối cảnh cuộc sống hiện đại, việc di chuyển đã trở nên dễ dàng hơn bao giờ hết...

Top 20 công ty thiết kế Mobile App chuyên nghiệp nhất Việt Nam

Top 20 công ty thiết kế Mobile App chuyên nghiệp nhất Việt Nam

Thời đại công nghệ số đã thay đổi hoàn toàn thói quen, hành vi mua hàng của khách hàng....

Top 5 Ứng Dụng Kiểm Tra Mã Vạch Nhanh Nhất Cho Mọi Nhu Cầu

Top 5 Ứng Dụng Kiểm Tra Mã Vạch Nhanh Nhất Cho Mọi Nhu Cầu

Mã vạch đã trở thành một phần không thể thiếu trong việc quản lý thông tin sản phẩm và...

Cách Tải và Sử Dụng Ứng Dụng Quét Mã Vạch Sản Phẩm Một Cách Hiệu Quả

Cách Tải và Sử Dụng Ứng Dụng Quét Mã Vạch Sản Phẩm Một Cách Hiệu Quả

Trong thế giới hiện đại nhiễu nhiễu, việc tìm kiếm thông tin sản phẩm và so sánh giá cả...

Khám Phá Top 5 App Đặt Xe Khách Phổ Biến Tại Việt Nam – Hành Trình An Toàn và Tiện Lợi

Khám Phá Top 5 App Đặt Xe Khách Phổ Biến Tại Việt Nam – Hành Trình An Toàn và Tiện Lợi

Trong thời đại số hóa và công nghệ 4.0, việc di chuyển bằng xe khách đã trở nên dễ...

Khám Phá Top 5 App Đặt Xe Taxi Phổ Biến Tại Việt Nam – Hành Trình Thuận Lợi và An Toàn

Khám Phá Top 5 App Đặt Xe Taxi Phổ Biến Tại Việt Nam – Hành Trình Thuận Lợi và An Toàn

Trong thời đại số hóa, việc di chuyển bằng xe taxi đã trở nên dễ dàng và tiện lợi...

Top 10 Ứng Dụng Quét Mã Vạch Hiệu Quả Cho Công Việc và Cuộc Sống Hàng Ngày

Top 10 Ứng Dụng Quét Mã Vạch Hiệu Quả Cho Công Việc và Cuộc Sống Hàng Ngày

Trong thời đại số hóa ngày nay, việc sử dụng ứng dụng quét mã vạch đã trở nên phổ...

Top 10 Ứng Dụng Học Tiếng Anh Hiệu Quả Nhất Tại Việt Nam

Top 10 Ứng Dụng Học Tiếng Anh Hiệu Quả Nhất Tại Việt Nam

Học tiếng Anh không chỉ là một kỹ năng, mà còn là một cánh cửa mở ra thế giới...

Top 10 Ứng Dụng Đặt Đồ Ăn Tại Việt Nam: Lựa Chọn Hoàn Hảo Cho Bữa Ăn Nhanh Gọn

Top 10 Ứng Dụng Đặt Đồ Ăn Tại Việt Nam: Lựa Chọn Hoàn Hảo Cho Bữa Ăn Nhanh Gọn

Trong xã hội hiện đại ngày nay, việc đặt đồ ăn thông qua ứng dụng đã trở thành một...

Kiến thức liên quan khác

Đối tác vững mạnh
hợp tác bền vững, trường tồn

Chuyên gia tư vấn của chúng tôi sẽ luôn có giải pháp cho bạn! Vui lòng liên hệ tại khu vực của bạn.

HOTLINE TOÀN QUỐC

0904.344.888
HD 159 Vinhomes Marina Cầu Rào 2, Vĩnh Niệm, Lê Chân, Hải Phòng Bản đồ

KHU VỰC MIỀN BẮC

0937.874.222
Tầng 12 Toà nhà Licogi 13, 164 Khuất Duy Tiến, Thanh Xuân, Hà Nội Bản đồ

ĐỊA CHỈ MALAYSIA

10985474
The Gardens Mall, Lingkaran Syed Putra, Mid Valley City, Kuala Lumpur, Malaysia Bản đồ

KHU VỰC MIỀN NAM

0904.344.888
Số 88 Đường Bạch Đằng, Phường 2, Quận Tân Bình, TP. Hồ Chí Minh Bản đồ

KHU VỰC MIỀN TRUNG

0932.697.333
Lô 12A4 Nguyễn Sinh Sắc, Hoà Minh, Liên Chiểu, Đà Nẵng Bản đồ

ĐỊA CHỈ INDONESIA

+62(21)3950 2888
40th.Floor, Capital Place, J1. Jend. Gatot Subroto Kav 18, Kuningan Barat, Mampang Prapatan, Indonesia Bản đồ