SINCE 2006 Email: support@sapp.vn Hotline: 0937.874.222 - 0901.536.444 - 0904.344.888
Xây dựng báo giá

REAL-TIME DNA DIAGNOSTIC APPLICATION

Sento App thiết kế app tại hải phòng, nhận thiết kế app các nơi trong đất nước việt nam .

Bản tóm tắt

Đào sâu hơn vào những chi tiết nhỏ nhất luôn mang lại những hiểu biết có giá trị. Điều tương tự cũng có liên quan đến Genomics, một lĩnh vực sinh học liên ngành tập trung vào cấu trúc, chức năng, đánh giá, lập bản đồ và chỉnh sửa bộ gen. Bộ gen là bộ DNA hoàn chỉnh của một sinh vật, bao gồm tất cả các gen của nó.

Thách thức chính trong Genomics hiện đại là Xử lý trình tự DNA Nanopore thời gian thực. Mặc dù có sẵn các  thiết bị trình tự DNA nanopore  mà bạn có thể mua với giá khoảng một nghìn đô la, nhưng không có phần mềm phù hợp nào có thể phân tích các mẫu DNA trong thời gian thực.

Đồng thời, các phân tích bộ gen hiện tại yêu cầu vận chuyển mẫu DNA đến một cơ sở tập trung, giải trình tự và phân tích mẫu trong một quy trình hàng loạt, mất hàng tuần và thậm chí hàng tháng. Quá trình phân tích chậm như vậy có thể phải trả giá bằng mạng sống, đặc biệt là đối với những bệnh nhân bị nhiễm trùng huyết, những người mà mỗi giờ chậm trễ sẽ làm giảm 4% cơ hội sống sót và tử vong có thể xảy ra trong 24-48 giờ.

Cốt truyện

Đào sâu hơn vào những chi tiết nhỏ nhất luôn mang lại những hiểu biết có giá trị. Điều tương tự cũng có liên quan đến Genomics, một lĩnh vực sinh học liên ngành tập trung vào cấu trúc, chức năng, đánh giá, lập bản đồ và chỉnh sửa bộ gen. Bộ gen là bộ DNA hoàn chỉnh của một sinh vật, bao gồm tất cả các gen của nó.

Thách thức chính trong Genomics hiện đại là Xử lý trình tự DNA Nanopore thời gian thực. Mặc dù có sẵn các  thiết bị trình tự DNA nanopore  mà bạn có thể mua với giá khoảng một nghìn đô la, nhưng không có phần mềm phù hợp nào có thể phân tích các mẫu DNA trong thời gian thực.

Đồng thời, các phân tích bộ gen hiện tại yêu cầu vận chuyển mẫu DNA đến một cơ sở tập trung, giải trình tự và phân tích mẫu trong một quy trình hàng loạt, mất hàng tuần và thậm chí hàng tháng. Quá trình phân tích chậm như vậy có thể phải trả giá bằng mạng sống, đặc biệt là đối với những bệnh nhân bị nhiễm trùng huyết, những người mà mỗi giờ chậm trễ sẽ làm giảm 4% cơ hội sống sót và tử vong có thể xảy ra trong 24-48 giờ.

Nó bắt đầu khi Allen Day, một nhà khoa học dữ liệu và người ủng hộ nhà phát triển cấp cao từ Google Cloud Platform, đang tìm kiếm một kiến ​​trúc sư đám mây có chứng chỉ GCP. Trong quá trình tìm kiếm, Allen đã liên lạc với chúng tôi. Sau khi anh ấy đảm bảo rằng chúng tôi có  kiến ​​trúc sư GCP được chứng nhận (Allen chỉ tìm thấy hai nhà phát triển có kinh nghiệm phù hợp), chúng tôi bắt đầu làm rõ thêm chi tiết của dự án.

Allen cần một chuyên gia như vậy cho dự án Đại học Công nghệ Queensland. Dự án nên kết hợp khả năng Học máy, công cụ Google Cloud Platform để phân tích dữ liệu và bộ dữ liệu bộ gen hiện có với phân tích dữ liệu trực tuyến.

Ban đầu, Allen chỉ cần một chuyên gia trong nhóm của chúng tôi. Tuy nhiên, theo thời gian, Allen đánh giá cao chuyên môn công nghệ, tính chủ động và tư duy sản phẩm của chúng tôi, điều này cho phép chúng tôi mở rộng nhóm phát triển lên 10 thành viên.

Ứng dụng phân tích trình tự DNA thời gian thực là gì?

Ứng dụng này phân tích các hạt nano DNA trong thời gian thực. Nó phát hiện tỷ lệ phân loại, vi rút tiềm năng và bệnh lý, gen kháng kháng sinh, v.v. Sau đó, ứng dụng sẽ trực quan hóa kết quả nhận được thông qua công cụ Sunburst tương tác. Nhờ trực quan hóa dữ liệu thuận tiện và chi tiết, các chuyên gia y tế có thể đưa ra quyết định sáng suốt về kế hoạch điều trị cho bệnh nhân.

Trình tự Nanopore DNA có nhiều ứng dụng trong ngành Y tế và Nông nghiệp:

 • Chẩn đoán nhiễm trùng từ mẫu máu và đếm phân loại
 • Theo dõi, lập hồ sơ và theo dõi sự tiến hóa của các gen kháng kháng sinh
 • Phát hiện mầm bệnh trong nước thải hoặc sức khỏe cộng đồng
 • Xác định virus trong cây sắn

Làm thế nào nó hoạt động?

Máu và các mẫu DNA khác được thu thập từ một thiết bị giải trình tự nanopore di động. Chúng tôi đã sử dụng thiết bị MinION do Oxford Nanopore Technologies phát triển. Sau đó, dữ liệu nhận được sẽ được gửi đến nền tảng và trải qua quy trình công việc sau:

 • Nhập  – các tệp được tải lên Google Cloud Platform và được truyền trực tuyến vào quy trình xử lý
 • Giai đoạn gọi cơ sở  – mô hình học máy suy ra chuỗi DNA từ tín hiệu điện
 • Giai đoạn sắp xếp  – thông qua cơ sở dữ liệu DNA, các mẫu được phân tích để tìm trình tự mầm bệnh, làm giàu phân loại và các bất thường khác
 • Giai đoạn tóm tắt  – tính toán tỷ lệ phần trăm của từng mầm bệnh trong mẫu cụ thể
 • Lưu trữ và trực quan hóa  – kết quả được lưu vào Google Firestore DB và sau đó được hiển thị trực quan trong thời gian thực với D3.js.

Mục tiêu dự án

Để phát triển một ứng dụng phân tích trình tự chuỗi hạt nano DNA, chúng tôi cần thực hiện các bước sau.

 • Điều tra các định dạng dữ liệu miền Genomics
 • Phát triển trình mô phỏng dữ liệu chuỗi thô
 • Trao quyền cho ứng dụng bằng cách đọc dữ liệu nguồn
 • Phát triển logic cho giai đoạn căn chỉnh
 • Phát triển quy trình cho giai đoạn tóm tắt
 • Tìm các giải pháp và công cụ phù hợp để lưu trữ và trực quan hóa dữ liệu đã phân tích
 • Viết tài liệu về cách sử dụng ứng dụng và cung cấp nó trên GitHub

Thách thức của chúng tôi

Trong quá trình phát triển ứng dụng giải trình tự chuỗi hạt nano DNA, chúng tôi đã đối mặt với những thách thức sau:

 • Xây dựng kiến ​​trúc hệ thống có thể mở rộng và đáng tin cậy . Nanopore Sequencer DNA Analysis là một quy trình đòi hỏi tài nguyên. Do khối lượng dữ liệu lớn và hạn chế về thời gian, hệ thống cần phải mở rộng quy mô cho phù hợp. Chúng tôi đã loại bỏ thách thức này bằng cách tận dụng các công cụ xử lý dữ liệu, lưu trữ và điện toán của Google Cloud Platform. Nhờ cách tiếp cận như vậy, chúng tôi đã đạt được khả năng mở rộng mượt mà, hợp lý hóa và đáng tin cậy cho các hoạt động xử lý dữ liệu.
 • Logic xử lý dữ liệu . Dự án yêu cầu hoạt động xử lý dữ liệu tinh chỉnh để cung cấp phạm vi kết quả rộng trong thời gian tối thiểu. Do đó, chúng tôi cần phát triển logic xử lý dữ liệu kết nối ứng dụng phân tích với nền tảng đám mây và đảm bảo luân chuyển thông tin hiệu quả. Để đạt được mục tiêu này, chúng tôi đã sử dụng thư viện Apache Beam chạy trên Google Cloud Dataflow và hỗ trợ tích hợp với các dịch vụ Google Cloud khác. Chúng tôi cũng đã tích hợp Công cụ Điện toán để xây dựng Cụm căn chỉnh tự động thay đổi quy mô trong ứng dụng.
 • Tích hợp Công cụ Phân tích DNA . Các công cụ Phân tích DNA cho máy giải trình tự Nanopore chỉ là các tiện ích dành cho máy tính để bàn, do đó chúng tôi cần điều chỉnh chúng cho các nền tảng đám mây. Chúng tôi cũng cần tích hợp các công cụ phân tích DNA trên máy tính để bàn thành một hệ thống thống nhất, có thể mở rộng. Chúng tôi đã diễn giải lại các công cụ phân tích DNA dựa trên máy tính để bàn cho định dạng HTTP và phân phối chúng dưới dạng dịch vụ web để chúng có thể xử lý lượng lớn dữ liệu trong khoảng thời gian ngắn hơn.

Chúng tôi đã làm như thế nào?

Kiến Trúc Hệ Thống

Đối với kiến ​​trúc hệ thống, chúng tôi đã áp dụng một loạt các công cụ xử lý dữ liệu của Google Cloud Platform cũng như khả năng tính toán. Dữ liệu được thu thập từ trình sắp xếp DNA nanopore sẽ có sẵn trong tệp đọc DNA mới và được tải lên bộ  chứa Lưu trữ đám mây . Khi tất cả các tệp được tải lên, chúng sẽ trải qua một quy trình công việc chuyển đổi các tệp đầu vào thành các báo cáo có thể thực hiện được.

Động cơ học máy

Ứng dụng này phải bao gồm một thuật toán máy học sẽ phân tích cơ sở dữ liệu kỹ thuật di truyền để đưa ra các kết quả xét nghiệm DNA có liên quan. Để đạt được mục tiêu này, chúng tôi đã áp dụng mô hình máy học trên TensorFlow, trước đây đã được đào tạo với một số cơ sở dữ liệu bộ gen.

Phía máy chủ

Chúng tôi cần tạo ra một phía máy chủ dành cho các nhà phát triển web và thiết bị di động. Do đó, để lưu trữ cơ sở dữ liệu và tệp, chúng tôi đã tận dụng  Firebase , một hệ thống lưu trữ tài liệu có thể biểu thị dữ liệu phân cấp, cần thiết để biểu thị các nguyên tắc phân loại sinh học.

Phía khách hàng

Mối quan tâm chính của chúng tôi là rút ngắn thời gian dữ liệu được tải lên và hiển thị trực quan từ trình sắp xếp thứ tự.

Để giữ mọi thứ nhanh nhất có thể từ phía máy khách, chúng tôi đã triển khai bảng điều khiển động với  D3.js , bảng điều khiển này thăm dò định kỳ cơ sở dữ liệu để tìm dữ liệu mới và cập nhật  trực quan hóa biểu đồ Sunburst  tương ứng.

Ngăn xếp công nghệ của chúng tôi

Ngăn xếp công nghệ:

 • JAPSA , Gói Java để phân tích trình tự.
 • TensorFlow , một thư viện nguồn mở để đào tạo thuật toán ML
 • Chiron Base Caller  để dịch tín hiệu nanopore thô
 • Các tiện ích của Samtools  để tương tác và xử lý hậu kỳ chuỗi DNA ngắn đọc sắp xếp theo định dạng SAM, BAM và CRAM
 •  Thuật toán BWA MEM để thực hiện căn chỉnh cục bộ
 • Minimap2 , một chương trình căn chỉnh trình tự linh hoạt để căn chỉnh trình tự DNA hoặc mRNA dựa trên cơ sở dữ liệu tham khảo lớn.

Công cụ đám mây của Google:

 • Google Cloud Storage  để lưu trữ và truy cập dữ liệu
 • Google Cloud PubSub  để gửi và nhận tin nhắn giữa các thành phần ứng dụng với độ trễ thấp với khả năng mở rộng theo yêu cầu
 • Google FireStore  để lưu trữ, đồng bộ hóa và truy vấn dữ liệu
 • Google Cloud Dataflow  để đơn giản hóa quá trình phát triển đường truyền dữ liệu trực tuyến với độ trễ dữ liệu thấp hơn
 • Apache Beam  để xác định và thực thi quy trình xử lý dữ liệu
 • Thư viện trực quan hóa dữ liệu D3  để tạo trực quan hóa dữ liệu động, tương tác trong trình duyệt web
 • JavaScript  để xây dựng Trực quan hóa dữ liệu

Thành phần đội

 • 2 kỹ sư dữ liệu
 • 1 Kỹ sư DevOps
 • 1 Nhà phát triển web

Kết quả và triển vọng

Chúng tôi đã phát triển trình sắp xếp trình tự DNA Nanopore giúp giảm đáng kể thời gian tạo dữ liệu trình tự DNA. Giờ đây, các chuyên gia y tế và kỹ sư bộ gen có thể nhận dữ liệu trình tự được tạo từ các mẫu (bệnh nhân, nhà máy xử lý nước thải hoặc cánh đồng trồng trọt) trong vòng vài phút.

Tiềm năng giải trình tự nanopore rất hứa hẹn. Nền tảng giải trình tự nanopore thời gian thực mà chúng tôi đã phát triển có tác động đáng kể đến chẩn đoán phân tử bệnh ở người, đặc biệt là nhiễm trùng huyết. Cùng với nhóm  Google Cloud Platform , chúng tôi đã tạo một bộ mã nguồn mở gồm các gói trình sắp xếp nanopore có sẵn trên  GitHub .

Dự án này chỉ là khởi đầu của sự hợp tác hiệu quả.

Một lần, Allen Day đến thăm văn phòng của chúng tôi ở Kyiv để tổ chức một buổi gặp mặt về Khoa học dữ liệu khá thành công giữa các nhà khoa học dữ liệu và kỹ sư dữ liệu.

 

Sau một năm làm việc với Allen và nhóm GCP, Giám đốc điều hành của chúng tôi, Pavel Tantsiura đã đến thăm văn phòng của Google tại Singapore để ký kết quan hệ đối tác chính thức với Google và The APP Solutions, đồng thời thảo luận về một dự án sắp tới.

Hiện tại, chúng tôi đang hợp tác với Allen trong dự án PopGen trong lĩnh vực Genomics nhằm xử lý các quần thể bộ gen. Các thư mục của dự án với các mẫu lúa và bộ gen người có sẵn trên kho lưu trữ GitHub .

CÁC ĐỐI TÁC TIÊU BIỂU CỦA SENTO APP
Họ đã khảo sát thực tế tại công ty chúng tôi và bị thuyết phục bởi chất lượng dịch vụ chuyên nghiệp và chi phí đầu tư hợp lý!
Curves for women Curves for women
Ajinomoto Ajinomoto
Milano coffee Milano coffee
Newhope singapore Newhope singapore
29 Foods 29 Foods
PARISGATEAUX PARISGATEAUX
 Panasonic e-Service Panasonic e-Service
Beone Beone
Pronest Pronest
 Cchat Cchat
Weeky Weeky
Sapp Việt Nam

ĐỐI TÁC VỮNG MẠNH, HỢP TÁC BỀN VỮNG TRƯỜNG TỒN

Chuyên gia tư vấn của chúng tôi sẽ luôn có giải pháp cho bạn! Vui lòng liên hệ tại khu vực của bạn.

Điện thoại: 0904.344.888

Email: support@sapp.vn

Khu vực miền Bắc

♦ Địa chỉ 1: P280 – Toà nhà Sholega 275 Lạch Tray – Ngô Quyền – Hải Phòng

♦ Địa chỉ 2: Tầng 12 Toà nhà Licogi 13 – 164 Khuất Duy Tiến – Thanh Xuân – Hà Nội

DMCA.com Protection Status

Thiết kế App Bán hàng

Thiết kế App Bất động sản

Thiết kế App Tài chính - Tín dụng

Thiết kế App quản lý

Khu vực miền Nam

♦ Địa chỉ 2: Số 88 Đường Bạch Đằng, Phường 2, Quận Tân Bình – TP. Hồ Chí Minh

Hồ Sơ Năng Lực
.
.
.
.