SỞ KHOA HỌC VÀ CÔNG NGHỆ
THÀNH PHỐ HỒ CHÍ MINH

Đề xuất giải pháp hạ tầng tính toán hiệu năng cao liên kết và chia sẻ triển khai tại TPHCM

19-06-2023

Các nhà khoa học tại Trường Đại học Bách Khoa khuyến nghị TP.HCM cần quyết tâm và đi đầu trong phát triển hạ tầng tính toán hiệu năng cao liên kết và chia sẻ xứng tầm với vai trò đầu tàu kinh tế trong nước, sẵn sàng cho việc hợp tác và cạnh tranh với các thành phố khác trong khu vực và thế giới.

Từ năm 2012 đến nay, lĩnh vực trí tuệ nhân tạo (Artificial Intelligence - AI) phát triển vượt bậc với giải pháp tiên tiến về học máy (Machine Learning - ML) và học sâu (Deep Learning - DL). Bài toán về AI trong ML và đặc biệt là DL cần một khối lượng tính toán rất lớn vì dựa trên mô hình mạng nơ-ron nhiều cấp.

Không chỉ riêng các ứng dụng khoa học, rất nhiều ứng dụng trong công nghiệp đã và đang phát triển ngày càng lớn hơn, phức tạp hơn mà việc thực thi chúng trên các máy tính thông thường là không khả thi bởi vì các ràng buộc về thời gian, mà phải dùng hệ thống máy tính hiệu năng cao (HPC) có khả năng tính toán số học mạnh, đồng thời còn phải mạnh về xử lý dữ liệu lớn (Big Data). Tính toán hiệu năng cao dần trở thành lĩnh vực đóng vai trò cực kỳ quan trọng trong việc thúc đẩy quá trình nghiên cứu khoa học, đặc biệt là các lĩnh vực khoa học hiện đại như khoa học vũ trụ, khoa học sinh học phân tử, khoa học hạt nhân...

Hiện nay, việc phát triển và nghiên cứu các hệ thống tính toán hiệu năng cao không chỉ còn gói gọn trong phạm vi của các nước phát triển, mà đã trở thành xu thế chung mang tính chất toàn cầu. Những lợi ích mà hệ thống HPC đem lại có sức ảnh hưởng cực kỳ lớn tới sự phát triển của con người và của toàn xã hội trong cả hiện tại lẫn và tương lai. Chỉ so riêng trong khu vực Đông Nam Á, Việt Nam hoàn toàn đi sau Singapore, Thái Lan, Indonesia, Malaysia trong lĩnh vực tính toán hiệu năng cao, đó là vì chưa có trung tâm siêu máy tính/tính toán hiệu năng cao ở cấp quốc gia. Đây là điều đáng lo khi mà các hệ thống tính toán mạnh và lưu trữ lớn kết hợp với hạ tầng mạng băng thông rộng được xem hạ tầng thông tin quan trọng trong nền công nghiệp số.

NV-20-H1.jpg

Kiến trúc tổng thể của hệ thống máy tính hiệu năng cao

Kết quả khảo sát các đơn vị, tổ chức, doanh nghiệp tại TP.HCM của nhóm thực hiện nhiệm vụ khoa học - công nghệ “Nghiên cứu và đề xuất thiết kế hạ tầng tính toán hiệu năng cao phục vụ cho TP.HCM (SuperNode-AI-22)” cho thấy toàn thành phố có khoảng chưa đến 10 hệ thống với sức mạnh tính toán dưới 100 TFlops cho HPC (64bit) và dưới 1 PFlops cho AI (16bit). Ngoài ra, khối viện - trường tuy đã đầu tư một số hệ thống tính toán hiệu năng cao nhưng hiện tại đều yếu, thậm chí có nhiều hệ thống máy tính mạnh nhưng rời rạc nên tính hiệu quả còn kém và không thể "giải" các bài toán lớn. Khối doanh nghiệp như Vingroup, VNPT, Viettel tuy có hạ tầng tính toán riêng nhưng không đặt TP.HCM, lại không thể chia sẻ cho doanh nghiệp khác.

"Trong những năm qua, nhóm ứng dụng liên quan đến khoa học và kỹ thuật tính toán được phát triển mạnh với việc hình thành các trung tâm - phòng thí nghiệm về khoa học và kỹ thuật tính toán, trí tuệ nhân tạo ở nhiều lĩnh vực khác nhau trong cả nước", PGS.TS Thoại Nam (chủ nhiệm nhiệm vụ) phân tích, "Tuy nhiên, các nhóm này thường giải bài toán ở quy mô nhỏ và đôi khi chạy bài toán với kích thước lớn ở các hệ thống máy tính mạnh ở nước ngoài vì trong nước chưa có hệ thống máy tính đủ lớn".

Do đó, việc đầu tư hạ tầng tính toán hiệu năng cao phục vụ hệ sinh thái trí tuệ nhân tạo bao gồm nghiên cứu và ứng dụng trí tuệ nhân tạo phục vụ các cơ quan, đơn vị và các cơ sở đào tạo, nghiên cứu về trí tuệ nhân tạo tại TP.HCM là rất cần thiết, hướng đến ứng dụng trí tuệ nhân tạo giải quyết các bài toán lớn của thành phố, thúc đẩy phát triển nghiên cứu khoa học và hỗ trợ sản xuất công nghiệp.

NV-20-H2.jpg

Mô hình hệ thống SuperNode-XP với các node tính toán

Các quốc gia ở châu Âu chia hệ thống tính toán hiệu năng cao thành 3 lớp (Tier):

− Lớp 1 (Tier-1): Lớp này bao gồm những hệ thống máy tính hiệu năng cao rất mạnh đặt tại các trung tâm tính toán hiệu năng cao (siêu máy tính) cấp quốc gia. Những hệ thống này cũng tham gia vào mạng lưới tính toán hiệu năng cao của châu Âu.

− Lớp 2 (Tier-2): Lớp này bao gồm những hệ thống máy tính hiệu năng cao mạnh đặt tại các trung tâm tính toán hiệu năng cao đóng vai trò liên kết và phục vụ cho một khu vực (specialist hubs).

− Lớp 3 (Tier-3): Lớp này bao gồm những hệ thống máy tính hiệu năng cao trung bình và nhỏ thuộc các đơn vị như trường, viện nghiên cứu, doanh nghiệp.

Ở cấp quốc gia thì họ thành lập các tổ chức liên minh về tính toán hiệu năng cao để kết nối các hệ thống ở cả ba lớp 1,2 và 3 như Liên minh Gauss (Gauss Alliance).

PGS.TS Thoại Nam khẳng định: “Từ bài học của các nước phát triển, chúng ta cần phát triển một hạ tầng tính toán hiệu năng cao kết nối và chia sẻ cho người sử dụng đầu cuối. Việc này giúp thành phố huy động được nguồn lực của nhiều đơn vị kể cả doanh nghiệp cùng tham gia đầu tư để giải quyết bài toán của của chính họ đồng thời chia sẻ cũng như sử dụng nguồn lực của đơn vị khác khi có bài toán toán. Một hạ tầng tính toán hiệu năng cao kết nối và chia sẻ mang lại lợi ích cho tất cả các đơn vị cùng tham gia.”.

NV-20-H3.jpg

Sơ đồ hạ tầng tính toán hiệu năng cao liên kết và chia sẻ cho TP.HCM

Dựa trên kinh nghiệm phát triển hạ tầng tính toán của một số nước cũng như xu thế phát triển và hợp tác trên thế giới, nhóm các nhà khoa học tại Trường Đại học Bách Khoa gợi ý việc phát triển hạ tầng tính toán hiệu năng cao liên kết và chia sẻ ở TP.HCM nên chia thành 3 giai đoạn:

  • Giai đoạn 1 - Xây dựng và phát triển hạ tầng tính toán hiệu năng cao liên kết và chia sẻ của Thành phố (Lớp 2). Hạ tầng này không thể thành công nếu không có một trung tâm tính toán hiệu năng cao chủ lực đóng vai trò trung tâm kết nối (specialist hub) và đáp ứng nhu cầu khai thác tài nguyên của người sử dụng khi các nút tính toán ở Lớp 3 quá tải hay không đủ năng lực tính toán. TP.HCM nên xem xét đầu tư một Trung tâm tính toán hiệu năng cao xứng tầm để đảm trách vai trò này và phục vụ cho chương trình nghiên cứu phát triển trí tuệ nhân tạo, đô thị thông minh, chuyển đổi số… Việc này cũng giúp Thành phố đi đầu trong cung cấp hạ tầng tính toán hiệu năng cao kết nối và chia sẻ để thúc đẩy phát triển nghiên cứu khoa học và công nghệ, hỗ trợ doanh nghiệp nâng cao năng lực cạnh tranh.
  • Giai đoạn 2 - Xây dựng và phát triển hạ tầng tính toán hiệu năng cao quốc gia. Trong bối cảnh cạnh tranh toàn cầu thì Việt Nam phải phát triển hạ tầng tính toán hiệu năng cao liên kết và chia sẻ cấp quốc gia, do đó một vài trung tâm tính toán hiệu năng cao ở Lớp 1 sẽ được đầu tư. Đây là thời điểm để TP.HCM đầu tư nâng cấp trung tâm tính toán hiệu năng cao từ Lớp 2 lên Lớp 1. Kinh nghiệm và giải pháp phát triển ở thành phố có thể nâng cấp và ứng dụng ở cấp quốc gia. Thành phố cũng là đầu tàu trong phát triển và sử dụng hạ tầng tính toán hiệu năng cao.
  • Giai đoạn 3 - Tham gia hạ tầng tính toán hiệu năng cao khu vực và quốc tế. Hiện tại trong khu vực thì Singapore, Thái Lan, Indonesia, Malaysia đang đẩy mạnh phát triển hạ tầng tính toán hiệu năng cao. Các tổ chức liên kết học thuật về tính toán hiệu năng cao cũng hình thành. Do đó, việc hình thành một liên minh hạ tầng tính toán hiệu năng cao trong khu vực Đông Nam Á nói riêng và châu Á nói chung là tất yếu. Khi chúng ta đã phát triển hạ tầng tính toán hiệu năng cao ở Giai đoạn 2 thì bước sang Giai đoạn 3 dễ dàng hơn.

Đầu tư vào hệ thống HPC khá tốn kém, đòi hỏi phải nâng cấp và thay thế thường xuyên để duy trì tính cạnh tranh cũng như theo kịp những tiến bộ trong công nghệ. Điều này tạo ra một thách thức đối với các tổ chức, đơn vị trong việc duy trì hoặc tái đầu tư hệ thống HPC nhằm đảm bảo hệ thống HPC vẫn hoạt động hiệu quả. Ở những nước khác, các trung tâm tính toán hiệu năng cao chủ lực đóng vai trò trung tâm kết nối (specialist hub) ở Lớp 2 đều do Nhà nước đầu tư. Do đó, Thành phố cần xem xét đầu tư một Trung tâm tính toán hiệu năng cao (Trung tâm) có khả năng liên kết và chia sẻ nhằm nâng cao năng lực khoa học và kỹ thuật, giải quyết các bài toán lớn, phục vụ phát triển kinh tế, xã hội và các chương trình lớn như Nghiên cứu phát triển trí tuệ nhân tạo, Đô thị thông minh, Chuyển đổi số…

"Điều quan trọng là đảm bảo Trung tâm có đủ thẩm quyền tiếp nhận đầu tư liên tục từ mua sắm trang thiết bị theo dự án và định kỳ hằng năm, khấu hao thiết bị, chi phí hoạt động thường xuyên và phát triển đội ngũ nhân sự. Ngoài ra, Trung tâm có thể triển khai các hoạt động hoặc dịch vụ có thu, nhưng phải đảm bảo ở mức thấp, nhằm hỗ trợ cho hoạt động nghiên cứu phát triển từ hàn lâm đến công nghiệp", đại diện nhóm triển khai nhiệm vụ nhấn mạnh.

NV-20-H4.jpeg

Đầu tư vào hệ thống HPC khá tốn kém, đòi hỏi phải nâng cấp và thay thế thường xuyên

Cùng với đó, TP.HCM cũng cần phát triển liên minh hạ tầng tính toán hiệu năng cao liên kết và chia sẻ ở Lớp 3, bao gồm các hệ thống HPC ở những tổ chức, doanh nghiệp trên địa bàn Thành phố. Thành phố có thể chọn những trường – viện (như Đại học Bách Khoa, Đại học Khoa học và Tự nhiên, Đại học CNTT, Đại học Quốc tế…) có thế mạnh về tính toán hiệu năng cao đóng vai trò nút chủ lực trong liên minh này. Liên minh hạ tầng tính toán hiệu năng cao của Thành phố cũng có thể mở rộng cho các đơn vị, doanh nghiệp bên ngoài. Tuy nhiên việc sử dụng tài nguyên của các đơn vị, doanh nghiệp phải có cùng mục tiêu phát triển thì liên minh mới vững mạnh. Việc có nhiều thành viên từ nhiều vùng khác nhau cũng nên được xem xét và cân nhắc.

Việc phát triển một hệ thống tính toán hiệu năng cao đáp ứng nhu cầu tính toán về hiệu năng cao, phân tích dữ liệu lớn và chạy các bài toán về trí tuệ nhân tạo đặt ra các bài toán khó cần giải quyết. Xây dựng một hệ thống máy tính mạnh không chỉ đơn giản là mua sắm phần cứng mà cần một lộ trình từ thiết kế kiến trúc phần cứng và phần mềm, quy chế vận hành, tái đầu tư cho đến phát triển nhân lực vận hành và hỗ trợ khai thác hệ thống máy tính mạnh và tập huấn cho người sử dụng.

Là một phần của nhiệm vụ, nhóm triển khai cũng đề xuất cấu hình phần cứng, giải pháp lưu trữ, giải pháp phần mềm, giải pháp vận hành cùng giải pháp đào tạo và phát triển nhân sự vận hành - hỗ trợ phát triển ứng dụng cho mô hình hệ thống tính toán hiệu năng cao liên kết và chia sẻ, nhằm đáp ứng cả 3 mô-đun về tính toán hiệu năng cao, phân tích dữ liệu lớn và tính toán về trí tuệ nhân tạo.

Theo PGS.TS Thoại Nam, giải pháp sử dụng dịch vụ điện toán đám mây hiệu năng cao (HPC Cloud) giúp giảm thiểu rủi ro đầu tư và vận hành. Do xét đến vấn đề an ninh thông tin nên nếu có đơn vị đủ năng lực để cung cấp HPC Cloud từ phần cứng đến phần mềm theo yêu cầu của nhà đầu tư, và có thể triển khai tại thành phố, thì cũng là lựa chọn nên xem xét.

NV-20-H5.png

 Một mô hình HPC Cloud

Có thể khẳng định rằng, kết quả của nhiệm vụ khoa học - công nghệ do PGS.TS Thoại Nam và các cộng sự hoàn thiện đã cho thấy một bức tranh toàn diện và cái nhìn sâu hơn về việc phát triển hạ tầng tính toán hiệu năng cao cho TP.HCM trong ngắn hạn và dài hạn. Theo đó, các bài toán liên quan đến chiến lược hệ thống tính toán hiệu năng cao, đào tạo nhân lực, xây dựng liên minh về tính toán hiệu năng cao một khi được xem xét và phát triển thì thành phố sẽ có điều kiện thuận lợi để thúc đẩy phát triển nhiều lĩnh vực khác, vì hầu hết đều cần đến hạ tầng tính toán hiệu năng cao.

Thông tin liên hệ:
Trường Đại học Bách Khoa (ĐHQG TP.HCM)
Địa chỉ: 268 Lý Thường Kiệt, Quận 10, TP.HCM
Điện thoại: 0918352226 - (082) 38647256 (ext: 5850)

E-mail: namthoai@hcmut.edu.vn

Website: www.hcmut.edu.vn


Bản quyền © 2018 Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh
Thiết kế và phát triển bởi HCMGIS
Tổng số truy cập: 11537353