SKĐS - Các nhà khoa học Việt Nam đã ứng dụng khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số để 'chống trời' bằng sức mạnh tri thức. Họ biến điều tưởng bất khả thi thành hiện thực và đưa nó đến tay người dân với kết quả dự báo bão chính xác hơn, "treo nước giữa trời" trên cao nguyên đá, cảnh báo sạt lở.
SKĐS - Từ những con số khô khan, bản đồ mưa gió và dữ liệu áp suất, các nhà khoa học đã "thổi hồn" công nghệ vào dự báo bão – lĩnh vực vốn luôn gắn với những quyết định sinh tử của hàng triệu người dân.
Công trình "Enhancing tropical cyclone intensity forecasting over the Bien Dong Sea with foundation model and prompt tuning" do Trung tâm Dự báo Khí tượng Thủy văn Quốc gia phối hợp cùng Viện Nghiên cứu và Ứng dụng Trí tuệ nhân tạo AI4LIFE thực hiện, đánh dấu một bước ngoặt quan trọng trong hành trình ứng dụng AI vào dự báo bão trên Biển Đông – vùng biển được xem là "tâm bão" của châu Á - Thái Bình Dương. Kết quả nghiên cứu mới vừa được công bố trên tạp chí Engineering Applications of Artificial Intelligence (Elsevier) vào tháng 10/2025.
"Mục tiêu của chúng tôi là cải thiện độ chính xác trong dự báo cường độ bão trên Biển Đông – một trong những thách thức lớn nhất của ngành khí tượng thủy văn,"
PGS.TS Mai Văn Khiêm, Giám đốc Trung tâm Dự báo Khí tượng Thủy văn Quốc gia, mở đầu câu chuyện bằng một khát vọng giản dị nhưng đầy quyết tâm.
Dự báo viên phân tích bản đồ thời tiết trên máy tính. Ảnh: Lê Xuân Tùng
Từ trước đến nay, dự báo bão là một trong những bài toán khó nhất của khí tượng hiện đại. Dù có trong tay các mô hình số trị mạnh, các siêu máy tính tính toán hàng tỷ điểm dữ liệu mỗi ngày, song cường độ bão – tức sức mạnh thực của nó khi di chuyển – vẫn thường là ẩn số khó lường. Chỉ cần sai lệch 10–20% trong dự báo cường độ, hệ quả ứng phó thực địa có thể hoàn toàn khác biệt.
Từ thực tế đó, nhóm nghiên cứu Việt Nam đã phát triển mô hình CIFOMI (Cyclone Intensity Forecasting with Foundation Model and Prompt Tuning) – sự kết hợp giữa mô hình nền tảng (foundation model) và kỹ thuật tinh chỉnh gợi ý (prompt tuning). Đây là hướng tiếp cận mới mẻ, tận dụng sức mạnh của học sâu toàn cầu và tinh chỉnh để phù hợp với đặc trưng dữ liệu bão ở khu vực Biển Đông.
"CIFOMI giúp giảm sai số dự báo cường độ bão trong 24 giờ từ 10–20% so với kết quả ban đầu. Quan trọng hơn, nó mở ra cách tiếp cận mới cho các nhà khí tượng – kết hợp mô hình truyền thống và AI để hình thành hệ thống dự báo tổ hợp thông minh," PGS Khiêm nhấn mạnh.
PGS.TS Mai Văn Khiêm (áo kẻ đứng) chỉ đạo công tác dự báo tại Trung tâm Dự báo Khí tượng Thủy văn Quốc gia.
Theo PGS.TS Mai Văn Khiêm, điểm đặc biệt của CIFOMI là khả năng "học" từ mô hình nền tảng toàn cầu nhưng chỉ cần tinh chỉnh một phần nhỏ tham số để thích ứng nhanh với điều kiện riêng của Biển Đông – nơi có đặc điểm địa hình, nhiệt độ mặt biển và hoàn lưu gió phức tạp.
Đây cũng là nghiên cứu đầu tiên ở Việt Nam áp dụng kỹ thuật tinh chỉnh gợi ý vào dự báo cường độ bão – một bước tiến giúp huấn luyện mô hình hiệu quả ngay cả khi dữ liệu còn hạn chế, đồng thời giảm đáng kể thời gian và chi phí tính toán.
Trong nghiên cứu này, nhóm sử dụng hai nguồn dữ liệu chính: dữ liệu "best track" (là dữ liệu chính xác về bão trong quá khứ) từ Trung tâm Khí tượng Nhật Bản (RSMC Tokyo Typhoon Center), làm dữ liệu quan trắc chuẩn để đánh giá, và dữ liệu mô hình số (NWP) từ Trung tâm Dự báo Thời tiết hạn vừa Châu Âu (ECMWF). Đây là hai nguồn dữ liệu then chốt để huấn luyện và kiểm định khả năng dự báo cường độ bão trên khu vực Biển Đông.
PGS.TS Mai Văn Khiêm, Giám đốc Trung tâm Dự báo Khí tượng Thủy văn Quốc gia.
Do đặc thù của mô hình nền tảng có quy mô lớn, quá trình huấn luyện yêu cầu năng lực tính toán cao. Nhóm đã khắc phục bằng cách tối ưu quy trình tiền xử lý và triển khai huấn luyện trên các máy chủ GPU chuyên dụng của Trung tâm, đảm bảo quá trình tính toán ổn định và hiệu quả.
"Nhờ cách thiết kế này, mô hình đạt độ chính xác cao hơn 30–35% so với mô hình số trị truyền thống, đặc biệt ở hạn dự báo ngắn 24–48 giờ," ông Khiêm cho biết.
Kết quả ấy không chỉ mang ý nghĩa khoa học mà còn khẳng định năng lực làm chủ công nghệ AI của các nhà nghiên cứu Việt Nam – khi họ có thể phát triển thuật toán riêng, tối ưu hóa hệ thống phù hợp với điều kiện dữ liệu trong nước, chứ không chỉ dựa vào công cụ nước ngoài.
PGS.TS Nguyễn Phi Lê, Viện Nghiên cứu và Ứng dụng Trí tuệ nhân tạo AI4LIFE:
"Việc dùng các mô hình nền tảng là cách làm tự nhiên mà những người trong ngành AI sẽ nhìn thấy. Tuy nhiên, cái khó ở đây là, không phải mô hình nền tảng nào cũng có thể dùng được, phải chọn được đúng mô hình nền tảng phù hợp nhất với dữ liệu của bài toán là vấn đề thứ nhất; tiếp theo, phải thiết kế thuật toán tinh chỉnh như thế nào để tinh chỉnh mô hình nền tảng một cách hiệu quả cũng là một bài toán khó. Tất cả những câu hỏi này, chỉ có thể giải quyết được nếu có đủ kiến thức chuyên sâu và kinh nghiệm trong lĩnh vực này".

Nếu PGS Khiêm là người "đặt hàng bài toán" thì PGS.TS Nguyễn Phi Lê, Viện trưởng AI4LIFE (Đại học Bách khoa Hà Nội), là người "giải mã" nó bằng ngôn ngữ của máy học.
PGS.TS Nguyễn Phi Lê chia sẻ: "Khi tiếp cận với bài toán dự đoán cường độ bão thì chúng tôi nhận thấy thách thức là ở chỗ: dữ liệu liên quan tới bão là dữ liệu rất nhiều chiều (hơn 80 trường khí tượng), và số lượng dữ liệu lại ít (mỗi năm số lượng cơn bão chỉ tính hàng chục).
Trong lĩnh vực học máy, học sâu, chúng tôi đều biết rằng, để xử lý dữ liệu càng nhiều chiều thì chúng ta càng phải dùng mô hình có kích thước lớn. Mà để huấn luyện mô hình có kích thước càng lớn thì càng phải dùng nhiều dữ liệu. Nó giống như bạn muốn giải một bài toán phức tạp thì bạn phải được dạy nhiều kiến thức hơn, sử dụng nhiều tài liệu để học hơn.
Thế nhưng bài toán dự báo cường độ bão này là đi ngược lại với nguyên tắc này. Vì vậy, nếu chúng ta sử dụng các mô hình thông thường (mô hình nhỏ), và các cách huấn luyện mô hình thông thường (huấn luyện mô hình từ đầu), thì mô hình sẽ khó đạt độ chính xác cao.
Vì vậy, chúng tôi lựa chọn tận dụng mô hình nền tảng và kỹ thuật tinh chỉnh dùng prompt. Đây chính là điểm khác biệt lớn nhất của CIFOMI so với các phương pháp của các nhóm khác hiện nay.
Nhờ cách tiếp cận này, CIFOMI vừa kế thừa được tri thức phong phú của các mô hình nền tảng, vừa khắc phục được bài toán dữ liệu thưa. Kết quả thực nghiệm cho thấy phương pháp này giúp cải thiện 11,8% độ chính xác so với mô hình học sâu thông thường, và prompt tuning tiếp tục mang lại thêm 9,3% cải thiện trong bối cảnh dữ liệu bão khu vực Biển Đông còn hạn chế".
"AI4LIFE chịu trách nhiệm phát triển mô hình học sâu, xử lý dữ liệu và tối ưu thuật toán; Trung tâm Dự báo Khí tượng Thủy văn Quốc gia cung cấp dữ liệu thô, đồng thời phối hợp phân tích, đánh giá kết quả. Hai bên cùng làm việc như một nhóm thống nhất, vì mục tiêu cuối cùng là cảnh báo sớm, cứu người dân khỏi rủi ro thiên tai," TS Lê nói.
Đó chính là sức mạnh của đổi mới sáng tạo – khi khoa học dữ liệu và khí tượng học cùng "nói chung một ngôn ngữ", tạo nên mô hình dự báo vừa chính xác vừa có khả năng học hỏi liên tục từ dữ liệu thực tế.
Kết quả cho thấy CIFOMI đạt độ chính xác cao hơn rõ rệt so với mô hình số trị truyền thống, đặc biệt ở các hạn dự báo ngắn. Cụ thể, ở hạn 24 giờ, sai số trung bình giảm khoảng 34,8%, và ở hạn 48 giờ giảm khoảng 30.6% so với sản phẩm HRES của ECMWF.
Trong giai đoạn tới, nhóm đang tiếp tục mở rộng mô hình cho hạn dự báo xa hơn, lên đến 72 giờ, nhằm kiểm chứng khả năng tổng quát hóa của CIFOMI trong các điều kiện khí quyển khác nhau trên khu vực Biển Đông.
Từng đoạt huy chương bạc tại kỳ thi Olympic Toán học quốc tế (IMO) năm 2000, một trong 11 nữ sinh của Việt Nam đoạt huy chương trong lịch sử, sinh viên chương trình tài năng của ĐH Bách khoa Hà Nội, sinh viên xuất sắc của ĐH Tokyo và Viện Tin học quốc gia Nhật Bản, PGS.TS Nguyễn Phi Lê (42 tuổi), hiện đang đảm nhận vị trí điều hành Viện Nghiên cứu và ứng dụng trí tuệ nhân tạo (AI4LIFE) và là giảng viên Trường Công nghệ thông tin và truyền thông, ĐH Bách khoa Hà Nội.

PGS. TS Nguyễn Phi Lê chia sẻ, AI4LIFE đang hợp tác chặt chẽ với trung tâm dự báo khí tượng thủy văn và các chuyên gia AI người Việt trên khắp thế giới để giải quyết các bài toán ứng dụng AI trong nhiều công đoạn của nghiệp vụ dự báo khí tượng thủy văn như: dự báo thời tiết, mưa bão lũ lụt, mực nước, ….
"Mong muốn của chúng tôi, và cũng là định hướng dài hạn là kết hợp cùng các chuyên gia AI và khí tượng thủy văn để xây dựng một mô hình nền tảng về dữ liệu khí tượng thủy văn cho riêng Việt nam. Từ cơ sở dó, có thể xây dựng một hệ thống ứng dụng AI toàn trình cho trung tập dự báo khí tượng thủy văn quốc gia", PGS.TS Nguyễn Phi Lê nói.
Theo PGS.TS Mai Văn Khiêm, để AI hoạt động hiệu quả, "nguồn nhiên liệu" của nó chính là dữ liệu. Mà trong khí tượng, dữ liệu lại đặc biệt phức tạp – đa tầng, đa thời gian, đa nguồn, từ trạm quan trắc mặt đất, vệ tinh, radar, đến mô hình số trị toàn cầu.
"Chúng tôi đang phối hợp với các viện nghiên cứu và doanh nghiệp công nghệ để xây dựng hệ thống dữ liệu và nền tảng tính toán mạnh, đáp ứng yêu cầu của các mô hình AI thế hệ mới," GS Khiêm cho biết.
Dự báo viên Trung tâm Dự báo KTTV vận hành khai thác hệ thống smatmet phục vụ cho việc ra bản tin dự báo, cảnh báo thiên tai nguy hiểm
Trung tâm Dự báo Khí tượng Thủy văn Quốc gia hiện đang từng bước chuẩn hóa dữ liệu theo hướng "mở – đồng bộ – có thể học được". Dữ liệu khí tượng trong quá khứ, vốn được lưu trữ rời rạc, đang được số hóa và tích hợp để phục vụ cho huấn luyện mô hình. Đây là một bước chuyển chiến lược trong chuyển đổi số ngành khí tượng.
Ở góc độ AI, PGS.TS Nguyễn Phi Lê cho rằng, Việt Nam đang có một lợi thế lớn:
"Nguồn dữ liệu khí tượng trong quá khứ rất dồi dào và đã được số hóa, đây chính là tài nguyên quý để phát triển các mô hình AI hiệu quả trong tương lai. Cái chúng ta cần là đầu tư bài bản vào hạ tầng tính toán và nguồn lực chuyên gia."
PGS.TS Nguyễn Phi Lê ví hạ tầng dữ liệu như "đất trồng", còn AI là "hạt giống". Nếu đất đủ màu mỡ, AI sẽ tự học, tự phát triển, tự tối ưu – giống như một cánh rừng tri thức đang lớn lên từ dữ liệu Việt Nam.
"Thách thức lớn nhất theo tôi là ngân sách: bao gồm ngân sách cho hạ tầng tính toán và ngân sách cho những người tham gia thực hiện các nghiên cứu ứng dụng AI trong khí tượng thủy văn.
Chúng tôi tự tin rằng các chuyên gia AI tại Viện AI4LIFE cũng như các nhà khoa học cộng tác với chúng tôi trên khắp thế giới hoàn toàn đủ khả năng và luôn cập nhật những công nghệ mới nhất để giải quyết các bài toán đặt ra.
Tuy vậy, vấn đề lớn là làm sao để có thể có được các chương trình lớn, đầu tư một cách toàn diện và bài bản để ứng dụng AI trong khí tượng thủy văn? Từ trước tới giờ không phải là chúng ta chưa từng đầu tư, nhưng các dự án từ trước tới giờ tương đối nhỏ lẻ và manh mún, thiếu một kiến trúc tổng thể cho toán bộ hệ thống. Vì vậy, các kết quả nghiên cứu trước đây ít có tính ứng dụng. Do đó, theo tôi, điều quan trọng nhất là cần phải có sự đầu tư đề thực hiện những chương trình nghiên cứu lớn, toàn diện về ứng dụng AI trong khí tượng thủy văn", PGS.TS Nguyễn Phi Lê nói.
"Những năm gần đây, sự phát triển mạnh mẽ của công nghệ, đặc biệt là trí tuệ nhân tạo (AI) và các mô hình số hiện đại, đã tạo ra thay đổi căn bản trong quy trình làm việc của dự báo viên khí tượng thủy văn. Nếu như trước đây, phần lớn công việc của dự báo viên dựa vào thao tác thủ công – như xử lý số liệu, vẽ bản đồ, phân tích synop, đối chiếu các mô hình – thì nay, một số công đoạn đã được tự động hóa và số hóa hoàn toàn", PGS.TS Mai Văn Khiêm.
Theo PGS.TS Mai Văn Khiêm, trong 5–10 năm tới, trí tuệ nhân tạo sẽ là trụ cột của công tác dự báo và cảnh báo sớm thiên tai ở Việt Nam.
"Tôi cho rằng trong 5–10 năm tới, công nghệ và trí tuệ nhân tạo (AI) sẽ đóng vai trò ngày càng quan trọng trong công tác dự báo và cảnh báo sớm thiên tai ở Việt Nam cũng như trên thế giới. Ngành Khí tượng thủy văn đang từng bước chuyển từ phương thức dự báo truyền thống sang một hệ thống dự báo hiện đại, tự động và thông minh hơn, nơi dữ liệu, mô hình số và AI được kết hợp chặt chẽ", ông Khiêm nói.
Mục tiêu lâu dài là xây dựng hệ thống dự báo thông minh, có khả năng cung cấp thông tin chi tiết theo từng vùng, từng nhóm đối tượng — như ngư dân trên biển, người dân vùng núi dễ sạt lở hay khu vực đô thị dễ ngập. Khi đó, mỗi bản tin không chỉ dừng ở mức "thời tiết ngày mai sẽ như thế nào", mà còn hướng tới dự báo tác động theo khuyến cáo của Tổ chức Khí tượng thế giới, đó là "rủi ro ở đâu, mức độ ra sao và cần hành động thế nào".
Trong 5–10 năm tới, trí tuệ nhân tạo sẽ là trụ cột của công tác dự báo và cảnh báo sớm thiên tai ở Việt Nam.
Để đạt được điều này, cần sự đầu tư đồng bộ về dữ liệu, hạ tầng công nghệ và con người, cùng với sự hợp tác chặt chẽ giữa cơ quan dự báo, viện nghiên cứu, doanh nghiệp công nghệ và địa phương. Trung tâm Dự báo Khí tượng Thủy văn Quốc gia hiện đang chủ động phối hợp với các đơn vị trong và ngoài nước để thử nghiệm các mô hình AI trong dự báo bão, mưa lớn,… tiến tới tích hợp vào hệ thống dự báo nghiệp vụ.
Trong khi đó, PGS.TS Nguyễn Phi Lê tin rằng những mô hình như CIFOMI mới chỉ là bước khởi đầu cho hệ sinh thái dự báo thông minh mà Việt Nam có thể tự xây dựng.
"Chúng tôi đặt mục tiêu hợp tác lâu dài với Trung tâm Dự báo Khí tượng Thủy văn Quốc gia và các chuyên gia Việt Nam trên toàn cầu, để phát triển một mô hình nền tảng AI cho riêng Việt Nam – có thể phục vụ toàn bộ hệ thống dự báo, cảnh báo sớm thiên tai, khí hậu và môi trường," chị nói.
Dự báo bão không chỉ là câu chuyện của những con số và mô hình. Đằng sau mỗi phép tính là trách nhiệm của người làm khoa học trước sinh mạng con người. Và khi trí tuệ nhân tạo được đưa vào công việc ấy, đó không chỉ là đổi mới công nghệ, mà là đổi mới cách con người bảo vệ chính mình.
PGS.TS Mai Văn Khiêm nhìn nhận, chuyển đổi số và ứng dụng trí tuệ nhân tạo trong dự báo khí tượng thủy văn là một quá trình tất yếu, nhưng đi kèm với đó là rất nhiều thách thức cả về kỹ thuật, con người lẫn cơ chế vận hành. Có thể nói, đây là một cuộc chuyển đổi toàn diện, đòi hỏi phải thay đổi từ tư duy quản lý, cách tiếp cận khoa học, cho tới hạ tầng công nghệ và năng lực cán bộ.
Mục tiêu lâu dài của nhóm nghiên cứu sẽ là xây dựng hệ thống dự báo thông minh, có khả năng cung cấp thông tin chi tiết theo từng vùng, từng nhóm đối tượng — như ngư dân trên biển, người dân vùng núi dễ sạt lở hay khu vực đô thị dễ ngập...
Trước hết, thách thức lớn nhất hiện nay là nguồn nhân lực. Các mô hình AI và hệ thống dữ liệu lớn đòi hỏi đội ngũ chuyên gia không chỉ giỏi chuyên môn khí tượng thủy văn mà còn phải am hiểu về khoa học dữ liệu, lập trình, xử lý thông tin. Trong khi đó, nhân lực có thể "làm chủ" cả hai lĩnh vực này hiện vẫn còn hạn chế.
Thứ hai là hạn chế về hạ tầng tính toán và lưu trữ dữ liệu. Các mô hình AI hiện nay cần dung lượng dữ liệu khổng lồ và năng lực xử lý cao. Trong khi đó, hệ thống máy chủ và hạ tầng HPC của Trung tâm tuy đã được nâng cấp nhưng vẫn còn thiếu so với nhu cầu, mới đáp ứng được chạy các bài toán dự báo số trị giới hạn trong một số phương án hạn chế.
Thứ ba là thách thức về cơ chế chia sẻ và tích hợp dữ liệu liên ngành. Dữ liệu khí tượng, thủy văn, hải văn, địa chất, viễn thám, thủy điện, thủy lợi, phòng chống thiên tai… hiện còn được quản lý rời rạc ở nhiều đơn vị. Việc kết nối, chuẩn hóa và chia sẻ vẫn đang trong quá trình hoàn thiện.
Ba nhóm giải pháp trọng tâm được PGS.TS Mai Văn Khiêm đưa ra là xây dựng hạ tầng dữ liệu số tập trung – hướng tới hình thành "dữ liệu liên ngành dùng chung giữa khí tượng thủy văn và các lĩnh vực khác".
Tăng cường hợp tác khoa học – công nghệ với các viện nghiên cứu, doanh nghiệp AI lớn trong và ngoài nước để chuyển giao công nghệ, đồng phát triển mô hình.
Đào tạo và chuyển đổi vai trò dự báo viên theo hướng "dự báo viên số", có khả năng làm việc với mô hình AI, dữ liệu lớn và công cụ tự động hóa.
Công trình CIFOMI là minh chứng sống động cho tinh thần đó: kết hợp tri thức toàn cầu với sáng tạo Việt Nam, vừa hiện đại, vừa mang tính nhân văn.
Từ những phòng máy tính lặng lẽ đến các bản tin cảnh báo truyền đi trên sóng truyền hình, những dòng dữ liệu AI đang góp phần giữ bình yên cho hàng triệu mái nhà ven biển.
"Khi dữ liệu, mô hình số và AI được kết hợp chặt chẽ, chúng ta có thể tiến tới dự báo sớm hơn, chính xác hơn, phục vụ tốt hơn cho công tác phòng chống thiên tai và bảo vệ cuộc sống người dân," PGS.TS Mai Văn Khiêm khẳng định.
Đó không chỉ là lời kết cho một nghiên cứu, mà là lời mở cho một tương lai của khoa học khí tượng Việt Nam – nơi trí tuệ nhân tạo đồng hành cùng con người vì sự an toàn và phát triển bền vững.
"AI và mô hình số giúp giảm đáng kể khối lượng thao tác thủ công, đồng thời tăng tốc độ phân tích và xử lý thông tin. Hệ thống mô hình dự báo toàn cầu, khu vực, cùng với các mô hình học máy, có thể tự động tổng hợp hàng trăm nguồn dữ liệu quan trắc, vệ tinh, radar, rồi đưa ra sản phẩm dự báo sơ bộ trong vài giờ đồng hồ (với mô hình số trị) thậm chí chỉ trong vài phút (đối với mô hình AI)", PGS.TS Mai Văn Khiêm.












