Nghiên cứu dự báo lượng nước chảy vào mỏ hầm lò Quảng Ninh bằng mô hình học máy

Quản trị viên 18/05/2026 Khối địa chất

Các vùng than trọng điểm của Tập đoàn Công nghiệp Than - Khoáng sản Việt Nam (TKV) đều nằm ở tỉnh Quảng Ninh, nơi nhạy cảm trước tác động của bão nhiệt đới và sự tăng cường, cường độ mưa trong bối cảnh biến đổi khí hậu. Trước hậu quả nặng nề của tai biến ngập lụt có thể gây hậu quả nghiêm trọng về tài sản và tính mạng của con người trong ngành Than. Việc nghiên cứu dự báo ngập lụt mỏ, đặc biệt mỏ hầm lò là một trong những giải pháp hữu ích phục vụ cho việc quy hoạch sản xuất để giảm thiểu tác động tiêu cực của thiên tai gây ra. Một ví dụ điển hình, trận mưa kỷ lục năm 2015 tại khu vực Đông Bắc, trong đó có tỉnh Quảng Ninh, đã gây ra thiệt hại nặng nề về người và tài sản gây thiệt hại trên 1.000 tỉ đồng, giao thông huyết mạch trên địa bàn bị chia cắt trong nhiều ngày. Lượng mưa từ ngày 26/7 đến ngày 29/7 các đơn vị đo được tại Cẩm Phả 1.211 mm, Hòn Gai 868 mm, vùng Uông Bí 215 mm.

Trong những năm gần đây, bên cạnh cách tiếp cận truyền thống, trí tuệ nhân tạo (học máy, học sâu) và các thuật toán tối ưu hóa đã và đang được áp dụng để giải quyết rất nhiều các vấn đề trong thực tế trong đó có việc dự báo và đánh giá ngập lụt các khu vực khai thác mỏ. Việc phát triển các công cụ dựa trên các thuật toán này là cần thiết để cải thiện độ chính xác trong dự báo và đánh giá nguy cơ ngập lụt các mỏ than.

Từ các thực tế như trên, bài báo tiến hành nghiên cứu áp dụng các mô hình học máy nhằm giải bài toán dự báo và đánh giá nguy cơ ngập lụt mỏ, nhất là trong kịch bản mưa cực đoan, đồng thời áp dụng thử nghiệm tại mỏ than Mông Dương.

1. Các phương pháp nghiên cứu và cơ sở tài liệu

1.1 Phương pháp phân tích mưa cực đoan

Trong bối cảnh biến đổi khí hậu, việc nghiên cứu dự báo lượng mưa cực đoan có thể xảy ra là vô cùng quan trọng. Phân tích giá trị cực đoan (EVA) được tiến hành bằng phần mềm extRemes của Trung tâm nghiên cứu Quốc gia về Khí tượng Hoa Kỳ. Các kết quả cơ bản của EVA đến từ một thuộc tính cơ bản liên kết với giá trị tối đa của một chuỗi các quan sát mẫu. Giả sử, ví dụ, chúng ta có một mẫu X1... X200. Nếu chúng ta chia chuỗi này thành hai chuỗi bởi tách nó ở giữa (tức là, X1...X100) và (X101...X200), sau đó là tối đa giá trị của chuỗi ban đầu có thể thu được, gián tiếp, là mức tối đa của tối đa của hai chuỗi. Đó là:

maX{X1,... , X200} = maX{maX{X1,..., X100}, maX{X101,..., X200}}

Do đó, phân bố gần đúng cho các giá trị tối đa phải có phân phối hàm (df) F thỏa mãn F2(x) = F (aX + b), trong đó a > 0 và b là các thông số chia tỷ lệ và trung tâm tương ứng. Giá trị tối đa của một chuỗi tăng lên khi độ dài của chuỗi tăng. Hàm Df như vậy được gọi là hàm tối đa ổn định. Df tối đa duy nhất có dạng các hàm giá trị cực đại tổng quát (GEV). Các hàm này có thể được viết dưới dạng đơn giản liên quan đến ba tham số: vị trí, tỷ lệ và hình dạng.

1.2. Các mô hình học máy

Mô hình trung bình động Bayes

Thuật toán trung bình động Bayes (Bayes Moving Average - BMA) nhằm cải thiện khả năng dự báo hoặc làm mượt chuỗi thời gian so với các phương pháp MA truyền thống bằng cách (1) Kết hợp thông tin tiên nghiệm (prior information), (2) Cập nhật niềm tin với dữ liệu mới, khi có dữ liệu mới (quan sát mới trong chuỗi thời gian), thuật toán sử dụng định lý Bayes để cập nhật các phân phối tiên nghiệm thành các phân phối hậu nghiệm (posterior distributions), (3) Lượng hóa độ không chắc chắn (uncertainty quantification), phương pháp Bayes cung cấp một phân phối Xác suất đầy đủ cho dự báo, cho phép đánh giá độ không chắc chắn của dự báo và (4) Học trọng số tối ưu (learning optimal weights), BMA có thể "học" ra các trọng số tối ưu cho các quan sát quá khứ dựa trên dữ liệu và thông tin tiên nghiệm, thay vì giả định trước một cấu trúc trọng số cố định. Mô hình BMA có ưu điểm thích ứng với cấu trúc dữ liệu thay vì áp đặt trọng số cố định, đưa ra dự báo dưới dạng phân phối Xác suất, rất hữu ích cho việc ra quyết định và cho phép tích hợp thông tin bên ngoài vào mô hình thông qua các tiên nghiệm.

Mô hình rừng ngẫu nhiên

Rừng ngẫu nhiên (Random Forest - RF) là một mô hình tiêu biểu dựa trên thuật toán bagging đồng nhất. Chiến lược chính của thuật toán bagging là kết hợp nhiều bộ phân loại yếu thành một mô hình mạnh thông qua tổ hợp tuyến tính. Phương pháp này giảm phương sai của bộ phân loại cơ bản bằng cách đưa vào tính ngẫu nhiên trong quá trình xây dựng mô hình tích hợp. RF bao gồm một số cây quyết định khác nhau. Mỗi cây quyết định ngẫu nhiên chọn một phần mẫu từ dữ liệu huấn luyện và ngẫu nhiên chọn một số đặc trưng để huấn luyện. Phương pháp này không nhạy cảm với dữ liệu bị thiếu, không cân bằng, và có đa cộng tuyến, đồng thời có thể dự đoán dữ liệu có chiều cao. Chiến lược tiến hành lặp (bootstrap) cho phép RF huấn luyện mô hình một cách hiệu quả khi xử lý dữ liệu có nhiều chiều, mang lại cho mô hình được huấn luyện phương sai nhỏ và khả năng tổng quát hóa mạnh. Đồng thời, RF có thể mô tả tầm quan trọng của từng đặc trưng đối với kết quả đầu ra.

Khi tính toán, tập dữ liệu mẫu thường được chia ngẫu nhiên thành tập huấn luyện thứ cấp và tập kiểm tra theo tỷ lệ 70%/30%. Trong mỗi mô hình, sử dụng chỉ số R2 để đánh giá mức độ tin cậy của kết quả.

1.3. Cơ sở dữ liệu

Dữ liệu bao gồm, mưa ngày trong các năm từ 1993 đến 2023 tại trạm Cửa Ông. Số liệu thực đo lượng nước chảy mỏ từ năm 2017 đến 2023 của mỏ Mông Dương. Đặc điểm dữ liệu về lượng nước là rời rạc và không phải là chuỗi thời gian liên tục, bao gồm giá trị lượng nước chảy mỏ tổng và lượng nước ở các mức -97,5m và -250m. Số trường dữ liệu gồm 330 bản ghi thực đo với 90 trường dữ liệu về mưa (lượng mưa từng ngày trong 3 tháng), 3 dữ liệu về lượng nước ngập trong mỏ.

Do tỷ lệ số bản ghi và trường dữ liệu xấp xỉ tỷ lệ 1/3 nên rất dễ bị quá khớp (overfit). Vì vậy, cần áp dụng các phương pháp chọn biến để tìm được các đặc trưng quan trọng. Mục tiêu là có thể xây dựng mô hình có khả năng dự đoán tốt trên tập dữ liệu hiện có. Số trường giữ liệu mưa 90 ngày được giảm thành 14 ngày mưa đầu tiên, lượng mưa tuần từ tuần thứ 3 đến tuần thứ 12 và bổ sung biến số thứ tự của tháng.

Dữ liệu được chia thành hai phần gồm, tập huấn luyện (Training) là các dữ liệu đến trước 01/09/2021; tập kiểm tra (Test) là các xữ liệu từ 01/9/2021 đến tháng 6 năm 2023.

Các bước tiến hành áp dụng các mô hình học máy như sau:

Bước 1: Giảm chiều dữ liệu. Để tránh trường hợp quá khớp, số trường giữ liệu mưa ngày trong 90 ngày liên tục cần được đánh giá giảm thành số lượng biến số ít hơn.

Bước 2: Áp dụng kỹ thuật giảm biến kết hợp với các phương pháp hồi quy đơn giản để tìm được một mô hình cơ sở. Mô hình cơ sở là mô hình thoả mãn tiêu chí đơn giản, có thể giải thích về mặt toán học và định lượng. Mô hình như vậy sẽ giúp:

  • Xác định được chuẩn để so sánh với các mô hình phức tạp hơn (các mô hình học máy được lựa chọn thì phải tốt hơn mô hình cơ sở này).
  • Giúp xác định các biến quan trọng. Để đánh giá tính hiệu quả của mô hình tập dữ liệu được chia làm 2 phần huấn luyện (train) và kiểm tra (test).

Bước 3: Áp dụng chọn biến xây dựng mô hình hồi quy cơ sở. Phương pháp sử dụng là quan sát bayes thông qua xác suất hậu nghiệm để đánh giá biến quan trọng.

Bước 4: Áp dụng mô hình tích chập (ensemble) với mô hình “rừng ngẫu nhiên” random forest để cải thiện mô hình cơ sở.

2. Kết quả và thảo luận

2.1. Đánh giá thống kê lượng mưa cực đoan tại vùng mỏ Quảng Ninh

Kết quả phân tích số liệu mưa tại Cửa Ông từ 1993 đến 2023 cho thấy trong tổng số 5 ngày lượng mưa vượt 250 mm thì có tới 4 ngày thuộc 2 sự kiện mưa lớn mang tính lịch sử ở vùng mỏ. Đó là các ngày 05/8/1995 mưa 276,7 mm, ngày 08/8/1995 mưa 285,8 mm và sự kiện gần 20 năm sau đó, ngày 26/7/2015 mưa 436,8 mm, ngày 27/7/2015 mưa 278,3 mm. Trong hai sự kiện mưa cực lớn năm 1995 và 2015, mưa liên tục trong 5 ngày liên tục cũng đạt tới mức kỷ lục 1025,5 mm tháng 8/1995 và 1208,9mm tháng 7/2015. Đây thực sự là lượng mưa mang tính lịch sử bởi ngoài hai sự kiện này, lượng mưa lớn tiếp theo là 619,7 mm vào tháng 7 năm 1994, những năm khác không có thời điểm nào lượng mưa 5 ngày liên tiếp đạt tới trên 500 mm, tức là chưa tới một nửa lượng mưa đã xảy ra trong hai sự kiện năm 1995 và 2015.

Kết quả phân tích giá trị mưa lớn cực đoan tại bảng 1 và các hình 1,2 cho thấy lượng mưa ngày cực đoan dẫn đến trường hợp ngập lụt nghiêm trọng như những ngày cuối tháng 7 năm 2015 có thể lặp lại với chu kỳ trung bình khoảng 20 năm. Tương tự như vậy, với chu kỳ tới 30-50 năm khả năng hiện tượng ngập lụt còn thể có nghiêm trọng hơn nhiều rất dễ có thể xảy ra. Vì vậy, trong bối cảnh biến đổi khí hậu, tại khu vực mỏ Quảng Ninh cần thiết phải xây dựng kịch bản ứng phó với trường hợp mưa cực đoan còn diễn biến nghiêm trọng hơn nhiều.

Bảng 1. Giá trị mưa ngày (mm) với độ tin cậy 95% ứng với các chu kỳ khác nhau

TT

Chu kỳ (năm)

Lượng mưa (mm)

Min (mm)

Max (mm)

1

5

297.6

239.6

355.7

2

10

371.1

283.5

458.6

3

20

458.5

330.5

586.6

4

30

517.2

359.2

675.2

5

50

600.2

396.5

803.8

6

100

731.4

448.6

1014.0

Hình 1. Đặc điểm mưa ngày (mm/ngày) tại trạm Cửa Ông giai đoạn 1993-2022.

Hình 2. Kết quả nghiên cứu các giá trị mưa ngày cực đoan tại Cửa Ông (1993-2022).

2.2 Đặc điểm lượng nước chảy vào mỏ hầm lò vùng Quảng Ninh

Vùng than Quảng Ninh là nơi có lượng mưa trung bình năm lớn, ảnh hưởng đến các dòng chảy vào các công trình khai thác. Về mùa mưa dòng chảy đạt giá trị cực đại, còn mùa khô đạt giá trị cực tiểu (bảng 2). Đối với các mỏ lộ thiên như Cọc Sáu, Đèo Nai hệ số biến đổi dòng chảy 62-113; đối với các mỏ khai thác hầm lò thì hệ số này từ 3-54. Ở những mỏ dòng chảy chịu ảnh hưởng của dòng mặt như Vàng Danh, Mông Dương hệ số biến đổi dòng chảy cũng chỉ đạt 72. Trị số dòng chảy vào công trình khai thác hầm lò tăng sau trận mưa từ 8 đến 36 giờ.

Bảng 2. Dòng chảy vào các công trình khai thác than ở Quảng Ninh [1]

Mỏ than

Công trình và mức khai thác (m)

Dòng chảy nhiều năm (m3/h)

Hệ số biến đổi từng năm

Trung bình

Cực đại

Cực tiểu

Mông Dương

Giếng -97,5

181,5

235,5

41,00

3-6

Cọc Sáu

Moong -60,0

200,0

460,1

12,50

85

Cọc Sáu- Q. Lợi

Lò bằng -80,0

13,79

50,4

0,94

41-54

Đèo Nai

Moong +122

183,3

431,2

20,81

62-113

Đông Lộ Trí

Lò bằng +130

132,81

915,8

24,20

11-90

Tây Khe Sim

Lò bằng +130

66,31

181,8

12,60

10-15

Hà Lầm

Lò bằng -16

43,18

124,9

12,14

6-10

Mạo Khê

Lò bằng +56

149,8

575,0

46,20

8-11

Vàng Danh

Lò bằng +122

288,98

3313,9

46,00

26-72

Cánh Gà

Lò bằng +135

33,65

127,0

9,00

6-8

2.3. Tính toán và dự báo lượng nước chảy vào mỏ than Mông Dương

Với các tham số đầu vào là lượng mưa ngày và lượng nước chảy mỏ thực đo từ 2017 đến 2023, kết quả tính toán tổng lượng nước chảy mỏ ở Mông Dương trên cơ sở lượng mưa ngày bằng mô hình hồi quy tuyến tính. Kết quả từ mô hình cơ sở này (hình 3) cho chỉ số mức R2=0,46. Do đây mới là kết quả tính toán trong thời gian từ 2017 đến hết 2023 ở mỏ Mông Dương nên cần có các nghiên cứu tiếp theo với các khoảng thời gian dài hơn để nâng cao độ chính xác.

Hình 3. Tương quan nước chảy mỏ thực đo và tính toán ở Mông Dương.

Với các mô hình học máy, các tập huyến luyện và kiểm tra được xác định như ở hình 3. Kết quả tính toán bằng mô hình BMA (hình 5 và 6) cho chỉ số R2 = 0,76, tốt hơn nhiều so với mô hình cơ sở.

Hình 4. Chuỗi số liệu train và test tính toán lượng nước chảy mỏ Mông Dương.

Hình 5. Kết quả tính toán bằng mô hình BMA.

Hình 6. Tương quan kết quả dự báo và thực đo theo mô hình BMA
(màu đen: số liệu thực đo, màu đỏ: số liệu dự báo)
.

Hình 7. Kết quả tính toán theo mô hình “rừng ngẫu nhiên”.

Hình 8. Tương quan kết quả dự báo và thực đo theo mô hình “rừng ngẫu nhiên”
(màu đen: số liệu thực đo, màu đỏ: số liệu dự báo)
.

Như vậy, độ tin cập của phương pháp đã được cải thiện hơn với R2 tăng từ 0,46 với mô hình cơ sở lên 0,76 và 0,82 với các mô hình học máy. Kết quả thu được đã được kiểm định với số liệu thực tế cho độ tin cậy cao và khá phù hợp với thực tế. Khi lượng nước chảy mỏ thấp hơn 2.000 m3/h, sử dụng mô hình dự báo “rừng ngẫu nhiên”, khi thông số này lớn hơn 2.000 m3/h sử dụng mô hình dự báo trung bình động BMA.

Trong thời gian vừa qua (nửa cuối năm 2023 và 2024), các kết quả tính toán đã được sử dụng để cảnh báo sớm các thời điểm lượng nước chảy mỏ Mông Dương vượt các ngưỡng 2.000 và 3.000 m3/h, hỗ trợ công tác chủ động ứng phó, thoát nước mỏ kịp thời, có hiệu quả. Do số liệu đo đạc thực tế còn tương đối ít, nhất là các ngày có lượng nước chảy mỏ lớn, mang tính chất cực đoan từ 3.000 m3/h trở lên còn ít. Việc đánh giá, hiệu chỉnh và dự báo cho những trường hợp như vậy được tiến hành theo kết quả của phương pháp thống kê thông thường. Thời gian tới cần liên tục cập nhật, bổ sung để nâng cao độ chính xác.

Hình 9. Lượng gia tăng nước chảy mỏ do mưa lớn.

Với các kết quả đã đạt được, nếu xét trường hợp của mưa lớn lịch sử cuối tháng 7 đầu tháng tháng 8 năm 2015, có thể thấy lượng mưa các ngày từ 26 đến 28 tháng 7, sẽ làm tăng thêm lượng nước chảy mỏ Mông Dương tới khoảng 5.350 m3/h, tức là đạt tới tổng lượng ước tính khoảng 7.450 m3/h. Những ngày tiếp theo lượng mưa không giảm, mà ngược lại ngày 30 tháng 7 lại có mưa lớn tới 246,8 mm/ngày, tức là bổ sung thêm lượng nước chảy mỏ khoảng 1.480 m3/h nữa. Lượng nước chảy mỏ chung trong trường hợp này đạt tới hơn 9.000 m3/h ở mức -97,5m. So với lượng nước cao nhất đã được ghi nhận từ năm 2017 đến năm 2022 (báo cáo ĐCTV mỏ Mông Dương) là gần 5.600 m3/h, lượng nước trong mưa lớn lịch sử năm 2015 cao hơn tới 60%, dẫn đến vượt công suất và không thể bơm thoát kịp và gây ngập mỏ. Hơn nữa, hệ số thấm của đất đá cũng có xu thể giảm dần theo chiều sâu. Các thực tế này dẫn đến khi mưa lớn, các tầng nông nước sẽ dồn đến nhanh hơn và gây ngập lụt ngay cả trước khi nước kịp vận động đến các tầng bơm thoát nước ở độ sâu lớn hơn. Thực tế ngập lụt còn trở nên nghiêm trọng hơn khi công suất bơm thoát nước ở các tầng trên không lớn như các tầng phía dưới và không đáp ứng được yêu cầu trong trường hợp mưa cực đoan.

Kết luận

1. Lượng nước chảy vào mỏ hầm lò có thể được dự báo qua nghiên cứu mối liên quan với lượng mưa ngày bằng các mô hình học máy. Kết quả tính toán bằng mô hình RF và BMA cho độ tin cậy cao với chỉ số R2 từ 0,76 đến 0,82. Các mô hình được xây dựng sử dụng các số liệu mưa thực đo, kết hợp với lượng mưa dự báo cho phép dự báo lượng nước chảy mỏ trước 1-2 ngày.

2. Mô hình dự báo lượng nước chảy vào mỏ tại mỏ than Mông Dương đã được kiểm định với số liệu thực tế cho độ tin cậy cao và khá phù hợp với thực tế. Khi lượng nước chảy mỏ thấp hơn 2.000 m3/h, sử dụng mô hình dự báo RF, khi thông số này lớn hơn 2.000 m3/h sử dụng mô hình BMA.

Với tập hợp số liệu đã có, việc dự báo lượng nước chảy mỏ trong các trường hợp mưa cực đoan trên 250-300 mm/ngày gặp rất nhiều khó khăn, độ chính xác thấp. Do vậy, phần tính toán lượng nước chảy mỏ than hầm lò do mưa cực đoan được tính toán riêng. /.

Tác giả: Đào Mạnh Hà, Vũ Anh Tuấn, Nguyễn Tân An (Phòng Địa chất)