Cách tính bình sai đường chuyền khép kín đơn giản và chính xác nhất

20/06/2024
361 lượt xem

Trong thống kê và khoa học dữ liệu, bình sai đường chuyền khép kín là một phương pháp quan trọng để ước lượng tham số của mô hình hồi quy tuyến tính. Trong bài viết này, chúng ta cùng tìm hiểu về cách tính bình sai đường chuyền khép kín dựa trên phương pháp Squared Error và phương pháp Maximum Likelihood Estimation (MLE) nhé. 

Cách tính bình sai đường chuyền khép kín bằng phương pháp Squared Error

Cách tính bình sai đường chuyền khép kín đơn giản và chính xác nhất
Phương pháp Squared Error

Dưới đây là hướng dẫn chi tiết và rõ ràng về cách tính bình sai đường chuyền khép kín trong mô hình hồi quy tuyến tính bằng phương pháp Squared Error:

Bước 1: Chuẩn bị dữ liệu

  • Chuẩn bị một mẫu dữ liệu gồm các cặp (xo, yo) trong đó xo là biến độc lập, yo là biến phụ thuộc.
  • Xác định phương trình đường chuyền tốt nhất (y_hat) để dự đoán giá trị yo dựa trên xo. Phương trình này thường có dạng y_hat = mx + b.

Bước 2: Tính toán sai số (error)

Tính sai số cho mỗi điểm dữ liệu bằng cách lấy hiệu của giá trị thực tế yo và giá trị dự đoán y_hat: error = yo – y_hat.

Bước 3: Bình phương sai số

Bình phương từng sai số để loại bỏ dấu âm: squared_error = error^2.

Bước 4: Tính tổng bình phương sai số

Tính tổng bình phương sai số cho toàn bộ mẫu dữ liệu: SSE = Σ(squared_error).

Bước 5: Đánh giá hiệu suất của mô hình

Giá trị bình phương sai số (SSE) cho biết mức độ sai lệch giữa giá trị dự đoán từ mô hình và giá trị thực tế trong mẫu dữ liệu. Giá trị SSE càng nhỏ thì mô hình hồi quy tuyến tính càng chính xác.

>>> Xem thêm: Lưới đường chuyền cấp 2 là gì? Những điều cần biết

Ví dụ minh họa: Cho một mẫu dữ liệu gồm các cặp (xo, yo): (1, 2), (2, 4), (3, 6)

  • Phương trình đường chuyền tốt nhất: y = 2x
  • Dự đoán giá trị y_hat tương ứng: 2, 4, 6
  • Sai số và bình phương sai số cho mỗi điểm dữ liệu: (0, 0), (0, 0), (0, 0)
  • Tổng bình phương sai số (SSE) = 0 + 0 + 0 = 0

Bình sai đường chuyền khép kín (SSE) của mô hình hồi quy tuyến tính trong ví dụ trên là 0, cho thấy mô hình dự đoán chính xác giá trị thực tế từ mẫu dữ liệu. 

Trong trường hợp, bình sai đường chuyền khép kín (SSE) của mô hình hồi quy tuyến tính khác 0, có nghĩa là mô hình đang mắc sai lệch trong việc dự đoán giá trị từ mẫu dữ liệu. Khi đó, mô hình này cần được điều chỉnh để cải thiện dự đoán.

Cách tính bình sai đường chuyền khép kín bằng phương pháp Maximum Likelihood Estimation (MLE) 

Cách tính bình sai đường chuyền khép kín đơn giản và chính xác nhất
Phương pháp Maximum Likelihood Estimation (MLE)

Để tính bình sai đường chuyền khép kín bằng phương pháp Maximum Likelihood Estimation (MLE) trong mô hình hồi quy tuyến tính, chúng ta cần thực hiện các bước sau:

Bước 1: Xác định Hàm Likelihood:

Xác định hàm Likelihood dựa trên phân phối Gaussian như đã mô tả ở trên.

Bước 2: Tính Log Likelihood:

Để dễ dàng tối ưu hóa, thường chúng ta sẽ tính logarit của hàm Likelihood để tìm cực đại.

Bước 3: Tối Ưu Log Likelihood:

Tìm giá trị m và b sao cho log Likelihood đạt giá trị lớn nhất bằng cách tìm đạo hàm của log Likelihood theo m và b, sau đó giải phương trình đạo hàm bằng 0. 

Bước 4: Tính Bình Sai Đường Chuyền Khép Kín:

Với các ước lượng tối ưu của m và b, ta có thể tính bình sai đường chuyền khép kín dựa trên phương pháp MLE.

>>> Xem thêm: Quy trình khảo sát địa hình chuẩn nhất

Ví dụ minh hoạ: Cho một mẫu dữ liệu gồm các cặp như sau: (1, 2), (2, 4), (3, 6).

Bước 1: Hàm Likelihood

Ta giả định phân phối Gaussian, nên hàm Likelihood sẽ là:

P(yi | xi, m, b) = (1 / sqrt(2πσ^2)) * exp(-(yi – mx – b)^2 / (2σ^2))

Bước 2: Log Likelihood

Lấy logarit tự nhiên của hàm Likelihood ta được:

ln(L) = -n/2 * ln(2π) – n * ln(σ) – Σ(yi – mx – b)^2 / (2σ^2)

Bước 3: Tối Ưu Log Likelihood

Tìm đạo hàm của ln(L) theo m và b, sau đó giải phương trình đạo hàm bằng 0 để tìm ra các ước lượng tối ưu của m và b.

Bước 4: Tính Bình Sai Đường Chuyền Khép Kín

Với các ước lượng tối ưu của m và b, ta có thể tính bình sai đường chuyền khép kín dựa trên phương pháp MLE. 

Hiện nay, có một số phần mềm và thiết bị hỗ trợ tính bình sai đường chuyền như:  phần mềm HHmaps, phần mềm Compass, máy GNSS RTK, máy thuỷ bình, máy toàn đạc điện tử,… được kết hợp những công nghệ hiện đại sẽ giúp cho việc tính toán của bạn trở nên thuận lợi và hiệu quả hơn.

>>> Xem thêm: Phần mềm HHmaps hỗ trợ khảo sát địa hình hiệu quả

Trong quá trình tìm hiểu về hồi quy tuyến tính và các phương pháp đánh giá hiệu suất của mô hình, việc biết cách tính bình sai đường chuyền khép kín đóng một vai trò quan trọng. Bình sai đường chuyền khép kín không chỉ giúp đánh giá mức độ chính xác của mô hình mà còn hỗ trợ trong việc tối ưu hóa và cải thiện dự đoán. 

Việt Thanh Group hy vọng bài viết trên hữu ích với các bạn đọc.

Thẻ:
Chia sẻ bài đăng này
(0)
lượt đánh giá

Bài viết cùng chủ đề

Review

0/5

0 đánh giá

Hiện tại không có đánh giá nào.