3. Basic concepts and problem statementCho I = {i1, i2, …in} là tập các phần tử, cơ sở dữ liệu D chứa các giao dịch (Transaction table), trong đó một giao dịch T trong được xác định duy nhất bằng tid và chứa các bộ 3 (i, q, p) ∈ (I x R x R) có ý nghĩa tương ứng: phần tử, số lượng, giá trị lợi nhuận. Với một ngưỡng tối thiểu minutil, vấn đề được đặt ra là làm thế nào tìm được tất cả các tập I'⊆I, sao cho giá trị hữu ích của tập I’ trên D không nhỏ hơn minutil.Định nghĩa 1. Giá trị hữu ích cơ bản của phần tử i trong giao dịch T, ký hiệu pu(i,T), là giá trị lợi nhuận của i trong T.Định nghĩa 2. Bội số hữu ích của phần tử i trong giao dịch T, ký hiệu qu(i,T), là giá trị số lượng kết hợp tương ứng của phần tử i trong T của D.Định nghĩa 3. Giá trị hữu ích của phần tử i trong giao dịch T, ký hiệu u(i,T), là phép nhân giữa qu(i,T) và pu(i,T) hay u(i,T) = qu(i,T) × pu(i,T). (1)Ví dụ: Với dữ liệu ở Bảng 1: pu(b,T2) = 2, qu(b,T2) = 1 và u(b,T2) = qu(b,T2) × pu(b,T2) = 2 × 1 = 2.Với dữ liệu ở Bảng 2: pu(b,T2) = 1.9, qu(a,T2) = 1 và u(b,T2) = qu(b,T2) × pu(b,T2) = 1.9 × 1 = 1.9.Để vận dụng các thuật toán khai thác HUI đã có vào trường hợp profit thay đổi, ta áp dụng kỹ thuật khai thác trực tiếp giá trị hữu ích của item trên từng giao dịch để chuyển đổi dữ liệu từ dạng được trình bày trong Bảng 2 sang dạng gọn hơn (chỉ còn 3 cột đầu tiên) bằng cách sử dụng công thức tính u(i,T) (ở Định nghĩa 3) thay thế giá trị bội số hữu ích của item bằng giá trị hữu ích của nó. Bảng 3 là kết quả của Bảng 2 sau khi áp dụng công thức
đang được dịch, vui lòng đợi..