Như vậy, có thể thấy, CSDL ở bảng 3 và bảng 4 là tương tự nhau về cấu trúc, nên có thể sửa đổi các thuật toán khai thác HUI hiện có vào trường hợp này.Quy ước 1. Dữ liệu minh họa của bài báo trở về sau, khi nói đến giao dịch chính là nói đến dạng giao dịch đã chuyển đổi như tại Bảng 3.Định nghĩa 4. Giá trị hữu ích của tập X trong giao dịch T, ký hiệu u(X,T), là tổng giá trị hữu ích của các phần tử thuộc X có trong giao dịch T hay u(X,T)=∑_(i∈X∧X⊆T)▒〖u(i,T)〗 [6]Định nghĩa 5. Giá trị hữu ích của tập X, ký hiệu u(X), là tổng giá trị hữu ích của X trong tất cả giao dịch T có chứa X trên DB hay u(X)=∑_(T∈DB∧X⊆T)▒〖u(T).〗 [6]Định nghĩa 6. Cho trước ngưỡng hữu ích tối thiểu minutil, tập X được gọi là tập hữu ích cao nếu giá trị hữu ích của X không nhỏ hơn ngưỡng hay u(X)≥minutil. [6]Ví dụ: u({ab}, T2) = u(a, T2) + u (b, T2) = 4 + 1.9 = 5.9, và u({ab}) = u({ab}, T2 ) + u({ab}, T4) + u({ab}, T5) = 5.9 + 9.9 + 13.2 = 34.Nếu minutil = 30 thì {ab} là tập hữu ích cao, ngược lại với minutil = 40 thì {ab} không phải là tập hữu ích cao.Định nghĩa 7. Giá trị hữu ích của giao dịch T, ký hiệu tu(T), là tổng giá trị hữu ích của các phần có trong T hay tu(T)=∑_(i∈T)▒〖u(i,T)〗 và giá trị hữu ích của DB là tổng giá trị hữu ích các giao dịch trong DB [6]. Ví dụ: tu(T3) = u({a}, T3) + u({c}, T3) + u({d}, T3) = 4.4 + 2.2 + 5.5 = 12.1Định nghĩa 8. Trọng số giao dịch hữu ích của tập X, ký hiệu TWU(X), là tổng giá trị hữu ích của tất cả các giao dịch có chứa X trên DB hay TWU(X)=∑_(T∈DB∧X⊆T)▒〖tu(T)〗 [6]. Ví dụ: TWU({e}) = tu(T2) + tu(T4) = 17.4 + 24.2 = 41.6Định nghĩa 9. Gọi ≻ là phép xếp thứ tự các phần tử của tập I theo TWU. Giá trị hữu ích còn lại của X trong giao dịch T, ký hiệu ru(X,T) là tổng giá trị hữu ích các phần tử sau X trong T, hay là ru(X,T)=∑_(i∈T∧ i ≻x ∀ x ∈ X)▒〖u(i,T)〗. [3]Ví dụ: ru({a},T3) = u({c}, T3) + u({d},T3) = 2.2 + 5.5 = 7.7Định nghĩa 10. Cho tập các phần tử I được xếp thứ tự theo ≻, và tập X, tập các phần tử mở rộng của X được định nghĩa như sau E(X)={ z ┤|z∈I∧z≻x∀x∈X } [11]Định nghĩa 11. Cho giao dịch T và tập X, phép chiếu của tập X trên giao dịch T được xác định là T_X= { i ┤|i∈T∧i∈E(X)} [11]Ví dụ: Cho X={b}, xét phép thứ tự a≻b ≻c ≻d ≻e thì 〖T1〗_X= ∅ , 〖T2〗_X={a}Định nghĩa 12. Cho cơ sở dữ liệu D và tập X, phép chiếu của tập X trên D được định nghĩa như sau D_X={ T_X ┤| T∈D∧T_X≠∅} [11]Ví dụ: Cho X={c}, xét phép thứ tự a≻b ≻c ≻d ≻e, D_X={ 〖T1〗_X,〖T2〗_(X ),〖T3〗_X,〖T5〗_X}={ {b},{ab},{a},{ab}}Định nghĩa 13. Cho tập X, phần tử z∈E(X) và giá trị hữu ích cục bộ của (X,z) được tính như sau lu(X,z)=∑_(T⊃(X ∪{z}))▒〖[u(X,T)+〗 ru(X,T)] [11]Ví dụ. Cho X ={a}, lu(X,c) = (u(X,T2) + ru(X,T2)) + (u(X,T3) + ru(X,T3)) + (u(X,T5) + ru(X,T5)) = 17.4 + 12.1 + 21.6 = 51.1Tính chất 1. Cho tập X, z∈E(X), nếu lu(X,z)Định nghĩa 14. Cho tập X và phần tử z∈E(X)), giá trị hữu ích trên nhánh phụ z và tập X là su(X,z)=∑_(T⊃(X ∪{z})))▒〖[u(α,T)+u(z,T)+〗 ∑_(i∈T⋀i∈E(α⋃{z}))▒〖u(i,T)]〗 [11]Ví dụ. Cho X ={a}, su(X,c) = (u({a},T2) + u({c},T2)+ u({d},T2) + u({e},T2)) + (u({a},T3) + u({c},T3)+ u({d},T3)) + (u({a},T5) + u({c},T5) + u({f},T5)) = 15.5 + 12.1 + 12 = 39.6.Tính chất 2. Cho tập X và z∈E(X), nếu su(X,z)Định nghĩa 15. Cho tập X, phần tử chính và phần tử phụ (Primary, Secondary item) được định nghĩa như sau Primary (X)={ z ┤|z∈E(X) ∧su(X,z)≥minutil} và Secondary (X)={ z ┤|z∈E(X) ∧lu(X,z)≥minutil} . [11]Ví dụ. Tiếp tục ví dụ tại định nghĩa 13 và 14, nếu xét minutil = 40 thì X={a} là 1 phần tử phụ nhưng không phải là phần tử chính, nhưng với minutil = 30 thì X={a} vừa là phần tử chính vừa là phần tử phụ.Định nghĩa 16. Cho hai giao dịch Ta, Tb chứa các phần tử tương ứng {i1,i2,…,im} và {j1,j2,…,jn}. Ta và Tb được gọi là đồng nhất hay Ta = Tb nếu thõa các điều kiện sau n=m và ∀ k∈[1,n], ik=jk [11]. Ví dụ: Xét tiếp ví dụ ở định nghĩa 12, thì 〖T2〗_(X ) và 〖T5〗_X được xem là đồng nhất vì có cùng kết quả là {a,b}.Định nghĩa 17. Cho các giao dịch đồng nhất Tr1 = Tr2 = …. = Trm trên D, các giao dịch trên được trộn lại bằng Tm trong đó ∀ i ∈ T_m,u(i,T_(m))= ∑_(k=1…m)▒〖u(i,T_k)〗. Ví dụ: Giả sử 〖T2〗_(X ) và 〖T5〗_X ở định nghĩa 12 là 2 giao dịch độc lập, thì hai giao dịch này được thay bằng 〖T2'〗_(X )có giá trị hữu ích nội bộ u({a},〖T2^'〗_(X ) )=u({a},〖T2〗_(X ) )+u({a},〖T5〗_(X ) )=4+3.6=7.6 và u({b},〖T2^'〗_(X ) )=u({b},〖T2〗_(X ) )+u({b},〖T5〗_(X ) )=1.9+9.6=11.5 Định nghĩa 18. (về phép chiếu kết hợp trộn các giao dịch đồng nhất) khi chiếu tập X lên D, các giao dịch đồng nhất được trộn bằng một giao dịch mới, ký hiệu cDX. [11]. Ví dụ: phép chiếu kết hợp phép trộn tiếp được thể hiện cụ thể ở hình 5 của ví dụ minh họa thuật toán MEFIM.
đang được dịch, vui lòng đợi..
