Information technology (it) has gone into people's lives and the impact on many different areas of social life, the network connection also becomes easy and convenient for people to support and help in the activities of management, education, manufacturing. But besides the Add-ons and the practical application of that side of IT, is the existence of some negative component takes advantage of his understanding of programming to create the malicious application, software or computer viruses, virus or viruses.To deal with the virus completely unnoticed simply. Through each era, the number of variants of the virus, increasing the level of hazardous looms, sophisticated and destructive behavior difficult to detect. Thus, the process prevents the virus becomes difficult and expensive human resources. From ask the current reality, we conducted research on solution of virus identification.Giải pháp dựa theo hành vi của virus là một hướng nghiên cứu mới và đang được phát triển. Hướng tiếp cận này sẽ rút ra các mẫu mô tả hành vi của virus, từ đó chuyển thành một công thức mô tả Linear Temporal Logic (LTL). Chúng ta sẽ kiểm tra mẫu ban đầu có phải là virus hay không dựa trên cấu trúc của công thức LTL thu được. Tuy nhiên, nếu mỗi lần chỉ quét với một mẫu virus thì thời gian để quét tất cả các mẫu sẽ tốn rất nhiều thời gian và tài nguyên. Chính vì thế, để giảm thiểu số lượng mẫu virus cần phải quét xuống mức thấp nhất có thể, chúng tôi đưa ra giải pháp cho vấn đề này là nghiên cứu tìm tập phổ biến chứa hành vi của virus và chỉ kiểm tra trên những tập phổ biến đó. Mỗi virus sẽ được biểu diễn thành một bộ hành vi. Từ những bộ hành vi thu thập được xây dựng nên một giàn khái niệm. Trên giàn khái niệm, ta sẽ chọn ra những mẫu quan trọng và phổ biến nhất dựa trên giải thuật tìm kiếm tập phổ biến tối đại. Hiện nay có nhiều phương pháp để tìm kiểm tập phổ biến tối đại, tuy nhiên chúng tôi lựa chọn giải thuật MAFIA (MAximal Frequent Itemset Algorithm) để hiện thực trong luận văn này. MAFIA đạt được hiệu quả tìm kiếm cao với số lượng mẫu dữ liệu đầu vào lớn.
đang được dịch, vui lòng đợi..
