หลักการพื้นฐาน ของ กฎความสัมพันธ์

กฎความสัมพันธ์ (Association Rule) สามารถเขียนได้ในรูปเซ็ตของ Item ที่เป็นเหตุ ไปสู่เซ็ตของ Item ที่เป็นผล

โดยกำหนดให้

I ={ i1 , i2 ,…,im} เป็น set ของ Items

D ={t1 , t2 ,…,tm} เป็น set ของ Transaction ซึ่งแต่ละ Transaction ใน D จะมีหมายเลข Transaction ID ที่ไม่ซ้ำกันและกำหนดให้ t เป็น subset ของ I

ตัวอย่างเช่น รายการที่ลูกค้าซื้อสินค้าทั้งหมด 5 Transaction ซึ่งมีรายละเอียดดังตาราง

Transaction IDMilkBreadButterBeer
11100
20110
30001
41110
50100

จากนั้น นำข้อมูล Transaction มาสร้าง Co-Occerence Table หรือตารางนับความถี่ของเหตุการณ์ เพื่อหาความสัมพันธ์ว่าเหตุการณ์อะไรเกิดขึ้นคู่กับเหตุการณ์อะไร ดังนี้

MilkBreadButterBeer
Milk2*210
Bread24*20
Butter112*0
Beer0001*

*เป็นการบอกว่ามีการซื้อสินค้านั้นกี่ครั้ง

จากนั้นจึงทำการสร้างกฎจากความสัมพันธ์ที่เป็นไปได้ โดยใช้ IF condition Then result เช่น

1.If Milk Then Bread

2.If Milk Then Butter เป็นต้น

ซึ่งจำนวนกฎที่เป็นไปได้ทั้งหมด จะคำนวณจากสมการ 2n-1 โดย n คือ จำนวนชนิดของ Items ทั้งหมด เช่น จากตารางมีจำนวนสินค้าทั้งหมด 4 ชนิด ดังนั้น จำนวนกฎที่เป็นไปได้ทั้งหมด คือ 24-1 = 15 กฎกฎความสัมพันธ์ที่ได้ จะไม่ได้บอกว่าเหตุการณ์ใดเกิดขึ้นก่อนหลัง เพียงแต่บอกว่าเหตุการณ์เหล่านั้น เกิดขึ้นด้วยกันเท่านั้น

ตัวชี้วัดที่ใช้ในการหากฎที่มีความน่าสนใจ

1.Support Factor เป็นค่าที่บ่งบอกว่าเหตุการณ์ A กับ B มีความถี่ในการเกิดขึ้นมากน้อยแค่ไหน

A → B : Support Factor =(A U B)

2. Confident Factor เป็นค่าที่บอกว่า เมื่อเกิดเหตุการณ์ B แล้ว มีโอกาสที่จะเกิดเหตุการณ์ A มากน้อยแค่ไหน

A → B : Confident Factor= P(A|B)