คำอธิบาย ของ การแบ่งกลุ่มข้อมูลแบบเคมีน

สมมติให้มีเซตของการสังเกต (x1, x2, …, xn) โดยแต่ละการสังเกตเป็นเวกเตอร์ค่าจริงใน d มิติ การแบ่งกลุ่มข้อมูลแบบเคมีนจะตัดแบ่งการสังเกตจำนวน n ครั้งให้เป็นข้อมูลจำนวน k ชุด (โดยที่ k น้อยกว่าหรือเท่ากับ n) ในเซต S = {S1, S2, …, Sk} ที่จะทำให้ค่าผลบวกกำลังสองภายในคลัสเตอร์ (within-cluster sum of squares; WCSS) มีค่าน้อยที่สุด. หรือพูดได้อีกอย่างว่า จุดประสงค์ของการแบ่งกลุ่มข้อมูลแบบเคมีนคือการหาผลลัพธ์ต่อไปนี้:

a r g m i n S ∑ i = 1 k ∑ x ∈ S i ‖ x − μ i ‖ 2 {\displaystyle {\underset {\mathbf {S} }{\operatorname {arg\,min} }}\sum _{i=1}^{k}\sum _{\mathbf {x} \in S_{i}}\left\|\mathbf {x} -{\boldsymbol {\mu }}_{i}\right\|^{2}}

โดยที่ μi เป็นค่าเฉลี่ยของจุดใน Si.

ใกล้เคียง

การแบ่งกลุ่มข้อมูลแบบเคมีน การแบ่งโปแลนด์ การแบ่งเขตภูมิอากาศแบบเคิพเพิน การแบ่งอินเดีย การแบ่งแยกนิวเคลียส การแบ่งโล่ (มุทราศาสตร์) การแบ่งสรรปันส่วนแบบสัดส่วนคู่ การแบ่งประเภทสนามฟุตบอลของยูฟ่า การแบ่งกลุ่มข้อมูล การแบ่งชนิดและสัณฐานของดาราจักร

แหล่งที่มา

WikiPedia: การแบ่งกลุ่มข้อมูลแบบเคมีน http://apps.nrbook.com/empanel/index.html#pg=842 http://www.frahling.de/Gereon_Frahling/Publication... http://www.cs.cmu.edu/~efros/courses/LBMV07/Papers... http://www.cc.gatech.edu/~vempala/papers/dfkvv.pdf http://citeseerx.ist.psu.edu/viewdoc/download?doi=... http://www.stanford.edu/~acoates/papers/coatesleen... http://www.stanford.edu/~acoates/papers/coatesng_n... http://www.cs.toronto.edu/~roweis/csc2515-2006/rea... http://charlotte.ucsd.edu/users/elkan/cikm02.pdf http://cseweb.ucsd.edu/users/avattani/papers/kmean...