ความรู้ที่ได้จากการทำเหมืองข้อความ ของ การทำเหมืองข้อความ

การสรุปเอกสารข้อความ (Document Summarization)เป็นการลดความซับซ้อนและขนาดของเอกสารข้อความโดยไม่ทำให้ความหมายหรือสาระสำคัญของข้อมูลเอกสารสูญเสียไปการแบ่งประเภทเอกสารข้อความ (Document classification)จัดแบ่งประเภทของกลุ่มเอกสารข้อความออกเป็นคลาส โดยการใช้ชุดข้อมูลตัวอย่างของเอกสารข้อความที่เรียกว่า Training Set สำหรับสร้าง Classifier Model และทดสอบ Classifier Model ด้วย Test Set ขั้นตอนวิธี ได้แก่ Supervised Learning Neural Networks, C4.5 Decision Treeการแบ่งกลุ่มเอกสารข้อความ (Document clustering)จัดแบ่งเอกสารข้อความออกเป็นกลุ่ม โดยใช้การวัดความคล้ายคลึงและความแตกต่างของคุณลักษณะของเอกสารข้อความ เพื่อนำไปใช้ประโยชน์ในด้านการข่าว ข้อมูลเอกสารจะถูกแปลงให้เป็นชุดข้อมูลตัวเลขโดยวิธีการ TF IDF โดยอาศัยวิธีการแทนเอกสารด้วยแบบจำลองเวกเตอร์สเปซ (อังกฤษ: Vector Space Model) และการให้น้ำหนักคำ (อังกฤษ: Term Weighting)จากนั้นถึงใช้ขั้นตอนวิธีการแบ่งกลุ่มข้อมูล ได้แก่ K-Mean, Unsupervised Learning Neural Networks, Hierarchical Clustering

ใกล้เคียง

การทำให้เป็นประชาธิปไตย การทำฝนเทียม การทำลายเขื่อนกาคอว์กา การทำงานในสมองกับการเข้าสมาธิ การทำแผนที่ การทำให้ไว การทำลายป่า การทำลายล้างวัตถุระเบิด การทำฝันวัยเด็กของคุณให้เป็นจริงได้อย่างแท้จริง การทำเครื่องหมายกางเขน