ปรึกษาฟรี
Data Mining 4124305 • Chapter 1

เหมืองข้อมูลเบื้องต้น
Introduction to Data Mining

เรียนรู้แนวคิดพื้นฐานของการทำเหมืองข้อมูล ตั้งแต่ความหมาย แหล่งข้อมูล Big Data ความสำคัญ ขั้นตอนการทำงาน เทคนิคสำคัญ และตัวอย่างการประยุกต์ใช้ในธุรกิจ การศึกษา งานวิจัย และเว็บไซต์

ค้นหารูปแบบที่ซ่อนอยู่Pattern & Relationship Discovery
ช่วยตัดสินใจจากข้อมูลDecision Support
ใช้สถิติ + Machine LearningData, Model & Insight

1. ข้อมูลรอบตัวเรา: จุดเริ่มต้นของเหมืองข้อมูล

ในชีวิตประจำวัน เราสร้างข้อมูลจำนวนมากจากกิจกรรมต่าง ๆ เช่น การซื้อสินค้าในร้านสะดวกซื้อ การใช้บัตรเครดิต การติดต่อ Call Center การใช้งานโทรศัพท์และแอปพลิเคชัน การสั่งอาหารผ่านแพลตฟอร์มออนไลน์ และการโพสต์รูปภาพหรือข้อความบนเครือข่ายสังคมออนไลน์

ข้อมูลเหล่านี้ไม่ได้เป็นเพียงบันทึกเหตุการณ์ แต่เป็น “วัตถุดิบ” สำคัญที่สามารถนำมาวิเคราะห์เพื่อเข้าใจแนวโน้ม พฤติกรรมผู้บริโภค และโอกาสในการตัดสินใจได้ดีขึ้น

2. เหมืองข้อมูลคืออะไร

เหมืองข้อมูล (Data Mining) คือ กระบวนการที่กระทำกับข้อมูลจำนวนมาก เพื่อค้นหา รูปแบบ ความสัมพันธ์ แนวโน้ม หรือความรู้ที่ซ่อนอยู่ ในชุดข้อมูล โดยอาศัยแนวคิดจากฐานข้อมูล สถิติ คณิตศาสตร์ และการเรียนรู้ของเครื่อง

เปรียบเทียบง่าย ๆ

ฐานข้อมูลช่วยให้เรา “เก็บและค้นหา” ข้อมูลได้ แต่เหมืองข้อมูลช่วยให้เราค้นพบ “ความรู้ใหม่” จากข้อมูล เช่น ลูกค้ากลุ่มใดมีแนวโน้มซื้อสินค้าใด ข้อมูลใดบ่งชี้ความเสี่ยง หรือพฤติกรรมแบบใดนำไปสู่ผลลัพธ์ที่ต้องการ

3. ทำไมจึงต้องมีเหมืองข้อมูล

หากองค์กรเก็บข้อมูลไว้เฉย ๆ ข้อมูลจะยังไม่เกิดประโยชน์เต็มที่ การทำเหมืองข้อมูลจึงช่วยสกัดสารสนเทศและความรู้จากฐานข้อมูลหรือคลังข้อมูลขนาดใหญ่ เพื่อนำไปใช้ตัดสินใจ วางแผน และคาดการณ์ผลลัพธ์ในอนาคต

  • ช่วยวิเคราะห์ฐานข้อมูลขนาดใหญ่ได้รวดเร็วขึ้น
  • ค้นหาความสัมพันธ์หรือรูปแบบที่มนุษย์อาจมองไม่เห็นด้วยตาเปล่า
  • ช่วยสนับสนุนการตัดสินใจของผู้บริหารและผู้ปฏิบัติงาน
  • นำไปสู่การทำนาย การจัดกลุ่มลูกค้า การลดความเสี่ยง และการเพิ่มประสิทธิภาพขององค์กร
Evolution

4. วิวัฒนาการของการทำเหมืองข้อมูล

จากการจัดเก็บข้อมูลธรรมดา ไปสู่การสร้างคลังข้อมูลและการค้นพบความรู้จากข้อมูล

1960

Data Collection

การนำข้อมูลมาจัดเก็บอย่างเหมาะสมในอุปกรณ์ที่เชื่อถือได้ และป้องกันการสูญหาย

1980

Data Access

การนำข้อมูลที่จัดเก็บมาสร้างความสัมพันธ์ เพื่อใช้วิเคราะห์และสนับสนุนการตัดสินใจ

1990

Data Warehouse & Decision Support

การรวบรวมข้อมูลจากหลายแหล่งมาไว้ในคลังข้อมูล เพื่อสนับสนุนการตัดสินใจในระดับองค์กร

2000

Data Mining

การวิเคราะห์ข้อมูลจากฐานข้อมูลขนาดใหญ่ด้วยแบบจำลองและความสัมพันธ์ทางสถิติ

5. วัตถุประสงค์และเป้าหมายของเหมืองข้อมูล

เป้าหมายสำคัญของเหมืองข้อมูลคือการค้นหา Pattern หรือองค์ความรู้ที่ซ่อนอยู่ภายในฐานข้อมูลหรือคลังข้อมูลขนาดใหญ่ เพื่อนำไปใช้ให้เกิดประโยชน์จริง

  • ค้นพบองค์ความรู้ใหม่ในฐานข้อมูล
  • สกัดความรู้ที่ซ่อนเร้นอยู่
  • สำรวจข้อมูลและค้นหารูปแบบของข้อมูล
  • ใช้ข้อมูลในอดีตเพื่อเรียนรู้และคาดการณ์อนาคต
  • สนับสนุนการตัดสินใจทางธุรกิจและงานวิจัย
  • นำผลลัพธ์ไปใช้ปฏิบัติได้จริง
Process

6. ขั้นตอนการทำเหมืองข้อมูล

1

Data Cleaning

คัดกรองหรือลบข้อมูลที่ไม่เกี่ยวข้อง ข้อมูลผิดพลาด หรือข้อมูลที่ไม่สมบูรณ์ออกไป

2

Data Integration

รวมข้อมูลจากหลายแหล่งให้เป็นชุดข้อมูลเดียวกัน เช่น จากฐานข้อมูล เว็บไซต์ หรือไฟล์ต่าง ๆ

3

Data Selection

เลือกข้อมูลที่เกี่ยวข้องกับปัญหาหรือวัตถุประสงค์ในการวิเคราะห์

4

Data Transformation

แปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสม เช่น จัดรูปแบบตัวเลข วันที่ หมวดหมู่ หรือหน่วยวัด

5

Data Mining

ใช้เทคนิคหรืออัลกอริทึมเพื่อค้นหารูปแบบ ความสัมพันธ์ หรือโมเดลจากข้อมูล

6

Pattern Evaluation

ประเมินว่ารูปแบบที่ค้นพบมีความถูกต้อง น่าสนใจ และนำไปใช้ประโยชน์ได้หรือไม่

7

Knowledge Representation

นำเสนอความรู้ที่ค้นพบในรูปแบบที่เข้าใจง่าย เช่น กราฟ แผนภูมิ รายงาน Dashboard หรือข้อเสนอแนะเชิงธุรกิจ

7. การได้มาซึ่งข้อมูลและแหล่งข้อมูล

ข้อมูลสำหรับการทำเหมืองข้อมูลอาจมาจากหลายแหล่ง เช่น Google Form, Google Sheet, เว็บไซต์ ฐานข้อมูล ระบบธุรกรรม และ Social Media เช่น LINE, Facebook หรือ TikTok

1,000 รายการ

เหมาะสำหรับการเรียนการสอนหรือแบบฝึกหัดเบื้องต้น

10,000 รายการ

เหมาะสำหรับงานวิจัยขนาดเล็กถึงกลาง

100,000 รายการขึ้นไป

เหมาะสำหรับงานวิจัยหรือระบบจริงที่ต้องวิเคราะห์ข้อมูลจำนวนมาก

8. ส่วนประกอบของระบบเหมืองข้อมูล

ส่วนประกอบ หน้าที่
Database / Data Warehouse / Webเป็นแหล่งข้อมูลสำหรับนำมาวิเคราะห์
DBMS หรือ Data Warehouse Serverจัดการและนำเข้าข้อมูลตามคำขอของผู้ใช้
Knowledge Baseความรู้เฉพาะด้านที่ช่วยประเมินความน่าสนใจของผลลัพธ์
Data Mining Engineแกนหลักที่ทำงานด้าน Association, Classification, Clustering และเทคนิคอื่น ๆ
Pattern Evaluation Moduleช่วยคัดกรองรูปแบบที่ค้นพบว่าแบบใดน่าสนใจหรือมีประโยชน์
User Interfaceส่วนติดต่อผู้ใช้สำหรับระบุงาน ดูข้อมูล และประเมินผลลัพธ์
Techniques

9. เทคนิคสำคัญในการทำเหมืองข้อมูล

การวิเคราะห์เชิงสถิติ

ใช้สถิติในการสรุปข้อมูล วิเคราะห์แนวโน้ม และประเมินความสัมพันธ์เบื้องต้นของข้อมูล

กฎความสัมพันธ์

ค้นหาสิ่งที่มักเกิดร่วมกัน เช่น ลูกค้าที่ซื้อสินค้าหนึ่งมักซื้อสินค้าอีกชนิดหนึ่งร่วมด้วย

การจำแนกประเภทข้อมูล

สร้างโมเดลเพื่อระบุประเภทของข้อมูล เช่น ลูกค้าดี/เสี่ยงผิดนัด หรือผู้ป่วยมี/ไม่มีโรค

การแบ่งกลุ่มข้อมูล

จัดกลุ่มข้อมูลที่มีลักษณะคล้ายกัน เช่น กลุ่มลูกค้า กลุ่มผู้เรียน หรือกลุ่มพฤติกรรมการใช้งานเว็บไซต์

การสร้างมโนภาพข้อมูล

นำเสนอข้อมูลด้วยกราฟ แผนภูมิ หรือ Dashboard เพื่อให้เข้าใจข้อมูลจำนวนมากได้ง่ายและเร็วขึ้น

10. ตัวอย่างการนำเหมืองข้อมูลไปใช้งาน

ด้านการตลาด

  • ทำนายการตอบสนองต่อสินค้าใหม่
  • ทำนายยอดขายเมื่อมีการลดราคา
  • วิเคราะห์กลุ่มลูกค้าที่น่าจะสนใจสินค้า

ด้านการเงินและธนาคาร

  • คาดการณ์โอกาสการชำระหนี้ของลูกค้า
  • ค้นหาลูกค้าที่มีความเสี่ยงสูง
  • วิเคราะห์พฤติกรรมการใช้บัตรเครดิต

ด้านเว็บไซต์และธุรกิจออนไลน์

  • แนะนำสินค้าที่ลูกค้าน่าจะสนใจ
  • วิเคราะห์พฤติกรรมการเข้าชมเว็บไซต์
  • ปรับปรุงโครงสร้างเว็บและประสบการณ์ผู้ใช้

ด้านงานวิจัยและการศึกษา

  • วิเคราะห์ข้อมูลผู้เรียนและผลสัมฤทธิ์ทางการเรียน
  • จัดกลุ่มพฤติกรรมผู้เรียน
  • ทำนายแนวโน้มจากข้อมูลภาคสนามหรือ IoT

11. แบบฝึกหัดท้ายบท

  1. อธิบายความหมายของเหมืองข้อมูล และเปรียบเทียบกับการวิเคราะห์ข้อมูลทั่วไป
  2. เหมืองข้อมูลมีความสำคัญและประโยชน์ต่อองค์กรหรือธุรกิจอย่างไร ยกตัวอย่างอย่างน้อย 2 กรณี
  3. อธิบายกระบวนการทำเหมืองข้อมูลอย่างย่อ และบอกความสำคัญของแต่ละขั้นตอน
  4. อธิบายประเภทของปัญหาในเหมืองข้อมูล เช่น Classification, Clustering และ Prediction พร้อมตัวอย่างจริง
  5. ระบุเครื่องมือที่นิยมใช้ในเหมืองข้อมูล เช่น Python, RapidMiner, Weka หรือ Scikit-learn พร้อมจุดเด่น
  6. อธิบายข้อกังวลด้านจริยธรรมและผลกระทบทางสังคมจากการใช้เหมืองข้อมูล
แหล่งเนื้อหา: สรุปและเรียบเรียงจากสไลด์รายวิชาเหมืองข้อมูล Data Mining (4124305) บทที่ 1 แนะนำเหมืองข้อมูลเบื้องต้น โดย ผู้ช่วยศาสตราจารย์ ดร. นัฐพงศ์ ส่งเนียม ภาควิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏพระนคร
Learn & Apply

ต้องการประยุกต์ Data Mining กับงานวิจัยหรือธุรกิจ?

Siam2Dev ช่วยวางแผนข้อมูล เตรียมชุดข้อมูล วิเคราะห์ด้วย Python และสร้าง Dashboard เพื่อใช้ตัดสินใจได้จริง