การวิเคราะห์ข้อมูล (Data Analysis) คืออะไร?

 การวิเคราะห์ข้อมูล (Data Analysis) เป็นทักษะที่กำลังเป็นที่ต้องการมากตั้งแต่การเกิดขึ้นของเทคโนโลยี เช่น อินเทอร์เน็ต และ โทรศัพท์มือถือ รวมไปถึง แท็ปเล็ต จึงทำให้มีความต้องการในงานสายนี้มากขึ้นเรื่อยๆ การเติบโตของแวดวงธุรกิจนี้ ผลักดันให้องค์กรตระหนักถึงข้อมูลจำนวนมากที่ถูกส่งไปมาทุกๆวินาที องค์กรสามารถติดตามและรวบรวมข้อมูลต่างๆ ที่จะเป็นประโยชน์ต่อตัวเองหรือทำให้ได้รับผลตอบแทนทางธุรกิจมากขึ้น วิทยาการข้อมูลจะมีอิธิพลต่อเศรษฐกิจโลกในอนาคตอย่างแน่นอน วิทยาการข้อมูลประกอบไปด้วย การวิเคราะห์สถานการณ์การตลาด (Market Analysis) และ การทำเหมืองข้อมูล (Data Mining)

 

วิทยาการข้อมูลคืออะไร

การวิเคราะห์ข้อมูลส่งผลต่อเศรษฐกิจในปัจจุบันเป็นอย่างมาก

 

 

การวิเคราะห์สถานการณ์การตลาด (Market Analysis)

 

 การเริ่มต้นธุรกิจ หรือการนำสินค้าใหม่เข้าสู่ตลาดอาจเป็นสิ่งที่ฟังดูไม่ง่ายนัก ความเข้าใจเกี่ยวกับการวิเคราะห์การตลาด จึงเป็นสิ่งที่ช่วยกำหนดเป้าหมายทางการตลาดและแบบแผนการตลาดได้ หากได้ทำความเข้าใจกับสิ่งเหล่านี้ การวางแผนทางการตลาดจะง่ายขึ้นและจะไม่เสียเงินโดยใช่เหตุ ให้กับการตลาดในโลกยุคใหม่ที่เติบโตจนล้นโลกแล้วก็ว่าได้

 

 ผู้ประกอบการควรใช้ความรอบคอบในการวางแผนสู่การตอบสนองผู้บริโภค ภายในอุสาหกรรมสินค้าและบริการนั้นๆ และการวิเคราะห์สถาณการณ์การตลาดอย่างรอบคอบเปรียบเสมือนกับแผนที่ชี้ทางให้กับเขา นอกจากนี้การทบทวนแผนงานเป็นระยะ และการเปลี่ยนแปลงเมื่อจำเป็น ก็เป็นสิ่งสำคัญ

 

การทำเหมืองข้อมูล (Data Mining)

 

 การทำเหมืองข้อมูล หรือ data mining หมายถึงการใช้ความรู้ทางคณิตศาสตร์ สมการ และ สถิติ ในการนำแยกข้อมูลทันสมัย และรูปแบบข้อมูลออกมาเพื่อใช้ในการโฆษณา และการตลาดอย่างมีประสิทธิภาพ รวมไปถึงการเริ่มทำ ธุรกิจออนไลน์ (e-commerce) ห่วงโซ่อุปทาน (supply chain process) และส่วนประกอบทางธุรกิจอื่นๆ องค์กรสามารถปรับเปลี่ยนกระบวนการเพื่อเพิ่มการผลิต และประสิทธิภาพได้ จากการนำข้อมูลมาใช้ การทำเหมืองข้อมูลจึงเป็นสิ่งที่จะช่วยเพิ่มผลประโยชน์ และทำให้ธุรกิจไปได้ราบรื่นยิ่งขึ้น

 

กระบวนการทำเหมืองข้อมูล

มีกระบวนการในการทำเหมืองข้อมูลอยู่ 3 ขั้นตอน ได้แก่ Pre-processing, Results validation และ Data mining

 

 

 เราอยู่ในยุคที่เศรษฐกิจกับข้อมูลทำงานไปด้วยกันและกำลังขยายใหญ่ขึ้น ให้นึกถึง social media เช่น Linkedin, Facebook, และ Twitter และจะเห็นว่าข้อมูลเกี่ยวกับทุกๆคนมีมากเหลือเกิน แต่ละคนมีสิ่งที่สอบไม่เหมือนกัน และเป็นคนละคนกัน การได้มาซึ่งข้อมูลเหล่านี้มาจากสิ่งที่เรียกว่าการทำเหมืองข้อมูล ในทางกลับกันหากไม่มีการใช้ข้อมูลเหล่านี้ในการตลาด บริษัทจะเสียเปรียบเป็นอย่างมาก โดยเฉพาะในเรื่องการตอบสนองความต้องการของลูกค้า การทำเหมืองข้อมูลมีอยู่ 3 ขั้นตอน ดังนี้

 

1. ขั้นก่อนดำเนินงาน (Pre-processing)

 ก่อนเราจะเริ่มดำเนินงานทำเหมืองข้อมูลได้นั้น จะต้องมีการจัดวางชุดข้อมูลก่อน เพราะเหมืองข้อมูลจะสามารถหาได้เพียงรูปแบบที่กำหนดในข้อมูลก่อนแล้ว ชุดข้อมูลที่กำหนดจะต้องมีขนาดใหญ่พอที่จะมองเห็นรูปแบบ และสั้นกระชับพอที่จะขุดข้อมูลภายในเวลาจำกัดได้ เราสามารถนำข้อมูลจากสถานที่ต่างๆเช่น ตลาดข้อมูล (Data Mart) และคลังข้อมูล (Data Warehouse) หรือเราจะกำหนดข้อมูลเองโดยกำหนดเป้าหมายเฉพาะที่เรากำลังต้องการ ก็ได้เช่นกัน ต่อจากนั้นก็ถึงเวลาทำความสอาดข้อมูลโดยนำข้อมูลที่ไม่เกี่ยวข้องออก

 

2. ขั้นตรวจวัดผล (Results validation)

  หลังจากนำชุดข้อมูลออกมาแล้วจะเป็นการตรวจวัดผล ข้อมูลที่พบอาจใช้ไม่ได้ทุกรูปแบบเสมอไป เนื่องจากการพบข้อมูลในโมเดลที่ไม่เคยเห็นมาก่อน (Over Fitting) เราจึงต้องทำตัวอย่างข้อมูลมาทดลองและดูว่าใช้ได้จริงหรือไม่

 

3. ขั้นดำเนินการทำเหมืองข้อมูล (Data mining)

 การทำหมืองข้อมูลประกอบด้วย 5 คลาสด้วยกัน
   • การหาความเบี่ยงเบน (Deviation detection) – คือการหาความผิดปกติในข้อมูลที่อาจใช้ได้หรืออาจเป็นข้อผิดพลาดที่ต้องมีการตรวจสอบ
   • การรวบรวม (Clustering) – คือการนำข้อมูลโครงสร้างคล้ายๆกัน โดยไม่ใช้ข้อมูลที่มีในโปรแกรมอยู่แล้ว
   • แบบจำลองความสัมพันธ์ (Dependency Modeling) – คือการหาความสัมพันธ์ของตัวแปร ยกตัวอย่างเช่น ร้านสะดวกซื้อรวบรวมข้อมูลจากการซื้อสินค้าของลูกค้า การใช้ แบบจำลองความสัมพันธ์ จะทำให้ทางร้านสะดวกซื้อรู้ได้ว่าลูกค้าซื้อสินค้าชนิดใดด้วยกันมากที่สุดและใช้ข้อมูลนั้นให้เป็นประโยชน์ต่อไป มันอาจเรียกอีกอย่างหนึ่งได้ว่า การวิเคราะห์ตระกร้าสินค้า
   • การแบ่งกลุ่ม (Classification) – คือการนำข้อมูลมาจัดหมู่ใหญ่ๆเพื่อสร้างข้อมูลใหม่ ยกตัวอย่างเช่น ซอฟแวร์อีเมลล์อาจจำแนกให้เราส่าอีเมลล์ไหนเป็นสแปม
   • การวิเคราะห์การถดถอย (Regression) – คือการหาฟังก์ชั่นที่แบบจำลองมีข้อผิดพลาดน้อยที่สุด