วันจันทร์ที่ 18 มิถุนายน พ.ศ. 2561

การวิจัย ทางสังคมศาสตร์ เทคนิค ANOVA


ANOVA เทคนิค
เป็นวิธีการวิเคราะห์ข้อมูล ทดสอบความแตกต่างระหว่างค่าเฉลี่ยของประชากรมากกว่า 2 ชุดขึ้นไป โดยใช้เทคนิคการวิเคราะห์ความแปรปรวน (Analysis of variance) ค่าความแปรปรวนของข้อมูลที่เกิดขึ้นทั้งหมด สามารถแยกได้เป็นตามแหล่งกำเนิดใหญ่ ๆ ได้ 2 แหล่ง คือ

1. ค่าความแปรปรวนระหว่างกลุ่ม (Between Groups) เป็นผลมาจากการได้รับ Treatment ที่แตกต่างกัน

2. ค่าความแปรปรวนภายในกลุ่ม (Within Groups) เป็นผลตอบสนองของ subject ที่แตกต่างกันซึ่งอยู่ใน Treatment เดียวกัน

ถ้า  มี 1 ตัว แต่สามารถแบ่งออกเป็นกลุ่ม ได้มากกว่า 2 กลุ่ม คือ one way ANOVA

ถ้า  มี 2 ตัว ขึ้นไป และ แต่ละตัวสามารถแบ่งออกเป็นกลุ่ม ได้ตั้งแต่ 2 กลุ่มขึ้นไป คือ 2-way ANOVA or higher

Assumption

1. ข้อมูลได้มาอย่างสุ่มและอิสระต่อกัน

2. ความแปรปรวนในแต่ละกลุ่มเท่ากัน (homogeneity of variance)

3. ตัวแปรตามมีระดับการวัดเป็น Interval Scale หรือ Ratio Scale และมีการแจกแจงแบบปกติในแต่ละกลุ่ม

4. สำหรับการวิจัยเชิงทดลองนั้น Subject ควรมีลักษณะดังนี้

4.1 ก่อนการได้รับ treatment หรือก่อนการทดลอง การตอบสนองของ subject มีความสม่ำเสมอกัน (Homogeneous of baseline)

4.2 ลักษณะทั่วไป (Characteristics) ของ Subjects ในแต่ละกลุ่มต้องมีลักษณะคล้ายคลึงกัน (Similarity)

ในการขจัด bias ของการทดลองสามารถกระทำได้โดย Random allocation หน่วยทดลองเข้ากลุ่มทดลองการทดสอบ Normality

1. ใช้การ plot ลงบน normal probability paper หรือทำ histogram

2. ใช้การทดสอบ Goodness of fit โดยใช้ chi-square

3. ใช้การทดสอบ Kolmogorov-Smirnov Test

การทดสอบ Homogeneity of variance

โดยที่   (all variance are equal)

สถิติที่ใช้ทดสอบ คือ

1. Cochran's test ใช้ในกรณีข้อมูลแต่ละชุดมีขนาด (nj) เท่ากัน

2. Bartlett's test ใช้ในกรณีข้อมูลแต่ละชุดมีจำนวนไม่เท่ากัน

3. F-test = Max variance / min variance เป็นวิธีที่ง่ายที่สุดในการทดสอบ

ขั้นตอนในการวิเคราะห์

1. ศึกษารูปแบบของงานวิจัยว่าเป็นแบบ experimental หรือ survey research ศึกษาวัตถุประสงค์ของงานวิจัย อย่างละเอียด

2. เก็บข้อมูลในระบบของฐานข้อมูล

3. ทำการทดสอบ normality of dependent variable แต่ละกลุ่ม

4. พิจารณา Homogeneity of variance

5. พิจารณาค่า F จากตาราง Analysis of variance ถ้ามีระดับนัยสำคัญควรวิเคราะห์ข้อ 6

6. พิจารณาเปรียบเทียบเป็นคู่ (Multiple Comparison)

วันพฤหัสบดีที่ 14 มกราคม พ.ศ. 2559

Basic Business Research Methods

Organizations use research, especially in market research activities. Market research is used to identify potential markets, the needs and wants of each, how those needs and wants can be met, how products and services could be packaged to be most accessible to customers and clients, the best pricing for those products and services, who the competitors are and how best to complete against each, potential collaborators and how to collaborate with each -- and many other applications of research. Organizations can conduct this research without having to have advanced skills. This topic aims to explain the most important practices in research that provide the most useful results.

Sections of This Topic Include

------------------------------------------------------------
Cr: http://managementhelp.org/businessresearch/index.htm

วันอังคารที่ 12 มกราคม พ.ศ. 2559

เทคนิคการเขียนวิทยานิพนธ์

 บทที่ว่าด้วยระเบียบวิจัยนั้นมักจะสร้างความเบื่อหน่ายให้หลายๆ คนที่ไม่รู้ว่า
1. จะเขียนอย่างไรไม่ให้เป็นการลอกเลียนแบบหรือ Plagiarism
2. ควรจะต้องเขียนเกี่ยวกับอะไรบ้าง
3. ควรจะเขียนมากน้อยขนาดไหน
จากประสบการณ์ของผมแล้วบท Methodology ควรมีลักษณะดังนี้ครับ
1. เขียนเสมือนหนึ่งว่าเรากำลังเล่าให้ผู้อ่านฟังว่าเราทำวิจัย(วิทยานิพนธ์)นี้อย่างไร
จุดประสงค์อย่างหนึ่งของบท Methodology ก็คือ ผู้อ่านสามารถทำวิจัยแบบที่เราทำซ้ำได้อีกครั้ง (Replication) ดังนั้นข้อมูลที่เราจะเขียนลงไปในบทนี้ควรจะมีรายละเอียดที่เพียงพอให้ผู้อ่านสามารถทำได้ดังกล่าว อย่างไรก็ตามเราอาจจะไม่ต้องเขียนไปทุกรายละเอียดแต่เล่าในเชิงขั้นตอนว่าทำอะไรอย่างไรบ้าง เช่น สัมภาษณ์โดยวิธีการใด ตัวต่อตัว หรือ ผ่านโทรศัพท์ หรือผ่าน Skype มีการเลือกกลุ่มตัวอย่างด้วยวิธีไหน จำนวนตัวอย่างใช้วิธีใดคำนวณหรือเลือกและสุ่มโดยบังเอิญ หรือ โดยเฉพาะเจาะจงตามความสะดวกหรือการเข้าถึงข้อมูล หากการสัมภาษณ์ใช้แบบสอบถามก็ควรจะมีการแนบแบบสอบถามหรือรายชื่อหัวข้อที่ถามในกรณีที่เป็นการสัมภาษณ์แบบกึ่งเปิดกึ่งปิด โดยควรแนบไว้ที่ภาคผนวก (Appendices) มากกว่าแนบไปในตัวบท
2. เขียนเสมือนหนึ่งว่าเรากำลังอธิบายว่าเราตัดสินใจเลือกและออกแบบกระบวนการต่างๆ ในการทำวิจัยอย่างไร
ในข้อนี้เป็นการแสดงว่าระเบียบวิธีวิจัยของเรานั้นมีความถูกต้องและเหมาะสมตามหลัก มีแนวทางการเขียนดังนี้
2.1 การเลือกระเบียบวิธีวิจัยให้เหมาะสมนั้นขึ้นอยู่กับคำถามวิจัยที่ใช้ ไม่ใช่โดยเหตุผลอื่นๆ เช่น เราคำนวณเก่งหรือไม่เก่ง หรือแม้จะอ้างว่ายังไม่มีใครใช้วิธีนี้ในการวิจัยเรื่องนั้นๆ ซึ่งแม้บางทีจะพอรับได้แต่ก็ไม่ถูกต้องตลอดไป ตัวอย่างการเลือกวิธีการวิจัยที่เหมาะสมเช่น
ก. คำถามวิจัยเริ่มต้นด้วยคำว่า ทำไม… จึงต้องการรายละเอียดที่จะอธิบายสาเหตุดังกล่าวประกอบกับยังไม่มีแนวทางจากงานวิจัยในอดีตมากนักจึงใช้การสัมภาษณ์แบบปลายเปิดแบบเชิงลึก หรือ
ข. คำถามวิจัยเริ่มด้วยคำว่า อะไร… เท่าไหร่ ต้องการคำตอบในเชิงปริมาณครอบคลุมกลุ่มตัวอย่างขนาดใหญ่ จึงใช้การสำรวจโดยใช้แบบสอบถาม
2.2 การเลือกวิธีการวิจัยอาจจะอ้างอิงจากงานวิจัยในอดีตที่ใกล้เคียงกัน
เช่นจำนวนตัวอย่างที่เหมาะสม  หรือหัวข้อคำถาม หรือกรอบแนวคิดที่มากจากงานวิจัยในอดีต
2.3 การเลือกวิธีการวิจัยอาจจะอ้างอิงจากการศึกษาขั้นต้น
หากมีโอกาสและเวลาพอ การศึกษาขั้นต้นเช่นกรณีศึกษานำร่อง (Pilot study) อาจจะเป็นตัวกำหนด กรอบแนวคิด หรือ คำถามวิจัย หรือ ตัวแปรที่เหมาะสมก็ได้ หรือหากงานที่ศึกษาใช้แบบสอบถามที่มี Likert Scale การเลือกว่าจะใช้ Likert Scale ที่ 5, 7 หรือ 10 นั้นอาจจะมาจากการทดลองเก็บข้อมูลขั้นต้นก็ได้
สำหรับ MSc Dissertation ที่มีความยาวไม่เกิน 15,000 คำ บท Methodology ปกติจะมีความยาวประมาณ 2,000-5,000 คำ แล้วแต่ความเหมาะสม
บทที่ว่าด้วยการทบทวนวรรณกรรมควรมีลักษณะดังนี้
  1. เล่าเรื่องความเป็นมาโดยสรุปว่าเรื่องที่กำลังวิจัยอยู่นั้นมีการศึกษาในอดีตเป็นมาอย่างไรบ้าง โดยใคร ใช้วิธีอะไร ได้ผลเป็นอย่างไร โดยอาจจะสรุปตามหัวข้อย่อย หรืออาจเล่าเรื่องตามลำดับเวลา ควรเป็นการสรุปโดยวิเคราะห์ข้อดีข้อเสีย สาหตุที่แต่ละงานที่ผ่านมาได้ผลเหมือนหรือแตกต่างกันอย่างไร
  2. ชี้ให้เห็นถึงช่องว่างในวรรณกรรม หรือ Gaps in Literature เพื่อสื่อว่าสิ่งที่เรากำลังจะทำวิจัยนั้นยังไม่มีใครทำมาก่อน โดยควรเป็นช่องว่างในเรื่องของปัญหาวิจัยที่ยังไม่มีคำตอบ ไม่ใช่วิธีการที่ยังไม่มีใครทำ
  3. อาจจะมีการสรุปทฤษฎีที่เกี่ยวข้องกับเรื่องที่วิจัยอยู่ด้วยโดยไม่จำเป็นจะต้องเป็นทฤษฎีในโลจิสติกส์อย่างเดียวเท่านั้น แต่อาจเป็นศาสตร์อื่นๆ ที่เกี่ยวข่้องเช่น จิตวิทยา หรือ สังคมวิทยา หรือ เศรษฐศาสตร์
--------------------------------------------------------------------------------------------
Cr : http://pairach.com/2011/08/07/part2_research_methodolog/

ระเบียบวิธีวิจัยทางสังคมศาสตร์

ข้อเสนอโครงการวิจัยเบื้องต้นและข้อเสนอโครงการเต็มรูป
ข้อเสนอโครงการวิจัยเขียนได้  2  รูปแบบ
                1. ข้อเสนอโครงการวิจัยเบื้องต้น  ควรมีความยาวประมาณ 2 – 5 หน้า โดยผู้เขียนข้อเสนอโครงการจะชี้ประเด็นที่สำคัญที่จะศึกษาและวิธีการศึกษาอย่าง ย่อๆ
          2. ข้อเสนอโครงการเต็มรูป ความยาวไม่ควรต่ำกว่า  20 หน้า ให้เขียนรายละเอียดทุกอย่างที่อยู่ใน pre-proposal พร้อมเพิ่มเติมบางรายการ และต้องเขียนวิธีการศึกษาให้ละเอียดที่สุด
               
กรอบแนวคิด
(conceptual framework)
กำหนดปัญหา
(problem identification)
การทบทวนเอกสาร
(literature review)
วิธีการศึกษา
(method and procedures)
วัตถุประสงค์
(objectives)
ความเชื่อมโยงของส่วนประกอบสำคัญในข้อเสนอโครงการวิจัย

จาก Ethridge ยังมีข้อเสนอแนะแก่ผู้วิจัยว่า ในกรณีการเขียนข้อเสนอแนะโครงการวิจัยแต่
ละครั้ง ผู้วิจัยควรตระหนักถึงประเด็นต่าง ๆ ดังนี้
                1. ผู้วิจัยมีความสนใจกับปัญหาที่จะทำหรือไม่
                2. มีความขาดแคลนองค์ความรู้เกี่ยวกับปัญหาที่จะทำวิจัยนั้น ๆ จริงหรือไม่
                3. ผู้วิจัยตระหนักถึงความต้องการของคนอื่น ๆ ที่มีต่อโครงการวิจัยนั้น ๆ หรือไม่
                4. วัตถุประสงค์ของการวิจัยเหมาะสมกับปัญหาของการวิจัย และมีความเฉพาะเจาะจงเพียงพอหรือไม่
                5. ผู้วิจัยมีทรัพยากร(ความรู้ อุปกรณ์ สิ่งอำนวยความสะดวก และเงินทุนเพียงพอสำหรับทำโครงการนั้น ๆ หรือไม่)
                6. โครงการวิจัยมีข้อจำกัดทั้งภายในและภายนอกอะไรหรือไม่ อย่างไร
                7. คุณค่าที่ได้รับจากโครงการวิจัยมากกว่าต้นทุนที่เสียไปหรือไม่
                8. ผลของการวิจัยสามารถนำไปใช้ได้อย่างกว้างขวางหรือไม่

ประเด็นที่ควรมีในโครงการวิจัย
  1. กล่าวถึงปัญหาในการวิจัย
  2. ชี้ให้เห็นความสำคัญของปัญหา
  3. แสดงนิยาม ข้อสมมติ และข้อจำกัดให้ชัดเจน
  4. ทบทวนวรรณกรรม หรือจัดทำวรรณกรรมปริทัศน์
  5. ชี้ให้เห็นสมมติฐานที่ตั้งขึ้น
  6. แสดงวิธีการที่ใช้ในการศึกษา
  7. แสดงแผนการดำเนินงาน หรือระยะเวลาในการทำงานแต่ละขั้นตอน

ความสอดคล้องระหว่างชื่อเรื่อง วัตถุประสงค์และวิธีการศึกษา
                ก่อนลงมือเขียนวัตถุประสงค์และวิธีการศึกษา ผู้วิจัยต้องพิจารณาก่อนว่าชื่อเรื่อง หรือชื่อโครงการที่จะทำวิจัยนั้นสื่อความได้ดีหรือยัง ซึ่งหมายถึงเมื่ออ่านชื่อโครงการวิจัยแล้วผู้อ่านสามารถทราบได้ทันทีว่าผู้วิจัยจะทำอะไรในโครงการนั้น และเรื่องที่จะทำวิจัยนั้นก็แปลงมาจากวัตถุประสงค์ของการวิจัย  อาจเป็นข้อเดียวหรือพรรณนา ความหลายข้อ


การตรวจสอบความสมบูรณ์ของข้อเสนอโครงการวิจัย
                ข้อเสนอโครงการวิจัยนั้น ต้องเป็นข้อเสนอวิจัยที่ดี มีความครบถ้วนสมบูรณ์ตามที่ควรจะเป็น เพื่อตรวจสอบความครบถ้วนสมบูรณ์ของข้อเสนอโครงการวิจัย ต้องตรวจสอบอีกครั้ง หลังจากเขียนร่างครั้งแรกเสร็จแล้ว เพื่อให้แน่ใจว่าข้อเสนอโครงการที่เขียนนั้นครบถ้วนสมบูรณ์ โดยประเด็นที่จะตรวจสอบ ดังนี้
  1. หัวข้อชัดเจนและกะทัดรัด
  2. ปัญหาในการวิจัยได้ถูกกล่าวไว้อย่างชัดเจน
  3. ข้อจำกัดในการวิจัยได้ถูกกล่าวไว้อย่างชัดเจน
  4. ข้อสมมติในการวิจัยได้ถูกกล่าวไว้อย่างชัดเจน
  5. ข้อสมมติที่ตั้งขึ้นมีเหตุผลสนับสนุน
  6. คำสำคัญต่าง ๆ ได้ถูกนิยามไว้อย่างดี
  7. ประเด็นที่จะศึกษาได้ถูกกล่าวไว้อย่างชัดเจน
  8. สมมุติฐานหรือคำถามในการวิจัยได้ถูกกล่าวไว้อย่างชัดเจน
  9. สมมุติฐานหรือคำถามในการวิจัยสามารถทดสอบหรือหาคำตอบได้
  10. ความสัมพันธ์ ความเหมือน หรือความแตกต่าง ระหว่างวิจัยชิ้นนี้ กับงานวิจัยที่เคยทำกันมา ได้กล่าวไว้อย่างชัดเจน
  11. วรรณกรรมปริทัศน์ได้ถูกสรุปไว้อย่างดี
  12. วิธีการศึกษาได้ถูกกล่าวไว้อย่างละเอียด
  13. วิธีการศึกษาที่ใช้นั้นเหมาะสมสำหรับการหาคำตอบ
  14. ประชากรและตัวอย่างได้เขียนไว้อย่างชัดเจน
  15. วิธีการคัดเลือกตัวอย่างที่ใช้มีความเหมาะสม
  16. วิธีการเก็บข้อมูลได้กล่าวถึงอย่างละเอียด
  17. วิธีการเก็บข้อมูลเหมาะสมกับคำตอบที่ต้องการ
  18. วิธีการที่ใช้ในการวิเคราะห์ข้อมูลมีความเหมาะสม
  19. การเขียนเครื่องหมายวรรคตอนทำได้อย่างถูกต้อง
  20. มีการตรวจสอบคำผิดและหลักไวยากรแล้ว
  21. ข้อความที่เขียนมีความยุติธรรม ไม่เข้าข้างฝ่ายใดฝ่ายหนึ่ง หรือมีอคติ
  22. มีการใช้ตารางและรูปภาพอย่างมีประสิทธิภาพ

จุดอ่อนของข้อเสนอโครงการวิจัยที่เสนอขอรับเงินทุนวิจัย
                การเขียนข้อเสนอโครงการวิจัยต้อง ทำให้ผู้อ่านมองเห็นภาพชัดเจนว่า จะเป็นอย่างไร สรุปได้ดังนี้
                1. เขียนประเด็นชัดเจน และตอบปัญหาในการเขียนข้อเสนอโครงการวิจัยคือ why  what  how
                2. พยายามชี้ชวนให้ผู้อ่านโดยเฉพาะแหล่งที่ให้การสนับสนุนทางเงินทุน เห็นความสำคัญของเรื่องหรือปัญหาที่จะทำวิจัย
                3. เขียนรายละเอียดให้มากที่สุดเท่าที่จะทำได้ โดนเฉพาะในส่วนของวิธีการศึกษา หรือดำเนินการวิจัย เพื่อให้ผู้อ่านทราบว่าเราจะทำอย่างไรจึงจะหาคำตอบได้
                4. แสดงแผนการและขั้นตอนการดำเนินงานให้ชัดเจน และสอดคล้องกับความเป็นไปได้ของโครงการในแง่ บุคลากร งบประมาณ และระยะเวลาของการทำวิจัย
                5. เนื้อความที่เขียนควรจะราบรื่น ต่อเนื่อง และกลมกลืน ตลอด (วิธีช่วยคือ อ่านทบทวนหลาย ๆ ครั้ง แล้วแก้ไข/ปรับปรุง)


การเก็บรวบรวมข้อมูล

ประเภทของข้อมูล
                ข้อมูลที่จะเก็บมีคุณสมบัติดังนี้
                1. สอดคล้องกับวัตถุประสงค์  กรอบแนวคิด สมมุติฐาน เครื่องมือ หรือวิธีการที่ใช้ในการวิเคราะห์ข้อมูล
                2. มีความถูกต้อง
                3. มีความน่าเชื่อถือ
ฉะนั้นก่อนลงมือเก็บข้อมูล ผู้วิจัยจะต้อง
                1. ทบทวนวัตถุประสงค์   วิธีการศึกษา  และสมมุติฐานของงานวิจัยว่างานวิจัยดังกล่าวมีตัวแปรอะไรบ้าง ข้อมูลที่จะใช้เป็นประเภทใด แหล่งข้อมูลอยู่ที่ไหน จะหามาได้อย่างไร
                2. กรณีที่เป็นข้อมูลปฐมภูมิ จะหามาโดยวิธีใด เช่น การใช้แบบสอบถาม การใช้แบบทดสอบ การสัมภาษณ์ การสังเกต หรือการทดลอง ประชากรเป้าหมายมีมากน้อยเพียงใด กรอบการเลือกตัวอย่างเป็นอย่างไร
                3. กรณีที่เป็นทุติยภูมิ ก็ต้องทราบว่าแหล่งข้อมูลสำหรับตัวแปรนั้น ๆ อยู่ที่ไหน มีกี่แห่ง สมควรจะได้แห่งใดก่อนหลัง และแหล่งใดเป็นแหล่งโดยตรงของข้อมูลนั้น
                4. กรณีที่ตัวแปรหนึ่ง ๆ สามารถใช้ข้อมูลหรือตัวเลขที่แสดงถึงตัวแปรนั้นได้มากกว่า 1 ตัว ผู้วิจัยต้องพิจารณาว่าควรใช้ข้อมูลตัวใดจึงจะดีที่สุด ทั้งในแง่ของความถูกต้อง  ความสะดวก หรือความสมบูรณ์ของข้อมูล

มาตราวัดระดับของข้อมูล
                เมื่อมีการวิจัย ใด ๆ ก็ตามก่อนลงมือเก็บรวบรวมข้อมูล ผู้วิจัยต้องทราบแน่นอนแล้วว่าข้อมูลที่ต้องใช้ในงานวิจัยนั้นมีอะไรบ้าง และจะเก็บรวบรวมมาจากไหน ด้วยวิธีการอะไรมาตราวัดระดับของข้อมูลมี 4 ระดับ
                1. ข้อมูลในมาตรวัดนามบัญญัติ ข้อมูลที่อยู่ในระดับนี้จะเป็นข้อมูลในระดับต่ำสุดที่มีข้อจำกัดทางด้านการใช้เครื่องมือทางสถิติมากที่สุด เป็นข้อมูลที่แยกออกเป็นกลุ่ม ไ ได้ และคุณสมบัติของข้อมูลในแต่ละกลุ่มต่างกันอย่างเด็ดขาด ไม่อาจมาบวกหรือลบกันได้ เช่น เพศ ศาสนา สีผิว
                2. ข้อมูลในมาตรวัดอันดับ เป็นข้อมูลที่ไม่เพียงแต่แบ่งออกเป็นกลุ่มได้ แต่ยังสามารถบอกลำดับของข้อมูลนั้น ๆ ได้ด้วย
                3. ข้อมูลในมาตรวัดอันตราภาค หรือข้อมูลที่สามารถทำเป็นช่วงต่อเนื่องกันได้เป็นข้อมูลที่บอกระยะความห่างซึ่งกันและกันด้วยช่วงที่เท่ากัน คือสามารถกำหนดช่วงความห่างของความแตกต่างได้แน่นอน สามารถบอกหรือลบด้วยค่าคงที่ได้โดยไม่มีผลต่อการเปลี่ยนแปลงในอันดับ หรือขนาดของความแตกต่าง
                4. ข้อมูลในมาตรวัดอัตราส่วน เป็นข้อมูลที่มีทั้งระดับ 3 ระดับรวมกัน ยังมีคุณสมบัติเพิ่มเติมคือ มีจุดเริ่มต้นหรือมีศูนย์ที่แท้จริง และเป็นข้อมูลที่สามารถชั่งตวงได้ เช่น  นน.  ส่วนสูง

การเก็บรวมรวมข้อมูลทุติยภูมิ
                ผู้วิจัยต้องออกไปหาข้อมูลจากแหล่งของเจ้าของข้อมูลโดยตรง หรือแหล่งรวบรวมข้อมูลเหล่านั้น  ต้องแน่ใจว่าข้อมูลที่มีอยู่นั้นเพียงพอต่อการวิเคราะห์ และมีการปรับ ข้อมูลเพื่อให้ถูกต้อง สอดคล้อง และเหมาะสมกับการวิเคราะห์ข้อมูล

การเก็บรวบรวมข้อมูลปฐมภูมิและการเลือกตัวอย่าง
                1. หลักการในการเลือกตัวอย่าง
                2. ประชากรเป้าหมายและกรอบการเลือกตัวอย่าง
                3. การเลือกตัวอย่างโดยคำนึงถึงความน่าจะเป็น
                4. การเลือกตัวอย่างโดยไม่คำนึงถึงความน่าจะเป็น
                5. การกำหนดจำนวนตัวอย่าง

เครื่องมือที่ใช้ในการเก็บรวบรวมข้อมูล

ข้อได้เปรียบของการใช้แบบสอบถาม
ข้อเสียเปรียบของการใช้แบบสอบถาม
1.สามารถใช้ได้หลายวิธี
1. ปัญหาในการออกแบบสอบถาม
2.สามารถครอบคลุมกลุ่มคนหรือองค์กรจำนวนมากได้
2. คำถามต้องง่ายต่อการตอบ
3. ครอบคลุมพื้นที่ภูมิศาสตร์อย่างกว้างขวาง
3. อัตราการตอบกลับมักต่ำ
4. ค่าใช้จ่ายค่อนข้างถูก
4. ใช้เวลามากระหว่างรอการตอบกลับ
5. อาจไม่จำเป็นต้องมีการเตรียมการล่วงหน้า
5. คนที่จะตอบต้องสามารถอ่านออกเขียนได้
6. คนตอบอาจไม่รู้สึกลำบากใจในการตอบ
6. ไม่สามารถควบคุมความสมบูรณ์หรือความครบถ้วนของการตอบ
7. ผู้ตอบสามารถพิจารณาว่าจะตอบหรือไม่ตอบก็ได้
7. ผู้ตอบรู้คำถามแล้วอาจจะไม่ตอบหรือไม่ตอบก็ได้


ข้อได้เปรียบของการสัมภาษณ์
ข้อเสียเปรียบของการสัมภาษณ์
1. อัตราการตอบกลับสูง
1. ต้องนัดหมายเวลาให้แน่นอน
2. ได้ข้อมูลทันทีและครบถ้วน
2. ใช้เวลามาก
3. สามารถใช้คำถามลึก ๆ ได้
3. ค่าใช้จ่ายสูง
4. ผู้สัมภาษณ์สามารถอธิบายเพิ่มเติมได้หากมีปัญหา
4. มีข้อจำกัดทางด้านภูมิศาสตร์
5. สามารถสำรวจแรงจูงใจหรือความรู้สึกของผู้ตอบได้
5. อาจมีความเอนเอียงได้
6. สามารถประเมินความรู้สึกของผู้ตอบได้
6. คำถามบางข้ออาจทำให้ผู้ตอบอับอายได้
7. สามารถใช้เครื่องบันทึกเสียงได้
7. ต้องมีการฝึกฝนการสัมภาษณ์เป็นอย่างดี



การวิเคราะห์และการแปลความหมายข้อมูล

การตรวจสอบและการแยกประเภทข้อมูล
งานวิจัยที่ต้องมีการสำรวจข้อมูลภาคสนามหรือใช้ข้อมูลปฐมภูมิ โดยเฉพาะข้อมูลปฐมภูมิที่ใช้แบบสอบถามเป็นเครื่องในการเก็บ เมื่อผู้วิจัยจัดทำแบบสอบถามเสร็จเรียนร้อยแล้ว ผู้วิจัยอาจนำคำถามต่าง ๆ ในแบบสอบถามมาทำเป็นตารางหุ่นเตรียมการไว้ก่อน การกระทำดังกล่าวเป็นการช่วยให้ผู้วิจัยได้ตรวจสอบความสมบูรณ์ของแบบสอบถามอีกทางหนึ่งด้วย

เครื่องมือในการวิเคราะห์ข้อมูล
                เครื่องมือทางสถิติที่จะใช้ในการวิเคราะห์ข้อมูลในมาตรวัดต่าง ๆ ผู้วิจัยสามารถเลือกใช้เครื่องมือและวิธีการวิเคราะห์ข้อมูล ให้เหมาะสมกับงานวิจัยที่กำลังดำเนินการอยู่ได้ โดยทั่วไปการวิเคราะห์ข้อมูลสามารถทำได้ใน 2 รูปแบบหลักคือ การวิเคราะห์ข้อมูลเชิงเหตุผล และการวิเคราะห์ข้อมูลเชิงสถิติ

การวิเคราะห์ข้อมูลเชิงเหตุผล
                เป็นการวิเคราะห์เชิงพรรณนาอย่างแท้จริงผลส่วนใหญ่อยู่ในลักษณะการบรรยายผู้วิจัยต้องอ่านทฤษฏีให้แตกฉาน การนวิเคราะห์จะต้องเป็นขั้นตอน แสดงความเป็นเหตุผลซึ่งกันและกันมีข้อเท็จจริงสนันสนุนการวิเคราะห์

การวิเคราะห์ข้อมูลเชิงสถิติ
          สถิติที่ใช้แบ่งออกเป็น 2 ประเภทใหญ่ ๆ คือ สถิติพรรณนา และสถิติอ้างอิง สถิติพรรณนาเป็นสถิติที่ใช้สรุปหรือบรรยายให้เห็นคุณลักษณะของตัวแปรที่เก็บรวบรวมมาจากประชากรหรือจากกลุ่มหนึ่งกลุ่มใดโดยเฉพาะ  สถิติอ้างอิง เป็นสถิติที่ใช้ในการวิเคราะห์ข้อมูลจากกลุ่มตัวอย่างแล้วสรุปไปยังประชากรเป้าหมายที่ต้องการศึกษา โดยอาศัยทฤษฏีความน่าจะเป็น
เครื่องมือทางสถิติ
                1. การวิเคราะห์เชิงบรรยาย วัตถุประสงค์เพื่อพรรณนา ความเกี่ยวกับข้อมูลชุดที่ใช้
                2. การวิเคราะห์เชิงอ้างอิง ใช้ในการหาข้อสรุปเกี่ยวกับคุณลักษณะของประชากรจากตัวอย่าง
                3. การวิเคราะห์ความแตกต่าง ใช้สำหรับเปรียบเทียบค่าเฉลี่ยของข้อมูลกลุ่มหนึ่งกับค่าเฉลี่ยของข้อมูลอีกกลุ่มหนึ่ง
                4. การวิเคราะห์ความสัมพันธ์ ใช้สำหรับการพิจารณาความแข็งแกร่งและทิศทางความสัมพันธ์ระหว่างตัวแปร 2 ตัวขึ้นไป
                5. การวิเคราะห์เชิงพยากรณ์ ใช้สำหรับการพยากรณ์เหตุการณ์ที่จะเกิดขึ้นในอนาคต

วันอังคารที่ 28 เมษายน พ.ศ. 2558

Data Mining: What is Data Mining

Overview

Generally, data mining (sometimes called data or knowledge discovery) is the process of analyzing data from different perspectives and summarizing it into useful information - information that can be used to increase revenue, cuts costs, or both. Data mining software is one of a number of analytical tools for analyzing data. It allows users to analyze data from many different dimensions or angles, categorize it, and summarize the relationships identified. Technically, data mining is the process of finding correlations or patterns among dozens of fields in large relational databases.

Continuous Innovation

Although data mining is a relatively new term, the technology is not. Companies have used powerful computers to sift through volumes of supermarket scanner data and analyze market research reports for years. However, continuous innovations in computer processing power, disk storage, and statistical software are dramatically increasing the accuracy of analysis while driving down the cost.

Example

For example, one Midwest grocery chain used the data mining capacity of Oracle software to analyze local buying patterns. They discovered that when men bought diapers on Thursdays and Saturdays, they also tended to buy beer. Further analysis showed that these shoppers typically did their weekly grocery shopping on Saturdays. On Thursdays, however, they only bought a few items. The retailer concluded that they purchased the beer to have it available for the upcoming weekend. The grocery chain could use this newly discovered information in various ways to increase revenue. For example, they could move the beer display closer to the diaper display. And, they could make sure beer and diapers were sold at full price on Thursdays.

Data, Information, and Knowledge

Data

Data are any facts, numbers, or text that can be processed by a computer. Today, organizations are accumulating vast and growing amounts of data in different formats and different databases. This includes:
  • operational or transactional data such as, sales, cost, inventory, payroll, and accounting
  • nonoperational data, such as industry sales, forecast data, and macro economic data
  • meta data - data about the data itself, such as logical database design or data dictionary definitions

Information

The patterns, associations, or relationships among all this data can provide information. For example, analysis of retail point of sale transaction data can yield information on which products are selling and when.

Knowledge

Information can be converted into knowledge about historical patterns and future trends. For example, summary information on retail supermarket sales can be analyzed in light of promotional efforts to provide knowledge of consumer buying behavior. Thus, a manufacturer or retailer could determine which items are most susceptible to promotional efforts.

Data Warehouses

Dramatic advances in data capture, processing power, data transmission, and storage capabilities are enabling organizations to integrate their various databases into data warehouses. Data warehousing is defined as a process of centralized data management and retrieval. Data warehousing, like data mining, is a relatively new term although the concept itself has been around for years. Data warehousing represents an ideal vision of maintaining a central repository of all organizational data. Centralization of data is needed to maximize user access and analysis. Dramatic technological advances are making this vision a reality for many companies. And, equally dramatic advances in data analysis software are allowing users to access this data freely. The data analysis software is what supports data mining.

What can data mining do?

Data mining is primarily used today by companies with a strong consumer focus - retail, financial, communication, and marketing organizations. It enables these companies to determine relationships among "internal" factors such as price, product positioning, or staff skills, and "external" factors such as economic indicators, competition, and customer demographics. And, it enables them to determine the impact on sales, customer satisfaction, and corporate profits. Finally, it enables them to "drill down" into summary information to view detail transactional data.
With data mining, a retailer could use point-of-sale records of customer purchases to send targeted promotions based on an individual's purchase history. By mining demographic data from comment or warranty cards, the retailer could develop products and promotions to appeal to specific customer segments.
For example, Blockbuster Entertainment mines its video rental history database to recommend rentals to individual customers. American Express can suggest products to its cardholders based on analysis of their monthly expenditures.
WalMart is pioneering massive data mining to transform its supplier relationships. WalMart captures point-of-sale transactions from over 2,900 stores in 6 countries and continuously transmits this data to its massive 7.5 terabyte Teradata data warehouse. WalMart allows more than 3,500 suppliers, to access data on their products and perform data analyses. These suppliers use this data to identify customer buying patterns at the store display level. They use this information to manage local store inventory and identify new merchandising opportunities. In 1995, WalMart computers processed over 1 million complex data queries.
The National Basketball Association (NBA) is exploring a data mining application that can be used in conjunction with image recordings of basketball games. The Advanced Scoutsoftware analyzes the movements of players to help coaches orchestrate plays and strategies. For example, an analysis of the play-by-play sheet of the game played between the New York Knicks and the Cleveland Cavaliers on January 6, 1995 reveals that when Mark Price played the Guard position, John Williams attempted four jump shots and made each one! Advanced Scout not only finds this pattern, but explains that it is interesting because it differs considerably from the average shooting percentage of 49.30% for the Cavaliers during that game.
By using the NBA universal clock, a coach can automatically bring up the video clips showing each of the jump shots attempted by Williams with Price on the floor, without needing to comb through hours of video footage. Those clips show a very successful pick-and-roll play in which Price draws the Knick's defense and then finds Williams for an open jump shot.

How does data mining work?

While large-scale information technology has been evolving separate transaction and analytical systems, data mining provides the link between the two. Data mining software analyzes relationships and patterns in stored transaction data based on open-ended user queries. Several types of analytical software are available: statistical, machine learning, and neural networks. Generally, any of four types of relationships are sought:
  • Classes: Stored data is used to locate data in predetermined groups. For example, a restaurant chain could mine customer purchase data to determine when customers visit and what they typically order. This information could be used to increase traffic by having daily specials.
  • Clusters: Data items are grouped according to logical relationships or consumer preferences. For example, data can be mined to identify market segments or consumer affinities.
  • Associations: Data can be mined to identify associations. The beer-diaper example is an example of associative mining.
  • Sequential patterns: Data is mined to anticipate behavior patterns and trends. For example, an outdoor equipment retailer could predict the likelihood of a backpack being purchased based on a consumer's purchase of sleeping bags and hiking shoes.
Data mining consists of five major elements:
  • Extract, transform, and load transaction data onto the data warehouse system.
  • Store and manage the data in a multidimensional database system.
  • Provide data access to business analysts and information technology professionals.
  • Analyze the data by application software.
  • Present the data in a useful format, such as a graph or table.
Different levels of analysis are available:
  • Artificial neural networks: Non-linear predictive models that learn through training and resemble biological neural networks in structure.
  • Genetic algorithms: Optimization techniques that use processes such as genetic combination, mutation, and natural selection in a design based on the concepts of natural evolution.
  • Decision trees: Tree-shaped structures that represent sets of decisions. These decisions generate rules for the classification of a dataset. Specific decision tree methods include Classification and Regression Trees (CART) and Chi Square Automatic Interaction Detection (CHAID) . CART and CHAID are decision tree techniques used for classification of a dataset. They provide a set of rules that you can apply to a new (unclassified) dataset to predict which records will have a given outcome. CART segments a dataset by creating 2-way splits while CHAID segments using chi square tests to create multi-way splits. CART typically requires less data preparation than CHAID.
  • Nearest neighbor method: A technique that classifies each record in a dataset based on a combination of the classes of the k record(s) most similar to it in a historical dataset (wherek 1). Sometimes called the k-nearest neighbor technique.
  • Rule induction: The extraction of useful if-then rules from data based on statistical significance.
  • Data visualization: The visual interpretation of complex relationships in multidimensional data. Graphics tools are used to illustrate data relationships.

What technological infrastructure is required?

Today, data mining applications are available on all size systems for mainframe, client/server, and PC platforms. System prices range from several thousand dollars for the smallest applications up to $1 million a terabyte for the largest. Enterprise-wide applications generally range in size from 10 gigabytes to over 11 terabytes. NCR has the capacity to deliver applications exceeding 100 terabytes. There are two critical technological drivers:
  • Size of the database: the more data being processed and maintained, the more powerful the system required.
  • Query complexity: the more complex the queries and the greater the number of queries being processed, the more powerful the system required.
Relational database storage and management technology is adequate for many data mining applications less than 50 gigabytes. However, this infrastructure needs to be significantly enhanced to support larger applications. Some vendors have added extensive indexing capabilities to improve query performance. Others use new hardware architectures such as Massively Parallel Processors (MPP) to achieve order-of-magnitude improvements in query time. For example, MPP systems from NCR link hundreds of high-speed Pentium processors to achieve performance levels exceeding those of the largest supercomputers.

Cr : http://www.anderson.ucla.edu/faculty/jason.frand/teacher/technologies/palace/datamining.htm