วิธีการทางสถิติยังช่วยให้คุณวิเคราะห์ข้อมูลได้อีกด้วย วิธีทางสถิติในการวิเคราะห์ข้อมูล

💖 ชอบไหม?แชร์ลิงก์กับเพื่อนของคุณ

มีการอธิบายรายละเอียดเพียงพอในวรรณกรรมในประเทศ อย่างไรก็ตามในทางปฏิบัติของวิสาหกิจรัสเซียมีการใช้เพียงบางส่วนเท่านั้น เรามาดูกันเพิ่มเติมบ้าง วิธีการประมวลผลทางสถิติ

ข้อมูลทั่วไป

ในการปฏิบัติงานของวิสาหกิจในประเทศนั้นแพร่หลายเป็นส่วนใหญ่ วิธีการควบคุมทางสถิติ. ถ้าเราพูดถึงการควบคุมกระบวนการทางเทคโนโลยีจะสังเกตได้น้อยมาก การประยุกต์วิธีการทางสถิติกำหนดให้องค์กรจัดตั้งกลุ่มผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสม

ความหมาย

ตามข้อกำหนดของ ISO ser ซัพพลายเออร์จะต้องกำหนดความจำเป็นสำหรับวิธีการทางสถิติที่ใช้ในการพัฒนา การควบคุม และการทดสอบความสามารถของกระบวนการผลิตและประสิทธิภาพของผลิตภัณฑ์ตามมาตรา 9000 เทคนิคที่ใช้จะขึ้นอยู่กับทฤษฎีความน่าจะเป็นและการคำนวณทางคณิตศาสตร์ วิธีทางสถิติในการวิเคราะห์ข้อมูลสามารถนำไปใช้ได้ในทุกขั้นตอนของวงจรชีวิตผลิตภัณฑ์ โดยจัดให้มีการประเมินและการบัญชีระดับของความหลากหลายของผลิตภัณฑ์หรือความแปรปรวนของคุณสมบัติที่เกี่ยวข้องกับการกำหนดราคาหรือค่าที่ต้องการ เช่นเดียวกับความแปรปรวนในกระบวนการสร้าง วิธีการทางสถิติได้แก่เทคนิคที่สามารถตัดสินสถานะของปรากฏการณ์ที่กำลังศึกษาได้อย่างแม่นยำและเชื่อถือได้ ช่วยให้คุณสามารถคาดการณ์ปัญหาบางอย่างและพัฒนาวิธีแก้ปัญหาที่เหมาะสมที่สุดโดยพิจารณาจากข้อมูลข้อเท็จจริง แนวโน้ม และรูปแบบที่ศึกษา

คำแนะนำสำหรับการใช้งาน

พื้นที่หลักที่แพร่หลาย วิธีการทางสถิติได้แก่:


การปฏิบัติของประเทศที่พัฒนาแล้ว

วิธีการทางสถิติได้แก่ฐานที่รับประกันการสร้างผลิตภัณฑ์ที่มีลักษณะผู้บริโภคสูง เทคนิคเหล่านี้ใช้กันอย่างแพร่หลายในประเทศอุตสาหกรรม โดยพื้นฐานแล้ววิธีการทางสถิติคือการรับประกันว่าผู้บริโภคจะได้รับผลิตภัณฑ์ที่ตรงตามข้อกำหนดที่กำหนด ผลของการใช้งานได้รับการพิสูจน์โดยแนวปฏิบัติขององค์กรอุตสาหกรรมในญี่ปุ่น พวกเขามีส่วนช่วยให้บรรลุระดับการผลิตสูงสุดในประเทศนี้ ประสบการณ์หลายปีในต่างประเทศแสดงให้เห็นว่าเทคนิคเหล่านี้มีประสิทธิภาพเพียงใด โดยเฉพาะอย่างยิ่งเป็นที่ทราบกันดีว่า บริษัท Hewlelt Packard ซึ่งใช้วิธีการทางสถิติสามารถลดจำนวนข้อบกพร่องต่อเดือนจาก 9,000 เหลือ 45 หน่วยได้ในกรณีหนึ่ง

ปัญหาในการดำเนินการ

ในทางปฏิบัติภายในบ้าน มีอุปสรรคหลายประการที่ขัดขวางการใช้งาน วิธีการศึกษาทางสถิติตัวชี้วัด ความยากลำบากเกิดขึ้นเนื่องจาก:


การพัฒนาโปรแกรม

ต้องบอกว่าการกำหนดความจำเป็นสำหรับวิธีการทางสถิติบางอย่างในด้านคุณภาพการเลือกและการเรียนรู้เทคนิคเฉพาะนั้นค่อนข้างซับซ้อนและใช้เวลานานสำหรับองค์กรในประเทศ เพื่อการนำไปปฏิบัติอย่างมีประสิทธิผล ขอแนะนำให้พัฒนาโปรแกรมพิเศษระยะยาว ควรจัดให้มีการให้บริการซึ่งมีหน้าที่รวมถึงองค์กรและคำแนะนำด้านระเบียบวิธีของการประยุกต์วิธีการทางสถิติ ในส่วนหนึ่งของโปรแกรม จำเป็นต้องจัดเตรียมวิธีการทางเทคนิคที่เหมาะสม ฝึกอบรมผู้เชี่ยวชาญ และกำหนดองค์ประกอบของงานการผลิตที่ต้องแก้ไขโดยใช้เทคนิคที่เลือก ขอแนะนำให้เริ่มการเรียนรู้โดยใช้วิธีที่ง่ายที่สุด ตัวอย่างเช่น คุณสามารถใช้การผลิตเบื้องต้นที่มีชื่อเสียงได้ ต่อจากนั้นขอแนะนำให้ใช้เทคนิคอื่นต่อไป ตัวอย่างเช่น อาจเป็นการวิเคราะห์ความแปรปรวน การประมวลผลข้อมูลแบบเลือกสรร การควบคุมกระบวนการ การวางแผนการวิจัยและการทดลองเชิงแฟคทอเรียล เป็นต้น

การจัดหมวดหมู่

วิธีการวิเคราะห์ทางสถิติทางเศรษฐศาสตร์ ได้แก่เทคนิคที่แตกต่างกัน มันคุ้มค่าที่จะบอกว่ามีค่อนข้างมาก อย่างไรก็ตาม K. Ishikawa ผู้เชี่ยวชาญชั้นนำในด้านการจัดการคุณภาพในญี่ปุ่น แนะนำให้ใช้วิธีการหลัก 7 วิธีดังนี้

  1. แผนภูมิพาเรโต
  2. การจัดกลุ่มข้อมูลตามลักษณะทั่วไป
  3. การ์ดควบคุม
  4. แผนภาพสาเหตุและผลกระทบ
  5. ฮิสโตแกรม
  6. รายการตรวจสอบ
  7. แปลงกระจาย

จากประสบการณ์การบริหารจัดการของเขาเอง อิชิกาว่าอ้างว่า 95% ของปัญหาและปัญหาทั้งหมดในองค์กรสามารถแก้ไขได้โดยใช้แนวทางทั้งเจ็ดนี้

แผนภูมิพาเรโต

อันนี้ขึ้นอยู่กับอัตราส่วนที่แน่นอน มันถูกเรียกว่า "หลักการพาเรโต" ตามที่เขาพูด 80% ของผลกระทบเกิดขึ้นจาก 20% ของสาเหตุ แสดงให้เห็นในรูปแบบที่ชัดเจนและเข้าใจได้ถึงอิทธิพลสัมพัทธ์ของแต่ละสถานการณ์ต่อปัญหาโดยรวมโดยเรียงลำดับจากมากไปหาน้อย ผลกระทบนี้สามารถศึกษาได้จากจำนวนความสูญเสียและข้อบกพร่องที่เกิดจากแต่ละสาเหตุ อิทธิพลสัมพัทธ์แสดงโดยใช้แท่งกราฟ ซึ่งเป็นผลกระทบสะสมของปัจจัยต่างๆ โดยใช้เส้นตรงสะสม

แผนภาพสาเหตุและผลกระทบ

ปัญหาที่กำลังศึกษาอยู่นั้นแสดงให้เห็นตามอัตภาพในรูปแบบของลูกศรตรงแนวนอนและเงื่อนไขและปัจจัยที่มีอิทธิพลทางอ้อมหรือโดยตรงนั้นอยู่ในรูปแบบของความโน้มเอียง เมื่อก่อสร้างควรคำนึงถึงสถานการณ์ที่ดูเหมือนไม่มีนัยสำคัญด้วย นี่เป็นเพราะความจริงที่ว่าในทางปฏิบัติ มีหลายกรณีที่การแก้ปัญหาทำได้สำเร็จโดยการกำจัดปัจจัยหลายประการที่ดูเหมือนจะไม่สำคัญออกไป เหตุผลที่มีอิทธิพลต่อสถานการณ์หลัก (ของคำสั่งซื้อแรกและคำสั่งซื้อถัดไป) จะแสดงอยู่ในแผนภาพพร้อมลูกศรสั้นแนวนอน แผนภาพโดยละเอียดจะอยู่ในรูปของโครงกระดูกปลา

การจัดกลุ่มข้อมูล

นี้ วิธีเศรษฐศาสตร์สถิติใช้เพื่อจัดระเบียบตัวบ่งชี้ต่างๆ ที่ได้รับจากการประเมินและการวัดพารามิเตอร์ตั้งแต่หนึ่งพารามิเตอร์ขึ้นไปของวัตถุ โดยทั่วไปแล้ว ข้อมูลดังกล่าวจะถูกนำเสนอในรูปแบบของลำดับค่าที่ไม่เรียงลำดับ สิ่งเหล่านี้อาจเป็นขนาดเชิงเส้นของชิ้นงาน อุณหภูมิหลอมเหลว ความแข็งของวัสดุ จำนวนข้อบกพร่อง และอื่นๆ จากระบบดังกล่าว เป็นการยากที่จะสรุปเกี่ยวกับคุณสมบัติของผลิตภัณฑ์หรือกระบวนการสร้างผลิตภัณฑ์ การสั่งซื้อจะดำเนินการโดยใช้กราฟเส้น แสดงให้เห็นการเปลี่ยนแปลงของพารามิเตอร์ที่สังเกตได้อย่างชัดเจนในช่วงเวลาหนึ่ง

รายการตรวจสอบ

ตามกฎแล้วจะแสดงในรูปแบบของตารางการกระจายความถี่ของการเกิดขึ้นของค่าที่วัดได้ของพารามิเตอร์วัตถุในช่วงเวลาที่สอดคล้องกัน รายการตรวจสอบจะถูกรวบรวมขึ้นอยู่กับวัตถุประสงค์ของการศึกษา ช่วงของค่าตัวบ่งชี้แบ่งออกเป็นช่วงเวลาที่เท่ากัน โดยปกติแล้วหมายเลขของพวกเขาจะถูกเลือกเท่ากับรากที่สองของจำนวนการวัดที่ทำ แบบฟอร์มควรเรียบง่ายเพื่อหลีกเลี่ยงปัญหาในการกรอก อ่าน หรือตรวจสอบ

แผนภูมิแท่ง

มันถูกนำเสนอในรูปแบบของรูปหลายเหลี่ยมขั้นบันได แสดงให้เห็นการกระจายตัวของตัวชี้วัดการวัดอย่างชัดเจน ช่วงของค่าที่กำหนดจะถูกแบ่งออกเป็นช่วงเวลาที่เท่ากันซึ่งถูกลงจุดตามแนวแกนของ Abscissa สี่เหลี่ยมจะถูกสร้างขึ้นสำหรับแต่ละช่วงเวลา ความสูงเท่ากับความถี่ของการเกิดปริมาณในช่วงเวลาที่กำหนด

แปลงกระจาย

ใช้เพื่อทดสอบสมมติฐานเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรสองตัว แบบจำลองถูกสร้างขึ้นดังนี้ ค่าของพารามิเตอร์หนึ่งจะถูกพล็อตบนแกน abscissa และค่าของพารามิเตอร์อื่นจะถูกพล็อตบนแกนพิกัด เป็นผลให้มีจุดปรากฏบนกราฟ ขั้นตอนเหล่านี้จะถูกทำซ้ำสำหรับค่าตัวแปรทั้งหมด หากมีความสัมพันธ์ สนามความสัมพันธ์จะยาวขึ้น และทิศทางจะไม่ตรงกับทิศทางของแกน y หากไม่มีข้อจำกัดก็จะขนานกับแกนใดแกนหนึ่งหรือจะมีรูปร่างเป็นวงกลม

การ์ดควบคุม

ใช้ในการประเมินกระบวนการในช่วงเวลาที่กำหนด การก่อตัวของแผนภูมิควบคุมขึ้นอยู่กับข้อกำหนดต่อไปนี้:

  1. กระบวนการทั้งหมดเบี่ยงเบนไปจากพารามิเตอร์ที่ระบุเมื่อเวลาผ่านไป
  2. ปรากฏการณ์ที่ไม่แน่นอนไม่เปลี่ยนแปลงโดยบังเอิญ การเบี่ยงเบนที่เกินขีดจำกัดที่คาดไว้นั้นไม่ใช่เรื่องสุ่ม
  3. สามารถคาดการณ์การเปลี่ยนแปลงส่วนบุคคลได้
  4. กระบวนการที่เสถียรสามารถสุ่มเบี่ยงเบนไปภายในขอบเขตที่คาดไว้

ใช้ในทางปฏิบัติของวิสาหกิจรัสเซีย

ควรจะกล่าวว่าประสบการณ์ในประเทศและต่างประเทศแสดงให้เห็นว่าวิธีการทางสถิติที่มีประสิทธิภาพที่สุดในการประเมินความเสถียรและความแม่นยำของอุปกรณ์และกระบวนการทางเทคโนโลยีคือการรวบรวมแผนภูมิควบคุม วิธีนี้ยังใช้เพื่อควบคุมกำลังการผลิตที่อาจเกิดขึ้นอีกด้วย เมื่อสร้างแผนที่ จำเป็นต้องเลือกพารามิเตอร์ที่กำลังศึกษาอย่างถูกต้อง ขอแนะนำให้เลือกใช้ตัวบ่งชี้ที่เกี่ยวข้องโดยตรงกับวัตถุประสงค์ของผลิตภัณฑ์ สามารถวัดได้ง่าย และได้รับอิทธิพลจากการควบคุมกระบวนการ หากตัวเลือกดังกล่าวยากหรือไม่สมเหตุสมผล คุณสามารถประเมินปริมาณที่สัมพันธ์กัน (สัมพันธ์กัน) กับพารามิเตอร์ที่ได้รับการควบคุมได้

ความแตกต่าง

หากการวัดตัวบ่งชี้ที่มีความแม่นยำที่จำเป็นสำหรับการรวบรวมแผนที่ตามเกณฑ์เชิงปริมาณนั้นเป็นไปไม่ได้ในเชิงเศรษฐกิจหรือทางเทคนิค ก็จะใช้ตัวบ่งชี้ทางเลือก ที่เกี่ยวข้องกับมันคือคำเช่น "ข้อบกพร่อง" และ "ข้อบกพร่อง" สิ่งหลังนี้ถูกเข้าใจว่าเป็นการไม่ปฏิบัติตามข้อกำหนดของผลิตภัณฑ์แต่ละรายตามข้อกำหนดที่กำหนดไว้ ข้อบกพร่องคือผลิตภัณฑ์ที่ไม่ได้รับอนุญาตให้จัดหาให้กับผู้บริโภคเนื่องจากมีข้อบกพร่องอยู่

ลักษณะเฉพาะ

การ์ดแต่ละประเภทมีลักษณะเฉพาะของตัวเอง จะต้องนำมาพิจารณาเมื่อเลือกในกรณีใดกรณีหนึ่ง แผนที่ที่อิงตามเกณฑ์เชิงปริมาณจะถือว่ามีความอ่อนไหวต่อการเปลี่ยนแปลงกระบวนการมากกว่าแผนที่ที่ใช้คุณลักษณะทางเลือก อย่างไรก็ตาม สิ่งแรกนั้นต้องใช้แรงงานมากกว่า ใช้สำหรับ:

  1. การดีบักกระบวนการ
  2. การประเมินโอกาสในการใช้เทคโนโลยี
  3. ตรวจสอบความถูกต้องของการทำงานของอุปกรณ์
  4. คำจำกัดความของความอดทน
  5. การเปรียบเทียบหลายวิธีที่ยอมรับได้ในการสร้างผลิตภัณฑ์

นอกจากนี้

หากความผิดปกติของกระบวนการมีลักษณะเฉพาะด้วยการเปลี่ยนแปลงพารามิเตอร์ควบคุม จำเป็นต้องใช้ X-cards หากมีการกระจายตัวของค่าเพิ่มขึ้น คุณจะต้องเลือกรุ่น R หรือ S อย่างไรก็ตามจำเป็นต้องคำนึงถึงคุณสมบัติหลายประการด้วย โดยเฉพาะอย่างยิ่งการใช้ S-map จะทำให้สามารถสร้างความผิดปกติของกระบวนการได้แม่นยำและรวดเร็วยิ่งขึ้นมากกว่ารุ่น R ในเวลาเดียวกัน อย่างไรก็ตาม การสร้างแบบหลังไม่จำเป็นต้องมีการคำนวณที่ซับซ้อน

บทสรุป

ในทางเศรษฐศาสตร์ มีความเป็นไปได้ที่จะศึกษาปัจจัยต่างๆ ที่ถูกค้นพบในระหว่างการประเมินเชิงคุณภาพ ในอวกาศและพลศาสตร์ ด้วยความช่วยเหลือเหล่านี้ คุณสามารถคำนวณเชิงคาดการณ์ได้ วิธีการวิเคราะห์ทางสถิติทางสถิติไม่รวมถึงวิธีการประเมินความสัมพันธ์ระหว่างเหตุและผลของกระบวนการและเหตุการณ์ทางเศรษฐกิจ การระบุปริมาณสำรองที่มีแนวโน้มและไม่ได้ใช้สำหรับการเพิ่มประสิทธิภาพทางธุรกิจ กล่าวอีกนัยหนึ่ง แนวทางที่พิจารณาไม่รวมเทคนิคแฟคทอเรียล

วิธีการทางสถิติ

วิธีการทางสถิติ- วิธีการวิเคราะห์ข้อมูลทางสถิติ มีวิธีสถิติประยุกต์ที่สามารถนำไปใช้ในทุกสาขาของการวิจัยทางวิทยาศาสตร์และภาคส่วนใดๆ ของเศรษฐกิจของประเทศ และวิธีการทางสถิติอื่นๆ ซึ่งการบังคับใช้นั้นจำกัดอยู่เพียงด้านใดด้านหนึ่งเท่านั้น นี่หมายถึงวิธีการต่างๆ เช่น การควบคุมการยอมรับทางสถิติ การควบคุมกระบวนการทางเทคโนโลยีทางสถิติ ความน่าเชื่อถือและการทดสอบ และการวางแผนการทดลอง

การจำแนกวิธีการทางสถิติ

วิธีการวิเคราะห์ข้อมูลทางสถิติถูกนำมาใช้ในกิจกรรมของมนุษย์เกือบทุกด้านใช้เมื่อใดก็ตามที่จำเป็นเพื่อให้ได้มาและพิสูจน์เหตุผลของการตัดสินเกี่ยวกับกลุ่ม (วัตถุหรือหัวข้อ) ที่มีความแตกต่างภายในบางอย่าง

ขอแนะนำให้แยกแยะกิจกรรมทางวิทยาศาสตร์และประยุกต์สามประเภทในสาขาวิธีการวิเคราะห์ข้อมูลทางสถิติ (ตามระดับความจำเพาะของวิธีการที่เกี่ยวข้องกับการแช่ในปัญหาเฉพาะ):

ก) การพัฒนาและการวิจัยวิธีการทั่วไป โดยไม่คำนึงถึงลักษณะเฉพาะของสาขาที่ประยุกต์ใช้

b) การพัฒนาและการวิจัยแบบจำลองทางสถิติของปรากฏการณ์และกระบวนการจริงตามความต้องการของกิจกรรมเฉพาะด้าน

ค) การประยุกต์วิธีการและแบบจำลองทางสถิติสำหรับการวิเคราะห์ทางสถิติของข้อมูลเฉพาะ

สถิติประยุกต์

คำอธิบายประเภทของข้อมูลและกลไกในการสร้างข้อมูลถือเป็นจุดเริ่มต้นของการศึกษาทางสถิติ ใช้วิธีการทั้งแบบกำหนดขึ้นและความน่าจะเป็นเพื่ออธิบายข้อมูล เมื่อใช้วิธีการที่กำหนดขึ้นทำให้สามารถวิเคราะห์เฉพาะข้อมูลที่มีให้กับผู้วิจัยเท่านั้น ตัวอย่างเช่นด้วยความช่วยเหลือของพวกเขา ทำให้ได้รับตารางที่คำนวณโดยหน่วยงานสถิติของรัฐอย่างเป็นทางการตามรายงานทางสถิติที่ส่งโดยองค์กรและองค์กรต่างๆ ผลลัพธ์ที่ได้สามารถถ่ายโอนไปยังประชากรในวงกว้างขึ้น และใช้สำหรับการคาดการณ์และการควบคุมบนพื้นฐานของการสร้างแบบจำลองทางสถิติที่น่าจะเป็นเท่านั้น ดังนั้นเฉพาะวิธีการที่ใช้ทฤษฎีความน่าจะเป็นจึงมักรวมอยู่ในสถิติทางคณิตศาสตร์

เราไม่ถือว่าเป็นไปได้ที่จะเปรียบเทียบวิธีการกำหนดและสถิติความน่าจะเป็น เราถือว่าสิ่งเหล่านี้เป็นขั้นตอนต่อเนื่องของการวิเคราะห์ทางสถิติ ในขั้นแรกจำเป็นต้องวิเคราะห์ข้อมูลที่มีอยู่และนำเสนอในรูปแบบที่อ่านง่ายโดยใช้ตารางและแผนภูมิ จากนั้นขอแนะนำให้วิเคราะห์ข้อมูลทางสถิติบนพื้นฐานของความน่าจะเป็นและแบบจำลองทางสถิติบางอย่าง โปรดทราบว่าความเป็นไปได้ของการเข้าใจอย่างลึกซึ้งยิ่งขึ้นเกี่ยวกับแก่นแท้ของปรากฏการณ์หรือกระบวนการจริงนั้นได้รับการรับรองโดยการพัฒนาแบบจำลองทางคณิตศาสตร์ที่เหมาะสม

ในสถานการณ์ที่ง่ายที่สุด ข้อมูลทางสถิติคือค่าของลักษณะเฉพาะบางประการของวัตถุที่กำลังศึกษา ค่าสามารถเป็นเชิงปริมาณหรือระบุหมวดหมู่ที่สามารถจำแนกวัตถุได้ ในกรณีที่สอง พวกเขาพูดถึงสัญญาณเชิงคุณภาพ

เมื่อทำการวัดด้วยคุณลักษณะเชิงปริมาณหรือเชิงคุณภาพหลายประการ เราจะได้เวกเตอร์เป็นข้อมูลทางสถิติเกี่ยวกับวัตถุ ถือได้ว่าเป็นข้อมูลประเภทใหม่ ในกรณีนี้ ตัวอย่างจะประกอบด้วยชุดเวกเตอร์ มีส่วนหนึ่งของพิกัด - ตัวเลขและส่วนหนึ่ง - ข้อมูลเชิงคุณภาพ (จัดหมวดหมู่) จากนั้นเรากำลังพูดถึงเวกเตอร์ของข้อมูลประเภทต่างๆ

องค์ประกอบหนึ่งของตัวอย่างคือมิติเดียวสามารถเป็นฟังก์ชันโดยรวมได้ ตัวอย่างเช่น การอธิบายไดนามิกของตัวบ่งชี้ นั่นคือ การเปลี่ยนแปลงเมื่อเวลาผ่านไป คือ คลื่นไฟฟ้าหัวใจของผู้ป่วยหรือความกว้างของจังหวะของเพลามอเตอร์ หรืออนุกรมเวลาที่อธิบายพลวัตของผลการดำเนินงานของบริษัทใดบริษัทหนึ่ง จากนั้นตัวอย่างจะประกอบด้วยชุดของฟังก์ชัน

องค์ประกอบตัวอย่างอาจเป็นวัตถุทางคณิตศาสตร์อื่นๆ ได้เช่นกัน ตัวอย่างเช่น ความสัมพันธ์แบบไบนารี ดังนั้นเมื่อสำรวจผู้เชี่ยวชาญพวกเขามักจะใช้การสั่งซื้อ (อันดับ) ของวัตถุในการตรวจสอบ - ตัวอย่างผลิตภัณฑ์ โครงการลงทุน ตัวเลือกสำหรับการตัดสินใจของฝ่ายบริหาร องค์ประกอบการสุ่มตัวอย่างอาจเป็นความสัมพันธ์แบบไบนารีประเภทต่างๆ ได้ (การเรียงลำดับ การแบ่งส่วน ความคลาดเคลื่อน) เซต เซตฟัซซี่ ฯลฯ ทั้งนี้ขึ้นอยู่กับข้อบังคับของการศึกษาของผู้เชี่ยวชาญ

ดังนั้นลักษณะทางคณิตศาสตร์ขององค์ประกอบตัวอย่างในปัญหาต่างๆ ของสถิติประยุกต์อาจแตกต่างกันมาก อย่างไรก็ตาม ข้อมูลทางสถิติสามารถจำแนกได้สองประเภท - แบบตัวเลขและไม่ใช่ตัวเลข ดังนั้นสถิติที่ใช้จึงแบ่งออกเป็นสองส่วนคือสถิติเชิงตัวเลขและสถิติที่ไม่ใช่ตัวเลข

สถิติเชิงตัวเลข ได้แก่ ตัวเลข เวกเตอร์ ฟังก์ชัน สามารถบวกและคูณด้วยสัมประสิทธิ์ได้ ดังนั้นในสถิติเชิงตัวเลข ผลรวมต่างๆ จึงมีความสำคัญอย่างยิ่ง เครื่องมือทางคณิตศาสตร์สำหรับการวิเคราะห์ผลรวมขององค์ประกอบสุ่มของกลุ่มตัวอย่างคือกฎ (คลาสสิก) ของจำนวนจำนวนมากและทฤษฎีบทขีดจำกัดกลาง

ข้อมูลทางสถิติที่ไม่ใช่ตัวเลขคือข้อมูลที่ถูกจัดหมวดหมู่ เวกเตอร์ของคุณลักษณะประเภทต่างๆ ความสัมพันธ์แบบไบนารี เซต ชุดฟัซซี ฯลฯ ไม่สามารถบวกและคูณด้วยสัมประสิทธิ์ได้ ดังนั้นจึงไม่มีเหตุผลที่จะพูดถึงผลรวมของสถิติที่ไม่ใช่ตัวเลข เป็นองค์ประกอบของปริภูมิทางคณิตศาสตร์ที่ไม่ใช่ตัวเลข (เซต) เครื่องมือทางคณิตศาสตร์สำหรับการวิเคราะห์ข้อมูลทางสถิติที่ไม่ใช่ตัวเลขนั้นขึ้นอยู่กับการใช้ระยะห่างระหว่างองค์ประกอบ (รวมถึงการวัดความใกล้ชิด ตัวชี้วัดความแตกต่าง) ในพื้นที่ดังกล่าว ด้วยความช่วยเหลือของระยะทาง ค่าเฉลี่ยเชิงประจักษ์และเชิงทฤษฎีจะถูกกำหนด กฎของจำนวนมากได้รับการพิสูจน์ การประมาณแบบไม่อิงพารามิเตอร์ของความหนาแน่นของการกระจายความน่าจะเป็นจะถูกสร้างขึ้น ปัญหาการวินิจฉัยและการวิเคราะห์คลัสเตอร์ได้รับการแก้ไข ฯลฯ (ดู)

การวิจัยประยุกต์ใช้ข้อมูลทางสถิติประเภทต่างๆ โดยเฉพาะอย่างยิ่งสำหรับวิธีการได้มาซึ่งสิ่งเหล่านี้ ตัวอย่างเช่น หากการทดสอบอุปกรณ์ทางเทคนิคบางอย่างดำเนินต่อไปจนถึงจุดหนึ่ง เราจะได้สิ่งที่เรียกว่า ข้อมูลที่เซ็นเซอร์ประกอบด้วยชุดตัวเลข - ระยะเวลาการทำงานของอุปกรณ์จำนวนหนึ่งก่อนเกิดความล้มเหลว และข้อมูลที่อุปกรณ์ที่เหลือยังคงทำงานต่อไปเมื่อสิ้นสุดการทดสอบ ข้อมูลที่เซ็นเซอร์มักใช้ในการประเมินและติดตามความน่าเชื่อถือของอุปกรณ์ทางเทคนิค

โดยทั่วไปแล้ว วิธีทางสถิติสำหรับการวิเคราะห์ข้อมูลสามประเภทแรกจะพิจารณาแยกกัน ข้อจำกัดนี้เกิดจากข้อเท็จจริงที่ระบุไว้ข้างต้นว่าเครื่องมือทางคณิตศาสตร์สำหรับการวิเคราะห์ข้อมูลที่มีลักษณะที่ไม่ใช่ตัวเลขมีความแตกต่างอย่างมีนัยสำคัญกับข้อมูลในรูปของตัวเลข เวกเตอร์ และฟังก์ชัน

การสร้างแบบจำลองความน่าจะเป็น-สถิติ

เมื่อใช้วิธีการทางสถิติในสาขาความรู้เฉพาะและภาคส่วนต่างๆ ของเศรษฐกิจของประเทศ เราได้รับสาขาวิชาทางวิทยาศาสตร์และการปฏิบัติ เช่น "วิธีการทางสถิติในอุตสาหกรรม" "วิธีการทางสถิติในการแพทย์" เป็นต้น จากมุมมองนี้ เศรษฐมิติคือ "ทางสถิติ" วิธีการทางเศรษฐศาสตร์” สาขาวิชาเหล่านี้ของกลุ่ม b) มักจะขึ้นอยู่กับแบบจำลองทางสถิติความน่าจะเป็นที่สร้างขึ้นตามลักษณะของสาขาการใช้งาน เป็นประโยชน์อย่างมากในการเปรียบเทียบแบบจำลองความน่าจะเป็น-สถิติที่ใช้ในสาขาต่างๆ เพื่อค้นหาความคล้ายคลึงกัน และในขณะเดียวกันก็สังเกตความแตกต่างบางประการ ดังนั้น เราจึงสามารถเห็นความคล้ายคลึงกันของคำแถลงปัญหาและวิธีการทางสถิติที่ใช้ในการแก้ปัญหาเหล่านั้นในสาขาต่างๆ เช่น การวิจัยทางวิทยาศาสตร์ทางการแพทย์ การวิจัยทางสังคมวิทยาเฉพาะ และการวิจัยการตลาด หรือกล่าวโดยย่อคือ ในการแพทย์ สังคมวิทยา และการตลาด สิ่งเหล่านี้มักจัดกลุ่มเข้าด้วยกันภายใต้ชื่อ "การศึกษาตัวอย่าง"

ก่อนอื่นความแตกต่างระหว่างการศึกษาตัวอย่างและการศึกษาโดยผู้เชี่ยวชาญนั้นแสดงให้เห็นอย่างชัดเจนในจำนวนวัตถุหรือวิชาที่สำรวจ - ในการศึกษาตัวอย่างเรามักจะพูดถึงหลายร้อยและในการศึกษาโดยผู้เชี่ยวชาญ - ประมาณสิบ แต่เทคโนโลยีการวิจัยของผู้เชี่ยวชาญนั้นซับซ้อนกว่ามาก ความจำเพาะจะยิ่งเด่นชัดมากขึ้นในแบบจำลองทางประชากรศาสตร์หรือลอจิสติกส์ เมื่อประมวลผลข้อมูลเชิงบรรยาย (ข้อความ พงศาวดาร) หรือเมื่อศึกษาอิทธิพลร่วมกันของปัจจัยต่างๆ

ประเด็นด้านความน่าเชื่อถือและความปลอดภัยของอุปกรณ์ทางเทคนิคและเทคโนโลยี ทฤษฎีการเข้าคิวจะถูกกล่าวถึงโดยละเอียดในงานทางวิทยาศาสตร์จำนวนมาก

การวิเคราะห์ทางสถิติของข้อมูลเฉพาะ

การประยุกต์วิธีการและแบบจำลองทางสถิติสำหรับการวิเคราะห์ทางสถิติของข้อมูลเฉพาะมีความเชื่อมโยงอย่างใกล้ชิดกับปัญหาในสาขาที่เกี่ยวข้อง ผลลัพธ์ของกิจกรรมทางวิทยาศาสตร์และประยุกต์ประเภทที่สามที่ระบุอยู่ที่จุดตัดของสาขาวิชา ถือได้ว่าเป็นตัวอย่างของการประยุกต์วิธีการทางสถิติในทางปฏิบัติ แต่ไม่มีเหตุผลใดที่จะถือว่าพวกเขาเป็นกิจกรรมของมนุษย์ที่สอดคล้องกัน

ตัวอย่างเช่น ผลการสำรวจผู้บริโภคกาแฟสำเร็จรูปมักมีสาเหตุมาจากการตลาด (ซึ่งเป็นสิ่งที่พวกเขาทำเมื่อบรรยายเกี่ยวกับการวิจัยการตลาด) การศึกษาพลวัตของการเติบโตของราคาโดยใช้ดัชนีเงินเฟ้อที่คำนวณจากข้อมูลที่รวบรวมอย่างอิสระเป็นที่สนใจเป็นหลักจากมุมมองของเศรษฐศาสตร์และการจัดการเศรษฐกิจของประเทศ (ทั้งในระดับมหภาคและระดับของแต่ละองค์กร)

แนวโน้มการพัฒนา

ทฤษฎีวิธีการทางสถิติมีวัตถุประสงค์เพื่อแก้ไขปัญหาที่แท้จริง ดังนั้นสูตรใหม่ของปัญหาทางคณิตศาสตร์สำหรับการวิเคราะห์ข้อมูลทางสถิติจึงเกิดขึ้นอย่างต่อเนื่องและมีการพัฒนาและพิสูจน์วิธีการใหม่ ๆ การหาเหตุผลมักกระทำโดยวิธีทางคณิตศาสตร์ กล่าวคือ โดยการพิสูจน์ทฤษฎีบท องค์ประกอบด้านระเบียบวิธีมีบทบาทสำคัญ - วิธีการตั้งปัญหาอย่างแน่นอน, สมมติฐานใดที่จะยอมรับเพื่อวัตถุประสงค์ของการศึกษาทางคณิตศาสตร์เพิ่มเติม บทบาทของเทคโนโลยีสารสนเทศสมัยใหม่โดยเฉพาะอย่างยิ่งการทดลองทางคอมพิวเตอร์นั้นยอดเยี่ยมมาก

งานเร่งด่วนคือการวิเคราะห์ประวัติของวิธีการทางสถิติเพื่อระบุแนวโน้มการพัฒนาและนำไปใช้ในการพยากรณ์

วรรณกรรม

2. เนย์เลอร์ ที. การทดลองจำลองเครื่องจักรด้วยแบบจำลองของระบบเศรษฐกิจ - อ.: มีร์ 2518 - 500 น.

3. Kramer G. วิธีการทางสถิติทางคณิตศาสตร์ - อ.: มีร์ 2491 (ฉบับพิมพ์ครั้งที่ 1) พ.ศ. 2518 (ฉบับพิมพ์ครั้งที่ 2) - 648 น.

4. Bolshev L. N. , Smirnov N. V. ตารางสถิติทางคณิตศาสตร์ - อ.: Nauka, 1965 (ฉบับพิมพ์ครั้งที่ 1), 1968 (ฉบับพิมพ์ครั้งที่ 2), 1983 (ฉบับพิมพ์ครั้งที่ 3).

5. Smirnov N. V. , Dunin-Barkovsky I. V. หลักสูตรทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์สำหรับการใช้งานทางเทคนิค เอ็ด ประการที่ 3 โปรเฟสเซอร์ - อ.: Nauka, 2512. - 512 น.

6. นอร์แมน เดรเปอร์, แฮร์รี สมิธการวิเคราะห์การถดถอยแบบประยุกต์ การถดถอยพหุคูณ = การวิเคราะห์การถดถอยประยุกต์ - ฉบับที่ 3 - อ.: “วิภาษวิธี”, 2550. - หน้า 912. - ISBN 0-471-17082-8

ดูสิ่งนี้ด้วย

มูลนิธิวิกิมีเดีย 2010.

  • ยัตคา
  • อะมัลกัม (แก้ความกำกวม)

ดูว่า "วิธีการทางสถิติ" ในพจนานุกรมอื่น ๆ คืออะไร:

    วิธีการทางสถิติ- วิธีการทางสถิติ วิธีการทางวิทยาศาสตร์ในการอธิบายและศึกษาปรากฏการณ์มวลที่ทำให้เกิดการแสดงออกเชิงปริมาณ (ตัวเลข) คำว่า "สถิติ" (จาก Igal. stato state) มีรากศัพท์มาจากคำว่า "state" ตอนแรกก็...... สารานุกรมปรัชญา

    วิธีการทางสถิติ –- วิธีการทางวิทยาศาสตร์ในการอธิบายและศึกษาปรากฏการณ์มวลที่ทำให้เกิดการแสดงออกเชิงปริมาณ (ตัวเลข) คำว่า "สถิติ" (จากภาษาอิตาลี stato - รัฐ) มีรากศัพท์มาจากคำว่า "รัฐ" เริ่มแรกเกี่ยวข้องกับศาสตร์แห่งการจัดการและ... สารานุกรมปรัชญา

    วิธีการทางสถิติ- (ในนิเวศวิทยาและชีววิทยา) วิธีการสถิติการแปรผัน ซึ่งทำให้สามารถศึกษาทั้งหมด (เช่น ไฟโตซีโนซิส ประชากร ผลผลิต) ตามผลรวมบางส่วน (เช่น ตามข้อมูลที่ได้รับจากสถานที่ลงทะเบียน) และประเมิน ระดับความแม่นยำ...... พจนานุกรมนิเวศวิทยา

    วิธีการทางสถิติ- (ในด้านจิตวิทยา) (จากสถานะสถานะละติน) วิธีการบางอย่างของสถิติทางคณิตศาสตร์ประยุกต์ซึ่งใช้ในด้านจิตวิทยาเป็นหลักสำหรับการประมวลผลผลการทดลอง วัตถุประสงค์หลักของการใช้ S. m. คือเพื่อเพิ่มความถูกต้องของข้อสรุปใน ... ... สารานุกรมจิตวิทยาที่ดี

    วิธีการทางสถิติ- 20.2. วิธีการทางสถิติ วิธีการทางสถิติเฉพาะที่ใช้ในการจัดระเบียบ ควบคุม และทดสอบกิจกรรมต่างๆ รวมถึงแต่ไม่จำกัดเฉพาะสิ่งต่อไปนี้ ก) การออกแบบการทดลองและการวิเคราะห์ปัจจัย b) การวิเคราะห์ความแปรปรวนและ... หนังสืออ้างอิงพจนานุกรมเกี่ยวกับเอกสารเชิงบรรทัดฐานและทางเทคนิค

    วิธีการทางสถิติ- วิธีการศึกษาปริมาณ แง่มุมต่างๆ ของสังคมมวลชน ปรากฏการณ์และกระบวนการ S. m. ทำให้สามารถอธิบายลักษณะดิจิทัลเกี่ยวกับการเปลี่ยนแปลงที่กำลังดำเนินอยู่ในสังคมได้ กระบวนการศึกษาต่างๆ รูปแบบของเศรษฐกิจและสังคม รูปแบบการเปลี่ยนแปลง...... พจนานุกรมสารานุกรมการเกษตร

    วิธีการทางสถิติ- วิธีการบางอย่างของสถิติทางคณิตศาสตร์ประยุกต์ที่ใช้ในการประมวลผลผลการทดลอง มีการพัฒนาวิธีการทางสถิติจำนวนหนึ่งเพื่อทดสอบคุณภาพของการทดสอบทางจิตวิทยาโดยเฉพาะ เพื่อใช้ในวิชาชีพ... ... การศึกษาวิชาชีพ พจนานุกรม

    วิธีการทางสถิติ- (ในด้านจิตวิทยาวิศวกรรม) (จากสถานะภาษาละติน) วิธีการบางอย่างของสถิติประยุกต์ที่ใช้ในจิตวิทยาวิศวกรรมเพื่อประมวลผลผลการทดลอง วัตถุประสงค์หลักของการใช้ S. m. คือเพื่อเพิ่มความถูกต้องของข้อสรุปใน ... ... พจนานุกรมสารานุกรมจิตวิทยาและการสอน

ส่งผลงานดีๆ ของคุณในฐานความรู้ได้ง่ายๆ ใช้แบบฟอร์มด้านล่าง

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์บน http://www.allbest.ru/

  • 3. ซีรี่ส์ไดนามิก
  • วรรณกรรม

1. ค่าสัมบูรณ์และค่าสัมพัทธ์

จากการสรุปและการจัดกลุ่มเนื้อหาทางสถิติ ผู้วิจัยพบว่าตัวเองอยู่ในมือของข้อมูลที่หลากหลายเกี่ยวกับปรากฏการณ์และกระบวนการที่กำลังศึกษา อย่างไรก็ตาม อาจเป็นความผิดพลาดครั้งใหญ่หากพิจารณาผลลัพธ์ที่ได้รับ เนื่องจากแม้จะจัดกลุ่มตามคุณลักษณะที่กำหนดและสะท้อนให้เห็นในรูปแบบตารางหรือกราฟิก ข้อมูลเหล่านี้ยังคงเป็นเพียงภาพประกอบประเภทหนึ่ง ซึ่งเป็นผลลัพธ์ระดับกลางที่ต้องวิเคราะห์ - ในกรณีนี้ , ทางสถิติ. เชิงสถิติการวิเคราะห์ - นี้ ผลงาน ศึกษา วัตถุ วี คุณภาพ แยกชิ้นส่วน ระบบ, เหล่านั้น. ซับซ้อน องค์ประกอบ และ การเชื่อมต่อ, การขึ้นรูป วี ของเขา ปฏิสัมพันธ์ โดยธรรมชาติ ทั้งหมด.

จากการวิเคราะห์ดังกล่าว จึงควรสร้างแบบจำลองของวัตถุที่กำลังศึกษา และเนื่องจากเรากำลังพูดถึงสถิติ จึงควรใช้องค์ประกอบที่มีนัยสำคัญทางสถิติและการเชื่อมต่อเมื่อสร้างแบบจำลอง

ในความเป็นจริง การวิเคราะห์ทางสถิติมีวัตถุประสงค์เพื่อระบุองค์ประกอบที่สำคัญและความเชื่อมโยงดังกล่าว

แน่นอนตัวชี้วัด(ค่า) - มูลค่ารวม คำนวณหรือนำมาจากรายงานทางสถิติสรุปโดยไม่มีการเปลี่ยนแปลงใดๆ ตัวบ่งชี้สัมบูรณ์จะเป็นค่าเล็กน้อยเสมอและสะท้อนให้เห็นในหน่วยการวัดที่ระบุไว้เมื่อจัดทำโปรแกรมการสังเกตทางสถิติ (จำนวนคดีอาญาที่เริ่มต้น จำนวนอาชญากรรมที่กระทำ จำนวนการหย่าร้าง เป็นต้น)

ตัวบ่งชี้สัมบูรณ์เป็นพื้นฐานสำหรับการดำเนินการทางสถิติเพิ่มเติม แต่ตัวบ่งชี้เหล่านี้เองก็มีประโยชน์เพียงเล็กน้อยในการวิเคราะห์ ตัวอย่างเช่น การใช้ตัวบ่งชี้สัมบูรณ์ เป็นการยากที่จะตัดสินระดับอาชญากรรมในเมืองหรือภูมิภาคต่างๆ และแทบจะเป็นไปไม่ได้เลยที่จะตอบคำถามว่าอาชญากรรมใดสูงกว่าและต่ำกว่า เนื่องจากเมืองหรือภูมิภาคอาจแตกต่างกันอย่างมีนัยสำคัญในด้านจำนวนประชากร อาณาเขต และ พารามิเตอร์ที่สำคัญอื่น ๆ

ญาติปริมาณในทางสถิติ สิ่งเหล่านี้เป็นตัวบ่งชี้ทั่วไปที่เปิดเผยรูปแบบตัวเลขของความสัมพันธ์ระหว่างปริมาณทางสถิติที่เปรียบเทียบสองค่า เมื่อคำนวณค่าสัมพัทธ์ค่าสัมบูรณ์สองค่ามักถูกเปรียบเทียบกันมากที่สุด แต่สามารถเปรียบเทียบทั้งค่าเฉลี่ยและค่าสัมพัทธ์ได้โดยรับตัวบ่งชี้สัมพันธ์ใหม่ ตัวอย่างที่ง่ายที่สุดในการคำนวณค่าสัมพัทธ์คือคำตอบสำหรับคำถามที่ว่า ตัวเลขหนึ่งมีค่ามากกว่าอีกจำนวนหนึ่งกี่ครั้ง

เมื่อเริ่มพิจารณาค่าสัมพัทธ์จำเป็นต้องพิจารณาดังนี้ โดยหลักการแล้ว คุณสามารถเปรียบเทียบสิ่งที่คุณต้องการได้ แม้แต่ขนาดเส้นตรงของกระดาษ A4 กับปริมาณผลิตภัณฑ์ที่ผลิตโดยโรงงาน Lomonosov Porcelain อย่างไรก็ตามการเปรียบเทียบดังกล่าวจะไม่ให้อะไรเราเลย เงื่อนไขที่สำคัญที่สุดสำหรับการคำนวณปริมาณสัมพัทธ์ที่มีผลสามารถกำหนดได้ดังนี้:

1. หน่วยวัดปริมาณที่เปรียบเทียบจะต้องเท่ากันหรือเทียบเคียงได้อย่างสมบูรณ์ จำนวนอาชญากรรม คดีอาญา และการพิพากษาลงโทษ เป็นตัวชี้วัดที่มีความสัมพันธ์กัน กล่าวคือ สัมพันธ์กันแต่ไม่สามารถเทียบเคียงได้ในหน่วยการวัด ในคดีอาญาคดีหนึ่ง สามารถดำเนินคดีอาญาได้หลายคดีและมีกลุ่มคนถูกตัดสินว่ามีความผิด นักโทษหลายคนสามารถก่ออาชญากรรมได้เพียงครั้งเดียว และในทางกลับกัน ผู้ต้องขังคนหนึ่งสามารถกระทำความผิดได้หลายอย่าง จำนวนอาชญากรรม คดี และการพิพากษาลงโทษเทียบได้กับประชากร จำนวนบุคลากรในกระบวนการยุติธรรมทางอาญา มาตรฐานการครองชีพของประชาชน และข้อมูลอื่นๆ ในปีเดียวกัน นอกจากนี้ ตลอดระยะเวลาหนึ่งปี ตัวชี้วัดที่อยู่ระหว่างการพิจารณายังเทียบเคียงกันได้ค่อนข้างมาก

2. ข้อมูลที่เปรียบเทียบจะต้องสอดคล้องกันในแง่ของเวลาหรืออาณาเขตของการรับ หรือพารามิเตอร์ทั้งสองเข้าด้วยกัน

แน่นอน ขนาด, กับ ที่ จะถูกเปรียบเทียบ อื่น วีปลอมตัว, เรียกว่า พื้นฐาน หรือ ฐาน การเปรียบเทียบ เปรียบเทียบและแกะสลัก ดัชนี - ขนาด การเปรียบเทียบ. ตัวอย่างเช่นเมื่อคำนวณอัตราส่วนของพลวัตของอาชญากรรมในรัสเซียในปี 2543-2553 ข้อมูลปี 2000 จะเป็นข้อมูลพื้นฐาน สามารถใช้เป็นค่าเดียวได้ (จากนั้นค่าสัมพัทธ์จะแสดงในรูปของสัมประสิทธิ์) หรือเป็น 100 (เป็นเปอร์เซ็นต์) ขึ้นอยู่กับขนาดของค่าที่เปรียบเทียบ เลือกรูปแบบที่สะดวกที่สุด บ่งชี้ และมองเห็นได้ในการแสดงค่าสัมพัทธ์

หากค่าที่เปรียบเทียบมากกว่าค่าฐานมาก อัตราส่วนผลลัพธ์จะแสดงเป็นค่าสัมประสิทธิ์ได้ดีกว่า ตัวอย่างเช่น อาชญากรรมในช่วงระยะเวลาหนึ่ง (เป็นปี) เพิ่มขึ้น 2.6 เท่า การแสดงออกในเวลาในกรณีนี้จะบ่งบอกได้มากกว่าในรูปแบบเปอร์เซ็นต์ ค่าสัมพัทธ์จะแสดงเป็นเปอร์เซ็นต์เมื่อค่าเปรียบเทียบไม่แตกต่างจากฐานมากนัก

ปริมาณสัมพัทธ์ที่ใช้ในสถิติ รวมถึงสถิติทางกฎหมาย มีหลายประเภท ปริมาณสัมพัทธ์ประเภทต่อไปนี้ถูกใช้ในสถิติทางกฎหมาย:

1. ความสัมพันธ์ที่แสดงลักษณะของโครงสร้างของประชากรหรือความสัมพันธ์ในการกระจาย

2. ความสัมพันธ์ของส่วนต่อส่วนรวมหรือความสัมพันธ์ของความเข้มข้น

3. ความสัมพันธ์ที่แสดงถึงลักษณะพลวัต

4. ความสัมพันธ์ของระดับและการเปรียบเทียบ

ญาติขนาดการกระจาย - นี้ ญาติ ขนาด, แสดงออก วี เปอร์เซ็นต์ รายบุคคล ชิ้นส่วน จำนวนทั้งสิ้น ศึกษา ปรากฏการณ์(อาชญากรรม อาชญากร คดีแพ่ง คดีความ สาเหตุ มาตรการป้องกัน ฯลฯ) ถึง ของพวกเขา ทั่วไป ผลที่ตามมา, ได้รับการยอมรับ ด้านหลัง 100% . นี่เป็นข้อมูลสัมพันธ์ประเภทที่พบบ่อยที่สุด (และง่ายที่สุด) ที่ใช้ในสถิติ ตัวอย่างเช่น โครงสร้างของอาชญากรรม (ตามประเภทของอาชญากรรม) โครงสร้างของประวัติอาชญากรรม (ตามประเภทของอาชญากรรม ตามอายุของผู้ต้องโทษ) เป็นต้น

ค่าสัมบูรณ์ของการวิเคราะห์ทางสถิติ

ทัศนคติความเข้ม(อัตราส่วนของส่วนหนึ่งต่อทั้งหมด) - ค่าสัมพัทธ์ทั่วไปที่สะท้อนถึงความชุกของลักษณะบางอย่างในการสังเกต จำนวนทั้งสิ้น

ตัวบ่งชี้ความรุนแรงที่พบบ่อยที่สุดที่ใช้ในสถิติทางกฎหมายคือความรุนแรงของอาชญากรรม . ความรุนแรงของอาชญากรรมมักสะท้อนด้วยอัตราอาชญากรรม , เหล่านั้น. จำนวนอาชญากรรมต่อประชากร 100 หรือ 10,000 คน

KP= (P*100000)/ยังไม่มีข้อความ

โดยที่ P คือจำนวนอาชญากรรมที่บันทึกไว้โดยสมบูรณ์ N คือขนาดประชากรสัมบูรณ์

ข้อกำหนดเบื้องต้นที่กำหนดความเป็นไปได้อย่างมากในการคำนวณตัวบ่งชี้ดังกล่าว ดังที่กล่าวไว้ข้างต้น คือ ตัวบ่งชี้สัมบูรณ์ทั้งหมดที่ใช้นั้นดำเนินการในดินแดนเดียวและในช่วงระยะเวลาหนึ่ง

ความสัมพันธ์,ลักษณะพลวัต, แทน การสรุปทั่วไป ญาติ ปริมาณ กำลังแสดง เปลี่ยน ใน เวลา เหล่านั้น หรือ อื่น ตัวชี้วัด ถูกกฎหมาย สถิติ. โดยทั่วไปช่วงเวลาจะใช้เวลาหนึ่งปี

ฐาน (ฐาน) เท่ากับ 1 หรือ 100% ถือเป็นข้อมูลเกี่ยวกับลักษณะที่กำลังศึกษาในปีหนึ่ง ซึ่งเป็นลักษณะเฉพาะของปรากฏการณ์ที่กำลังศึกษาอยู่ ข้อมูลปีฐานทำหน้าที่เป็นฐานคงที่ซึ่งมีเปอร์เซ็นต์ตัวบ่งชี้ของปีต่อๆ ไป

งานวิเคราะห์ทางสถิติมักต้องมีการเปรียบเทียบรายปี (หรือช่วงอื่น) เมื่อใด ฐาน ได้รับการยอมรับ ข้อมูล ทุกคน ก่อนหน้า ของปี(เดือนหรือช่วงเวลาอื่น) ฐานดังกล่าวเรียกว่า มือถือ. โดยปกติจะใช้ในการวิเคราะห์อนุกรมเวลา (อนุกรมเวลา)

ความสัมพันธ์องศาและการเปรียบเทียบทำให้สามารถเปรียบเทียบตัวชี้วัดต่างๆ เพื่อระบุได้ว่าค่าใดมีค่ามากกว่าค่าอื่นๆ มากเพียงใด ปรากฏการณ์หนึ่งแตกต่างหรือคล้ายกับปรากฏการณ์อื่นมากน้อยเพียงใด สิ่งที่พบบ่อยและโดดเด่นในกระบวนการทางสถิติที่สังเกตได้ เป็นต้น

ดัชนีเป็นตัวบ่งชี้การเปรียบเทียบที่สร้างขึ้นเป็นพิเศษ (ในเวลา พื้นที่ เมื่อเปรียบเทียบกับการคาดการณ์ ฯลฯ) แสดงให้เห็นว่าระดับของปรากฏการณ์ที่กำลังศึกษาภายใต้เงื่อนไขหนึ่งแตกต่างจากระดับของปรากฏการณ์เดียวกันภายใต้เงื่อนไขอื่นกี่ครั้ง เงื่อนไข. ดัชนีที่พบบ่อยที่สุดอยู่ในสถิติทางเศรษฐกิจ แม้ว่าดัชนีเหล่านี้จะมีบทบาทบางอย่างในการวิเคราะห์ปรากฏการณ์ทางกฎหมายก็ตาม

คุณไม่สามารถทำได้โดยไม่มีดัชนีในกรณีที่จำเป็นต้องเปรียบเทียบตัวบ่งชี้ที่ไม่สามารถเทียบเคียงได้ ซึ่งการสรุปง่ายๆ นั้นเป็นไปไม่ได้ ดังนั้นดัชนีจึงมักถูกกำหนดให้เป็น ตัวบ่งชี้ตัวเลขสำหรับการวัดเฉลี่ยลำโพงจำนวนทั้งสิ้นต่างกันองค์ประกอบ.

ในทางสถิติ ดัชนีมักจะแสดงด้วยตัวอักษร I (i) ตัวพิมพ์ใหญ่หรือตัวพิมพ์ใหญ่ - ขึ้นอยู่กับว่าเรากำลังพูดถึงดัชนีบุคคล (ส่วนตัว) หรือดัชนีทั่วไป

รายบุคคลดัชนี(i) สะท้อนอัตราส่วนของตัวบ่งชี้ของงวดปัจจุบันต่อตัวบ่งชี้ที่สอดคล้องกันของงวดที่เปรียบเทียบ

สรุปดัชนีใช้ในการวิเคราะห์ความสัมพันธ์ระหว่างปรากฏการณ์ทางเศรษฐกิจและสังคมที่ซับซ้อนและประกอบด้วยสองส่วน: ค่าดัชนีจริงและผู้วัดร่วม (“น้ำหนัก”)

2. ค่าเฉลี่ยและการนำไปใช้ในสถิติทางกฎหมาย

ผลลัพธ์ของการประมวลผลตัวบ่งชี้สัมบูรณ์และตัวบ่งชี้สัมพัทธ์คือการสร้างอนุกรมการกระจาย แถว การกระจาย - นี้สั่งโดยคุณภาพสูงหรือเชิงปริมาณสัญญาณการกระจายหน่วยจำนวนทั้งสิ้น. การวิเคราะห์ชุดข้อมูลเหล่านี้เป็นพื้นฐานของการวิเคราะห์ทางสถิติ ไม่ว่ามันจะซับซ้อนแค่ไหนในภายหลังก็ตาม

ชุดการจัดจำหน่ายสามารถสร้างขึ้นตามคุณลักษณะเชิงคุณภาพหรือเชิงปริมาณ ในกรณีแรกจะเรียกว่า เนื่องมาจากในครั้งที่สอง - แปรผัน. ในกรณีนี้จะเรียกว่าความแตกต่างในลักษณะเชิงปริมาณ การเปลี่ยนแปลงและเครื่องหมายนี้เอง - ตัวเลือก. สถิติทางกฎหมายมักต้องจัดการด้วยชุดข้อมูลรูปแบบต่างๆ

ชุดรูปแบบจะประกอบด้วยสองคอลัมน์ (กราฟ) เสมอ หนึ่งระบุค่าของลักษณะเชิงปริมาณตามลำดับจากน้อยไปมากซึ่งในความเป็นจริงเรียกว่าตัวเลือกซึ่งถูกกำหนดไว้ x. อีกคอลัมน์หนึ่ง (กราฟ) ระบุจำนวนหน่วยที่เป็นลักษณะของตัวเลือกหนึ่งหรืออีกตัวเลือกหนึ่ง เรียกว่าความถี่และกำหนดด้วยตัวอักษรละติน .

ตารางที่ 2.1

ตัวเลือก x

ความถี่

ความถี่ของการเกิดลักษณะเฉพาะนั้นมีความสำคัญมากเมื่อคำนวณตัวบ่งชี้ทางสถิติที่สำคัญอื่น ๆ ได้แก่ ค่าเฉลี่ยและตัวบ่งชี้ความแปรผัน

ซีรีส์รูปแบบต่างๆ ก็สามารถเป็นได้ ไม่ต่อเนื่องหรือ ช่วงเวลา. ซีรีส์แบบแยกตามชื่อหมายถึง ถูกสร้างขึ้นบนพื้นฐานของคุณลักษณะที่แตกต่างกันแบบไม่ต่อเนื่อง และอนุกรมช่วงเวลา - บนพื้นฐานของการเปลี่ยนแปลงอย่างต่อเนื่อง ตัวอย่างเช่น การแบ่งผู้กระทำความผิดตามอายุอาจเป็นแบบแยก (18, 19, 20 ปี ฯลฯ) หรือต่อเนื่อง (สูงสุด 18 ปี, 18-25 ปี, 25-30 ปี เป็นต้น) ยิ่งไปกว่านั้น อนุกรมช่วงเวลานั้นสามารถสร้างได้ทั้งแบบแยกส่วนหรือต่อเนื่องกัน ในกรณีแรก ขอบเขตของช่วงที่อยู่ติดกันจะไม่เกิดซ้ำ ในตัวอย่างของเรา ช่วงเวลาจะมีลักษณะดังนี้: สูงสุด 18 ปี, 18-25, 26-30, 31-35 เป็นต้น ซีรีส์ดังกล่าวมีชื่อว่า อย่างต่อเนื่องไม่ต่อเนื่องแถว. ช่วงเวลาแถวกับอย่างต่อเนื่องการเปลี่ยนแปลงถือว่าขีดจำกัดบนของช่วงก่อนหน้าเกิดขึ้นพร้อมกับขีดจำกัดล่างของช่วงถัดไป

ตัวบ่งชี้แรกที่อธิบายชุดของรูปแบบคือ เฉลี่ย ปริมาณ. พวกเขามีบทบาทสำคัญในสถิติทางกฎหมาย เนื่องจากมีเพียงความช่วยเหลือเท่านั้นที่สามารถกำหนดลักษณะประชากรด้วยคุณลักษณะตัวแปรเชิงปริมาณซึ่งสามารถนำมาเปรียบเทียบได้ เมื่อใช้ค่าเฉลี่ย เราสามารถเปรียบเทียบชุดของปรากฏการณ์ที่มีนัยสำคัญทางกฎหมายที่เราสนใจตามลักษณะเชิงปริมาณบางอย่าง และได้ข้อสรุปที่จำเป็นจากการเปรียบเทียบเหล่านี้

เฉลี่ยปริมาณสะท้อน ที่สุด ทั่วไป แนวโน้ม (ลวดลาย), มีอยู่ในปรากฏการณ์มวลทั้งหมดที่กำลังศึกษาอยู่ มันแสดงออกมาใน ทั่วไป ลักษณะเชิงปริมาณเช่น ในมูลค่าเฉลี่ยของตัวชี้วัดที่มีอยู่ทั้งหมด (แปรผัน)

สถิติได้พัฒนาค่าเฉลี่ยหลายประเภท: ค่าเฉลี่ยเลขคณิต, ค่าเฉลี่ยเรขาคณิต, ค่าเฉลี่ยลูกบาศก์, ค่าเฉลี่ยฮาร์มอนิก ฯลฯ อย่างไรก็ตาม ในทางปฏิบัติไม่ได้ใช้ในสถิติทางกฎหมาย ดังนั้นเราจะพิจารณาค่าเฉลี่ยเพียงสองประเภทเท่านั้น - ค่าเฉลี่ยเลขคณิตและค่าเฉลี่ยเรขาคณิต

ค่าเฉลี่ยทั่วไปและเป็นที่รู้จักมากที่สุดคือ เฉลี่ยเลขคณิต. ในการคำนวณ จะมีการคำนวณผลรวมของตัวบ่งชี้และหารด้วยจำนวนตัวบ่งชี้ทั้งหมด ตัวอย่างเช่น ครอบครัวที่มีสมาชิก 4 คนประกอบด้วยพ่อแม่อายุ 38 และ 40 ปี และลูกสองคนอายุ 7 และ 10 ปี เราสรุปอายุ: 38+40+7+10 และหารผลรวมผลลัพธ์ของ 95 ด้วย 4 อายุครอบครัวเฉลี่ยที่ได้คือ 23.75 ปี หรือลองคำนวณปริมาณงานเฉลี่ยต่อเดือนของผู้ตรวจสอบหากแผนกที่มีคน 8 คนสามารถแก้ไขคดีได้ 25 คดีในหนึ่งเดือน หาร 25 ด้วย 8 แล้วเราจะได้ 3,125 คดีต่อเดือนต่อผู้สอบสวน 1 คน

ในสถิติทางกฎหมาย ค่าเฉลี่ยเลขคณิตใช้ในการคำนวณปริมาณงานของพนักงาน (ผู้สืบสวน อัยการ ผู้พิพากษา ฯลฯ ) คำนวณการเพิ่มขึ้นของอาชญากรรมโดยสมบูรณ์ คำนวณกลุ่มตัวอย่าง ฯลฯ

อย่างไรก็ตาม ในตัวอย่างที่ให้ไว้ ปริมาณงานเฉลี่ยต่อเดือนต่อผู้ตรวจสอบได้รับการคำนวณอย่างไม่ถูกต้อง ความจริงก็คือว่าค่าเฉลี่ยเลขคณิตอย่างง่ายไม่ได้นำมาพิจารณา ความถี่ลักษณะที่กำลังศึกษาอยู่ ในตัวอย่างของเรา ปริมาณงานเฉลี่ยต่อเดือนของผู้ตรวจสอบนั้นถูกต้องและให้ข้อมูลพอ ๆ กับ "อุณหภูมิเฉลี่ยในโรงพยาบาล" จากเรื่องตลกชื่อดังซึ่งอย่างที่เราทราบคืออุณหภูมิห้อง เพื่อคำนึงถึงความถี่ของการสำแดงคุณลักษณะที่กำลังศึกษาเมื่อคำนวณค่าเฉลี่ยเลขคณิตจะใช้ดังนี้: เฉลี่ยเลขคณิตถ่วงน้ำหนักหรือค่าเฉลี่ยสำหรับอนุกรมรูปแบบที่ไม่ต่อเนื่องกัน (ชุดความแปรผันแบบไม่ต่อเนื่อง - ลำดับของการเปลี่ยนแปลงในลักษณะตามตัวบ่งชี้ที่ไม่ต่อเนื่อง (ไม่ต่อเนื่อง))

ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก (ค่าเฉลี่ยถ่วงน้ำหนัก) ไม่มีความแตกต่างพื้นฐานจากค่าเฉลี่ยเลขคณิตอย่างง่าย ในนั้นผลรวมของค่าเดียวกันจะถูกแทนที่ด้วยการคูณค่านี้ด้วยความถี่ของมันนั่นคือ ในกรณีนี้ แต่ละค่า (ตัวแปร) จะถูกถ่วงน้ำหนักด้วยความถี่ของการเกิดขึ้น

ดังนั้น เมื่อคำนวณปริมาณงานโดยเฉลี่ยของผู้สอบสวน เราต้องคูณจำนวนคดีด้วยจำนวนผู้สอบสวนที่สอบสวนจำนวนคดีนั้นอย่างแน่ชัด โดยปกติจะสะดวกที่จะนำเสนอการคำนวณดังกล่าวในรูปแบบของตาราง:

ตารางที่ 2.2

จำนวนคดี

(ตัวเลือก เอ็กซ์)

จำนวนผู้สอบสวน (ความถี่ )

ตัวเลือกผลิตภัณฑ์

ไปยังความถี่ ( เอ็กซ์)

2. ลองคำนวณค่าเฉลี่ยถ่วงน้ำหนักจริงโดยใช้สูตร:

ที่ไหน x- จำนวนคดีอาญา และ - จำนวนผู้สอบสวน

ดังนั้นค่าเฉลี่ยถ่วงน้ำหนักจึงไม่ใช่ 3.125 แต่เป็น 4.375 หากคุณลองคิดดู สิ่งนี้ควรจะเป็น: ภาระงานของผู้ตรวจสอบแต่ละคนเพิ่มขึ้นเนื่องจากข้อเท็จจริงที่ว่าผู้ตรวจสอบคนหนึ่งในแผนกสมมุติของเรากลายเป็นคนเกียจคร้าน - หรือในทางกลับกัน กำลังสืบสวนคดีที่สำคัญและซับซ้อนเป็นพิเศษ . แต่ประเด็นการตีความผลการวิจัยทางสถิติจะกล่าวถึงในหัวข้อถัดไป ในบางกรณี กล่าวคือ ในกรณีของความถี่ที่จัดกลุ่มของการแจกแจงแบบไม่ต่อเนื่อง การคำนวณค่าเฉลี่ยเมื่อมองแวบแรกอาจไม่ชัดเจน สมมติว่าเราจำเป็นต้องคำนวณค่าเฉลี่ยเลขคณิตสำหรับการกระจายตัวของบุคคลที่ถูกตัดสินว่ามีความผิดฐานหัวไม้ตามอายุ การกระจายมีลักษณะดังนี้:

ตารางที่ 2.3

(ตัวเลือก เอ็กซ์)

จำนวนนักโทษ (ความถี่ )

ตรงกลางของช่วง

ตัวเลือกผลิตภัณฑ์

ไปยังความถี่ ( เอ็กซ์)

(21-18) /2+18=19,5

ถัดไป ค่าเฉลี่ยจะคำนวณตามกฎทั่วไปและมีค่าเท่ากับ 23.6 ปีสำหรับซีรี่ส์ที่แยกจากกันนี้ ในกรณีของสิ่งที่เรียกว่า อนุกรมแบบเปิด กล่าวคือ ในสถานการณ์ที่ช่วงเวลาสุดขั้วถูกกำหนดโดย “น้อยกว่า” x" หรือมากกว่า x" ขนาดของช่วงเวลาสุดขั้วจะถูกตั้งค่าคล้ายกับช่วงเวลาอื่นๆ

3. ซีรี่ส์ไดนามิก

ปรากฏการณ์ทางสังคมที่ศึกษาโดยสถิติมีการพัฒนาและเปลี่ยนแปลงอย่างต่อเนื่อง ตัวชี้วัดทางสังคมและกฎหมายสามารถนำเสนอได้ไม่เพียง แต่ในรูปแบบคงที่ซึ่งสะท้อนถึงปรากฏการณ์บางอย่าง แต่ยังเป็นกระบวนการที่เกิดขึ้นในเวลาและสถานที่ตลอดจนในรูปแบบของปฏิสัมพันธ์ของลักษณะที่ศึกษา กล่าวอีกนัยหนึ่ง อนุกรมเวลาแสดงถึงพัฒนาการของลักษณะ กล่าวคือ การเปลี่ยนแปลงของเวลา สถานที่ หรือขึ้นอยู่กับสภาพแวดล้อม

ชุดนี้เป็นลำดับของค่าเฉลี่ยในช่วงเวลาที่กำหนด (สำหรับแต่ละปีปฏิทิน)

สำหรับการศึกษาเชิงลึกเกี่ยวกับปรากฏการณ์ทางสังคมและการวิเคราะห์ การเปรียบเทียบระดับของชุดของพลวัตอย่างง่าย ๆ นั้นไม่เพียงพอ จำเป็นต้องคำนวณตัวบ่งชี้อนุพันธ์ของชุดของพลวัต: การเติบโตสัมบูรณ์ อัตราการเติบโต การเติบโต อัตราการเติบโตและอัตราการเติบโตโดยเฉลี่ย เนื้อหาสัมบูรณ์ของการเติบโตหนึ่งเปอร์เซ็นต์

การคำนวณตัวบ่งชี้ของอนุกรมไดนามิกนั้นดำเนินการบนพื้นฐานของการเปรียบเทียบระดับ ในกรณีนี้ มีสองวิธีที่เป็นไปได้ในการเปรียบเทียบระดับของอนุกรมเวลา:

ตัวบ่งชี้พื้นฐาน เมื่อระดับต่อมาทั้งหมดถูกเปรียบเทียบกับระดับเริ่มต้นบางระดับที่ใช้เป็นฐาน

ตัวบ่งชี้ลูกโซ่เมื่อแต่ละระดับที่ตามมาของชุดของไดนามิกถูกเปรียบเทียบกับระดับก่อนหน้า

การเติบโตแบบสัมบูรณ์แสดงจำนวนหน่วยที่ระดับของช่วงเวลาปัจจุบันมากกว่าหรือน้อยกว่าระดับฐานหรือช่วงเวลาก่อนหน้าในช่วงเวลาที่กำหนด

การเพิ่มขึ้นสัมบูรณ์ (P) คำนวณจากความแตกต่างระหว่างระดับที่เปรียบเทียบ

ฐานการเติบโตสัมบูรณ์:

พีบี = ฉัน - ฐาน . (ฉ.1)

ห่วงโซ่เพิ่มขึ้นแน่นอน:

ทีเอส = ฉัน - ฉัน -1 (ฉ.2)

อัตราการเติบโต (Tr) แสดงจำนวนครั้ง (ตามเปอร์เซ็นต์) ที่ระดับของช่วงเวลาปัจจุบันมากกว่าหรือน้อยกว่าระดับของฐานหรือช่วงเวลาก่อนหน้า:

อัตราการเติบโตพื้นฐาน:

(ฉ.3)

อัตราการเติบโตของห่วงโซ่:

(ฉ.4)

อัตราการเติบโต (Tpr) แสดงตามเปอร์เซ็นต์ที่ระดับของช่วงเวลาปัจจุบันมากกว่าหรือน้อยกว่าระดับของฐานหรือช่วงเวลาก่อนหน้าที่ใช้เป็นพื้นฐานของการเปรียบเทียบ และคำนวณเป็นอัตราส่วนของการเติบโตแบบสัมบูรณ์ต่อระดับสัมบูรณ์ เอามาเป็นฐาน

อัตราการเติบโตสามารถคำนวณได้โดยการลบ 100% ออกจากอัตราการเติบโต

อัตราการเติบโตพื้นฐาน:

หรือ (ฉ.5)

อัตราการเติบโตของห่วงโซ่:

หรือ (ฉ.6)

อัตราการเติบโตเฉลี่ยคำนวณโดยใช้สูตรค่าเฉลี่ยเรขาคณิตของอัตราการเติบโตของชุดไดนามิก:

(ฉ.7)

อัตราการเติบโตเฉลี่ยอยู่ที่ไหน

- อัตราการเติบโตในแต่ละช่วงเวลา

n- จำนวนอัตราการเติบโต

ปัญหาที่คล้ายกันซึ่งมีเลขชี้กำลังรูทมากกว่า 3 มักจะแก้ไขได้โดยใช้ลอการิทึม จากพีชคณิต เรารู้ว่าลอการิทึมของรากเท่ากับลอการิทึมของตัวถูกถอดรากหารด้วยเลขชี้กำลังของราก และลอการิทึมของผลคูณของปัจจัยหลายตัวเท่ากับผลรวมของลอการิทึมของปัจจัยเหล่านี้

ดังนั้นอัตราการเติบโตเฉลี่ยจึงคำนวณโดยการแยกราก nองศาจากผลงานของแต่ละบุคคล n- อัตราการเติบโตของห่วงโซ่ อัตราการเติบโตเฉลี่ยคือความแตกต่างระหว่างอัตราการเติบโตเฉลี่ยกับหนึ่ง () หรือ 100% เมื่ออัตราการเติบโตแสดงเป็นเปอร์เซ็นต์:

หรือ

ในกรณีที่ไม่มีระดับกลางในชุดไดนามิก อัตราการเติบโตและอัตราการเพิ่มขึ้นโดยเฉลี่ยจะถูกกำหนดโดยสูตรต่อไปนี้:

(ฉ.8)

ระดับสุดท้ายของซีรีย์ไดนามิกอยู่ที่ไหน

- ระดับเริ่มต้นของซีรีย์ไดนามิก

n - จำนวนระดับ (วันที่)

เห็นได้ชัดว่าตัวบ่งชี้อัตราการเติบโตและการเพิ่มขึ้นโดยเฉลี่ยซึ่งคำนวณโดยใช้สูตร (แบบฟอร์ม 7 และแบบฟอร์ม 8) มีค่าตัวเลขเหมือนกัน

เนื้อหาสัมบูรณ์ของการเติบโต 1% แสดงให้เห็นว่าค่าสัมบูรณ์ 1% ของการเติบโตมีค่าเท่าใด และคำนวณเป็นอัตราส่วนของการเติบโตสัมบูรณ์ต่ออัตราการเติบโต

เนื้อหาสัมบูรณ์เพิ่มขึ้น 1%:

พื้นฐาน: (แบบฟอร์ม 9)

ห่วงโซ่: (ฉ.10)

การคำนวณและการวิเคราะห์ค่าสัมบูรณ์ของการเพิ่มแต่ละเปอร์เซ็นต์ช่วยให้เข้าใจธรรมชาติของการพัฒนาปรากฏการณ์ที่อยู่ระหว่างการศึกษาได้ลึกซึ้งยิ่งขึ้น ข้อมูลจากตัวอย่างของเราแสดงให้เห็นว่าแม้จะมีความผันผวนของอัตราการเติบโตและการเพิ่มขึ้นในแต่ละปี แต่ตัวบ่งชี้พื้นฐานของเนื้อหาสัมบูรณ์ 1% ของการเติบโตยังคงไม่เปลี่ยนแปลง ในขณะที่ตัวบ่งชี้ลูกโซ่แสดงลักษณะการเปลี่ยนแปลงในค่าสัมบูรณ์ของหนึ่งเปอร์เซ็นต์ของการเติบโตในแต่ละ ปีหน้าเมื่อเทียบกับปีก่อนหน้ามีเพิ่มขึ้นอย่างต่อเนื่อง

เมื่อสร้าง ประมวลผล และวิเคราะห์อนุกรมเวลา มักมีความจำเป็นต้องกำหนดระดับเฉลี่ยของปรากฏการณ์ที่กำลังศึกษาในช่วงเวลาหนึ่ง ค่าเฉลี่ยตามลำดับเวลาของอนุกรมช่วงเวลาคำนวณในช่วงเวลาที่เท่ากันโดยใช้สูตรค่าเฉลี่ยเลขคณิตอย่างง่าย และในช่วงเวลาที่ไม่เท่ากัน - โดยใช้ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:

โดยที่ระดับเฉลี่ยของอนุกรมช่วงเวลาคือ

- ระดับเริ่มต้นของซีรีส์

n- จำนวนระดับ

สำหรับชุดไดนามิกชั่วขณะ โดยมีเงื่อนไขว่าช่วงเวลาระหว่างวันที่เท่ากัน ระดับเฉลี่ยจะคำนวณโดยใช้สูตรตามลำดับเวลาเฉลี่ย:

(ฉ.11)

ค่าเฉลี่ยตามลำดับเวลาอยู่ที่ไหน

1 ,., n- ระดับสัมบูรณ์ของซีรีส์

n - จำนวนระดับสัมบูรณ์ของซีรีย์ไดนามิก

ระดับลำดับเหตุการณ์โดยเฉลี่ยของอนุกรมโมเมนต์ของไดนามิกเท่ากับผลรวมของตัวบ่งชี้ของซีรีย์นี้หารด้วยจำนวนตัวบ่งชี้ลบหนึ่ง ในกรณีนี้ ระดับเริ่มต้นและระดับสุดท้ายควรแบ่งครึ่ง เนื่องจากจำนวนวันที่ (ช่วงเวลา) มักจะมากกว่าจำนวนช่วงเวลาหนึ่ง

ขึ้นอยู่กับเนื้อหาและรูปแบบการนำเสนอแหล่งข้อมูล (ชุดช่วงเวลาหรือช่วงเวลาของการเปลี่ยนแปลง ช่วงเวลาที่เท่ากันหรือไม่) สำหรับการคำนวณตัวชี้วัดทางสังคมต่างๆ เช่น จำนวนอาชญากรรมและความผิดโดยเฉลี่ยต่อปี (ตามประเภท) ค่าเฉลี่ย ขนาดของเงินทุนหมุนเวียน จำนวนเฉลี่ยของผู้กระทำผิด และอื่นๆ ให้ใช้นิพจน์การวิเคราะห์ที่เหมาะสม

4. วิธีทางสถิติเพื่อศึกษาความสัมพันธ์

ในคำถามก่อนหน้านี้ เราได้พิจารณาการวิเคราะห์การแจกแจงแบบ "หนึ่งมิติ" - อนุกรมรูปแบบต่างๆ นี่เป็นสิ่งที่สำคัญมาก แต่ยังห่างไกลจากการวิเคราะห์ทางสถิติเพียงประเภทเดียว การวิเคราะห์ชุดความแปรผันเป็นพื้นฐานสำหรับการวิเคราะห์ทางสถิติประเภท "ขั้นสูง" มากขึ้น โดยหลักแล้วสำหรับ กำลังเรียนความสัมพันธ์. จากผลการศึกษาดังกล่าว เผยให้เห็นความสัมพันธ์ระหว่างเหตุและผลระหว่างปรากฏการณ์ ซึ่งทำให้สามารถระบุได้ว่าการเปลี่ยนแปลงลักษณะใดที่ส่งผลต่อความแปรผันของปรากฏการณ์และกระบวนการที่กำลังศึกษาอยู่ ในกรณีนี้ลักษณะที่ทำให้เกิดการเปลี่ยนแปลงในสิ่งอื่นเรียกว่าแฟคทอเรียล (ปัจจัย) และลักษณะที่เปลี่ยนแปลงภายใต้อิทธิพลของพวกเขาเรียกว่ามีประสิทธิผล

ในวิทยาศาสตร์สถิติ มีการเชื่อมต่อสองประเภทระหว่างคุณลักษณะต่างๆ และข้อมูลของมัน - การเชื่อมต่อเชิงหน้าที่ (กำหนดยาก) และเชิงสถิติ (สุ่ม)

สำหรับ การทำงานการเชื่อมต่อมีความสอดคล้องกันอย่างสมบูรณ์ระหว่างการเปลี่ยนแปลงในลักษณะปัจจัยและการเปลี่ยนแปลงค่าผลลัพธ์ ความสัมพันธ์นี้แสดงให้เห็นอย่างเท่าเทียมกันในทุกหน่วยของประชากร ตัวอย่างที่ง่ายที่สุด: อุณหภูมิที่เพิ่มขึ้นสะท้อนให้เห็นในปริมาตรของปรอทในเทอร์โมมิเตอร์ ในกรณีนี้ อุณหภูมิโดยรอบจะทำหน้าที่เป็นปัจจัย และปริมาตรของปรอทจะทำหน้าที่เป็นคุณลักษณะที่มีประสิทธิผล

ความสัมพันธ์เชิงหน้าที่เป็นลักษณะของปรากฏการณ์ที่ศึกษาโดยวิทยาศาสตร์เช่นเคมีฟิสิกส์กลศาสตร์ซึ่งเป็นไปได้ที่จะทำการทดลองที่ "บริสุทธิ์" ซึ่งอิทธิพลของปัจจัยภายนอกจะถูกกำจัดออกไป ความจริงก็คือการเชื่อมต่อการทำงานระหว่างสองเป็นไปได้ก็ต่อเมื่อค่าที่สอง (ลักษณะผลลัพธ์) ขึ้นอยู่กับ เท่านั้น และ โดยเฉพาะตั้งแต่ครั้งแรก สิ่งนี้พบได้น้อยมากในปรากฏการณ์ทางสังคม

กระบวนการทางสังคมและกฎหมายซึ่งเป็นผลมาจากอิทธิพลพร้อมกันของปัจจัยจำนวนมาก ได้รับการอธิบายผ่านการเชื่อมโยงทางสถิติ นั่นคือ การเชื่อมโยง สุ่ม (โดยบังเอิญ) กำหนดไว้เมื่อค่าที่แตกต่างกันของตัวแปรหนึ่งสอดคล้องกับค่าที่แตกต่างกันของตัวแปรอื่น

กรณีที่สำคัญที่สุด (และทั่วไป) ของการพึ่งพาแบบสุ่มคือ ความสัมพันธ์ติดยาเสพติด. ด้วยการพึ่งพาอาศัยกัน สาเหตุไม่ได้กำหนดผลกระทบอย่างชัดเจน แต่มีความน่าจะเป็นในระดับหนึ่งเท่านั้น การวิเคราะห์ทางสถิติประเภทแยกต่างหากมีไว้เพื่อระบุการเชื่อมต่อดังกล่าว - การวิเคราะห์สหสัมพันธ์

หลัก งานการวิเคราะห์ความสัมพันธ์ - ใช้เทคนิคทางคณิตศาสตร์อย่างเคร่งครัดสร้างการแสดงออกเชิงปริมาณของความสัมพันธ์ที่มีอยู่ระหว่างคุณลักษณะภายใต้การศึกษา มีหลายวิธีในการคำนวณความสัมพันธ์ที่แน่นอน และค่าสัมประสิทธิ์สหสัมพันธ์หลายประเภทตามลำดับ: ค่าสัมประสิทธิ์ฉุกเฉิน A.A. Chuprov (เพื่อวัดความสัมพันธ์ระหว่างคุณลักษณะเชิงคุณภาพ) ค่าสัมประสิทธิ์การเชื่อมโยงของ K. Pearson ตลอดจนค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Spearman และ Kendall โดยทั่วไป ค่าสัมประสิทธิ์ดังกล่าวแสดงความน่าจะเป็นที่ความสัมพันธ์ที่ศึกษาจะปรากฏ ดังนั้นยิ่งค่าสัมประสิทธิ์สูงเท่าใดความสัมพันธ์ระหว่างคุณลักษณะก็จะยิ่งเด่นชัดมากขึ้นเท่านั้น

ความสัมพันธ์ทั้งโดยตรงและผกผันสามารถเกิดขึ้นได้ระหว่างปัจจัยที่กำลังศึกษา ตรงความสัมพันธ์ติดยาเสพติดสังเกตในกรณีที่การเปลี่ยนแปลงค่าของปัจจัยสอดคล้องกับการเปลี่ยนแปลงเดียวกันในค่าของแอตทริบิวต์ผลลัพธ์นั่นคือเมื่อค่าของแอตทริบิวต์ปัจจัยเพิ่มขึ้นค่าของแอตทริบิวต์ผลลัพธ์ก็เพิ่มขึ้นเช่นกันและในทางกลับกัน . ตัวอย่างเช่น มีความสัมพันธ์โดยตรงระหว่างปัจจัยที่ก่ออาชญากรรมและอาชญากรรม (ที่มีเครื่องหมาย "+") หากการเพิ่มขึ้นของค่าของคุณลักษณะหนึ่งทำให้เกิดการเปลี่ยนแปลงแบบย้อนกลับในค่าของอีกคุณลักษณะหนึ่ง ความสัมพันธ์ดังกล่าวจะถูกเรียก ย้อนกลับ. ตัวอย่างเช่น ยิ่งการควบคุมทางสังคมในสังคมสูงเท่าไร อาชญากรรมก็จะยิ่งน้อยลงเท่านั้น (ความสัมพันธ์กับเครื่องหมาย "-")

การเชื่อมต่อทั้งไปข้างหน้าและข้างหลังอาจเป็นแบบเชิงเส้นหรือแบบโค้ง

เส้นตรง (ความสัมพันธ์เชิงเส้น) จะปรากฏขึ้นเมื่อค่าของคุณลักษณะปัจจัยเพิ่มขึ้นมีการเพิ่มขึ้น (โดยตรง) หรือลดลง (ผกผัน) ในค่าของคุณลักษณะที่ตามมา ในทางคณิตศาสตร์ ความสัมพันธ์นี้แสดงโดยสมการการถดถอย: ที่ = + เอ็กซ์, ที่ไหน ที่ - สัญญาณผล; และ - ค่าสัมประสิทธิ์การมีเพศสัมพันธ์ที่สอดคล้องกัน เอ็กซ์ - ปัจจัยสัญญาณ

เส้นโค้ง การเชื่อมต่อมีลักษณะที่แตกต่างกัน การเพิ่มมูลค่าของคุณลักษณะปัจจัยมีผลกระทบอย่างไม่สม่ำเสมอต่อมูลค่าของคุณลักษณะผลลัพธ์ ในตอนแรกการเชื่อมต่อนี้สามารถทำได้โดยตรง จากนั้นจึงย้อนกลับ ตัวอย่างที่รู้จักกันดีคือความเชื่อมโยงระหว่างอาชญากรรมกับอายุของผู้กระทำผิด ในตอนแรก กิจกรรมทางอาญาของแต่ละบุคคลจะเพิ่มขึ้นในสัดส่วนโดยตรงกับอายุของผู้กระทำผิดที่เพิ่มขึ้น (สูงสุดประมาณ 30 ปี) จากนั้นเมื่ออายุมากขึ้น กิจกรรมทางอาญาจะลดลง นอกจากนี้ เส้นการกระจายด้านบนของผู้กระทำผิดตามอายุจะเปลี่ยนจากค่าเฉลี่ยไปทางซ้าย (ไปยังอายุน้อยกว่า) และไม่สมมาตร

ความสัมพันธ์เชิงเส้นสามารถเชื่อมต่อได้ หนึ่งโอแฟกทอเรียล, เมื่อมีการศึกษาความเชื่อมโยงระหว่างสัญญาณแฟคเตอร์หนึ่งและสัญญาณผลที่ตามมาหนึ่งรายการ (สหสัมพันธ์แบบคู่) พวกเขาอาจจะเป็น หลายปัจจัย,เมื่อมีการศึกษาอิทธิพลของปัจจัยสัญญาณที่มีปฏิสัมพันธ์ต่อสัญญาณและผลที่ตามมา (ความสัมพันธ์หลายประการ)

แต่ไม่ว่าจะใช้สัมประสิทธิ์สหสัมพันธ์แบบใด ไม่ว่าจะศึกษาความสัมพันธ์แบบใด ก็เป็นไปไม่ได้ที่จะสร้างการเชื่อมโยงระหว่างคุณลักษณะตามตัวบ่งชี้ทางสถิติเท่านั้น การวิเคราะห์ตัวบ่งชี้เบื้องต้นจะเป็นการวิเคราะห์เสมอ เชิงคุณภาพในระหว่างที่มีการศึกษาและชี้แจงธรรมชาติทางสังคมและกฎหมายของปรากฏการณ์นี้ ในกรณีนี้มีการใช้วิธีการและวิธีการทางวิทยาศาสตร์ที่เป็นลักษณะของสาขาวิทยาศาสตร์ที่ศึกษาปรากฏการณ์นี้ (สังคมวิทยา กฎหมาย จิตวิทยา ฯลฯ ) จากนั้นการวิเคราะห์การจัดกลุ่มและค่าเฉลี่ยช่วยให้เราสามารถตั้งสมมติฐาน สร้างแบบจำลอง และกำหนดประเภทของการเชื่อมต่อและการพึ่งพาได้ หลังจากนี้คุณลักษณะเชิงปริมาณของการพึ่งพาที่กำหนด - อันที่จริงคือค่าสัมประสิทธิ์สหสัมพันธ์

วรรณกรรม

1. อวาเนซอฟ จี.เอ. พื้นฐานของการพยากรณ์อาชญวิทยา บทช่วยสอน อ.: โรงเรียนมัธยมปลายของกระทรวงกิจการภายในของสหภาพโซเวียต, 2513

2. Avrutin K.E., Gilinsky Ya.I. การวิเคราะห์อาชญวิทยาของอาชญากรรมในภูมิภาค: วิธีการ เทคนิค เทคนิค ล., 1991.

3. Adamov E. et al. เศรษฐศาสตร์และสถิติของ บริษัท : หนังสือเรียน / Ed. เอส.ดี. อิลเยนโควา. อ.: การเงินและสถิติ, 2551.

4. บาลาคินา เอ็น.เอ็น. สถิติ: หนังสือเรียน. - วิธี. ซับซ้อน. Khabarovsk: IVESEP สาขาใน Khabarovsk, 2008

5. Bluvshtein Yu.D., Volkov G.I. อนุกรมเวลาของอาชญากรรม: หนังสือเรียน มินสค์, 1984.

6. Borovikov V.P. , Borovikov I.P. STATISTICA - การวิเคราะห์ทางสถิติและการประมวลผลข้อมูลในสภาพแวดล้อม Windows อ.: ข้อมูลและสำนักพิมพ์ "Filin", 2540.

7. โบโรดิน เอส.วี. การควบคุมอาชญากรรม: แบบจำลองทางทฤษฎีสำหรับโครงการที่ครอบคลุม อ.: เนากา, 1990.

8. คำถามเกี่ยวกับสถิติ // นิตยสารวิทยาศาสตร์และข้อมูลรายเดือนของคณะกรรมการสถิติแห่งรัฐของสหพันธรัฐรัสเซีย พ.ศ. 2545-2552

9. กูซารอฟ วี.เอ็ม. สถิติ: หนังสือเรียน. คู่มือสำหรับมหาวิทยาลัย อ.: UNITY-DANA, 2552.

10. Dobrynina N.V., Nimenya I.N. สถิติ: หนังสือเรียน. - วิธี. เบี้ยเลี้ยง. เซนต์ปีเตอร์สเบิร์ก: SPbGIEU, 2009

11. Eliseeva I.I. , Yuzbashev M.M. ทฤษฎีสถิติทั่วไป: หนังสือเรียนมหาวิทยาลัย / เรียบเรียงโดย I. I. Eliseeva.4th ed. อ.: การเงินและสถิติ, 2542.

12. Eliseeva I.I. , Yuzbashev M.M. ทฤษฎีสถิติทั่วไป: หนังสือเรียน. - อ.: การเงินและสถิติ, 2538.

13. Eremina T., Matyatina V., Pluschevskaya Yu. ปัญหาการพัฒนาภาคเศรษฐกิจรัสเซีย // คำถามเศรษฐศาสตร์. พ.ศ. 2552 ฉบับที่ 7.

14. Efimova M.R., Ganchenko O.I., Petrova E.V. การประชุมเชิงปฏิบัติการเรื่องทฤษฎีสถิติทั่วไป: หนังสือเรียน คู่มือ. ฉบับพิมพ์ครั้งที่ 2, ปรับปรุง. และเพิ่มเติม อ.: การเงินและสถิติ, 2552.

15. Efimova M.R., Petrova E.V., Rumyantsev V.N. ทฤษฎีสถิติทั่วไป: หนังสือเรียน. - ม.: INFRA-M, 1998.

16. คิริลลอฟ แอล.เอ. การศึกษาอาชญวิทยาและการป้องกันอาชญากรรมโดยหน่วยงานภายใน M. , 1992

17. Kosoplechev N.P. วิธีการวิจัยทางอาชญาวิทยา ม., 1984.

18. ลี ดี.เอ. อาชญากรรมในรัสเซีย: การวิเคราะห์ระบบ ม., 1997.

19. ลี ดี.เอ. การบัญชีทางสถิติทางอาญา: รูปแบบโครงสร้างและการทำงาน อ.: หน่วยงานข้อมูลและสิ่งพิมพ์ "Russian World", 1998

20. Makarova N.V., Trofimets V.Ya. สถิติใน Excel: หนังสือเรียน. เบี้ยเลี้ยง. อ.: การเงินและสถิติ, 2552.

21. เนสเตรอฟ แอล.ไอ. แนวโน้มใหม่ในสถิติความมั่งคั่งของชาติ // คำถามทางสถิติ พ.ศ. 2551 ฉบับที่ 11.

22. เปโตรวา อี.วี. และอื่นๆ การประชุมเชิงปฏิบัติการเรื่องสถิติการขนส่ง: หนังสือเรียน เบี้ยเลี้ยง. อ.: การเงินและสถิติ, 2551.

23. อาชญากรรมในรัสเซียในยุค 90 และบางแง่มุมของหลักนิติธรรมและการต่อสู้กับมัน ม., 1995.

24. อาชญากรรม สถิติ กฎหมาย // เอ็ด. ศาสตราจารย์ AI. หนี้. อ.: สมาคมอาชญวิทยา, 2540.

25. รอสตอฟ เค.ที. อาชญากรรมในภูมิภาคของรัสเซีย (การวิเคราะห์ทางสังคมและอาชญวิทยา) เซนต์ปีเตอร์สเบิร์ก: สถาบันเซนต์ปีเตอร์สเบิร์กแห่งกระทรวงกิจการภายในของรัสเซีย, 2541

26. แนวทางสำหรับผู้ทำสำมะโนประชากรเกี่ยวกับขั้นตอนการดำเนินการสำรวจสำมะโนประชากรทั้งหมดของรัสเซียในปี 2545 และการกรอกเอกสารสำมะโนประชากร อ.: PIK "ออฟเซ็ต", 2546

27. ซาวุค แอล.เค. สถิติทางกฎหมาย: หนังสือเรียน. อ.: ยูริสต์, 1999.

28. ซาลิน วี.เอ็น., ชปาคอฟสกายา อี.พี. สถิติเศรษฐกิจและสังคม: หนังสือเรียนสำหรับมหาวิทยาลัย. อ.: ทนายความการ์ดานิกา, 2551.

29. Sidenko A.V., Popov G.Yu., Matveeva V.M. สถิติ: หนังสือเรียน. อ.: ธุรกิจและบริการ, 2551.

30. การป้องกันอาชญากรรมทางสังคม: เคล็ดลับ คำแนะนำ // เอ็ด. ใช่. เคริโมวา. ม., 1989.

31. สถิติสังคม: หนังสือเรียนสำหรับมหาวิทยาลัย // เอ็ด. ฉัน. เอลิเซวา. ฉบับที่ 3 อ.: การเงินและสถิติ, 2552.

โพสต์บน Allbest.ru

เอกสารที่คล้ายกัน

    การพิจารณาวิธีหลักในการวิเคราะห์ทางสถิติ การศึกษาของเทศบาลตำบลกุนกูร์ ดำเนินการคำนวณตามตัวบ่งชี้หนังสือรุ่น การวิเคราะห์ประชากรศาสตร์และการพัฒนาเศรษฐกิจและสังคมของพื้นที่โดยพิจารณาจากผลการสมัคร

    งานหลักสูตรเพิ่มเมื่อ 24/06/2558

    ค่าเฉลี่ยเป็นลักษณะอิสระของกฎของกระบวนการในเงื่อนไขที่เกิดขึ้น แบบฟอร์มและวิธีการคำนวณค่าเฉลี่ย การใช้ค่าเฉลี่ยในทางปฏิบัติ: การคำนวณความแตกต่างของค่าจ้างตามภาคเศรษฐกิจ

    งานหลักสูตร เพิ่มเมื่อ 12/04/2550

    วิธีทางสถิติในการวิเคราะห์การหย่าร้าง การวิเคราะห์ทางสถิติของการหย่าร้างในภูมิภาคอามูร์ การวิเคราะห์พลวัตและโครงสร้างของการหย่าร้าง การจัดกลุ่มเมืองและเขตของภูมิภาคอามูร์ตามจำนวนการหย่าร้างต่อปี การคำนวณค่าเฉลี่ยและตัวชี้วัดการเปลี่ยนแปลง

    งานหลักสูตรเพิ่มเมื่อ 04/12/2014

    แง่มุมของการวิเคราะห์ทางสถิติของการจัดหาที่อยู่อาศัย การประยุกต์วิธีการทางสถิติเพื่อวิเคราะห์อุปทานที่อยู่อาศัยของประชากร การวิเคราะห์ความเป็นเนื้อเดียวกันของประชากรในเขตตามอัตราส่วนการพึ่งพา การวิเคราะห์สหสัมพันธ์และการถดถอย

    งานหลักสูตรเพิ่มเมื่อ 18/01/2552

    การจัดสถิติของรัฐในรัสเซีย ข้อกำหนดสำหรับข้อมูลที่รวบรวม รูปแบบ ประเภท และวิธีการสังเกตทางสถิติ การเตรียมการสังเกตทางสถิติ ข้อผิดพลาดในการสังเกตทางสถิติ วิธีการติดตามสถิติ

    บทคัดย่อ เพิ่มเมื่อ 12/02/2550

    การพัฒนาโปรแกรมติดตามสถิติกฎหมายอาญา ขั้นตอนและข้อกำหนดหลัก วิธีการ และขั้นตอนการดำเนินการ การกำหนดสถานะอาชญากรรมในพื้นที่ศึกษา หลักเกณฑ์การบันทึกผลการสังเกตทางสถิติ

    ทดสอบเพิ่มเมื่อ 18/05/2010

    การจำแนกประเภทของเอกสารทางสถิติ ประเภทของเอกสาร: ลายลักษณ์อักษร การยึดถือ สถิติ และการออกเสียง วิธีการและวิธีการวิเคราะห์วัสดุ: แบบไม่เป็นทางการ (แบบดั้งเดิม) และแบบเป็นทางการ ขั้นตอนการดำเนินการวิเคราะห์เนื้อหา

    การนำเสนอเพิ่มเมื่อ 16/02/2014

    แนวคิดเรื่องค่าเฉลี่ย วิธีการหาค่าเฉลี่ยในการศึกษาปรากฏการณ์ทางสังคม ความเกี่ยวข้องของการใช้วิธีการเฉลี่ยในการศึกษาปรากฏการณ์ทางสังคมนั้นมั่นใจได้จากความเป็นไปได้ในการย้ายจากบุคคลไปสู่ทั่วไปจากสุ่มไปสู่ธรรมชาติ

    งานหลักสูตรเพิ่มเมื่อ 13/01/2552

    แนวคิดของการสังเกตทางสถิติ การวิเคราะห์ความสัมพันธ์เชิงเส้นและเส้นโค้ง ความคุ้นเคยกับสูตรและปริมาณของการสังเกตทางสถิติ การวิเคราะห์การคำนวณความสัมพันธ์ของดัชนี การสร้างฮิสโตแกรม องค์ประกอบของอนุกรมการแจกแจง

    ทดสอบเพิ่มเมื่อ 27/03/2555

    ลักษณะของตัวบ่งชี้หลักของการวิเคราะห์ทางสถิติเกี่ยวกับสภาพทางสังคมของการสาธารณสุขในสหพันธรัฐรัสเซีย ระดับการประเมินสุขภาพจากมุมมองของเวชศาสตร์สังคม การจำแนกประชากรเด็กตามกลุ่มสุขภาพ


อย่าสูญเสียมันไปสมัครสมาชิกและรับลิงค์ไปยังบทความในอีเมลของคุณ

กิจกรรมของผู้คนในหลายกรณีเกี่ยวข้องกับการทำงานกับข้อมูล และสิ่งนี้สามารถบอกเป็นนัยว่าไม่เพียงแต่ปฏิบัติการกับข้อมูลเท่านั้น แต่ยังรวมถึงการศึกษา ประมวลผล และวิเคราะห์ข้อมูลด้วย ตัวอย่างเช่น เมื่อคุณต้องการย่อข้อมูล ค้นหาความสัมพันธ์หรือกำหนดโครงสร้าง และสำหรับการวิเคราะห์ในกรณีนี้ สะดวกมากที่จะใช้ไม่เพียงแต่ แต่ยังใช้วิธีการทางสถิติด้วย

คุณลักษณะของวิธีการวิเคราะห์ทางสถิติคือความซับซ้อนเนื่องจากรูปแบบทางสถิติที่หลากหลายตลอดจนความซับซ้อนของกระบวนการวิจัยทางสถิติ อย่างไรก็ตาม เราต้องการพูดคุยเกี่ยวกับวิธีการที่ทุกคนสามารถใช้ได้ และทำได้อย่างมีประสิทธิภาพและมีความสุข

การวิจัยทางสถิติสามารถทำได้โดยใช้วิธีการดังต่อไปนี้:

  • การสังเกตทางสถิติ
  • สรุปและการจัดกลุ่มวัสดุการสังเกตทางสถิติ
  • ค่าสถิติสัมบูรณ์และค่าสัมพัทธ์
  • ชุดรูปแบบต่างๆ
  • ตัวอย่าง;
  • การวิเคราะห์สหสัมพันธ์และการถดถอย
  • ซีรีย์ไดนามิก

การสังเกตทางสถิติ

การสังเกตทางสถิติเป็นการวางแผน จัดระเบียบ และในกรณีส่วนใหญ่ เป็นการรวบรวมข้อมูลอย่างเป็นระบบ โดยมุ่งเป้าไปที่ปรากฏการณ์ของชีวิตทางสังคมเป็นหลัก วิธีการนี้ดำเนินการผ่านการลงทะเบียนคุณสมบัติที่โดดเด่นที่สุดที่กำหนดไว้ล่วงหน้า โดยมีวัตถุประสงค์เพื่อให้ได้มาซึ่งลักษณะของปรากฏการณ์ที่กำลังศึกษาอยู่ในภายหลัง

การสังเกตทางสถิติจะต้องดำเนินการโดยคำนึงถึงข้อกำหนดที่สำคัญบางประการ:

  • จะต้องครอบคลุมปรากฏการณ์ที่กำลังศึกษาอย่างครบถ้วน
  • ข้อมูลที่ได้รับจะต้องมีความถูกต้องและเชื่อถือได้
  • ข้อมูลที่ได้รับควรมีความสม่ำเสมอและเปรียบเทียบได้ง่าย

นอกจากนี้ การสังเกตทางสถิติอาจมีสองรูปแบบ:

  • การรายงานเป็นรูปแบบหนึ่งของการสังเกตทางสถิติ โดยที่ข้อมูลจะถูกส่งไปยังแผนกสถิติเฉพาะขององค์กร สถาบัน หรือองค์กรต่างๆ ในกรณีนี้ข้อมูลจะถูกป้อนลงในรายงานพิเศษ
  • การสังเกตที่จัดเป็นพิเศษคือการสังเกตที่จัดขึ้นเพื่อวัตถุประสงค์เฉพาะ เพื่อให้ได้ข้อมูลที่ไม่มีอยู่ในรายงาน หรือเพื่อชี้แจงและสร้างความน่าเชื่อถือของข้อมูลในรายงาน แบบฟอร์มนี้ประกอบด้วยแบบสำรวจ (เช่น แบบสำรวจความคิดเห็น) การสำรวจสำมะโนประชากร ฯลฯ

นอกจากนี้ การสังเกตทางสถิติยังแบ่งตามลักษณะเฉพาะได้ 2 ลักษณะ คือ ตามลักษณะการบันทึกข้อมูล หรือตามความครอบคลุมของหน่วยสังเกตการณ์ หมวดหมู่แรกประกอบด้วยการสำรวจ เอกสาร และการสังเกตโดยตรง และประเภทที่สองรวมถึงการสังเกตอย่างต่อเนื่องและไม่สมบูรณ์ เช่น เลือกสรร

ในการรับข้อมูลโดยใช้การสังเกตทางสถิติ คุณสามารถใช้วิธีการต่างๆ เช่น แบบสอบถาม กิจกรรมผู้สื่อข่าว การคำนวณด้วยตนเอง (เช่น เมื่อผู้สังเกตกรอกเอกสารที่เกี่ยวข้องด้วยตนเอง) การสำรวจ และการรายงาน

สรุปและการจัดกลุ่มวัสดุการสังเกตทางสถิติ

เมื่อพูดถึงวิธีที่สอง ก่อนอื่นเราควรพูดถึงบทสรุป สรุปคือกระบวนการประมวลผลข้อเท็จจริงบางอย่างซึ่งประกอบขึ้นเป็นเนื้อหาโดยรวมที่รวบรวมระหว่างการสังเกต หากการสรุปดำเนินการอย่างถูกต้อง ข้อมูลจำนวนมากเกี่ยวกับวัตถุการสังเกตแต่ละรายการสามารถเปลี่ยนเป็นตารางสถิติและผลลัพธ์ที่ซับซ้อนทั้งหมดได้ นอกจากนี้การวิจัยดังกล่าวยังช่วยในการกำหนดลักษณะทั่วไปและรูปแบบของปรากฏการณ์ที่กำลังศึกษาอยู่

เมื่อคำนึงถึงตัวบ่งชี้ความแม่นยำและความลึกของการศึกษาสามารถแยกแยะบทสรุปที่ง่ายและซับซ้อนได้ แต่สิ่งใดสิ่งหนึ่งควรขึ้นอยู่กับขั้นตอนเฉพาะ:

  • มีการเลือกลักษณะการจัดกลุ่ม
  • กำหนดลำดับการก่อตัวของกลุ่ม
  • มีการพัฒนาระบบตัวบ่งชี้เพื่อระบุลักษณะกลุ่มและวัตถุหรือปรากฏการณ์โดยรวม
  • เค้าโครงตารางกำลังได้รับการพัฒนาซึ่งจะนำเสนอผลลัพธ์สรุป

สิ่งสำคัญคือต้องทราบว่ามีรูปแบบการสรุปที่แตกต่างกัน:

  • สรุปแบบรวมศูนย์ โดยต้องมีการถ่ายโอนวัสดุหลักที่ได้รับไปยังศูนย์ที่สูงกว่าเพื่อการประมวลผลในภายหลัง
  • สรุปแบบกระจายอำนาจ โดยที่การศึกษาข้อมูลเกิดขึ้นในหลายขั้นตอนในลักษณะจากน้อยไปหามาก

การสรุปสามารถทำได้โดยใช้อุปกรณ์พิเศษ เช่น การใช้ซอฟต์แวร์คอมพิวเตอร์หรือด้วยตนเอง

ในส่วนของการจัดกลุ่ม กระบวนการนี้จะมีความโดดเด่นโดยการแบ่งข้อมูลที่อยู่ระหว่างการศึกษาออกเป็นกลุ่มตามลักษณะเฉพาะ คุณสมบัติของงานที่เกิดจากการวิเคราะห์ทางสถิติมีอิทธิพลต่อประเภทของการจัดกลุ่ม: การจำแนกประเภท โครงสร้าง หรือการวิเคราะห์ นั่นคือเหตุผลที่ในการสรุปและการจัดกลุ่มพวกเขาหันไปใช้บริการของผู้เชี่ยวชาญเฉพาะทางหรือการใช้งาน

ปริมาณทางสถิติสัมบูรณ์และสัมพัทธ์

ค่าสัมบูรณ์ถือเป็นรูปแบบแรกของการนำเสนอข้อมูลทางสถิติ ด้วยความช่วยเหลือนี้ จึงเป็นไปได้ที่จะกำหนดคุณลักษณะเชิงมิติให้กับปรากฏการณ์ได้ เช่น ในเวลา ความยาว ปริมาตร พื้นที่ มวล เป็นต้น

หากคุณต้องการทราบเกี่ยวกับค่าสถิติสัมบูรณ์แต่ละรายการ คุณสามารถใช้การวัด การประมาณค่า การนับจำนวน หรือการชั่งน้ำหนักได้ และหากคุณต้องการได้รับตัวบ่งชี้ปริมาณรวม คุณควรใช้การสรุปและการจัดกลุ่ม จะต้องคำนึงถึงว่าค่าสถิติสัมบูรณ์จะแตกต่างกันเมื่อมีหน่วยวัด หน่วยดังกล่าวประกอบด้วยต้นทุน แรงงาน และธรรมชาติ

และปริมาณสัมพัทธ์แสดงความสัมพันธ์เชิงปริมาณที่เกี่ยวข้องกับปรากฏการณ์ของชีวิตทางสังคม เพื่อให้ได้มา ปริมาณบางจำนวนจะถูกหารด้วยปริมาณอื่นเสมอ ตัวบ่งชี้ที่ใช้เปรียบเทียบ (นี่คือตัวส่วน) เรียกว่าพื้นฐานของการเปรียบเทียบ และตัวบ่งชี้ที่ใช้เปรียบเทียบ (นี่คือตัวเศษ) เรียกว่าค่าการรายงาน

ค่าสัมพัทธ์อาจแตกต่างกันไปขึ้นอยู่กับเนื้อหา ตัวอย่างเช่นมีค่าของการเปรียบเทียบค่าของระดับการพัฒนาค่าของความเข้มข้นของกระบวนการเฉพาะค่าของการประสานงานโครงสร้างไดนามิก ฯลฯ และอื่น ๆ

ในการศึกษาประชากรตามลักษณะเฉพาะที่แตกต่างกัน การวิเคราะห์ทางสถิติจะใช้ค่าเฉลี่ย โดยสรุปลักษณะเชิงคุณภาพของชุดปรากฏการณ์ที่เป็นเนื้อเดียวกันโดยอาศัยลักษณะเฉพาะที่แตกต่างบางประการ

คุณสมบัติที่สำคัญอย่างยิ่งของค่าเฉลี่ยคือการพูดถึงค่าของคุณสมบัติเฉพาะในคอมเพล็กซ์ทั้งหมดเป็นตัวเลขตัวเดียว แม้ว่าแต่ละหน่วยอาจแสดงความแตกต่างเชิงปริมาณ แต่ค่าเฉลี่ยจะแสดงค่าทั่วไปซึ่งเป็นลักษณะของทุกหน่วยของคอมเพล็กซ์ภายใต้การศึกษา ปรากฎว่าโดยการใช้คุณลักษณะของสิ่งหนึ่ง คุณจะได้รับคุณลักษณะของทั้งหมด

ควรระลึกไว้ว่าหนึ่งในเงื่อนไขที่สำคัญที่สุดสำหรับการใช้ค่าเฉลี่ยหากทำการวิเคราะห์ทางสถิติของปรากฏการณ์ทางสังคมจะถือเป็นความสม่ำเสมอของความซับซ้อนซึ่งจำเป็นต้องค้นหา ค่าเฉลี่ย และสูตรในการพิจารณาจะขึ้นอยู่กับว่าจะแสดงข้อมูลเริ่มต้นสำหรับการคำนวณค่าเฉลี่ยอย่างไร

ซีรี่ส์รูปแบบต่างๆ

ในบางกรณี ข้อมูลตัวบ่งชี้เฉลี่ยของปริมาณที่ศึกษาบางประเภทอาจไม่เพียงพอที่จะประมวลผล ประเมิน และวิเคราะห์เชิงลึกต่อปรากฏการณ์หรือกระบวนการ จากนั้น เราควรคำนึงถึงความแปรผันหรือการกระจายตัวของตัวบ่งชี้ของแต่ละหน่วย ซึ่งแสดงถึงลักษณะสำคัญของประชากรที่ศึกษาด้วย

ค่าแต่ละค่าของปริมาณสามารถได้รับอิทธิพลจากหลายปัจจัย และปรากฏการณ์หรือกระบวนการที่กำลังศึกษาอยู่นั้นมีความหลากหลายมาก เช่น มีความแปรผัน (ความหลากหลายนี้คืออนุกรมความแปรผัน) เหตุผลที่ควรค้นหาในสาระสำคัญของสิ่งที่กำลังศึกษา

ค่าสัมบูรณ์ที่กล่าวมาข้างต้นจะขึ้นอยู่กับหน่วยวัดลักษณะโดยตรง ดังนั้น จึงทำให้กระบวนการศึกษา การประเมิน และการเปรียบเทียบชุดรูปแบบตั้งแต่ 2 ชุดขึ้นไปมีความซับซ้อนมากขึ้น และจำเป็นต้องคำนวณตัวบ่งชี้สัมพัทธ์เป็นอัตราส่วนของตัวบ่งชี้สัมบูรณ์และค่าเฉลี่ย

ตัวอย่าง

ความหมายของวิธีการสุ่มตัวอย่าง (หรือเรียกง่ายๆ ก็คือ การสุ่มตัวอย่าง) ก็คือการนำคุณสมบัติของส่วนหนึ่งมาใช้ในการกำหนดลักษณะเชิงตัวเลขของผลรวมทั้งหมด (ซึ่งเรียกว่าประชากรทั่วไป) วิธีการสุ่มตัวอย่างหลักคือการเชื่อมต่อภายในที่รวมชิ้นส่วนและทั้งหมดเข้าด้วยกัน ทั้งแบบรายบุคคลและแบบทั่วไป

วิธีการสุ่มตัวอย่างมีข้อได้เปรียบเหนือวิธีอื่นหลายประการอย่างมากเพราะว่า ด้วยการลดจำนวนการสังเกต ทำให้คุณสามารถลดปริมาณงาน เงิน และความพยายามที่ใช้ไป รวมถึงรับข้อมูลเกี่ยวกับกระบวนการและปรากฏการณ์ดังกล่าวได้สำเร็จ ซึ่งเป็นไปไม่ได้เลยที่จะศึกษาทั้งหมดอย่างสมบูรณ์

ความสอดคล้องกันของคุณลักษณะของกลุ่มตัวอย่างกับคุณลักษณะของปรากฏการณ์หรือกระบวนการที่กำลังศึกษาจะขึ้นอยู่กับชุดของเงื่อนไข และหลักๆ แล้วจะขึ้นอยู่กับวิธีนำวิธีการสุ่มตัวอย่างไปใช้ในทางปฏิบัติ ซึ่งอาจเป็นได้ทั้งการเลือกอย่างเป็นระบบ ตามแผนการที่เตรียมไว้ หรือโดยไม่ได้วางแผนไว้ เมื่อสร้างตัวอย่างจากประชากรทั่วไป

แต่ในทุกกรณี วิธีการสุ่มตัวอย่างจะต้องเป็นแบบอย่างและเป็นไปตามเกณฑ์ความเป็นกลาง ต้องปฏิบัติตามข้อกำหนดเหล่านี้เสมอเพราะว่า ความสอดคล้องกันระหว่างลักษณะของวิธีการและลักษณะของสิ่งที่ถูกวิเคราะห์ทางสถิติจะขึ้นอยู่กับสิ่งเหล่านั้น

ดังนั้น ก่อนที่จะประมวลผลวัสดุตัวอย่าง จำเป็นต้องตรวจสอบอย่างละเอียด เพื่อกำจัดทุกสิ่งที่ไม่จำเป็นและไม่สำคัญออกไป ในเวลาเดียวกัน เมื่อรวบรวมตัวอย่าง จำเป็นต้องหลีกเลี่ยงกิจกรรมสมัครเล่นใดๆ ซึ่งหมายความว่าไม่ว่าในกรณีใดคุณควรเลือกเฉพาะตัวเลือกที่ดูเหมือนปกติและละทิ้งตัวเลือกอื่นทั้งหมด

ต้องเลือกตัวอย่างที่มีประสิทธิภาพและมีคุณภาพสูงอย่างเป็นกลาง เช่น จะต้องดำเนินการในลักษณะที่ไม่รวมอิทธิพลส่วนตัวและแรงจูงใจที่มีอคติ และเพื่อให้เป็นไปตามเงื่อนไขนี้อย่างถูกต้อง จำเป็นต้องใช้หลักการสุ่มหรือพูดง่ายๆ ก็คือ หลักการสุ่มตัวเลือกจากประชากรทั้งหมด

หลักการที่นำเสนอทำหน้าที่เป็นพื้นฐานสำหรับทฤษฎีของวิธีการสุ่มตัวอย่าง และจะต้องปฏิบัติตามเมื่อใดก็ตามที่จำเป็นเพื่อสร้างประชากรตัวอย่างที่มีประสิทธิผล และกรณีของการคัดเลือกอย่างเป็นระบบก็ไม่มีข้อยกเว้นในที่นี้

การวิเคราะห์สหสัมพันธ์และการถดถอย

การวิเคราะห์สหสัมพันธ์และการวิเคราะห์การถดถอยเป็นสองวิธีที่มีประสิทธิภาพสูงที่ช่วยให้คุณสามารถวิเคราะห์ข้อมูลจำนวนมากเพื่อศึกษาความสัมพันธ์ที่เป็นไปได้ของตัวบ่งชี้สองตัวขึ้นไป

ในกรณีการวิเคราะห์ความสัมพันธ์ มีวัตถุประสงค์ดังนี้

  • วัดความใกล้ชิดของการเชื่อมต่อที่มีอยู่ระหว่างคุณลักษณะที่แตกต่าง
  • ระบุความสัมพันธ์เชิงสาเหตุที่ไม่ทราบสาเหตุ
  • ประเมินปัจจัยที่มีอิทธิพลต่อลักษณะสุดท้ายมากที่สุด

และในกรณีการวิเคราะห์การถดถอยงานมีดังนี้

  • กำหนดรูปแบบการสื่อสาร
  • กำหนดระดับอิทธิพลของตัวบ่งชี้อิสระต่อตัวบ่งชี้ที่ขึ้นอยู่กับ
  • กำหนดค่าที่คำนวณได้ของตัวบ่งชี้ที่ขึ้นอยู่กับ

เพื่อแก้ไขปัญหาข้างต้นทั้งหมด จำเป็นต้องใช้ทั้งการวิเคราะห์สหสัมพันธ์และการถดถอยร่วมกันเกือบทุกครั้ง

ซีรี่ส์ไดนามิก

เมื่อใช้วิธีการวิเคราะห์ทางสถิตินี้ จะสะดวกมากในการกำหนดความรุนแรงหรือความเร็วของปรากฏการณ์ที่เกิดขึ้น ค้นหาแนวโน้มของการพัฒนา เน้นความผันผวน เปรียบเทียบพลวัตของการพัฒนา และค้นหาความสัมพันธ์ระหว่างปรากฏการณ์ที่เกิดขึ้นเมื่อเวลาผ่านไป

ซีรีส์ไดนามิกคือซีรีส์ที่มีตัวบ่งชี้ทางสถิติตามลำดับในช่วงเวลาหนึ่ง การเปลี่ยนแปลงที่บ่งบอกถึงลักษณะกระบวนการพัฒนาของวัตถุหรือปรากฏการณ์ที่กำลังศึกษาอยู่

ซีรีย์ Dynamic ประกอบด้วยสององค์ประกอบ:

  • ช่วงเวลาหรือช่วงเวลาที่เกี่ยวข้องกับข้อมูลที่มีอยู่
  • ระดับหรือตัวบ่งชี้ทางสถิติ

เมื่อนำมารวมกัน ส่วนประกอบเหล่านี้แสดงถึงสองเงื่อนไขของอนุกรมเวลา โดยที่เทอมแรก (ช่วงเวลา) จะแสดงด้วยตัวอักษร “t” และเทอมที่สอง (ระดับ) จะแสดงด้วยตัวอักษร “y”

ขึ้นอยู่กับระยะเวลาของช่วงเวลาที่ระดับต่างๆ เชื่อมต่อกัน อนุกรมไดนามิกสามารถเป็นแบบชั่วขณะและแบบช่วงเวลาได้ อนุกรมช่วงเวลาช่วยให้คุณสามารถเพิ่มระดับเพื่อให้ได้มูลค่ารวมของช่วงเวลาต่อๆ ไป แต่ในอนุกรมช่วงเวลานั้น ไม่มีความเป็นไปได้ดังกล่าว แต่ก็ไม่จำเป็น

อนุกรมเวลายังมีอยู่ในช่วงเวลาที่เท่ากันและต่างกัน สาระสำคัญของช่วงเวลาในอนุกรมโมเมนต์และอนุกรมช่วงเวลาจะแตกต่างกันเสมอ ในกรณีแรก ช่วงเวลาคือช่วงเวลาระหว่างวันที่เชื่อมโยงข้อมูลสำหรับการวิเคราะห์ (สะดวกในการใช้ชุดข้อมูลดังกล่าว เช่น เพื่อกำหนดจำนวนการดำเนินการต่อเดือน ปี ฯลฯ) และในกรณีที่สองคือช่วงเวลาที่แนบชุดข้อมูลทั่วไป (ชุดดังกล่าวสามารถใช้เพื่อกำหนดคุณภาพของการดำเนินการเดียวกันเป็นเวลาหนึ่งเดือนหนึ่งปี ฯลฯ ) ช่วงเวลาสามารถเท่ากันหรือต่างกันได้ โดยไม่คำนึงถึงประเภทของซีรี่ส์

โดยธรรมชาติแล้วเพื่อที่จะเรียนรู้วิธีการประยุกต์ใช้วิธีการวิเคราะห์ทางสถิติแต่ละวิธีอย่างมีความสามารถนั้นยังไม่เพียงพอที่จะรู้เกี่ยวกับพวกเขาเพราะในความเป็นจริงสถิติเป็นวิทยาศาสตร์ทั้งหมดที่ต้องใช้ทักษะและความสามารถบางอย่างด้วย แต่เพื่อให้ง่ายขึ้น คุณสามารถและควรฝึกการคิดและ...

มิฉะนั้นการวิจัย การประเมิน การประมวลผล และการวิเคราะห์ข้อมูลถือเป็นกระบวนการที่น่าสนใจมาก และถึงแม้ในกรณีที่ไม่ได้นำไปสู่ผลลัพธ์ใดๆ ก็ตาม ก็สามารถเรียนรู้สิ่งที่น่าสนใจมากมายระหว่างการวิจัยได้ การวิเคราะห์ทางสถิติพบว่ามีการใช้งานในกิจกรรมของมนุษย์ในด้านต่างๆ มากมาย และคุณสามารถใช้ในโรงเรียน ที่ทำงาน ธุรกิจ และด้านอื่นๆ รวมถึงการพัฒนาเด็กและการศึกษาด้วยตนเอง

พื้นฐานของการวิเคราะห์ข้อมูลทางสถิติ

สถิติ"ชีวสถิติ".

1. ชื่อ;
2. ลำดับ;
3. ช่วงเวลา;

ตัวอย่าง

ตัวแทน

เฟรมที่เลือก การสุ่มตัวอย่างอย่างง่าย การสุ่มตัวอย่างตามช่วงเวลา

ตัวอย่างแบบแบ่งชั้น

กลุ่มและ การสุ่มตัวอย่างโควต้า

สมมติฐานว่าง

สมมติฐานทางเลือก พลัง

ความน่าจะเป็นของความมั่นใจ"


หัวข้อ: พื้นฐานของการวิเคราะห์ข้อมูลทางสถิติ
คำอธิบายโดยละเอียด:

หลังจากเสร็จสิ้นการวิจัยทางวิทยาศาสตร์ ทั้งขั้นพื้นฐานหรือเชิงทดลองแล้ว จะมีการดำเนินการวิเคราะห์ทางสถิติของข้อมูลที่ได้รับ เพื่อให้การวิเคราะห์ทางสถิติสามารถดำเนินการได้สำเร็จและเพื่อแก้ไขปัญหาที่ได้รับมอบหมาย ต้องมีการวางแผนการศึกษาอย่างเหมาะสม ด้วยเหตุนี้ หากไม่เข้าใจพื้นฐานของสถิติ จึงเป็นไปไม่ได้ที่จะวางแผนและประมวลผลผลลัพธ์ของการทดลองทางวิทยาศาสตร์ อย่างไรก็ตาม การศึกษาด้านการแพทย์ไม่เพียงแต่ให้ความรู้ด้านสถิติเท่านั้น แต่ยังให้ความรู้พื้นฐานของคณิตศาสตร์ขั้นสูงอีกด้วย ดังนั้น บ่อยครั้งที่มีคนเห็นความเห็นว่ามีเพียงนักสถิติเท่านั้นที่ควรจัดการกับปัญหาการประมวลผลทางสถิติในการวิจัยทางชีวการแพทย์ และนักวิจัยแพทย์ควรมุ่งเน้นไปที่ประเด็นทางการแพทย์ของงานทางวิทยาศาสตร์ของเขา การแบ่งงานด้านแรงงานที่เกี่ยวข้องกับความช่วยเหลือในการวิเคราะห์ข้อมูลนี้เป็นสิ่งที่สมเหตุสมผลอย่างยิ่ง อย่างไรก็ตามจำเป็นต้องมีความเข้าใจในหลักการของสถิติอย่างน้อยที่สุดเพื่อหลีกเลี่ยงการกำหนดปัญหาที่ไม่ถูกต้องต่อหน้าผู้เชี่ยวชาญการสื่อสารกับใครก่อนเริ่มการศึกษามีความสำคัญพอ ๆ กับในขั้นตอนการประมวลผลข้อมูล

ก่อนจะพูดถึงพื้นฐานการวิเคราะห์ทางสถิติจำเป็นต้องชี้แจงความหมายของคำว่า “ สถิติ". มีคำจำกัดความมากมาย แต่คำจำกัดความที่สมบูรณ์และกระชับที่สุดในความเห็นของเราคือคำจำกัดความของสถิติว่าเป็น "ศาสตร์แห่งการรวบรวม การนำเสนอ และการวิเคราะห์ข้อมูล" ในทางกลับกัน การใช้สถิติมาประยุกต์ใช้กับโลกที่มีชีวิตเรียกว่า “ไบโอเมตริกซ์” หรือ “ ชีวสถิติ".

ควรสังเกตว่าบ่อยครั้งที่สถิติลดลงเฉพาะกับการประมวลผลข้อมูลการทดลองเท่านั้นโดยไม่สนใจขั้นตอนของการได้มา อย่างไรก็ตาม ความรู้ทางสถิติเป็นสิ่งจำเป็นอยู่แล้วในระหว่างการวางแผนการทดลอง เพื่อให้ตัวบ่งชี้ที่ได้รับในระหว่างนั้นสามารถให้ข้อมูลที่เชื่อถือได้แก่ผู้วิจัย ดังนั้นเราจึงสามารถพูดได้ว่าการวิเคราะห์ทางสถิติของผลการทดลองเริ่มต้นก่อนที่จะเริ่มการศึกษาด้วยซ้ำ

อยู่ในขั้นตอนของการพัฒนาแผน ผู้วิจัยจะต้องเข้าใจอย่างชัดเจนว่าตัวแปรประเภทใดที่จะอยู่ในงานของเขา ตัวแปรทั้งหมดสามารถแบ่งออกเป็นสองประเภท: เชิงคุณภาพและเชิงปริมาณ ช่วงที่ตัวแปรสามารถใช้ได้ขึ้นอยู่กับขนาดของการวัด สามารถแยกแยะได้สี่ระดับหลัก:

1. ชื่อ;
2. ลำดับ;
3. ช่วงเวลา;
4. เหตุผล (ระดับความสัมพันธ์)

ระดับที่ระบุ (ขนาดของ "ชื่อ") มีเพียงการกำหนดทั่วไปสำหรับการอธิบายประเภทของวัตถุบางประเภท เช่น "เพศ" หรือ "อาชีพของผู้ป่วย" สเกลที่ระบุบอกเป็นนัยว่าตัวแปรจะใช้กับค่าที่ไม่สามารถกำหนดความสัมพันธ์เชิงปริมาณได้ ดังนั้นจึงเป็นไปไม่ได้ที่จะสร้างความสัมพันธ์ทางคณิตศาสตร์ระหว่างชายและหญิง การกำหนดตัวเลขทั่วไป (ผู้หญิง - 0, ผู้ชาย - 1 หรือในทางกลับกัน) ถูกกำหนดไว้โดยพลการและมีไว้สำหรับการประมวลผลด้วยคอมพิวเตอร์เท่านั้น สเกลที่ระบุนั้นมีคุณภาพในรูปแบบที่บริสุทธิ์ แต่ละหมวดหมู่ในระดับนี้จะแสดงตามความถี่ (จำนวนหรือสัดส่วนของการสังเกต เปอร์เซ็นต์)

มาตราส่วนลำดับ (ลำดับ) ระบุว่าแต่ละหมวดหมู่สามารถจัดเรียงจากน้อยไปหามากหรือจากมากไปหาน้อยได้ ในสถิติทางการแพทย์ ตัวอย่างคลาสสิกของระดับลำดับคือการไล่ระดับความรุนแรงของโรค ในกรณีนี้ เราสามารถจัดความรุนแรงตามลำดับจากน้อยไปหามากได้ แต่เรายังไม่มีโอกาสที่จะระบุความสัมพันธ์เชิงปริมาณ กล่าวคือ ไม่ทราบระยะห่างระหว่างค่าที่วัดในระดับลำดับหรือไม่สำคัญ ง่ายต่อการสร้างลำดับของค่าของตัวแปร "ความรุนแรง" แต่ไม่สามารถระบุได้ว่าสภาวะที่รุนแรงแตกต่างจากสภาวะปานกลางกี่ครั้ง

ระดับลำดับหมายถึงข้อมูลประเภทกึ่งปริมาณ และการไล่ระดับสามารถอธิบายได้ทั้งตามความถี่ (เช่นเดียวกับในระดับคุณภาพ) และโดยการวัดค่าส่วนกลาง ซึ่งเราจะกล่าวถึงด้านล่าง

สเกลช่วงเวลาและเหตุผลเป็นข้อมูลประเภทเชิงปริมาณล้วนๆ ในระดับช่วงเวลา เราสามารถระบุได้ว่าค่าหนึ่งของตัวแปรแตกต่างจากค่าอื่นมากเพียงใด ดังนั้น อุณหภูมิร่างกายที่เพิ่มขึ้น 1 องศาเซลเซียส ย่อมหมายถึงการเพิ่มขึ้นของความร้อนที่เกิดจากจำนวนหน่วยคงที่เสมอ อย่างไรก็ตาม สเกลช่วงเวลามีทั้งค่าบวกและค่าลบ (ไม่มีศูนย์สัมบูรณ์) ในเรื่องนี้ เป็นไปไม่ได้ที่จะบอกว่าอุณหภูมิ 20 องศาเซลเซียสอบอุ่นเป็นสองเท่าของอุณหภูมิ 10 องศา เราบอกได้เพียงว่าอุณหภูมิ 20 องศาอุ่นกว่า 10 เท่ากับ 30 องศาอุ่นกว่า 20 องศา

ระดับเหตุผล (ระดับความสัมพันธ์) มีจุดอ้างอิงจุดเดียวและค่าบวกเท่านั้น ในทางการแพทย์ ระดับเหตุผลส่วนใหญ่เป็นความเข้มข้น ตัวอย่างเช่น ระดับกลูโคส 10 มิลลิโมล/ลิตร จะเป็น 2 เท่าของความเข้มข้นเมื่อเทียบกับ 5 มิลลิโมล/ลิตร สำหรับอุณหภูมิ สเกลตรรกยะคือสเกลเคลวิน ซึ่งมีศูนย์สัมบูรณ์ (ไม่มีความร้อน)

ควรเสริมด้วยว่าตัวแปรเชิงปริมาณใดๆ ก็ตามสามารถมีความต่อเนื่องได้ เช่น ในกรณีของการวัดอุณหภูมิร่างกาย (นี่คือมาตราส่วนช่วงต่อเนื่อง) หรือแยกกัน ถ้าเรานับจำนวนเซลล์เม็ดเลือดหรือลูกหลานของสัตว์ทดลอง (นี่คือ ระดับเหตุผลแบบไม่ต่อเนื่อง)

ความแตกต่างเหล่านี้มีความสำคัญต่อการเลือกวิธีวิเคราะห์ผลการทดลองทางสถิติ ดังนั้น สำหรับข้อมูลที่ระบุ เราใช้การทดสอบไคสแควร์ และการทดสอบของนักเรียนที่รู้จักกันดีกำหนดให้ตัวแปร (ช่วงหรือจำนวนตรรกยะ) มีความต่อเนื่อง

หลังจากตัดสินใจคำถามเกี่ยวกับประเภทของตัวแปรแล้ว คุณควรเริ่มสร้าง ตัวอย่าง. ตัวอย่างคือกลุ่มเล็ก ๆ ของวัตถุบางประเภท (ในทางการแพทย์ - ประชากร) เพื่อให้ได้ข้อมูลที่แม่นยำอย่างยิ่ง จำเป็นต้องศึกษาวัตถุทั้งหมดของชั้นเรียนที่กำหนด อย่างไรก็ตาม ด้วยเหตุผลเชิงปฏิบัติ (มักเป็นทางการเงิน) มีการศึกษาเพียงส่วนหนึ่งของประชากรเท่านั้นซึ่งเรียกว่าตัวอย่าง ต่อจากนั้นการวิเคราะห์ทางสถิติช่วยให้ผู้วิจัยสามารถขยายรูปแบบที่ได้รับไปยังประชากรทั้งหมดได้อย่างแม่นยำในระดับหนึ่ง ที่จริงแล้ว สถิติทางชีวการแพทย์ทั้งหมดมีเป้าหมายเพื่อให้ได้ผลลัพธ์ที่แม่นยำที่สุดจากการสังเกตด้วยจำนวนน้อยที่สุด เนื่องจากการพิจารณาทางจริยธรรมก็มีความสำคัญเช่นกันเมื่อทำการวิจัยในมนุษย์ เราไม่สามารถทำให้ผู้ป่วยตกอยู่ในความเสี่ยงเกินความจำเป็นได้

การสร้างตัวอย่างได้รับการควบคุมโดยข้อกำหนดบังคับจำนวนหนึ่ง การละเมิดซึ่งอาจนำไปสู่ข้อสรุปที่ผิดพลาดจากผลการวิจัย ประการแรก ขนาดตัวอย่างมีความสำคัญ ความแม่นยำของการประมาณค่าพารามิเตอร์ที่ศึกษาขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง ที่นี่คุณควรใส่ใจกับคำว่า "ความแม่นยำ" ยิ่งกลุ่มที่ศึกษามีขนาดใหญ่เท่าใด ผลลัพธ์ที่นักวิทยาศาสตร์ได้รับก็จะมีความแม่นยำมากขึ้น (แต่ไม่จำเป็นต้องถูกต้องเสมอไป) เพื่อให้ผลการศึกษาตัวอย่างสามารถถ่ายโอนไปยังประชากรทั้งหมดโดยรวมได้ ตัวอย่างจะต้องเป็น ตัวแทน. ความเป็นตัวแทนของกลุ่มตัวอย่างถือว่าสะท้อนถึงคุณสมบัติที่สำคัญทั้งหมดของประชากร กล่าวอีกนัยหนึ่ง ในกลุ่มที่ศึกษา บุคคลที่มีเพศ อายุ อาชีพ สถานะทางสังคม ฯลฯ ต่างกันจะพบว่ามีความถี่เดียวกันกับประชากรทั้งหมด

อย่างไรก็ตาม ก่อนที่คุณจะเริ่มเลือกกลุ่มการศึกษา คุณควรพิจารณาความจำเป็นในการศึกษาประชากรเฉพาะกลุ่ม ตัวอย่างของประชากรอาจเป็นผู้ป่วยทุกรายที่มี nosology หรือคนในวัยทำงาน เป็นต้น ดังนั้น ผลลัพธ์ที่ได้รับสำหรับประชากรคนหนุ่มสาวในวัยทหารจึงไม่น่าจะสามารถคาดการณ์ได้กับสตรีวัยหมดประจำเดือน ชุดคุณลักษณะที่ประชากรที่ทำการศึกษาจะเป็นตัวกำหนด "ความสามารถทั่วไป" ของข้อมูลการศึกษา

ตัวอย่างสามารถเกิดขึ้นได้หลายวิธี วิธีที่ง่ายที่สุดคือการเลือกจำนวนวัตถุที่ต้องการจากประชากรหรือโดยใช้ตัวสร้างตัวเลขสุ่ม เฟรมที่เลือก(กรอบตัวอย่าง) วิธีการนี้เรียกว่า " การสุ่มตัวอย่างอย่างง่าย" หากคุณสุ่มเลือกจุดเริ่มต้นในกรอบการสุ่มตัวอย่าง แล้วหยิบวัตถุทุกวินาที ห้า หรือสิบ (ขึ้นอยู่กับขนาดกลุ่มที่ต้องการในการศึกษา) คุณจะได้รับ การสุ่มตัวอย่างตามช่วงเวลา. การสุ่มตัวอย่างแบบช่วงเวลาไม่ใช่การสุ่ม เนื่องจากความเป็นไปได้ที่ข้อมูลซ้ำเป็นระยะภายในกรอบการสุ่มตัวอย่างจะไม่ถูกแยกออก

สามารถสร้างสิ่งที่เรียกว่า “ ตัวอย่างแบบแบ่งชั้น” ซึ่งถือว่าประชากรประกอบด้วยหลายกลุ่มและโครงสร้างนี้ควรได้รับการทำซ้ำในกลุ่มทดลอง ตัวอย่างเช่น หากอัตราส่วนของผู้ชายต่อผู้หญิงในประชากรคือ 30:70 ดังนั้นในกลุ่มตัวอย่างแบบแบ่งชั้น อัตราส่วนควรจะเท่ากัน ด้วยแนวทางนี้ สิ่งสำคัญคือต้องไม่ทำให้ตัวอย่างสมดุลมากเกินไป กล่าวคือ เพื่อหลีกเลี่ยงความสม่ำเสมอของคุณลักษณะ มิฉะนั้น ผู้วิจัยอาจพลาดโอกาสที่จะพบความแตกต่างหรือความสัมพันธ์ในข้อมูล

นอกจากวิธีการสร้างกลุ่มที่อธิบายไว้แล้วยังมีอีกด้วย กลุ่มและ การสุ่มตัวอย่างโควต้า. อันแรกใช้ในกรณีที่การได้รับข้อมูลที่ครบถ้วนเกี่ยวกับกรอบตัวอย่างเป็นเรื่องยากเนื่องจากขนาดของมัน จากนั้นกลุ่มตัวอย่างจะถูกสร้างขึ้นจากหลายกลุ่มที่รวมอยู่ในประชากร โควต้าที่สองนั้นคล้ายกับการสุ่มตัวอย่างแบบแบ่งชั้น แต่การกระจายของวัตถุไม่สอดคล้องกับการกระจายตัวของประชากร

เมื่อกลับไปที่ขนาดตัวอย่างควรกล่าวว่ามีความสัมพันธ์อย่างใกล้ชิดกับความน่าจะเป็นของข้อผิดพลาดทางสถิติของประเภทที่หนึ่งและสอง ข้อผิดพลาดทางสถิติอาจเกิดจากการที่การศึกษาไม่ได้ศึกษาประชากรทั้งหมด แต่เป็นเพียงส่วนหนึ่งเท่านั้น ข้อผิดพลาดประเภทแรกคือการเบี่ยงเบนที่ผิดพลาด สมมติฐานว่าง. ในทางกลับกัน สมมติฐานว่างคือการสันนิษฐานว่ากลุ่มที่ศึกษาทั้งหมดนำมาจากประชากรทั่วไปกลุ่มเดียวกัน ซึ่งหมายความว่าความแตกต่างหรือความสัมพันธ์ระหว่างกลุ่มเหล่านั้นจะเป็นแบบสุ่ม หากเราทำการเปรียบเทียบกับการทดสอบวินิจฉัย ข้อผิดพลาดประเภทที่ 1 จะเป็นผลลัพธ์ที่เป็นบวกลวง

ข้อผิดพลาดประเภทที่สองเป็นการเบี่ยงเบนที่ไม่ถูกต้อง สมมติฐานทางเลือกความหมายก็คือความแตกต่างหรือความเชื่อมโยงระหว่างกลุ่มไม่ได้เกิดจากการบังเอิญ แต่เกิดจากอิทธิพลของปัจจัยที่กำลังศึกษา และอีกครั้ง การเปรียบเทียบกับการวินิจฉัย: ข้อผิดพลาดประเภท II เป็นผลลบที่ผิดพลาด ที่เกี่ยวข้องกับข้อผิดพลาดนี้คือแนวคิด พลังซึ่งบอกเราว่าวิธีการทางสถิติบางอย่างมีประสิทธิผลเพียงใดภายใต้เงื่อนไขและความไวที่กำหนด กำลังคำนวณโดยใช้สูตร: 1-β โดยที่ β คือความน่าจะเป็นของข้อผิดพลาดประเภท II ตัวบ่งชี้นี้ขึ้นอยู่กับขนาดตัวอย่างเป็นหลัก ยิ่งขนาดกลุ่มมีขนาดใหญ่เท่าใด ความน่าจะเป็นของข้อผิดพลาดประเภท II ก็จะยิ่งน้อยลง และพลังของการทดสอบทางสถิติก็จะยิ่งสูงขึ้นเท่านั้น การพึ่งพาอาศัยกันนี้เป็นกำลังสองเป็นอย่างน้อย กล่าวคือ การลดขนาดตัวอย่างลงครึ่งหนึ่งจะทำให้กำลังลดลงอย่างน้อยสี่เท่า กำลังขั้นต่ำที่ยอมรับได้ถือเป็น 80% และระดับข้อผิดพลาดประเภท I ที่ยอมรับได้สูงสุดคือ 5% อย่างไรก็ตาม ควรจำไว้เสมอว่าขอบเขตเหล่านี้ถูกกำหนดโดยพลการและอาจเปลี่ยนแปลงได้ขึ้นอยู่กับลักษณะและเป้าหมายของการศึกษา ตามกฎแล้ว ชุมชนวิทยาศาสตร์ยอมรับการเปลี่ยนแปลงอำนาจโดยพลการ แต่ในกรณีส่วนใหญ่ ระดับข้อผิดพลาดประเภทที่ 1 จะต้องไม่เกิน 5%

ที่กล่าวมาทั้งหมดเกี่ยวข้องโดยตรงกับขั้นตอนการวางแผนการศึกษา อย่างไรก็ตาม นักวิจัยหลายคนเข้าใจผิดว่าการประมวลผลข้อมูลทางสถิติเป็นเพียงการจัดการบางอย่างที่ดำเนินการหลังจากเสร็จสิ้นส่วนหลักของงานแล้ว บ่อยครั้งหลังจากเสร็จสิ้นการทดลองโดยไม่ได้วางแผนไว้ ความปรารถนาอันไม่อาจต้านทานดูเหมือนจะสั่งการวิเคราะห์ข้อมูลทางสถิติจากด้านข้าง แต่จาก "กองขยะ" แม้แต่นักสถิติก็ยังพบว่าเป็นการยากที่จะดึงผลลัพธ์ที่ผู้วิจัยคาดหวังออกมา ดังนั้นหากคุณมีความรู้ด้านชีวสถิติไม่เพียงพอควรขอความช่วยเหลือในการวิเคราะห์ทางสถิติก่อนเริ่มการทดลอง

เมื่อพิจารณาถึงขั้นตอนการวิเคราะห์ เราควรชี้ให้เห็นเทคนิคทางสถิติหลักสองประเภท: เชิงพรรณนาและเชิงสาธิต (เชิงวิเคราะห์) เทคนิคเชิงพรรณนาประกอบด้วยวิธีการที่ช่วยให้คุณนำเสนอข้อมูลในรูปแบบที่กะทัดรัดและเข้าใจง่าย ซึ่งรวมถึงตาราง กราฟ ความถี่ (สัมบูรณ์และสัมพัทธ์) การวัดแนวโน้มจากศูนย์กลาง (ค่าเฉลี่ย ค่ามัธยฐาน โหมด) และการวัดการกระจายตัวของข้อมูล (ความแปรปรวน ค่าเบี่ยงเบนมาตรฐาน ช่วงระหว่างควอไทล์ ฯลฯ) กล่าวอีกนัยหนึ่ง วิธีการอธิบายจะแสดงลักษณะของตัวอย่างที่กำลังศึกษา

วิธีที่ได้รับความนิยมมากที่สุด (แต่มักจะผิดพลาด) ในการอธิบายข้อมูลเชิงปริมาณที่มีอยู่คือการกำหนดตัวบ่งชี้ต่อไปนี้:

  • จำนวนการสังเกตในกลุ่มตัวอย่างหรือขนาดของมัน
  • ค่าเฉลี่ย (ค่าเฉลี่ยเลขคณิต);
  • ค่าเบี่ยงเบนมาตรฐานคือการวัดว่าค่าของตัวแปรแปรผันไปมากเพียงใด

สิ่งสำคัญคือต้องจำไว้ว่าค่าเฉลี่ยเลขคณิตและส่วนเบี่ยงเบนมาตรฐานเป็นการวัดแนวโน้มจากศูนย์กลางและการกระจายตัวในกลุ่มตัวอย่างจำนวนค่อนข้างน้อย ในตัวอย่างนี้ค่าของวัตถุส่วนใหญ่เบี่ยงเบนไปจากค่าเฉลี่ยโดยมีความน่าจะเป็นเท่ากันและการแจกแจงของพวกมันจะสร้าง "ระฆัง" แบบสมมาตร (เส้นโค้งแบบเกาส์เซียนหรือเกาส์ - ลาปลาซ) การกระจายนี้เรียกอีกอย่างว่า "ปกติ" แต่ในทางปฏิบัติของการทดลองทางการแพทย์นั้นเกิดขึ้นเพียง 30% ของกรณีเท่านั้น หากมีการกระจายค่าของตัวแปรแบบไม่สมมาตรสัมพันธ์กับศูนย์กลางจะเป็นการดีกว่าที่จะอธิบายกลุ่มโดยใช้ค่ามัธยฐานและควอนไทล์ (เปอร์เซ็นไทล์, ควอไทล์, เดซิล)

เมื่ออธิบายกลุ่มต่างๆ เสร็จสิ้นแล้ว จำเป็นต้องตอบคำถามเกี่ยวกับความสัมพันธ์ของพวกเขาและความเป็นไปได้ในการสรุปผลการศึกษากับประชากรทั้งหมด เพื่อจุดประสงค์นี้ จึงใช้วิธีการทางชีวสถิติตามหลักฐานเชิงประจักษ์ สิ่งเหล่านี้คือสิ่งที่นักวิจัยจดจำเป็นอันดับแรกเมื่อพูดถึงการประมวลผลข้อมูลทางสถิติ ขั้นตอนการทำงานนี้มักเรียกว่า "การทดสอบสมมติฐานทางสถิติ"

งานทดสอบสมมติฐานสามารถแบ่งออกเป็นสองกลุ่มใหญ่ กลุ่มแรกตอบคำถามว่ามีความแตกต่างระหว่างกลุ่มในระดับของตัวบ่งชี้บางตัวหรือไม่ เช่น ความแตกต่างในระดับของทรานซามิเนสในตับในผู้ป่วยโรคตับอักเสบและคนที่มีสุขภาพแข็งแรง กลุ่มที่สองช่วยให้คุณสามารถพิสูจน์ความสัมพันธ์ระหว่างตัวบ่งชี้ตั้งแต่สองตัวขึ้นไป เช่น การทำงานของตับและระบบภูมิคุ้มกัน

ในทางปฏิบัติ งานจากกลุ่มแรกสามารถแบ่งออกเป็นสองประเภทย่อย:

  • การเปรียบเทียบตัวบ่งชี้ในสองกลุ่มเท่านั้น (มีสุขภาพดีและป่วยชายและหญิง)
  • การเปรียบเทียบสามกลุ่มขึ้นไป (ศึกษาขนาดยาที่แตกต่างกัน)

ต้องคำนึงว่าวิธีการทางสถิติแตกต่างกันอย่างมีนัยสำคัญสำหรับข้อมูลเชิงคุณภาพและเชิงปริมาณ

ในสถานการณ์ที่ตัวแปรที่กำลังศึกษาเป็นตัวแปรเชิงคุณภาพและมีการเปรียบเทียบเพียงสองกลุ่มเท่านั้น ก็สามารถใช้การทดสอบไคสแควร์ได้ นี่เป็นเกณฑ์ที่ค่อนข้างทรงพลังและเป็นที่รู้จักอย่างกว้างขวาง อย่างไรก็ตาม จะไม่มีประสิทธิภาพเพียงพอหากจำนวนการสังเกตมีน้อย มีหลายวิธีในการแก้ปัญหานี้ เช่น การแก้ไขความต่อเนื่องของเยตส์ และวิธีการที่แน่นอนของฟิชเชอร์

หากตัวแปรที่กำลังศึกษาเป็นเชิงปริมาณ ก็สามารถใช้การทดสอบทางสถิติประเภทใดประเภทหนึ่งจากสองประเภทได้ เกณฑ์ของประเภทแรกจะขึ้นอยู่กับประเภทการกระจายตัวของประชากรที่เฉพาะเจาะจง และดำเนินการกับพารามิเตอร์ของประชากรกลุ่มนี้ การทดสอบดังกล่าวเรียกว่า "พาราเมตริก" และโดยปกติจะขึ้นอยู่กับสมมติฐานของการแจกแจงค่าแบบปกติ การทดสอบแบบไม่อิงพารามิเตอร์ไม่ได้ขึ้นอยู่กับสมมติฐานเกี่ยวกับประเภทการกระจายตัวของประชากร และไม่ได้ใช้พารามิเตอร์ บางครั้งเกณฑ์ดังกล่าวเรียกว่า "การทดสอบแบบไม่มีการกระจาย" สิ่งนี้มีข้อผิดพลาดในระดับหนึ่ง เนื่องจากเกณฑ์ที่ไม่ใช่พารามิเตอร์ใดๆ ถือว่าการแจกแจงในกลุ่มที่เปรียบเทียบทั้งหมดจะเหมือนกัน มิฉะนั้นอาจได้ผลลัพธ์ที่เป็นบวกลวง

มีการทดสอบพาราเมตริกสองแบบที่ใช้กับข้อมูลที่ดึงมาจากประชากรที่แจกแจงตามปกติ ได้แก่ การทดสอบ t-test ของนักเรียนเพื่อเปรียบเทียบสองกลุ่ม และการทดสอบ F ของ Fisher เพื่อทดสอบความเท่าเทียมกันของความแปรปรวน (หรือที่เรียกว่า การวิเคราะห์ความแปรปรวน) มีเกณฑ์ที่ไม่ใช่พารามิเตอร์มากกว่านั้นมาก การทดสอบที่แตกต่างกันจะแตกต่างกันไปตามสมมติฐานที่ใช้เป็นหลัก ในความซับซ้อนของการคำนวณ ในกำลังทางสถิติ ฯลฯ อย่างไรก็ตาม การทดสอบที่ยอมรับได้มากที่สุดในกรณีส่วนใหญ่คือการทดสอบวิลคอกซัน (สำหรับกลุ่มที่เกี่ยวข้อง) และการทดสอบแมนน์-วิทนีย์ หรือที่เรียกว่าการทดสอบ Wilcoxon สำหรับตัวอย่างอิสระ การทดสอบเหล่านี้สะดวกเนื่องจากไม่จำเป็นต้องมีสมมติฐานเกี่ยวกับลักษณะของการกระจายข้อมูล แต่หากปรากฏว่าตัวอย่างนั้นนำมาจากประชากรที่แจกแจงตามปกติ พลังทางสถิติของพวกมันก็จะไม่แตกต่างอย่างมีนัยสำคัญจากการทดสอบของนักเรียน

คำอธิบายที่สมบูรณ์ของวิธีการทางสถิติสามารถพบได้ในเอกสารเฉพาะทาง อย่างไรก็ตาม ประเด็นสำคัญคือการทดสอบทางสถิติแต่ละครั้งจำเป็นต้องมีชุดของกฎ (สมมติฐาน) และเงื่อนไขในการใช้งาน และการค้นหาเชิงกลของวิธีการต่างๆ มากมายเพื่อค้นหา "ความถูกต้อง" ” ผลลัพธ์เป็นสิ่งที่ยอมรับไม่ได้อย่างแน่นอนจากมุมมองทางวิทยาศาสตร์ ในแง่นี้ การทดสอบทางสถิติมีความคล้ายคลึงกับยา โดยแต่ละวิธีมีข้อบ่งชี้และข้อห้าม ผลข้างเคียง และความเป็นไปได้ที่จะไม่ได้ผล และอันตรายพอๆ กันคือการใช้การทดสอบทางสถิติที่ไม่สามารถควบคุมได้ เนื่องจากสมมติฐานและข้อสรุปขึ้นอยู่กับสิ่งเหล่านั้น

เพื่อให้เข้าใจประเด็นความแม่นยำของการวิเคราะห์ทางสถิติได้ครบถ้วนยิ่งขึ้น จึงจำเป็นต้องกำหนดและวิเคราะห์แนวคิด” ความน่าจะเป็นของความมั่นใจ"ความน่าจะเป็นของความเชื่อมั่นคือค่าที่ใช้เป็นขอบเขตระหว่างเหตุการณ์ที่น่าจะเป็นและเหตุการณ์ที่ไม่น่าเป็นไปได้ ตามเนื้อผ้าจะแสดงด้วยตัวอักษร "p" สำหรับนักวิจัยหลายคน จุดประสงค์เดียวของการวิเคราะห์ทางสถิติคือการคำนวณค่า p ที่เป็นที่ต้องการ ซึ่งดูเหมือนว่าจะใส่ลูกน้ำในวลีที่มีชื่อเสียงว่า "execute never be pardoned" ระดับความเชื่อมั่นสูงสุดที่ยอมรับได้คือ 0.05 ควรจำไว้ว่าความน่าจะเป็นของความเชื่อมั่นไม่ใช่ความน่าจะเป็นของเหตุการณ์บางอย่าง แต่เป็นเรื่องของความไว้วางใจ ด้วยการตั้งค่าความน่าจะเป็นของความเชื่อมั่นก่อนเริ่มการวิเคราะห์ ดังนั้นเราจึงกำหนดระดับความเชื่อมั่นในผลการวิจัยของเรา และอย่างที่คุณทราบ ความใจง่ายมากเกินไปและความสงสัยที่มากเกินไปส่งผลเสียต่อผลงานใดๆ เท่าๆ กัน

ระดับความเชื่อมั่นแสดงให้เห็นว่าความน่าจะเป็นสูงสุดของข้อผิดพลาดประเภท 1 เกิดขึ้นซึ่งผู้วิจัยถือว่ายอมรับได้ กล่าวอีกนัยหนึ่งคือการลดระดับความเชื่อมั่น การกระชับเงื่อนไขในการทดสอบสมมติฐาน จะเพิ่มโอกาสที่จะเกิดข้อผิดพลาดประเภทที่สอง ดังนั้นควรเลือกระดับความน่าจะเป็นของความเชื่อมั่นโดยคำนึงถึงความเสียหายที่อาจเกิดขึ้นจากการเกิดข้อผิดพลาดประเภทที่หนึ่งและที่สอง ตัวอย่างเช่น กรอบการทำงานที่เข้มงวดที่ใช้ในสถิติชีวการแพทย์ ซึ่งกำหนดสัดส่วนของผลลัพธ์ผลบวกลวงไม่เกิน 5% นั้นมีความจำเป็นอย่างยิ่ง เนื่องจากจากผลการวิจัยทางการแพทย์ มีการแนะนำหรือปฏิเสธการรักษาใหม่ และนี่คือ เป็นเรื่องของชีวิตคนหลายพันคน

โปรดทราบว่าค่า p นั้นไม่ได้ให้ข้อมูลมากนักสำหรับแพทย์ เนื่องจากเป็นเพียงตัวบ่งชี้ความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างอย่างผิดพลาดเท่านั้น ตัวบ่งชี้นี้ไม่ได้พูดอะไรเกี่ยวกับขนาดของผลการรักษาเมื่อใช้ยาภายใต้การศึกษาในประชากรทั่วไป จึงมีความเห็นว่า แทนที่จะใช้ระดับความน่าจะเป็นของความเชื่อมั่น ควรประเมินผลการศึกษาตามขนาดของช่วงความเชื่อมั่นจะดีกว่า ช่วงความเชื่อมั่นคือช่วงของค่าที่ค่าประชากรที่แท้จริง (สำหรับค่าเฉลี่ย ค่ามัธยฐาน หรือความถี่) อยู่ภายใน ด้วยความน่าจะเป็นที่แน่นอน ในทางปฏิบัติ จะสะดวกกว่าที่จะมีทั้งสองค่านี้ ซึ่งช่วยให้คุณสามารถตัดสินด้วยความมั่นใจมากขึ้นถึงการประยุกต์ใช้ผลลัพธ์ที่ได้รับกับประชากรโดยรวม

โดยสรุป ควรพูดอะไรสักสองสามคำเกี่ยวกับเครื่องมือที่นักสถิติหรือนักวิจัยใช้ซึ่งทำการวิเคราะห์ข้อมูลอย่างอิสระ การคำนวณด้วยตนเองหายไปนานแล้ว โปรแกรมคอมพิวเตอร์ทางสถิติในปัจจุบันทำให้สามารถวิเคราะห์ทางสถิติได้โดยไม่ต้องฝึกฝนทางคณิตศาสตร์อย่างจริงจัง ระบบที่มีประสิทธิภาพเช่น SPSS, SAS, R ฯลฯ ช่วยให้นักวิจัยใช้วิธีการทางสถิติที่ซับซ้อนและมีประสิทธิภาพ อย่างไรก็ตาม นี่ไม่ใช่เรื่องดีเสมอไป ผู้วิจัยสามารถทำการคำนวณและได้ตัวเลขผลลัพธ์บางส่วนโดยไม่ทราบระดับของการบังคับใช้ของการทดสอบทางสถิติ แต่ผลลัพธ์ที่ได้จะเป็นที่น่าสงสัยมาก ดังนั้นข้อกำหนดเบื้องต้นสำหรับการดำเนินการประมวลผลทางสถิติของผลการทดลองจะต้องเป็นความรู้ที่ดีเกี่ยวกับพื้นฐานทางคณิตศาสตร์ของสถิติ




บอกเพื่อน