Thống kê miêu tả (Descriptive Statistics) là các cách thức sử dụng nhằm tóm tắt hoặc bộc lộ một tập hợp dữ liệu, một mẫu phân tích dưới dạng số tuyệt biểu thiết bị trực quan. Các công cầm cố số dùng để mô tả hay sử dụng nhất là trung bình cộng và độ lệch chuẩn. Các công cầm trực quan hay được dùng nhất là những biểu đồ.

Bạn đang xem: Phương pháp thống kê mô tả

*

Trong loạt bài bác “Thống kê thể hiện trong nghiên cứu”, 4 đội đại lượng của thống kê biểu thị sẽ thứu tự được ra mắt một cách bao quát và đưa ra rất nhiều trường phù hợp sử dụng, bao gồm:

Các đại lượng về trung tâmCác đại lượng về độ phân tánCác đại lượng về dáng vẻ phân phốiCác đại lượng về sự việc tương quan

Trong Phần 1 – những đại lượng về trung tâm, 3 thước đo được áp dụng rộng rãi nhằm mục đích biểu diễn một giá chỉ trị bộc lộ vị trí/xu rứa “trung tâm” của tập dữ liệu được giới thiệu: trung bình (mean – trung trung ương về mặt giá bán trị), trung vị (median – trung trọng điểm về khía cạnh vị trí) với yếu vị (mode – trung vai trung phong về mức độ triệu tập dữ liệu).

Tổng quan về 3 đại lượng biểu thị vị trí/xu cầm cố “trung tâm” của tập dữ liệu

 Trung bình Pythagore (Pythagorean Means)Trung vị (Median)Yếu vị (Mode)
 Trung chổ chính giữa về mặt giá trịTrung tâm về khía cạnh vị tríTrung vai trung phong về nút độ tập trung dữ liệu

ĐỊNH NGHĨA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Đại lượng vừa đủ Pythagore thể hiện trung vai trung phong về mặt quý hiếm của tập dữ liệu, bao gồm:

Trung bình cùng (Arithmetic mean)

Là thước đo phổ cập nhất và dễ dàng nắm bắt nhất về xu thế trung trung tâm trong tập dữ liệu. Vừa phải cộng bao gồm trung bình cộng đơn giản và vừa đủ cộng có trọng số.

Trung bình nhân (Geometric mean)

Còn được call là trung bình hình học, cho thấy thêm xu phía trung trung ương hoặc giá chỉ trị điển hình của một tập vừa lòng số bằng phương pháp sử dụng tích những giá trị của chúng. Quý hiếm trung bình nhân hay được áp dụng cho một tập hợp các số có giá trị được nhân với nhau hoặc có đặc điểm cấp số nhân, ví dụ như một tập hợp những số liệu tăng trưởng như: dân số hoặc lãi suất vay của một khoản chi tiêu tài bao gồm theo thời gian.

Trung bình cân bằng (Harmonic mean)

Thường được thực hiện để tìm cực hiếm trung bình của những quan liền kề được biểu diễn bởi tỉ số của hai giá chỉ trị gồm hai đơn vị chức năng đo không giống nhau chẳng hạn như tốc độ di chuyển trung bình trong một khoảng thời gian.

Trung vị là một số tách giữa nửa to hơn và nửa nhỏ hơn của một mẫu, một quần thể, hay như là một phân bố xác suất. Trung vị là quý hiếm giữa, có nghĩa ½ quan liêu sát sẽ sở hữu các giá chỉ trị nhỏ hơn hay ngay số trung vị, với ½ quan sát sẽ có được giá trị bằng hoặc to hơn số trung vị.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yếu vị là giá chỉ trị lộ diện nhiều lần độc nhất trong tập dữ liệu. Có tập dữ liệu có 1 mode, bao gồm tập tài liệu có đến 2 hoặc 3 mode và cũng rất có thể có tập dữ liệu không có mode nào.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 CÁCH TÍNH

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Trung bình cộng (Arithmetic mean)

- vừa đủ cộng đơn giản được tính theo công thức:

*

Trong đó: n là tổng số quan tiền sát, xi là giá trị của các quan sát.

- vừa phải cộng bao gồm trọng số được xem theo công thức:

*

Trong đó: xi là giá chỉ trị của các quan sát, n là tổng số quan liêu sát, wi là trọng số tương ứng của các quan sát.

Trung bình nhân (Geometric mean)

Số trung bình nhân của n cực hiếm xi gồm quan hệ tích số giao diện x1× x2 × x3 ... × xn được xem theo công thức:

*

Trung bình điều hòa (Harmonic mean)

Công thức phổ biến của vừa phải điều hòa tất cả dạng:

*

Hoặc đơn giản và dễ dàng hơn là nghịch đảo của trung bình cộng của tập dữ liệu:

*

- Tập dữ liệu có số quan tiếp giáp (n) là số lẻ: quan tiền sát ở đoạn thứ <(n+1)/2> là số trung vị.

- Tập tài liệu có số quan gần kề (n) là số chẵn: số trung vị là quý hiếm trung bình cộng của 2 quan tiếp giáp nằm ở đoạn n/2 và <(n+2)/2>)

Ví dụ đơn giản để tìm số trung vị:

Cho tập tài liệu X=2,4,5,6,7,8,8,8,9,9.

- Tập dữ liệu này còn có 10 giá trị. Giá trị trung vị là trung bình cộng của quan cạnh bên nằm tại phần thứ 5(7) với 6(8).

Số trung vị là (7+8)/2 = 7,5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Đếm số lần lộ diện của những giá trị, giá chỉ trị xuất hiện nhiều nhất chính là số mode.

Ví dụ dễ dàng để tra cứu số mode:

Cho tập dữ liệu: X=2,4,5,6,7,8,8,8,9,9.

Tập dữ liệu này có giá trị 8 xuất hiện thêm nhiều duy nhất (3 lần).

Số mode là 8.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MÔ TẢ BẰNG ĐỒ THỊ

*

MỘT SỐ ỨNG DỤNG THƯỜNG GẶP VÀ VÍ DỤ MINH HỌA

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Trung bình cộng (Arithmetic mean)

- vừa phải cộng dễ dàng và đơn giản được thực hiện rất thông dụng để đo lường các tập tài liệu mang tính liên tiếp trong các lĩnh vực: toán học, thống kê, kinh tế tài chính học, nhân chủng học, lịch sử,…

Ví dụ: mang đến tập dữ liệu: X=2,4,5,6,7,8,9. Quý hiếm trung bình cộng đơn giản được tính như sau:

*

- vừa đủ cộng bao gồm trọng số thường được sử dụng để tính toán các chỉ số, tính điểm trung bình học tập tập, dữ liệu phối kết hợp bảng tần số, thống kê giám sát các giá trị hoặc lợi nhuận kỳ vọng của những khoản đầu tư,…

Ví dụ: Một sinh viên tất cả điểm học kỳ I 4 môn học tập A, B, C, D theo lần lượt là 6,8,7,5, số tín chỉ theo lần lượt của 4 môn này là 2,3,3,3. Tính điểm trung bình học kỳ I của sv này?

Điểm trung bình học tập kỳ I của sv này được xem như sau:

*

Trung bình nhân (Geometric mean)

- trung bình nhân hay được thực hiện để tính xác suất tăng trưởng trung bình, còn được gọi là tỷ lệ phát triển kép hàng năm (CAGR).

- trong tài chính, mức độ vừa phải nhân được thực hiện để tính lợi tức hàng năm trong danh mục đầu tư chi tiêu chứng khoán; xây dựng các chỉ số hội chứng khoán.

Ví dụ: Nhà chi tiêu có mối cung cấp vốn ban sơ là 1 tỷ đồng, lãi suất chi tiêu nhận được qua 5 năm thứu tự là: 2%, 5%, 7%, 8%, 10%. Ví như nhà đầu tư tiếp tục tái chi tiêu hàng năm, tính số tiền nhà đầu tư chi tiêu thu trong tương lai 5 năm?

- Vốn ban đầu: Vo=1.000.000.000đ- tiền lãi nhà đầu tư chi tiêu nhận sau 5 năm được gọi là lãi kép, được tính bằng phương pháp sử dụng mức độ vừa phải nhân như sau:

*
 

Số tiền nhà đầu tư chi tiêu nhận được sau 5 năm:

*
 

- dùng để giám sát trong các nghành thống kê làng hội công ty yếu dựa vào khả năng giám sát từ những nguồn dữ liệu khác thang đo cơ mà không cần chuẩn chỉnh hóa <2>.

Ví dụ: Một doanh nghiệp muốn xác định unique học tập của hai nhân viên cấp dưới mới được cử đi tập huấn là A cùng B. Tuy nhiên, A và B được tập huấn ở 2 tổ chức lần lượt là U1 và U2 với 2 thang điểm đánh giá công dụng khác nhau:- tổ chức U1 (thang điểm 5):rating(U1, A) = 4,5; rating(U1, B) = 3,5- tổ chức U2 (thang điểm 100):rating(U2, A) = 70; rating(U2, B) = 80

Vậy unique học triệu tập bình của A tốt B cao hơn?

Thông thường, giả dụ thực hiện chuẩn hóa về cùng 1 solo vị, ta vẫn lấy điểm rating của từng nhân viên cấp dưới A cùng B phân chia cho thang điểm:

*

Tuy nhiên, áp dụng công thức của trung bình nhân trong trường hợp này sẽ không cần chuẩn hóa lại dữ liệu:

 

*

=>A xuất sắc hơn B

Trung bình cân bằng (Harmonic mean)

- Trong trang bị lý, trung bình ổn định được sử dụng để tính gia tốc trung bình, cân nặng riêng, điện trở, phương trình quang quẻ học.

Ví dụ: Một tín đồ đi trường đoản cú nhà mang đến cơ quan lại với gia tốc 30km/h với từ phòng ban về nhà với gia tốc 10km/h, quãng lối đi dài 5km. Gia tốc trung bình trên cả hai đoạn đường dịch chuyển của fan này là bao nhiêu?

- gia tốc trung bình giả dụ tính bằng trung bình cộng tất cả trọng số: Đầu tiên, đề nghị tính thời gian di chuyển 2 lượt đi do vận tốc dịch rời lượt đi và lượt về rất khác nhau:

*
 

- vận tốc trung bình nếu như tính bởi công thức trung bình điều hòa:

 

*

- vào tài chính: trung bình điều hòa tất cả trọng số là cách thức thích đúng theo hơn để tính trung bình các bội số, chẳng hạn như phần trăm giá – thu nhập (price–earnings – P/E)

- Trong nghành khoa học trang bị tính, đặc biệt là truy xuất tin tức và đồ vật học, cực hiếm trung bình cân bằng của Precision cùng Recall (được hotline là F1–Score)<3> được sử dụng để tấn công giá tác dụng các thuật toán và mô hình máy học.

- Trung vị là thước đo trung tâm giỏi hơn so với các tập tài liệu bất đối xứng tốt tập dữ liệu bị tác động bởi quý giá ngoại lệ (Outliers <1>).

Ví dụ: mang sử thu nhập hàng năm của 10 hộ dân trong một khu cư dân lần lượt là 1.000$ (5 hộ), 2.000$ (2 hộ), 3.000$ (1 hộ), 30.000$ (1 hộ) cùng 200.000$ (1 hộ). Tp cần soát soát những khu cư dân có thu nhập thấp (dưới 3.000$) để thực hiện các chính sách hỗ trợ.

- Ta thấy trung bình thu nhập của khu dân cư này giả dụ tính bởi trung bình cộng dễ dàng sẽ là 24.200$. Tuy nhiên, nếu áp dụng giá trị trung bình để khẳng định khu cư dân này ở trong nhóm tích lũy cao thì nó sẽ tương đối không phù hợp vì trong nhóm này có một hộ dân có thu nhập quá chênh lệch so với các hộ còn lại (200.000$) đề xuất đã khiến giá trị trung bình bị đưa lên cao.

Do đó, nên sử dụng giá trị trung vị (1.500$) rứa giá trị vừa đủ để xác định bình quân thu nhập của khu cư dân này. Có thể tạo thành 2 nhóm:

+ Những hộ gia đình dưới mức thu nhập cá nhân 1.500$ nằm trong diện các khoản thu nhập nhấp rất cần được hỗ trợ;

+ Những hộ dân cư trên mức 1.500$ trực thuộc nhóm thu nhập cá nhân khá, nhưng lại những hộ dân có thu nhập dưới 3.000$ trong đội này sẽ liên tục được chú ý để nhận cung cấp của Thành phố.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- yếu đuối vị là đại lượng thống kê trình bày duy nhất có thể vận dụng cho dữ liệu định tính.

Ví dụ: thu thập thông tin về nam nữ của người công nhân trong một xí nghiệp sản xuất sản xuất, trở thành Giới tính là trở thành định danh cùng với mã hóa 1 thay mặt đại diện cho Nam, 2 đại diện thay mặt cho Nữ. Ví như đếm được không ít số 1 hơn số 2, tức quý giá của Mode trong tình huống này là 1, đồng nghĩa với công nhân nam nhiều hơn thế nữa công nhân nữ.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

MỘT SỐ LƯU Ý

- Trung bình cộng thường được sử dụng để biểu diễn xu hướng trung tâm, tuy nhiên giá trị của trung bình cộng dễ bị tác động bởi những giá trị ngoại lệ và những phân phối bất đối xứng.

- Không áp dụng đại lượng vừa đủ cộng đối với dữ liệu định danh.

- vừa phải cộng tiêu giảm sử dụng với dữ liệu định lượng theo thang đo khoảng.

Mặc dù quý hiếm trung vị không chịu tác động của những giá trị ngoại lệ và rất giản đơn tính toán. Mặc dù trung vị quan yếu dùng để tham dự đoán vị không đúng chuẩn bằng trung bình, trung vị thường xuyên được dùng để thay chũm hoặc bổ sung nhằm kiểm soát và điều chỉnh 1 số tinh giảm khi sử dụng giá trị trung bình.

 

 

Yếu vị cũng không bị ảnh hưởng bởi những giá trị ngoại lệ. Mặc dù nhiên, yếu ớt vị chỉ ổn định khi lượng giá trị nhiều và đã khó khẳng định rõ nếu tài liệu chỉ có một số trong những ít giá trị.

Do yếu đuối vị chỉ đếm số lần lộ diện nhiều độc nhất của cực hiếm trong tập tài liệu nên hoàn toàn có thể có một hoặc nhiều yếu vị hoặc không tồn tại yếu vị nào cả.

 

Duy quý phái tổng hợp

Chú thích:<1> dữ liệu ngoại lệ (Outliers) là 1 trong những điểm tài liệu có sự biệt lập đáng đề cập so với những quan liền kề khác. Dữ liệu ngoại lệ có thể xuất hiện bởi sự đổi khác thang đo hoặc vì lỗi tự dữ liệu thu thập (thông thường dữ liệu ngoại lệ dạng này sẽ bị loại bỏ khỏi tập dữ liệu). Một giá trị ngoại lệ rất có thể gây ra vấn đề nghiêm trọng trong quá trình phân tích dữ liệu.<2> từ thời điểm năm 2010, Chỉ số cách tân và phát triển Con tín đồ (HDI) của liên hợp Quốc đã được gửi sang phương thức tính toán bằng vừa phải nhân do các nguồn dữ liệu được thực hiện để tính HDI có thể khác thang đo.

Xem thêm: Giải Bài Tập Đại Số 10: Ôn Tập Chương 6 Đại Số 10 : Ôn Tập Chương 6

<3> F1-Score là quý hiếm trung bình điều hòa của Precision cùng Recall, nhằm kim chỉ nam tối nhiều hóa Precision hoặc Recall nhằm mô hình tốt hơn. Trong đó: Precision có nghĩa là tỉ lệ số điểm Positive mô hình dự đoán đúng trên toàn bô điểm mô hình dự đoán là Positive (true positives per predicted positive). Recall là tỉ lệ số điểm Positive mô hình dự đoán đúng trên tổng thể điểm thiệt sự là Positive hay tổng số điểm được gán nhãn là Positive ban đầu (true positives per real positive).

 

----------------------------------------

Tài liệu tham khảo:Hoàng Trọng, Chu Nguyễn Mộng Ngọc. (2011). Thống kê vận dụng trong kinh tế tài chính - làng hội. Hà Nội: NXB Lao Động - làng hội.Illowsky et al. (2013). Introductory Statistics. Houston: OpenStax.Evans, J. R. (2017). Business Analytics. PearsonWikipedia. (2021). Arithmetic mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Arithmetic_meanWikipedia. (2021). Geometric mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Geometric_meanWikipedia. (2021). Harmonic mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Harmonic_mean

 

----------------------------------------

Thống kê thể hiện trong nghiên cứu và phân tích – những đại lượng về độ phân tán

Thống kê bộc lộ trong phân tích – các đại lượng về dáng vẻ phân phối

Thống kê biểu đạt trong nghiên cứu và phân tích – các đại lượng về việc tương quan

 

---------------------------------------------------------------------------------------------------

QUÝ ANH/CHỊ CẦN HỖ TRỢ XỬ LÝ, PHÂN TÍCH DỮ LIỆU VUI LÒNG GỬI THÔNG TIN QUA form DƯỚI ĐÂYCHÚNG TÔI SẼ LIÊN HỆ VÀ PHÚC ĐÁP trong THỜI GIAN SỚM NHẤT