Tomorrow Marketers – Percentiles là cách thức cho thấy sở hữu từng nào xác suất điểm tài liệu nhỏ rộng lớn một mốc độ quý hiếm ví dụ. Ví dụ: một người dân có chỉ số IQ 120 ở 91% Percentile (P91), tức là chỉ số IQ của những người này cao hơn nữa 91% những người dân không giống.
Bạn đang xem: percentile là gì
Percentile là một trong những khí cụ rất hay nhằm các bạn hiểu rằng địa điểm kha khá của một độ quý hiếm, coi bọn chúng đứng ở đâu vô biểu đồ gia dụng phân phối gia tốc của tệp tài liệu. Trong nội dung bài viết sau, nằm trong Tomorrow Marketers tìm hiểu hiểu về percentile, những tình huống quan trọng đặc biệt của percentile và cơ hội áp dụng chỉ số này vô đo đếm tế bào miêu tả nhé!
Đọc thêm: 04 quá trình phân tách tài liệu – Descriptive, Diagnostic, Predictive & Prescriptive Analytics
1. Percentile tăng thêm ý nghĩa gì?
Percentile hoàn toàn có thể cho thấy địa điểm của một độ quý hiếm đối với những độ quý hiếm không giống thế nào. Dễ hiểu rộng lớn, nếu như độ quý hiếm X ở percentile loại K, thì X to hơn K% độ quý hiếm.
Ví dụ, nếu như điểm đánh giá đứng riêng rẽ lẻ nhưng mà không tồn tại sự đối chiếu với điểm số của những người dân sót lại vô cuộc đua, thì điểm cơ ko đã cho chúng ta thấy loại bậc (ranking) ở đâu đối với những người dân sót lại. Khi các bạn đạt 500 điểm TOEIC, số lượng 500 này không chỉ là đi ra đó là số lượng cao hoặc thấp, ko cho thấy sở hữu từng nào xác suất người bên trên 500 điểm và từng nào xác suất người bên dưới 500 điểm. Đối với kỳ đua SAT, nếu như tổng điểm của công ty là 1340, số lượng này nằm tại vị trí khoảng chừng 90% Percentile (P90), đồng nghĩa tương quan điểm số của công ty cao hơn nữa 90% sỹ tử không giống.
2. Các tình huống quan trọng đặc biệt của Percentile
Một số tình huống quan trọng đặc biệt của Percentile sở hữu những cái thương hiệu riêng:
Quartile là độ quý hiếm phân tách tập dượt tài liệu trở nên tứ phần bởi vì nhau:
- Quartile loại nhất (Q1 hoặc còn được gọi là quartile dưới), là độ quý hiếm của 25th percentile. Một phần tư tài liệu nhỏ rộng lớn độ quý hiếm này, trong lúc phụ vương phần tư tài liệu sót lại to hơn độ quý hiếm này.
- Quartile loại nhì (Q2 hoặc đó là median – độ quý hiếm trung vị). Giá trị này phân tách tập dượt tài liệu trở nên nhì nửa. Một nửa có mức giá trị thấp rộng lớn độ quý hiếm bên trên P50, 1/2 sót lại có mức giá trị cao hơn nữa độ quý hiếm bên trên P50. Quartile loại nhì đó là median – đó là độ quý hiếm nằm tại vị trí tại chính giữa của tập dượt tài liệu sau thời điểm được bố trí theo đuổi trật tự.
- Quartile loại ba (Q3 hoặc còn được gọi là quartile trên), là độ quý hiếm của 75% percentile. Một phần tư tài liệu to hơn độ quý hiếm này, trong lúc phụ vương phần tư tài liệu sót lại nhỏ rộng lớn độ quý hiếm này.
The interquartile range (IQR) là thước đo cường độ phân giã vô đo đếm. Khoảng độ quý hiếm này ứng với khoảng cách thân thiết quartile loại nhất và quartile loại ba (IQR = Q3 – Q1), tương tự với 1/2 độ quý hiếm của tập dượt tài liệu. Một phần tư độ quý hiếm nhỏ rộng lớn IQR và 1 phần tư độ quý hiếm không giống to hơn IQR. Khi đối chiếu 2 dataset nằm trong và một trở thành, tệp này sở hữu IQR to hơn đã cho chúng ta thấy tài liệu phân giã rộng lớn rộng lớn.

Percentile hoàn toàn có thể được phần mềm hoạt bát. Không chỉ giúp đỡ bạn xác xác định trí kha khá của một độ quý hiếm, Percentile còn làm phân tách tập dượt tài liệu trở nên những phần, xác lập Xu thế trung tâm, vạc hiện tại độ quý hiếm nước ngoài lai (outlier) và tính toán sự phân giã của phân phối. Nói vậy là, Percentile là một trong những khí cụ phân tách tài liệu hữu ích vô đo đếm tế bào miêu tả.
Dưới đó là phụ vương phía tiếp cận nhưng mà những căn nhà phân tách dùng nhằm tính Percentile Lúc đánh giá cỗ tài liệu kha khá nhỏ. Ba phía tiếp cận này xác lập phân vị loại k theo đuổi những cơ hội không giống nhau sau:
- Tìm độ quý hiếm nhỏ nhất rộng lớn hơn k xác suất của những độ quý hiếm.
- Tìm độ quý hiếm nhỏ nhất to hơn hoặc bằng k xác suất độ quý hiếm.
- Tìm một độ quý hiếm nội suy thân thiết nhì trật tự sớm nhất (Nội suy là cách thức dự trù độ quý hiếm của những điểm tài liệu không biết vô phạm vi của một tụ hội tách rốc chứa chấp một số trong những điểm tài liệu tiếp tục biết).
Trước Lúc tính Percentile bằng phương pháp dùng phụ vương phía tiếp cận này, bạn phải chính thức bằng phương pháp bố trí tập dượt tài liệu kể từ độ quý hiếm thấp nhất cho tới độ quý hiếm tối đa.
Hãy dùng phụ vương phía tiếp cận này với tập dượt tài liệu sau (n=11) nhằm tìm hiểu P70 (70% Percentile):

Hướng tiếp cận 1: Lớn hơn
Với phía tiếp cận này, tất cả chúng ta cần thiết tìm hiểu độ quý hiếm to hơn 70% độ quý hiếm của 11 điểm tài liệu. Lấy 70% của 11, tớ được loại hạng 7,7. Sau cơ, thực hiện tròn xoe 7,7 lên đến mức 8. Giá trị của P70 cần to hơn độ quý hiếm của 8 điểm tài liệu. Như vậy, độ quý hiếm của P70 bởi vì độ quý hiếm của điểm tài liệu loại 9 theo đuổi trật tự của tập dượt tài liệu, tương tự 40.
Hướng tiếp cận 2: Lớn rộng lớn hoặc bằng
Với phía tiếp cận này, tất cả chúng ta cần thiết tìm hiểu độ quý hiếm to hơn hoặc bởi vì 70% độ quý hiếm của 11 điểm tài liệu. Tương tự động, lấy 70% của 11, là 7,7. Sau cơ, thực hiện tròn xoe 7,7 lên đến mức 8. Giá trị của P70 cần to hơn hoặc bởi vì độ quý hiếm của 8 điểm tài liệu. Như vậy, độ quý hiếm của P70 hoàn toàn có thể bởi vì độ quý hiếm của điểm tài liệu loại 8 theo đuổi trật tự của tập dượt tài liệu, tương tự 35. cũng có thể thấy nhì phía tiếp cận với nhì phía tiếp cận không giống nhau tiếp tục đã tạo ra nhì thành phẩm không giống nhau.
Hướng tiếp cận 3: Giá trị nội suy thân thiết nhì trật tự sát nhất
Như các bạn tiếp tục thấy kể từ ví dụ bên trên, việc dùng “lớn hơn” hoặc “lớn rộng lớn hoặc bằng” tiếp tục đã tạo ra những thành phẩm không giống nhau đáng chú ý, quan trọng đặc biệt khi chúng ta đang được thao tác với cùng 1 tập dượt tài liệu nhỏ. Tùy nằm trong vô thực chất và độ cao thấp của tập dượt tài liệu, sự khác lạ này tiếp tục thay cho thay đổi đáng chú ý chân thành và ý nghĩa của tài liệu. Hướng tiếp cận loại phụ vương – độ quý hiếm nội suy thân thiết nhì độ quý hiếm tài liệu sớm nhất – tiếp tục xử lý yếu tố này.
Xem thêm: Những kinh nghiệm bán buôn giày thể thao tại Hà Nội cho dân buôn mới
Bạn cần thiết tuân theo quá trình sau:
- Tính loại hạng nhằm dùng cho tới percentile. Sử dụng: xếp thứ hạng = p(n+1), vô cơ p = xác suất và n = cỡ kiểu mẫu. Với ví dụ bên trên, nhằm tìm hiểu loại hạng cho tới P70, lấy 0,7*(11 + 1) = 8,4.
- Nếu loại hạng tính được vô bước một là một số trong những nguyên vẹn, hãy tìm hiểu độ quý hiếm tài liệu ứng với loại hạng cơ và coi đó là độ quý hiếm của percentile.
- Nếu loại hạng tính được vô bước 1 ko cần là số nguyên vẹn, bạn phải nội suy thân thiết nhì để ý sớm nhất. Với ví dụ bên trên, 8,4 ở trong tầm kể từ 8 cho tới 9, ứng với những độ quý hiếm tài liệu là 35 và 40.
- Lấy sự khác lạ thân thiết nhì độ quý hiếm tài liệu này và nhân nó với phần thập phân của loại hạng tiếp tục tính vô bước phía bên trên. Với ví dụ bên trên, (40 – 35)*0,4 = 2 (0,4 là phần thập phân của 8,4).
- Lấy độ quý hiếm được xếp thứ hạng thấp rộng lớn vô bước 3 và thêm thắt độ quý hiếm kể từ bước 4 nhằm thu giá tốt trị nội suy cho tới percentile. Với ví dụ bên trên, độ quý hiếm này đó là 35 + 2 = 37.
Kết trái khoáy, sở hữu phụ vương độ quý hiếm không giống nhau cho tới P70: 35, 37 và 40.
Hướng tiếp cận 4: Percentile Rank
Có cách thứ hai nhằm đo lường và tính toán percentile – này đó là percentile rank.
“In statistics, the percentile rank (PR) of a given score is the percentage of scores in its frequency distribution that are less than thở that score” – Trong đo đếm, loại hạng xác suất (PR) của một điểm chắc chắn là tỷ trọng xác suất của những điểm vô phân bổ gia tốc nhỏ rộng lớn điểm cơ.
Các căn nhà phân tách hay sử dụng sử dụng phương pháp này nhằm phân loại điểm số của những cuộc đua đã và đang được chi tiêu chuẩn chỉnh hóa, vì như thế đặc trưng của tệp tài liệu này là bọn chúng sở hữu thật nhiều data point tái diễn. Ví dụ, sở hữu sản phẩm triệu con người nhập cuộc kỳ đua SAT và sở hữu không ít người nằm trong đạt điểm số tương đương nhau trong tầm kể từ 200 cho tới 800.
Công thức tính Percentile rank:

Trong cơ PR: Percentile Rank, CF: Cumulative Frequency, F: Frequency.
Ví dụ, đánh giá tệp tài liệu sau sở hữu những điểm tài liệu ở cột Score và gia tốc xuất hiện tại của bọn chúng ở cột Frequency:

Hình này minh họa phương pháp tính Percentile Rank và cho thấy phương pháp chỉ số 0,5 × F vô công thức đảm nói rằng Percentile Rank phản ánh Percentage of Score thấp rộng lớn một điểm tiếp tục chỉ định và hướng dẫn.
Ví dụ: so với 10 điểm được hiển thị vô hình, 60% vô số cơ bên dưới điểm 4 (năm điểm nhỏ rộng lớn 4 và 1/2 của nhì điểm bởi vì 4) và 95% bên dưới 7 (chín điểm bên dưới 7 và 1/2 của một bởi vì 7). Thông thông thường, Percentile Rank chỉ được xem cho những data point sở hữu vô phân phối tuy nhiên, như hình minh họa, xếp thứ hạng xác suất cũng hoàn toàn có thể được xem cho tới điểm sở hữu gia tốc bởi vì ko. Ví dụ, 90% số điểm nhỏ rộng lớn 6 (chín điểm nhỏ rộng lớn 6, ko điểm này bởi vì 6).
Hướng tiếp cận 6: Sử dụng phân phối chuẩn chỉnh (Normal Distribution) nhằm dự trù Percentile
Chiều cao sở hữu Xu thế tuân theo đuổi phân phối chuẩn chỉnh (normal distribution), nên là hãy lấy độ cao thực hiện case study của phía tiếp cận này. Giả sử, độ cao của population tuân theo đuổi phân phối chuẩn chỉnh với độ quý hiếm khoảng (mean) là một,512 mét và phỏng nghiêng chuẩn chỉnh (standard deviation) là 0,0741 mét.
Đối với những population sở hữu phân phối chuẩn chỉnh, bạn cũng có thể dùng Z-scores nhằm tính percentile. Z-score của một để ý là số phỏng nghiêng chuẩn chỉnh nhưng mà nó phía trên hoặc bên dưới nấc khoảng của tổng thể. Hướng tiếp cận này kha khá thuận tiện nếu khách hàng chỉ mất vấn đề tóm lược về sample và có mức giá trị Z-scores.
Bạn hoàn toàn có thể dùng hàm tỷ lệ phần trăm (PDF) nhằm đo lường và tính toán và vẽ biểu đồ gia dụng của percentile. Trong loại biểu đồ gia dụng tỷ lệ phần trăm này (probability mật độ trùng lặp từ khóa plot), tỷ trọng của diện tích S được tô đậm bên dưới lối cong biểu thị tỷ trọng xác suất phân phối ở trong phạm vi độ quý hiếm cơ. Biểu đồ gia dụng này được tô đậm 70% độ quý hiếm thấp rộng lớn độ quý hiếm 1.551m, tức là độ quý hiếm độ cao ứng của P70 là một.551m.
Xem thêm: gastrobar là gì
Biểu đồ gia dụng này đã cho chúng ta thấy độ cao 1,551 mét nằm tại vị trí P70 so với population nữ giới sinh trung học tập này.

Tạm kết
Percentile là một trong những độ quý hiếm hữu ích nhằm hiểu địa điểm của một độ quý hiếm vô phân phối của tài liệu, mặt khác hoàn toàn có thể tương hỗ trong các công việc vạc hiện tại những tài liệu nước ngoài lai (outlier). Hy vọng trải qua nội dung bài viết này, các bạn tiếp tục hiểu Percentile là gì, phần mềm vô đo đếm tế bào miêu tả như này và hiểu rằng những cách thức tính Percentile không giống nhau. Nếu các bạn quan hoài rộng lớn về những kỹ năng và kiến thức đo đếm tế bào miêu tả vô phân tách tài liệu, hãy tìm hiểu thêm khóa huấn luyện và đào tạo Data Analysis của Tomorrow Marketers nhé!

Bài viết lách được biên dịch bởi vì Tomorrow Marketers, van lơn mừng lòng chẳng sao chép bên dưới từng hình thức!
Bình luận