Thủ Thuật Hướng dẫn Ý nghĩa của box plot 2022
Họ tên bố(mẹ) đang tìm kiếm từ khóa Ý nghĩa của box plot được Update vào lúc : 2022-04-20 09:53:05 . Với phương châm chia sẻ Bí kíp về trong nội dung bài viết một cách Chi Tiết Mới Nhất. Nếu sau khi tham khảo tài liệu vẫn ko hiểu thì hoàn toàn có thể lại Comment ở cuối bài để Ad lý giải và hướng dẫn lại nha.[embed]https://www.youtube.com/watch?v=5SZuIy4L2wc[/embed]
Các Box Plots còn được nghe biết với tên gọi là box và whisker plots được dùng để hiển thị sự phân phối của những giá trị dọc theo trục. Bạn hoàn toàn có thể định hình những đường (lines), còn được gọi là whiskers, để hiển thị tất cả những điểm trong phạm vi 1.5 lần liên vùng. Nói cách khác là tất cả những điểm trong phạm vi 1.5 lần chiều rộng như ảnh minh họa phía dưới.Bạn đang xem: Boxplot là gì
Biểu đồ Box Plot còn được gọi là box-and-whisker plots
Hướng dẫn tạo Box Plot trong Tableau Desktop
Để tạo một box plot hiển thị tình trạng giảm giá theo khu vực và phân khúc người tiêu dùng (discounts by region and customer segment), hãy thực hiện theo tiến trình sau:
Bước 1: Mở Tableau Desktop và link đến nguồn tài liệu mẫu Sample – Superstore.Bạn đang xem: Boxplot là gì
Bước 2: Kéo dimension Segment vào ngăn Columns.Bước 3: Kéo measure Discount vào ngăn Rows.
Tableau sẽ tạo một trục dọc và hiển thị một biểu đồ cột là loại biểu đồ mặc định khi có một dimension trên ngăn Columns và một measure trên ngăn Rows.
Bước 4: Kéo dimension Region và ngăn Columns và thả nó ở bên phải của trường Segment trước đó.Bây giờ, tất cả chúng ta đã thu được một khối mạng lưới hệ thống phân cấp với 2 Lever của dimensions từ trái sang phải trong view, với những vùng hay regions (được liệt kê dọc phía dưới) được lồng trong những phân đoạn hay segments (được liệt kê trên cùng).
Bước 5: Nhấp vào Show Me trong thanh công cụ, sau đó chọn loại biểu đồ box-and-whisker plot chart.Tableau sẽ hiển thị một box plot như ảnh minh họa:
Lưu ý rằng chỉ có một vài đánh dấu (marks) trong mỗi box plot. Ngoài ra, Tableau đã chỉ định lại vùng (Region) từ ngăn Columns sang thẻ Marks. Khi bạn thay đổi loại biểu đồ thành box plot, Tableau xác định những gì những marks riêng biệt trong plot nên đại diện. Nó xác định rằng marks nên đại diện cho Region và tất cả chúng ta sẽ thay đổi điều đó.
Bước 6: Kéo Region từ thẻ Marks trở lại Columns và đặt nó ngay bên phải của Segment.Kết quả trên biểu đồ thu được những đường ngang là những ô vuông dẹt, điều này xảy ra khi những box plots nhờ vào một mark duy nhất.
Xem thêm: Tuổi 1992 Mệnh Gì - Tuổi Nhâm Thân 1992 Hợp Màu Gì Năm 2022
[embed]https://www.youtube.com/watch?v=5SZuIy4L2wc[/embed]
Hình ảnh trên là một ô vuông . Biểu đồ hộp là một cách tiêu chuẩn hóa để hiển thị phân phối tài liệu nhờ vào tóm tắt năm số (“tối thiểu”, phần tư thứ nhất (Q1), trung vị, phần tư thứ ba (Q3) và “tối đa”). Nó hoàn toàn có thể cho bạn biết về những ngoại lệ của bạn và giá trị của chúng. Nó cũng hoàn toàn có thể cho bạn biết liệu tài liệu của bạn có đối xứng hay là không, tài liệu của bạn được nhóm ngặt nghèo ra làm sao và nếu và cách tài liệu của bạn bị lệch.
Bạn đang xem: Boxplot là gì
Hướng dẫn này sẽ gồm có:
Boxplot là gì? Hiểu giải phẫu của một ô vuông bằng phương pháp so sánh một ô vuông với hàm tỷ lệ xác suất cho một phân phối chuẩn. Làm thế nào để bạn tạo và lý giải những hộp đồ trang bằng Python? Boxplot là gì?Đối với một số trong những phân phối / bộ tài liệu, bạn sẽ thấy rằng bạn cần nhiều thông tin hơn là những thước đo của xu hướng trung tâm (trung bình, trung bình và chính sách).
Đôi khi, giá trị trung bình, giá trị trung bình và chính sách không đủ để mô tả một tập tài liệu (lấy từ đây).
Bạn nên phải có thông tin về sự thay đổi hoặc phân tán của tài liệu. Biểu đồ hình hộp là một biểu đồ đáp ứng cho bạn tín hiệu tốt về cách những giá trị trong tài liệu được trải ra. Mặc dù biểu đồ hộp có vẻ như nguyên thủy so với biểu đồ hoặc biểu đồ tỷ lệ , nhưng chúng có lợi thế là chiếm ít không khí hơn, điều này rất hữu ích khi so sánh phân phối giữa nhiều nhóm hoặc tập tài liệu.
Các phần rất khác nhau của một boxplot
Boxplots là một cách tiêu chuẩn hóa để hiển thị phân phối tài liệu nhờ vào tóm tắt năm số (“tối thiểu”, phần tư thứ nhất (Q1), trung vị, phần tư thứ ba (Q3) và “tối đa”).
trung vị (Phần trăm thứ 2/50) : giá trị giữa của tập tài liệu.
phần tư đầu tiên (Phần trăm Q1 / 25) : số ở chính giữa giữa số nhỏ nhất (không phải số "tối thiểu") và số trung bình của tập tài liệu.
phần tư thứ ba (Phần trăm thứ 3/75) : giá trị ở giữa giữa giá trị trung bình và giá trị cao nhất (không phải "tối đa") của tập tài liệu.
phạm vi liên phân vị (IQR) : phân vị thứ 25 đến 75.
râu (màu xanh lam)
ngoại lệ (được hiển thị dưới dạng vòng tròn màu xanh lục)
"Tối đa" : Q3 + 1.5 * IQR
"Tối thiểu" : Q1 -1,5 * IQR
Điều gì xác định ngoại lệ, "tối thiểu" hoặc "tối đa" hoàn toàn có thể chưa rõ ràng. Phần tiếp theo sẽ nỗ lực làm rõ điều đó cho bạn.
Boxplot trên phân phối thông thườngSo sánh biểu đồ hộp có phân phối gần chuẩn và hàm tỷ lệ xác suất (pdf) cho phân phối chuẩn
Hình ảnh trên là sự việc so sánh giữa biểu đồ hình hộp có phân phối gần chuẩn và hàm tỷ lệ xác suất (pdf) cho phân phối chuẩn. Lý do tại sao tôi cho bạn xem hình ảnh này là việc xem xét một phân phối thống kê phổ biến hơn là xem một biểu đồ hình hộp. Nói cách khác, nó hoàn toàn có thể giúp bạn hiểu về một boxplot.
Phần này sẽ gồm có nhiều thứ gồm có:
Mức độ ngoại lệ ra làm sao (đối với phân phối chuẩn) .7% tài liệu. "Tối thiểu" và "tối đa" là gìPhần này của bài đăng rất giống với nội dung bài viết quy tắc 68–95–99.7 , nhưng được điều chỉnh cho một diễn biến. Để hoàn toàn có thể hiểu phần trăm đến từ đâu, điều quan trọng là phải biết về hàm tỷ lệ xác suất (PDF). Một PDF được sử dụng để xác định xác suất của biến ngẫu nhiên rơi xuống trong một phạm vi rõ ràng của những giá trị , như trái ngược với tham gia vào bất kỳ giá trị một. Xác suất này được cho bởi tích phân của PDF của biến này trên phạm vi đó - nghĩa là, nó được đáp ứng bởi diện tích s quy hoạnh dưới hàm tỷ lệ nhưng nằm trên trục hoành và giữa giá trị thấp nhất và lớn số 1 của phạm vi. Định nghĩa này hoàn toàn có thể không còn nhiều ý nghĩa vì vậy hãy làm rõ nó bằng phương pháp vẽ đồ thị hàm tỷ lệ xác suất cho một phân phối chuẩn. Phương trình dưới đây là hàm tỷ lệ xác suất cho phân phối chuẩn
PDF cho một bản phân phối thông thường
Hãy đơn giản hóa nó bằng phương pháp giả sử tất cả chúng ta có trung bình (μ) là 0 và độ lệch chuẩn (σ) là một trong.
PDF cho một bản phân phối thông thường
Điều này hoàn toàn có thể được vẽ bằng bất kỳ thứ gì, nhưng tôi chọn vẽ biểu đồ bằng Python.
# Import all libraries for this portion of the blog postfrom scipy.integrate import quadimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinex = np.linspace(-4, 4, num = 100)constant = 1.0 / np.sqrt(2*np.pi)pdf_normal_distribution = constant * np.exp((-x**2) / 2.0)fig, ax = plt.subplots(figsize=(10, 5));ax.plot(x, pdf_normal_distribution);ax.set_ylim(0);ax.set_title("Normal Distribution", size = 20);ax.set_ylabel("Probability Density", size = 20);
# Make PDF for the normal distribution a functiondef normalProbabilityDensity(x): constant = 1.0 / np.sqrt(2*np.pi) return(constant * np.exp((-x**2) / 2.0) )# Integrate PDF from -.6745 to .6745result_50p, _ = quad(normalProbabilityDensity, -.6745, .6745, limit = 1000)print(result_50p)
# Make a PDF for the normal distribution a functiondef normalProbabilityDensity(x): constant = 1.0 / np.sqrt(2*np.pi) return(constant * np.exp((-x**2) / 2.0) )# Integrate PDF from -2.698 to 2.698result_99_3p, _ = quad(normalProbabilityDensity, -2.698, 2.698, limit = 1000)print(result_99_3p)
Xem thêm: Hướng Dẫn Up Rom Cho Zenfone 4, 5, 6 Nhanh Nhất, Hướng Dẫn Up Rom Asus Zenfone 5
Phần này phần lớn nhờ vào video xem trước miễn phí từ khóa học Python cho Trực quan hóa tài liệu của tôi . Trong phần trước, tất cả chúng ta đã xem xét một ô vuông trên phân phối chuẩn, nhưng vì bạn rõ ràng không phải lúc nào thì cũng luôn có thể có một phân phối chuẩn cơ bản, hãy xem qua cách sử dụng một ô vuông trên một tập tài liệu thực. Để làm điều này, chúng tôi sẽ sử dụng Bộ tài liệu Wisconsin (Chẩn đoán) Ung thư vú . Nếu bạn không còn tài năng khoản Kaggle, bạn hoàn toàn có thể tải xuống bộ tài liệu từ github của tôi .
Đọc trong tài liệu
Đoạn mã dưới đây đọc tài liệu vào khung tài liệu gấu trúc.
import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt# Put dataset on my github repo df = pd.read_csv("https://raw.githubusercontent.com/mGalarnyk/Python_Tutorials/master/Kaggle/BreastCancerWisconsin/data/data.csv") Biểu đồ hình hộp được sử dụng phía dưới để phân tích quan hệ giữa một đặc điểm phân loại (khối u ác tính hoặc lành tính) và một đặc điểm liên tục (area_mean).
Có một số trong những phương pháp để vẽ đồ thị hình hộp thông qua Python. Bạn hoàn toàn có thể vẽ biểu đồ hình hộp thông qua seaborn, matplotlib hoặc gấu trúc.
sơ sinh
Đoạn mã dưới đây chuyển khung tài liệu gấu trúc dfvào seaborn"s boxplot.
sns.boxplot(x="diagnosis", y="area_mean", data=df)
Các hộp đấu bạn đã thấy trong nội dung bài viết này được thực hiện thông qua matplotlib. Cách tiếp cận này hoàn toàn có thể tẻ nhạt hơn nhiều, nhưng hoàn toàn có thể đáp ứng cho bạn mức độ trấn áp cao hơn.
malignant = df
[embed]https://www.youtube.com/watch?v=_q9V36Zu30M[/embed]