Last updated on 18 December, 2024
Biểu đồ Histogram, hay biểu đồ tần suất, là một trong 7 công cụ quản lý chất lượng (7 QC Tools) phổ biến. Đây là một loại biểu đồ sử dụng các thanh có độ cao khác nhau để hiển thị tần suất của các khoảng dữ liệu. Histogram có thể có nhiều hình dạng khác nhau, bao gồm các hình dạng không đều và đối xứng, tùy thuộc vào loại dữ liệu của bạn.
Hiểu cách đọc và tạo biểu đồ Histogram có thể giúp bạn nghiên cứu phân phối tần suất của một tập dữ liệu, điều này đặc biệt quan trọng nếu bạn đang hoạt động trong lĩnh vực quản lý sản xuất hay thống kê. Trong bài viết này, OCD sẽ cùng bạn tìm hiểu biểu đồ Histogram là gì và cách tự tạo một biểu đồ.
Table of Contents
ToggleTừ “Histogram” bắt nguồn từ tiếng Hy Lạp “histos”, nghĩa là cột hoặc cột của một con thuyền; và “gram” có nghĩa là biểu đồ. Do đó, nghĩa đen của “Histogram” là “biểu đồ cột”. Biểu đồ Histogram là một biểu đồ thống kê hiển thị sự phân bố của dữ liệu liên tục được sắp xếp theo nhóm.
Một biểu đồ histogram điển hình bao gồm trục x, trục y và các thanh (cột) hình chữ nhật. Khoảng giá trị nằm trên trục x, trong khi trục y hiển thị số lần xuất hiện. Cấu trúc này cho phép bạn dễ dàng thấy và so sánh tần suất của các nhóm giá trị khác nhau từ dữ liệu bạn thu thập được.
Chuyên gia thường sử dụng biểu đồ Histogram trong các bài thuyết trình tại công ty và trong các cuộc họp như một công cụ kiểm soát chất lượng hoặc để xác định các nhiệm vụ tại nơi làm việc có thể cần điều chỉnh nhằm mục tiêu trở nên hiệu quả hơn.
Bạn nên sử dụng công cụ này khi:
Tiêu đề: Tiêu đề mô tả ngắn gọn thông tin được chứa trong biểu đồ Histogram.
Trục hoành (trục x):
Trục tung (trục y):
Các thanh (cột):
Tiêu chí | Biểu đồ cột (Bar Chart) | Biểu đồ tần suất (Histogram) |
Mục đích | So sánh tần suất hoặc số lượng giữa các danh mục rời rạc. | Biểu diễn sự phân phối của dữ liệu liên tục. |
Loại dữ liệu | Dữ liệu rời rạc (như loại sản phẩm, quốc gia, giới tính). | Dữ liệu liên tục (như chiều cao, tuổi, điểm số). |
Khoảng cách giữa các cột | Có khoảng cách giữa các cột để phân tách danh mục. | Các cột sát nhau để thể hiện tính liên tục. |
Trục X | Đại diện cho các danh mục riêng biệt. | Đại diện cho các khoảng giá trị liên tiếp. |
Sử dụng khoảng (Bins) | Không sử dụng khoảng (bins). | Sử dụng khoảng (bins) để nhóm dữ liệu. |
Phân phối chuẩn có dạng hình chuông, đối xứng quanh giá trị trung bình. Các giá trị tập trung nhiều ở giữa và giảm dần về hai phía. Đây là loại phân phối thường gặp trong tự nhiên, như chiều cao, cân nặng, hoặc điểm thi.
Phân phối đồng nhất có các thanh Histogram có chiều cao xấp xỉ bằng nhau, cho thấy các giá trị phân bố đồng đều trên toàn bộ phạm vi biểu đồ. Loại phân phối này cho thấy không có xu hướng nào nổi bật và tất cả các giá trị đều có khả năng xảy ra ngang nhau.
Phân phối hai đỉnh (hay phân phối nhị thức) có hai đỉnh rõ ràng, cho thấy có hai nhóm dữ liệu khác biệt trong tập dữ liệu. Loại phân phối này có thể xuất hiện khi tập dữ liệu bao gồm hai nhóm dân số khác nhau, ví dụ như chiều cao của trẻ em và của người lớn trong một mẫu dữ liệu.
Phân phối lệch phải (Right-Skewed Distribution)
Phân phối lệch phải có đỉnh ở bên trái, trong khi phần đuôi kéo dài về phía bên phải. Trong loại phân phối này, phần lớn các điểm dữ liệu có giá trị nhỏ, còn các giá trị lớn hơn lại ít hơn. Ví dụ điển hình là thu nhập cá nhân, khi mà phần lớn người dân có thu nhập thấp hoặc trung bình và chỉ một số ít người có thu nhập cao.
Phân phối lệch trái (Left-Skewed Distribution)
Phân phối lệch trái có đỉnh ở bên phải và phần đuôi kéo dài về bên trái. Loại này hiếm gặp hơn, nhưng có thể xuất hiện trong các tình huống như độ tuổi nghỉ hưu, khi đa số người dân nghỉ hưu ở độ tuổi cao nhưng cũng có một số ít người nghỉ sớm hơn.
Phân phối hình chữ U (U-shaped Distribution)
Biểu đồ phân phối hình chữ U có các đỉnh cao ở hai bên đầu và thấp ở giữa, cho thấy có rất ít dữ liệu nằm ở khoảng giữa của phạm vi. Loại phân phối này có thể xuất hiện trong các tập dữ liệu mà các giá trị trung gian ít xuất hiện hơn giá trị ở hai đầu của biểu đồ Histogram.
Phân phối ngẫu nhiên
Phân phối ngẫu nhiên thiếu một mô hình rõ ràng, có nhiều đỉnh và không có xu hướng tập trung vào một vùng cụ thể nào. Trong biểu đồ histogram phân phối ngẫu nhiên, giữa các giá trị dữ liệu không có mối liên hệ rõ ràng hoặc các quy luật nhất định. Do đó, dữ liệu nên được tách riêng và phân tích riêng biệt.
Bước đầu tiên là thu thập tất cả dữ liệu của bạn và sắp xếp chúng theo thứ tự tăng dần. Ví dụ, hãy tưởng tượng bạn đang ghi lại dữ liệu cho một y tá muốn theo dõi độ tuổi của 20 trẻ sơ sinh tính bằng ngày. Độ tuổi bạn thu được cho 20 trẻ sơ sinh khác nhau là 5, 5, 1, 2, 4, 5, 3, 6, 7, 8, 5, 6, 2, 2, 5, 7, 1, 4, 5 và 2 ngày. Khi sắp xếp theo thứ tự tăng dần, tập dữ liệu mới của bạn sẽ như sau: 1, 1, 2, 2, 2, 2, 3, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 7, 7 và 8.
Bây giờ bạn đã sắp xếp tất cả dữ liệu theo thứ tự tăng dần, bạn có thể đặt nó vào một bảng dữ liệu. Tạo một bảng bao gồm hai cột. Cột đầu tiên chứa độ tuổi của trẻ sơ sinh tính theo ngày. Cột thứ hai bao gồm tần suất xuất hiện của mỗi độ tuổi dựa vào tập dữ liệu đã có.
Độ tuổi của trẻ sơ sinh (tính bằng ngày) | Tần suất |
1 | 2 |
2 | 4 |
3 | 1 |
4 | 2 |
5 | 6 |
6 | 2 |
7 | 2 |
8 | 1 |
Sau khi đã tạo bảng dữ liệu để xem tần suất của mỗi điểm dữ liệu, bạn có thể tiến hành vẽ biểu đồ histogram. Vẽ một trục x và trục y cắt nhau ở góc dưới bên trái. Các khoảng dữ liệu được đặt trên trục x và tần suất trên trục y. Đối với ví dụ này, bạn có thể tạo các khoảng giá trị riêng biệt cho từng độ tuổi trên trục x bằng cách dán nhãn từ 1 đến 8. Dán nhãn trục y cao nhất là số 6, vì đây là tần suất xuất hiện lớn nhất trong bảng dữ liệu của bạn.
Hãy bắt đầu với khoảng dữ liệu đầu tiên – trẻ sơ sinh 1 ngày tuổi trong ví dụ này. Có hai trẻ sơ sinh 1 ngày tuổi, vì vậy bạn có thể vẽ một thanh cao bằng giá trị “2” trên trục y. Tô màu cho thanh này và lặp lại quy trình cho tất cả độ tuổi của trẻ sơ sinh. Sau khi tô màu tất cả các thanh, bạn sẽ nhận thấy biểu đồ này có phân phối ngẫu nhiên. Bạn có thể kết luận đây là một phân phối ngẫu nhiên vì biểu đồ không bị lệch theo một xu hướng hay có đặc điểm nào rõ ràng.
Dưới đây là một số lợi ích nổi bật của việc sử dụng biểu đồ Histogram:
Biểu đồ Histogram là một trong những công cụ trực quan hóa dữ liệu phổ biến và mạnh mẽ nhất, giúp chúng ta khám phá các đặc điểm phân phối dữ liệu. Dưới đây là một số sự thật thú vị về biểu đồ này:
Trong số các công cụ trực quan hóa dữ liệu hiện nay, biểu đồ Histogram nổi bật nhờ vào sự đơn giản, tính linh hoạt và đem lại giá trị thông tin sâu sắc. Nó không chỉ cung cấp cái nhìn trực quan về sự phân bố dữ liệu mà còn tạo nền tảng cho các phân tích thống kê nâng cao hơn.
——————————-
Công ty Tư vấn Quản lý OCD (OCD Management Consulting Co) là một trong những công ty tư vấn quản lý hàng đầu Việt Nam với tính chuyên nghiệp, thực tiễn và chất lượng cao.
Nếu bạn quan tâm, hãy liên hệ với chúng tôi để được tư vấn miễn phí!
Thông tin chính thức về OCD được cập nhật tại website: https://ocd.vn
Fanpage chính thức của OCD vui lòng truy cập: https://facebook.com/OCDConsulting
Liên hệ nhanh Hotline/Zalo: 0886595688 hoặc gửi email đến: ocd@ocd.vn
You must be logged in to post a comment.