FLC Zbigniew Huber
PL EN
Konsulting Szkolenia inżynieryjne Projektowanie elektroniki Rozwój oprogramowania Regulamin Kontakt Wykres pareto Cykl PDCA Histogram SPC - karty kontrolne Poka-yoke 14 zasad Deminga

Histogram

Wstęp

Histogram jest uważany za jeden z siedmiu podstawowych narzędzi doskonalenia jakości, którego zastosowanie w statystyce jest bardzo szerokie. Dzięki histogramowi możemy graficznie przedstawić rozkład badanej cechy (np. wymiaru, wagi, temperatury itp.) i przez to lepiej zrozumieć analizowany proces lub jego wyroby.

Co to jest histogram?

Histogram jest to wykres przedstawiający rozkładu badanej cechy (np. szerokości wyrobu) w formie pewnej ilości prostokątów, umieszczonych na osi współrzędnych X-Y. Szerokość prostokąta (W) reprezentuje pewien zakres wartości badanej cechy, natomiast wysokość prostokąta (H) reprezentuje ilość przypadków (częstotliwość), gdy badana cecha zawiera się w danym zakresie. Poniższy rysunek przedstawia przykładowy histogram.

Histogram

Powyższy histogram przedstawia wyniki pomiaru długości 53 metalowych prętów po procesie ich cięcia na wymiar 100mm +/- 3mm.

Jak rozumieć pojedynczy prostokąt?

Prostokąt zaznaczony na kolor żółty przedstawia 10 elementów (H) o długości zawierających się w zakresie od 99.75 do 100.25 natomiast prostokąt w kolorze zielonym reprezentuje 9 prętów o długości znajdującej się w zakresie 99.25 - 99.75.

Jak przygotować histogram?

Zebranie wyników pomiarowych

  1. Należy zebrać minimum 50 pomiarów, aby histogram mógł w miarę dobrze odwzorować badaną cechę w całej populacji. Oczywiście im więcej wyników zostanie zebrane, tym bardziej histogram będzie podobny do badanej populacji, dlatego zalecam pobieranie większej liczny próbek o ile to tylko możliwe.
  2. Pobierając próbki należy zadbać o to, aby pobierać próbki w sposób losowy.
  3. Oczywiście należy upewnić się, czy metoda pomiaru danej cechy jest poprawna.

Ustalenie ilości przedziałów (ilości prostokątów)

  1. Ustal rozstęp (ang. "range") dla całej pobranej próbki (wszystkich wyników). Rozstęp to wynik odejmowania najmniejszej wartości z próbki od wartości największej.histogram - jak obliczyć?
  2. Określ liczbę potrzebnych przedziałów (ang. "bins"). Nie jest to łatwe zadanie gdyż, nie ma jednego sposobu na określenie ilości przedziałów. Stosuje się wiele różnych metod:
    1. Liczba przedziałów (k) to pierwiastek kwadratowy z ilości obserwacji zaokrąglony do najbliższej liczby całkowitej [1].histogram - ilość przedziałów?
    2. Drugim rozwiązaniem jest dzielenie wg normy DIN 55302, korzystając z poniższej tabeli [2]:
      Ilość próbekIlość przedziałów k
      do 50nie możliwe
      do 100nie mniej niż 10
      do 1000nie mniej niż 13
      do 10000nie mniej niż 16
    3. W literaturze amerykańskiej spotykana też jest taka tabela [1]:
      Ilość próbekIlość przedziałów k
      do 505 - 7
      50 - 996 - 10
      100 - 2507 - 12
      powyżej 25010 - 20
    4. Norma CNOMO Norm E41.32.110N (PSA - Peugeot, Citröen, Renault) zaleca następujący sposób [2]:
      histogram - metoda CNOMO

Obliczenie szerokości przedziałów

Szerokość przedziału (W) możemy obliczyć na podstawie następującego wzoru:

histogram - szerokość przedziału

gdzie k to uprzednio obliczona ilość przedziałów a R to także uprzednio obliczony rozstęp.

Szerokość przedziału (W) należy zaokrąglić w górę do takie samego miejsca po przecinku, co zebrane dane pomiarowe.

Określenie wartości dla poszczególnych przedziałów

Dolną granicę dla pierwszego przedziału możemy określić jako minimalną wartość z danych pomiarowych. Jego górna granica to początek kolejnego przedziału. Kolejne przedziały wyznaczamy kolejno dodając do siebie szerokości przedziałów (W).

Należy pamiętać, aby przedziały wzajemnie się wykluczały, czyli inaczej mówiąc obserwacje, które znajdują się "na granicy przedziałów" mogą należeć tylko do jednego z nich.

Poniższa tabela zawiera przykładowe zestawienie poszczególnych przedziałów dla k=7, w=0,8 i najmniejszej wartości w obserwacjach = 97,5

PrzedziałZakres przedziałuIlość obserwacji w przedziale
197,50 - 98,29
298,30 - 99,09
399,10 - 99,98
499,90 - 100,69
5100,70 - 101,49
6101,50 - 102,29
7102,30 - 103,09

Określenie ilości obserwacji w danym przedziale

Po określeniu zakresów policz ile wyników pomiarów (obserwacji) należy do poszczególnych przedziałów. Każdą obserwacje zaznacza jedną pionową kreską I

PrzedziałZakres przedziałuIlość obserwacji w przedziale
197,50 - 98,29III
298,30 - 99,09IIIIII
399,10 - 99,98IIIIIIIIIIII
499,90 - 100,69IIIIIIIIIIIIIIII
5100,70 - 101,49IIIIIIIIII
6101,50 - 102,29IIIII
7102,30 - 103,09I

To co otrzymaliśmy to właśnie histogram.

Histogram - jak analizować?

Średnia

Średnia (ang "mean") pozwala nam na oszacowanie, gdzie jest środek analizowanego zbioru obserwacji. Dzięki temu możemy lepiej zrozumieć, jaka jest średnia wartość cechy i ewentualnie porównać ją ze średnia w innych histogramach o podobnej lub nieco innej zmienności. Poniższy wykres przedstawia dwa histogramy o tej samej ilości obserwacji (53), podobnej zmienności lecz o innej średniej. Dla wykresu A średnia wynosi 100.1 natomiast dla wykresu B średnia wynosi 102.1

histogram - środek procesu

Zmienność

Szerokość histogramu odzwierciedla stopień zmienności badanej cechy. Im szerszy jest histogram tym większa jest zmienność, im węższy histogram tym zmienność jest mniejsza. Zmienność najczęściej jest opisywana za pomocą odchylenia standardowego oznaczonego literą s lub σ (grecka litera sigma). Czasami stosuje się też oznaczenie StDev (ang. "standard deviation").

Im większe jest odchylenie standardowe tym większa jest zmienność danej cechy.

Poniższy wykres przedstawia dwa histogramy o tej samej liczbie obserwacji i średniej ale o różnej zmienności. Wykres A jest szerszy od wykresu C. Odchylenie standardowe dla A wynosi σ = 1.078 natomiast wykres C ma odchylenie standardowe równe σ = 0.575.

histogram - środek procesu

Kształt

W naturze (w przyrodzie) wiele cech, które chcielibyśmy opisać za pomocą histogramu ma rozkład normalny o ile nie występują jakieś zaburzenia, które zmieniają ten rozkład na inny niż normalny. Te zaburzenia określa się mianem "przyczyn specjalnych" (ang. "special cause").

Histogram pozwala nam na wykrycie takich zaburzeń, poprzez analizę kształtu wykresu.

Rozkład normalny ma kształt przypominający dzwon lub górę o jednym szczycie i dwóch podobnie nachylonych zboczach. Przykład rozkładu normalnego przedstawia wykres A (zielony). Rozkład normalny posiadają też wykresy przedstawiane powyżej.

Rozkład skośny (ang. "skewed"). To rozkład asymetryczny, ponieważ istnieją jakieś czynniki (naturalne lub zaburzenia), które ograniczają ilość obserwacji poniżej (lub powyżej) pewnej wartości. W zależności od czynnika ograniczającego lub zaburzającego taki wykres jest prawostronnie skośny (ang. "right skewed") jak pokazano na wykresie E (szary) lub w lewostronnie skośny (ang. "left skewed") jak pokazano na wykresie D (niebieski).

Rozkład dwumodalny (ang. "bi-modal"). Tego typu rozkład posiada dwa szczyty. Niekoniecznie muszą być one sobie równe. Wystarczy, że są widoczne. Taki wykres to najczęściej sygnał, że w badanej próbce mamy do czynienia sumą działania dwóch procesów (np. mamy dwóch dostawców tego samego wyrobu i te wyroby nieco się od siebie różnią). Sam wykres jest sumą dwóch lub więcej histogramów. Przykładem histogramu dwumodalnego jest wykres F (czerwony).

Rozkład wielomodalny (ang. "plateau" lub "multi-modal"). Podobnie jak w rozkładzie bimodlanym - tylko, że mamy więcej niż dwa czynniki (procesy) wpływające na zmienność. Histogram ma wtedy więcej niż dwa szczyty.

histogram - kształt procesu

Oczywiście istnieją procesy, które mają naturalne odchylenia i nie należy oczekiwać, aby miały rozkład normalny. Przykładowo naturalnym limitem może być średnica otworu, która nie może być mniejsza niż średnica wiertła, którym ten otwór wywiercono. Innym przykładem jest płaskość powierzchni, która nie może być mniejsza niż 0 itd. Dlatego ważne jest, aby rozumieć naturę analizowanego zjawiska.

Histogram w ocenie jakości procesu

Histogram możemy wykorzystać do sprawdzenia, jaka jest relacja pomiędzy analizowaną cecha (procesem) a stawianymi wymogami. Wymogami mogą być wymagania technologii, klienta itp. Dzięki temu możemy ocenić czy badany proces spełnia wymagania czy nie.

W przypadku nie spełnienia wymagań, możemy sprawdzić następujące aspekty:

Przesunięcie średniej

Czy średnia jest w pobliżu wartości nominalnej (oczekiwanej)? Jeżeli mamy niewłaściwie ustawiony proces, wtedy zazwyczaj średnia histogramu jest przesunięta w pobliże lub poza granice tolerancji.

histogram - przesunięcie procesu

Zbyt duża zmienność

Czy zmienność procesu nie jest zbyt duża? Średnia procesu może być ustawiona poprawnie, ale zbyt duża zmienność powoduje powstawanie wad. Należy szukać przyczyn zbyt dużej zmienności oraz należy zastanowić się czy proces (sam z siebie) jest adekwatny do stawianych wymagań.

histogram - zmienność za duża

Niewłaściwy kształt

Jeżeli kształt histogramu powinien mieć rozkład normalny a ma inny to świadczy o tym, że w procesie jest zaburzenie (przyczyna specjalna). Tą przyczynę należy zidentyfikować i usunąć. Po usunięciu przyczyny proces powinien powrócić do stanu normalnego.

histogram - zmiana rozkładu

Podsumowanie

Dzięki histogramowi można łatwiej zrozumieć jak analizowany proces wygląda oraz jaki jest środek, zmienność i kształt analizowanych danych. Porównując histogram z limitami specyfikacji możemy szybko ocenić czy proces spełnia wymagania czy nie.

Na koniec chciałbym zwrócić uwagę na kilka rzeczy:

  1. Histogram jak każde inne narzędzie statystyczne może też być źle wykorzystane. Manipulując ilością przedziałów lub ich szerokością można zmieniać kształt wykresu. Dlatego ważne jest, aby podczas analizy histogramu zwrócić uwagę na to ile mamy próbek (n), ile mamy przedziałów i jak szerokie one są.
  2. Histogram będzie odzwierciedlał rzeczywistość tylko wtedy, gdy dane będą aktualne i zebrane w odpowiedni sposób (odpowiednią metodą pomiaru). Jeżeli analizowane dane to próbka z większej populacji to należy także upewnić się czy została ona pobrana w sposób losowy.
  3. Do opracowania histogramu warto stosować dobre oprogramowanie po to, aby nie tracić czasu na obliczenia oraz co ważniejsze, aby nie popełnić błędów w obliczeniach, które mogą skutkować późniejszymi błędnymi decyzjami.

Histogram też może służyć jako efektywne narzędzie w komunikacji lub podejmowania decyzji biznesowych szczególnie wtedy, gdy mamy do czynienia z dużą ilością danych trudnych do przedstawienia w innej formie.

Odnośniki:

  1. M. Brassard, D.Ritter "Pomocnik Pamięci" Wydanie 1, GOAL/QPC, Methuen MA USA, 1994
  2. E.Dietrich, A.Schulze "Metody Statystyczne w kwalifikacji środków pomiarowych maszyn i procesów produkcyjnych" Wydanie 1, Notika System, 2000

Autor: Zbigniew Huber, 2007-01-01