Przykłady problemów optymalizacji dyskretnej

Wykład 7

Przykłady problemów optymalizacji dyskretnej.

Streszczenie

Klasa problemów NP-zupełnych zdefiniowana na poprzednim wykładzie okazuje się być klasą bardzo szeroką i mającą duże znaczenie praktyczne. Niniejszy wykład stanowi przegląd problemów NP-zupełnych i metod radzenia sobie z nimi.

Problemy NP-zupełne i ich rozwiązywanie

Przypomnijmy podstawowe pojęcia i fakty poznane na poprzednim wykładzie:

Klasa P - problemy rozwiązywalne w czasie wielomianowym.
Klasa NP - problemy rozwiązywalne w wielomianowym czasie na NDTM (czyli takie, których poprawność rozwiązania sprawdza się wielomianowo)
SAT (problem spełnialności formuł) jest "uniwersalny", jego rozwiązanie w czasie wielomianowym pozwalałoby na rozwiązanie wszystkich problemów z klasy NP w czasie wielomianowym.
Tego rodzaju problemów (nazywanych NP-zupełnymi), jest więcej (np. problem istnienia w grafie kliki rzędu k)
Nie znamy szybkich algorytmów rozwiązywania problemów NP-zupełnych.

Stwierdzenie, że dany problem jest NP-zupełny oznacza w praktyce, że powinniśmy wykorzystywać przybliżone algorytmy heurystyczne (jak poznany już algorytm zachłanny, wspinaczki czy przeszukiwanie wiązkowe). Udowodnienie, że problem rzeczywiście jest NP-zupełny, bywa dość trudne i wykracza poza ramy tego wykładu - w poniższym zestawieniu problemów ograniczymy się jedynie do zaznaczenia, który z problemów jest NP-zupełny.

Większość popularnych algorytmów heurystycznych (przybliżonych) opiera się na dwóch podstawowych schematach: zachłannym (budowanie rozwiązań po kawałku) i opartym na sąsiedztwie (oceniamy pełne rozwiązania i definiujemy zasady sąsiedztwa). Oznacza to, że aby wskazać sposób rozwiązania problemów za pomocą jednej z poznanych metod (i wielu, które dopiero poznamy), wystarczy omówić te dwa aspekty. W poniższym zestawieniu omówienia te umieszczono w tabelkach.

Klika w grafie

Problem ten został na poprzednim wykładzie omówiony i przedstawiony jako NP-zupełny. Dla przypomnienia:

Przykład kliki w grafie Niech G=(V, E) - dany graf. Kliką nazywamy zbiór wierzchołków grafu G połączonych "każdy z każdym".

Problem: Czy w danym grafie istnieje klika rzędu k?

Wersja optymalizacyjna problemu: znaleźć w grafie największą klikę.

Metody zachłanne

Metody oparte na sąsiedztwie

Jeden krok = dodanie do podzbioru kolejnego (wybranego) wierzchołka, łączącego się ze wszystkimi dotychczasowymi.

Jakość dodawanego wierzchołka: liczba wychodzących z niego krawędzi.

Rozwiązania sąsiednie to takie, które różnią się jednym wierzchołkiem (dodanym lub usuniętym z podzbioru).

Oceniamy wszystkie podzbiory, również nie będące klikami. Miara jakości:
n - liczba wierzchołków w grafie
k - liczba wierzch. w podzbiorze
p - liczba krawędzi w podzbiorze

wówczas jakość = k + 2np / k(k-1)

Pokrycie wierzchołkowe grafu

Dany jest graf G = (V, E). Znaleźć najmniejszy podzbiór wierzchołków taki, by każda krawędź kończyła się jednym z nich. (Problem NP-trudny)

Metody zachłanne

Metody oparte na sąsiedztwie

Jeden krok = dodanie do podzbioru wybranego wierzchołka.

Jakość dodawanego wierzchołka: liczba nowo pokrytych przez niego krawędzi.

Rozwiązania sąsiednie to takie, które różnią się jednym wierzchołkiem (dodanym lub usuniętym z podzbioru).

Oceniamy wszystkie podzbiory, również nie będące pełnymi pokryciami. Miara jakości:
n - liczba wierzchołków w grafie
k - liczba wierzch. w podzbiorze
p - liczba pokrytych krawędzi

wówczas jakość = p - k/n

Podział zbioru

Mamy dany zbiór n wartości rzeczywistych {a₁, ... , a_n}. Czy da się podzielić zbiór na dwa rozłączne podzbiory A₁ i A₂ takie, żeby suma wartości z A₁ równała się sumie wartości z A₂? (Problem NP-zupełny)

Wersja optymalizacyjna: znaleźć podział dający najmniejszy moduł różnicy sum.

Przykład praktyczny: rozmieścić towar (kontenery o różnej masie) w ładowni dziobowej i rufowej tak, by statek był w równowadze.

Metody zachłanne

Metody oparte na sąsiedztwie

Jeden krok = dodanie jednego lub dwóch elementów.

Jakość jednego kroku: jak najmniejszy moduł różnicy wag po operacji.

Rozwiązania sąsiednie to takie, które różnią się położeniem jednego lub dwóch elementów.

Funkcja celu: moduł różnicy wag.

Planowanie zadań

Dany jest zbiór zadań do wykonania (w dowolnej kolejności) o ustalonych długościach, oraz liczba m procesorów. Czy da się rozdzielić i rozplanować zadania tak, żeby się zmieścić w pewnym limicie czasu D? (Problem NP-zupełny)

Metody zachłanne

Metody oparte na sąsiedztwie

Jeden krok = dodanie jednego zadania.

Przydzielamy zadanie pierwszemu procesorowi, który jest wolny (poczynając od najdłuższych zadań).

Rozwiązania sąsiednie to takie, które różnią się przyporządkowaniem jednego zadania.

Funkcja celu: minimalizacja przekroczenia limitu D.

Inna wersja - problem pakowania (bin packing): w zadaniu j.w. użyć jak najmniej procesorów.

Pokrycie zbioru

Znamy problem minimalnego pokrycia macierzy zerojedynkowej. Równoważnym problemem jest problem minimalnego pokrycia zbioru (oba problemy są NP-trudne):

Dany jest zbiór U i rodzina jego podzbiorów {S₁, …, S_n}, dająca w sumie U. Znajdź najmniejszą podrodzinę {S_a1, …, S_ak} taką, że suma tej podrodziny również wynosi U.

Metody zachłanne

Metody oparte na sąsiedztwie

Jeden krok = dodanie jednego podzbioru.

Wybieramy ten podzbiór, który pokrywa jak największą niepokrytą część U.

Rozwiązania sąsiednie to takie, które różnią się jednym elementem.

Oceniamy wszystkie rozwiązania, również nie będące pełnymi pokryciami. Miara jakości:
n - wielkość rodziny podzbiorów
k - liczba wybranych podzbiorów
p - liczba pokrytych elementów U

wówczas jakość = p - k/n

Uwagi na temat sąsiedztwa

Metody typu przeszukiwanie tabu czy algorytm wspinaczki bazują na pojęciu sąsiedztwa rozwiązań (punktów przestrzeni stanów). Może być ono zdefiniowane przez nas w zasadzie dowolnie, jednak należy trzymać się kilku zasad ogólnych:

Sąsiedztwo nie powinno być zbyt liczne. W praktyce: powinno być najwyżej kwadratowo liczne. Częścią wielu algorytmów jest pętla przeglądająca wszystkich sąsiadów lub funkcja losująca jednego z nich.
Relacja sąsiedztwa powinna być spójna. Jak wiemy z jednego z poprzednich wykładów, wymagamy możliwości dojścia z każdego rozwiązania do każdego innego przechodząc jedynie od sąsiada do sąsiada. Inaczej część rozwiązań będzie nieosiągalna.
Przejście do sąsiada powinno w niewielkim stopniu zmieniać funkcję celu. Milczące założenie: w pobliżu dobrych rozwiązań warto szukać jeszcze lepszych - bez tego heurystyki są bezradne.

Przykład: problem podziału zbioru.

Mamy dany zbiór n wartości rzeczywistych {a₁, ... , a_n}. Znaleźć podział zbioru na dwa rozłączne podzbiory A₁ i A₂ taki, żeby moduł różnicy sum wartości z A₁ i A₂ był minimalny.

Funkcja celu: moduł różnicy sum zbiorów (minimalizujemy).

Wartość funkcji celu - przechodzenie między sąsiadami

Jeżeli sąsiednie rozwiązanie polega na tym, że przekładamy jeden pakunek z jednej ładowni do drugiej, to taka funkcja jest trudna do optymalizacji (lewy wykres), gdyż ma wiele maksimów lokalnych.

Jeżeli sąsiednie rozwiązanie polega na tym, że wybieramy parę pakunków z różnych ładowni i zamieniamy je miejscami, wówczas zmiany funkcji celu są łagodniejsze (prawy wykres), ale relacja jest niespójna (nie zmieniamy liczby pakunków w żadnej z ładowni). Dodatkowo zamiast n sąsiadów mamy ich rzędu n².

Najlepiej połączyć te dwie definicje sąsiedztwa w jednym algorytmie.

Podsumowanie i literatura

Zaprezentowano przegląd problemów optymalizacyjnych wraz z uniwersalnymi schematami ich rozwiązania. Problemy te odpowiadają bardzo wielu praktycznym zadaniom optymalizacyjnym. Pominięto (omówione na jednym z poprzednich wykładów) problem komiwojażera i problem pokrycia macierzy.

Zalecana literatura:

T.H. Cormen, C.E. Leiserson, R.L. Rivest. Wprowadzenie do algorytmów. WNT, Warszawa 1997.

Zadania

7.1. Sprawdzić, że miary jakości rozwiązań dla problemów opisanych na tym wykładzie osiągają wartość maksymalną dla rozwiązania optymalnego.

Strona uaktualizowana przez Sinh Hoa Nguyen, 2009