Dany jest ciąg macierzy A₁, A₂,...,A_n. Obliczyć iloczyn A₁ ´ A₂ ´ ... ´ A_n, tak by koszt wykonania zadania był najmniejszy.

Wiadomo, że dwie macierze możemy pomnożyć tylko wtedy, gdy liczba kolumn w pierwszej z nich jest taka sama, jak liczba wierszy w drugiej. W powyższym problemie zakładać będziemy, że wymiary macierzy są odpowiednie, aby ich pomnożenie było możliwe.

Niech p₀, p₁,... p_n oznacza ciąg, w którym para (p_i-1, p_i) jest rozmiarem macierzy A_i (macierz A_i ma więc p_i-1 wierszy i p_i kolumn). Przy takim założeniu obliczenie iloczynu możemy wykonać po kolei mnożąc A₁ przez A₂, następnie wynik przez A₃ itd, albo mnożąc najpierw macierze z jakiegoś wybranego segmentu np. od A_i do A_j, a potem obliczając iloczyn A₁ ´... ´ A_i-1 ´ W ´ A_j+1´... ´ A_n, gdzie W = A_i ´ A_i+1 ´ ... ´ A_j. Oczywiście pamiętamy, że mnożenie macierzy nie jest przemienne, jest natomiast łączne i z tej własności będziemy właśnie korzystać szukając optymalnego rozwiązania problemu.

Niech A, B i C będą macierzami o wymiarach odpowiednio (10 ´ 100), (100 ´ 5) i (5 ´ 50). Iloczyn tych macierzy możemy obliczyć albo licząc najpierw iloczyn A ´ B a potem mnożąc wynik przez C, albo najpierw licząc B ´ C, a potem mnożąc A przez otrzymany wynik. Macierze uzyskane w wyniku są oczywiście identyczne

Obliczmy liczbę wykonanych mnożeń skalarnych w obu przypadkach pamiętając, że pomnożenie macierzy o wymiarach (n ´ m) przez macierz o wymiarach (m ´ k) wymaga m* n * k mnożeń elementów tych macierzy, jeśli używamy zwykłego algorytmu opartego na algebraicznej definicji mnożenia macierzy.

Dla wyrażenia (A ´ B) ´ C mamy więc (10*100*5) + (10 *5 * 50) mnożeń, bo w wyniku pomnożenia A przez B otrzymamy macierz o wymiarze (10 ´ 5). Wykonany więc 7500 mnożeń skalarnych.

Dla wyrażenia A ´ (B ´ C) mamy (10*100*50) + (100 * 5 * 50) mnożeń, bo w wyniku mnożenia B przez C otrzymamy macierz o wymiarach (100 ´ 50). Tym razem wykonamy 75000 mnożeń skalarnych. Różnica jest istotna! J

Najprostszy pomysł rozwiązania problemu mnożenia łańcucha macierzy przedstawia następujący algorytm.

Taki algorytm gwarantuje, że liczba wykonanych mnożeń skalarnych (wykonujemy je tylko w punkcie czwartym tego algorytmu) jest minimalna. Punkty 1-3 powyższej metody mają charakter pomocniczy. Przy ich realizacji wykonujemy jednak pewną liczbę mnożeń i dodawań liczb naturalnych. Zastanówmy się jaki jest koszt z tym związany. Pytanie właściwie dotyczy liczby przypadków, które trzeba rozważyć, gdyż punkt drugi wymaga co najwyżej O(n) mnożeń rzeczywistych dla łańcucha złożonego z n macierzy. Ile jest więc możliwych ustawień nawiasów w ciągu złożonym z n macierzy?

Oznaczmy przez P(n) liczbę ustawień nawiasów w ciągu n elementowym. Przyjmijmy, że dla n=1, P(1)=1. Dla n=2 mamy tylko jedno ustawienie nawiasów, a dla n=3, dwa ustawienia, tak jak w przykładzie 2.1. Ogólnie, jeśli pierwszy nawias postawimy po pozycji ktej rozdzielając ciąg mnożeń na dwa podciągi A₁ ´ A₂ ´ ... ´ A_ki A_k+1 ´ A_k+2 ´ ... ´ A_n, to liczba ustawień nawiasów w tym przypadku wynosi P(k)*P(n-k). Ponieważ k może przyjąć dowolną z wartości od 1 do n-1, więc otrzymujemy następujący wzór rekurencyjny:

Zauważmy, że P(4) = 5, P(5) = 14, a P(6) = 42. Funkcja ta dość szybko rośnie. I rzeczywiście

Lemat 2.1 Rozwiązaniem równania rekurencyjnego (*) jest (n-1)sza liczba Catalana,

P(n)= c(n-1), gdzie c(n) = (2n nad n)/(n+1).

Formuła Stirlinga (n! ~ sqrt(2np) nⁿ/eⁿ) pozwala przybliżyć liczbę Catalana następująco:

Wynika stąd, że liczba możliwych ustawień nawiasów w ciągu n macierzy jest wykładnicza. Nawet dla niewielkich wartości n, taki algorytm byłby zbyt kosztowny. Musimy więc szukać innego rozwiązania.

Lemat 2.2 Problem mnożenia łańcucha macierzy ma własność optymalnej podstruktury.

Nazwijmy optymalnym nawiasowaniem ciągu A₁, A₂,...,A_ntaki układ nawiasów, dla którego koszt pomnożenia wszystkich macierzy, mierzony liczbą mnożeń skalarnych, jest najmniejszy. Niech będzie optymalne nawiasowanie ciągu A₁, A₂,...,A_n, w którym został on rozbity na dwa podciągi A₁ ´ A₂ ´ ... ´ A_ki A_k+1 ´ A_k+2 ´ ... ´ A_n,

A₁ ´ A₂ ´ ... ´ A_n = (A₁ ´ A₂ ´ ... ´ A_k) ´ ( A_k+1 ´ A_k+2 ´ ... ´ A_n).

Układ nawiasów musi być optymalny zarówno w ciągu A₁ ´ A₂ ´ ... ´ A_k, jak i w ciągu A_k+1 ´ A_k+2 ´ ... ´ A_n, gdyż w przeciwnym razie moglibyśmy rozważyć inne nawiasowanie całego ciągu, dające mniejszy koszt mnożenia macierzy, niż to, w tej chwili rozważane. Czyli optymalne rozwiązanie problemu mieści w sobie optymalne rozwiązania dla podproblemów. Ten fakt zachęca do zastosowania metody programowania dynamicznego.

Zajmijmy się teraz policzeniem kosztu rozwiązania optymalnego. Niech m(i,j) będzie minimalną liczbą mnożeń skalarnych potrzebnych do policzenia iloczynu A_i ´ A₂ ´ ... ´ A_j dla i £ j. Mamy m(i,i) = 0, oraz dla i<j

W minimum po prawej stronie równości (**), k zmienia się od i do j-1, co odpowiada ustawieniu pierwszego nawiasu po pozycji ktej. W wyniku mnożenia macierzy A_i ´ A_i+1 ´ ... ´ A_k otrzymamy macierz o wymiarach p_i-1´ p_k, a w wyniku mnożenia macierzy A_k+1 ´ A_k+2 ´ ... ´ A_j macierz o wymiarach p_k´ p_j . Koszt pomnożenia tych macierzy wynosi więc p_i-1*p_k*p_j. Jeśli k wybierzemy tak, by wartość m(i,k) + m(k+1,j) + p_i-1*p_k*p_j była najmniejsza, to koszt pomnożenia A_i ´ A_i+1 ´ ... ´ A_j jest najmniejszy z możliwych. Oznaczmy tę wybraną wartość k przez s(i,j).

Może się wydawać, że obliczenie wartości m(i,j) możemy powierzyć procedurze rekurencyjnej. Gdybyśmy użyli wprost wzoru (**) do policzenia wartości m(i,j), to musielibyśmy wywoływać rekurencyjnie tę procedurę dla podproblemów (i,k) i (k+1,j), dla wszystkich k od i do j. To jednak w konsekwencji doprowadziłoby do dalszych rekurencyjnych wywołań, przy czym wiele ze spotkanych podproblemów powtarzałoby się.

Na rysunku 14.1 przedstawiliśmy fragment drzewa możliwych rekurencyjnych wywołań przy obliczaniu m(1,6). Drzewo to ma dwa typy wierzchołków: wierzchołki z etykietami i-j, odpowiadające wywołaniu rekurencyjnemu funkcji m(i,j), oraz wierzchołki oznaczone pojedynczą liczbą, wskazującą podział aktualnego zadania na dwa podzadania. Zauważmy, że w wielu wierzchołkach występują te same wskaźniki. Oznacza to ponowne wykonanie tego samego rekurencyjnego obliczenia.

Pytanie 2: Jaki byłby koszt algorytmu rekurencyjnego obliczania wszystkich wartości m(i,j)?

Rzeczywiście, obliczenie wartości m(1,n) moglibyśmy oszacować za pomocą funkcji rekurencyjnej T(n), takiej że T(1) ³1, T(n) ³ (1+ S_k=1,...,n-1(T(k) + T(n-k) + 1) dla n>1. Zakładamy, że na wykonanie instrukcji początkowych oraz porównania przy wyborze minimum potrzebujemy jednostkę czasu. Łatwo sprawdzić, że musi być T(n) ³ 2^n-1, tzn . rozwiązaniem jest funkcja rosnąca co najmniej tak szybko jak 2^n-1. A więc koszt obliczenia wartości m(1,n) byłby wykładniczy.

Wyciągnijmy jednak z tych rozważań wniosek pozytywny: skoro podproblemy, które musimy rozważać powtarzają się, nasz problem ma własność wspólnych podproblemów. Jeszcze jeden sygnał, że być może metoda programowania dynamicznego da dobre rezultaty. Zamiast więc powtarzać obliczenia wielokrotnie dla tych samych podproblemów, zapamiętajmy wcześniej wyliczone wartości w tablicy.

Kłopot polega teraz tylko na ustaleniu, w jakim porządku wyliczać wielkości m(i,j). Zauważmy, że przy obliczaniu m(i,j) korzystamy we wzorze (**) z wartości m(i,i), m(i,i+1),...,m(i,j-1) oraz z wartości m(i+1,j), m(i+2,j),..., m(j,j). Są to elementy i-tego wiersza i j-tej kolumny. Wynika stąd, że wyliczenie m(i,j) powinniśmy wykonywać wzdłuż diagonali, zgodnie z numeracją przedstawioną na rysunku 14.2 Otrzymujemy stąd następujący algorytm:

{
	for i := 1 to n do m(i,i) := 0;	//inicjalizacja diagonali
	for l :=2 to n do	// l= numer diagonali
	for i := 1 to n-l+1 do	//kolejne pozycje l-tej diagonali
	j := i + l - 1 ;
	m(i,j) := +¥ ;
	for k := i to j-1 do	//szukamy najlepszego podziału
	q := m(i,k) + m(k+1,j) + p_i-1p_k p_j;
	if q< m(i,j) then m(i,j) := q; s(i,j):= k fi	//s(i,j) zapamiętujemy indeks, przy którym osiągnięto minimum
	od
	od
	od
}

W algorytmie występują trzy zagnieżdżone pętle. Każda z nich wykonuje się rzędu O(n) razy, zatem koszt czasowy algorytmu można oszacować przez O(n³). Koszt pamięciowy natomiast jest kwadratowy O(n²) i związany jest z koniecznością zapamiętania wartości m(i,j) oraz s(i,j).

Przypuśćmy, że mamy sześć macierzy A₁ (4 ´ 2), A₂ (2´ 3), A₃ (3 ´ 1), A₄ (1 ´ 2),A₅ (2 ´ 2), A₆ (2 ´ 3) i chcemy obliczyć iloczyn A₁ ´ A₂ ´ ... ´ A₆. Obliczmy zgodnie z algorytmem MM minimalną liczbę mnożeń skalarnych, którą trzeba wykonać przy obliczaniu tego iloczynu. W tabeli na rysunku 14.3 przedstawiliśmy wartości m(i,j), a wartości najlepszych podziałów w tablicy s. Na przykład do policzenia m(2,5) potrzebujemy wartości:

Najmniejsza wartość to 14 i dlatego m(2,5) = 14. Ponieważ została ona osiągnięta, gdy k=3 (tzn. nawias postawiono po trzeciej macierzy) więc s(2,5)= 3. Optymalne ustawienie nawiasów w tym przykładzie wygląda następująco :

A₁ ´ A₂ ´ ... ´ A₆= (A₁ ´ (A₂ ´ A₃)) ´ ((A₄ ´ A₅) ´ A₆).

Mając wszystkie wartości s(i,j) dla i<j możemy wypisać optymalne nawiasowanie. Następujący rekurencyjny algorytm "wypisz" odczytuje z tablicy s pozycje, w których mają być umieszczone nawiasy w optymalnym nawiasowaniu.

wypisz( i,j : int){
	if (i = j) then
	write (i)	// wypisujemy numer macierzy, która ma w tym miejscu występować.
	else
	if (i < j) then
	write("(");
	wypisz (i, s(i,j));	//wypisz optymalne ustawienie nawiasów w ciągu i,...,s(i,j)
	write("´");
	wypisz(s(i,j)+1, j);	//wypisz optymalne ustawienie nawiasów w ciągu s(i,j)+1,...,j
	write(")");
	fi;
	fi }

Skoro umiemy wypisać optymalny układ nawiasów, to możemy tę wiedzę wykorzystać, wykonując w odpowiedniej kolejności mnożenie macierzy. Algorytm wyliczania iloczynu łańcucha macierzy, korzystający z tablicy najlepszego nawiasowania s przedstawiono jako rekurencyjną funkcję mult. Zakładamy, że dany jest łańcuch macierzy A₁, A₂, ..., A_n, dla którego wyliczono wcześniej najlepsze nawiasowanie zapamiętane w tablicy s(i,j). Wynikiem tej funkcji jest iloczyn A₁ ´ A₂ ´ ... ´ A_n, a liczba mnożeń użyta do wyliczenia tego iloczynu jest najmniejsza z możliwych.

mult( i,j : int){
	if (i < j) then
	X := mult (i, s(i,j) );
	Y := mult (s(i,j)+1, j)
	return X ´ Y;
	else
	return A_i
	fi;
}

Pytanie 3: Rozważmy macierze A₁ (4 ´ 2), A₂ (2´ 300), A₃ (300 ´ 1), A₄ (1 ´ 2),A₅ (2 ´ 2), A₆ (2 ´ 300). Jaka jest minimalna liczba mnożeń skalarnych potrzebna do obliczenia iloczynu A₁ ´ A₂ ´ ... ´ A₆?