Programowanie

Heurystyka

Heurystyka

Heurystyka – w logice umiejętność wykrywania nowych faktów oraz znajdywania związków między faktami, zwłaszcza z wykorzystaniem hipotez. Na podstawie istniejącej wiedzy stawia się hipotezy, których nie trzeba udowadniać.

W informatyce metoda znajdowania rozwiązań, dla której nie ma gwarancji znalezienia rozwiązania optymalnego, a często nawet prawidłowego. Rozwiązań tych używa się np. wtedy, gdy pełny algorytm jest z przyczyn technicznych zbyt kosztowny, lub gdy jest nieznany (np. przy przewidywaniu pogody lub przy wykrywaniu niektórych zagrożeń komputerowych, takich jak wirusy lub robaki). Metody używa się też często do znajdowania rozwiązań przybliżonych, na podstawie których później wylicza się ostateczny rezultat pełnym algorytmem. To ostatnie zastosowanie szczególnie dotyczy przypadków, gdy heurystyka jest wykorzystywana do nakierowywania pełnego algorytmu ku optymalnemu rozwiązaniu, aby zmniejszyć czas działania programu w typowym przypadku bez poświęcania jakości rozwiązania (np. algorytm A*).

Spis treści

[edytuj] Geneza, znaczenie oraz zastosowanie pojęcia heurystyka

Wywodzące się z języka greckiego, najczęściej kojarzone ze słynnym okrzykiem Archimedesa, pojęcie heurystyka (gr. Heuresis – odnaleźć, odkryć, heureka – znaleźć) związane jest z filozofią, logiką, pedagogiką, psychologią, sztuczną inteligencją, teorią informacji oraz metodami przeszukiwania i oceny jakości interfejsów zasobów informacyjnych w Internecie.

W szerokim ujęciu heurystyka jest nazwą dziedziny wiedzy, której cel stanowi poszukiwanie i badanie optymalnych metod oraz reguł odnajdywania odpowiedzi na stawiane zapytania lub problemy.

Wielka Encyklopedia PWN heurystykę definiuje jako umiejętność wykrywania nowych faktów i związków między faktami, zwłaszcza czynność formułowania hipotez. Zgodnie z Wielką Encyklopedią Multimedialną heurystyka to sztuka wykrywania nowych faktów oraz związków występujących pomiędzy nimi, prowadząca do odkrywania nowych prawd i stawiania hipotez.

Zdaniem Anety Firlej-Buzon najszerszą definicję podaje Encyklopedia Katolicka: to teoria metod rozwiązywania zagadnień, wiedza dotycząca sposobu dokonywania odkryć naukowych (stawiania hipotez i konstrukcji nowych teorii), podająca przepisy normujące twórczość naukową; umiejętność stosowania reguł (reguły efektywnego postępowania) sterująca procesami myślowymi, dzięki którym człowiek generuje pomysły rozwiązania nowych problemów; najczęściej występuje jako ars inveniendi – sztuka odkrywania rozwiązań pojedynczych zadań, dziś stosowana w logice, pedagogice. Mnogość i różnorodność dyscyplin, które wykorzystują heurystykę sprawia, że nie istnieje jedno arbitralne określenie przedstawionego pojęcia.

[edytuj] Podstawowe własności heurystyki

Oprócz rzeczownika heurystyka często wykorzystywany jest również przymiotnik heurystyczny, który charakteryzuje proces jako postępowanie badawcze, odkrywcze, wspomagające, uzupełniające, doskonalące czy rozwijające wiedzę zdobytą w określonym zakresie.

[edytuj] Heurystyka w wyszukiwaniu informacji

Wyszukiwaniem informacji nazywamy proces przeszukiwania określonego zbioru dokumentów odnoszących się do tematu czy przedmiotu wskazanego w zapytaniu lub zawierających konieczne dla użytkownika fakty. Proces ten nie został jednak precyzyjnie i skończenie określony przez wzory, normy czy algorytmy i w dużej mierze opiera się na heurystykach w tym wypadku definiowanych jako zbiór reguł oraz wskazówek, które mogą, lecz nie muszą, prowadzić do właściwego rozwiązania.

W tym miejscu warto rozróżnić pojęcie algorytmu od heurystyki, heurystyk czy metod heurystycznych. Algorytm to w szerokim ujęciu każdy regularny proces, który w skończonej liczbie kroków daje rozwiązanie określonej klasy zagadnień; prosty, jednoznaczny, pewny i skończony opis toku postępowania; dokładny przepis podający sposób rozwiązania konkretnego zadania w skończonej liczbie kroków lub zbiór poleceń odnoszących się do pewnych obiektów, ze wskazaniem porządków w jakim mają być realizowane. Zasadnicza różnica między postępowaniem algorytmicznym a heurystycznym polega na tym, że pierwsze podejście zawsze daje rozwiązanie (choć czas oczekiwania na rozwiązanie może być nawet nieskończenie długi), podczas gdy podejście twórcze może być zawodne. Ze względu na to metody algorytmiczne stosowane są najczęściej w przypadku zbadanych, znanych już problemów, heurystyczne natomiast wszędzie tam, gdzie algorytmy nie wystarczają do rozwiązania zadania, gdzie wymagane są uzupełnienia, poszukiwane nowe metody i sposoby odnajdywania odpowiedzi czy rozwiązania zapytań.

Heurystyka informacyjna dotyczy więc tego, jak szybko i efektywnie wyszukać dokładnie tę informację, której użytkownik potrzebuje oraz tego, z jakich narzędzi, pamięci lub sprzętów służących do procesu poszukiwawczego będzie korzystał. Optymalne dotarcie do rozwiązania określa szybkość oraz cenę dostępu do właściwego wyniku, czyli odnalezienie dokumentów relewantnych przy minimalnej liczbie operacji w procesie wyszukiwania.

Dwie naczelne zasady heurystyki informacyjnej to:

  1. zasada wyczerpania (kompletności);
  2. zasada właściwego doboru materiału (relewantności).

Pożądany stopień trafności i kompletności zależy w dużej mierze od przeznaczenia wykorzystania informacji, tzn. do czego informacja jest w rzeczywistości potrzebna. Nie zawsze użytkownikowi zależy w jednakowym stopniu na osiągnięciu dużej trafności i kompletności wyszukiwania, tym bardziej, że podniesienie jednego wskaźnika powoduje z reguły obniżenie drugiego, tj. zwiększenie trafności obniża kompletność i odwrotnie. Przy ustalaniu zdolności potrzeb informacyjnych pamiętać należy, że istotną cechą relewantności jest jej subiektywny charakter, jest to jednak podstawowa cecha każdej informacji, która nie może istnieć bez odbiorcy.

[edytuj] Strategia wyszukiwawcza

Dwie wymienione wyżej zasady obligują do przyjęcia określonej, optymalnej strategii wyszukiwawczej, tzn. takiego formułowania instrukcji wyszukiwawczej i ustalania kolejności poszukiwań, aby zidentyfikować maksymalną liczbę relewantnych dokumentów pochodnych istniejących w zbiorze przy minimalnej liczbie operacji identyfikowania, czyli przekształcania zbioru. Inaczej mówiąc, jest to plan układu i kolejności stawiania pytań przez przeszukującego w trakcie realizacji określonego zapotrzebowania na informację.

Zgodnie z 4 podstawowymi heurystykami wyszukiwania informacji należy:

  1. wybraną strategię traktować jako hipotezę, próbę odgadnięcia sposobu zaindeksowania poszukiwanego tematu,
  2. początkowo uzyskane wyniki przeglądać pod kątem odnalezienia innych niż przyjęte możliwości wyszukiwawcze,
  3. wykorzystywać wszelkie alternatywne strategie wyszukiwania,
  4. )nie zakładać, iż dane w bazie danych są indeksowane w sposób optymalny dla użytkownika

Z pojęciem strategii wyszukiwawczej związek mają inne:

[edytuj] Potrzeby informacyjne użytkownika

Służenie pomocą użytkownikom w odnajdywaniu informacji jest celem działalności informacyjnej. W procesie przepływu informacji pełni ona funkcję pośrednika między źródłem a odbiorcą. Przekazuje informacje lub dokumenty z informacjami w nich zawartymi użytkownikom, a od nich przyjmują dezyderaty wyrażające ich potrzeby informacyjne. Użytkownikiem może być osoba lub instytucja. Może być nim student przystępujący do egzaminu, początkujący pracownik naukowy lub zaawansowany badacz, naukowiec lub praktyk. Każdy z nich będzie mieć inne zapotrzebowania informacyjne, gdyż każdy z nich potrzebuje informacji w innym celu i na innym poziomie.

Aby w pełni i skutecznie zaspokoić te zindywidualizowane zapotrzebowania informacyjne, centralnym punktem zainteresowania placówek i serwisów informacyjnych powinien być użytkownik ze swoimi wciąż zmieniającymi się potrzebami. Należy pamiętać, że nawet najlepiej, najpełniej, najtrafniej i najbardziej atrakcyjnie przygotowana informacja nie ma znaczenia, nim nie trafi do właściwego odbiorcy i zanim odbiorca nie przekształci się w użytkownika, wykorzystując otrzymane informacje. Potrzeby informacyjne są wielkościami dynamicznymi, zmieniającymi się oraz zróżnicowanymi, zależnymi od wielu czynników subiektywnych i obiektywnych. Czynniki subiektywne związane są osobowością użytkownika, jego wiekiem, uzdolnieniami, poziomem i rodzajem wykształcenia, znajomością języków obcych, doświadczeniem, zainteresowaniami itp. Czynniki obiektywne to między innymi rodzaj i charakter pracy, pełnione funkcje, przeznaczenie wykorzystania informacji. Użytkowników można podzielić według wielu kryteriów: według rodzajów wykształcenia, wykonywanego zawodu (zajęcia), zajmowanych stanowisk (pełnionych funkcji), przygotowania do samodzielnego prowadzenia wyszukiwań, wieku, poziomu wykształcenia itd. Tak więc znajomość potrzeb informacyjnych odbiorców ma istotne znaczenie dla efektywności działalności informacyjnej. Od trafnego określenia tych potrzeb zależy w dużej mierze znalezienie właściwych możliwości ich zaspokojenia.

[edytuj] Skuteczność wyszukiwania informacji

Skuteczność efektów procesu poszukiwania można zmierzyć przy pomocy następujących wskaźników określających:

[edytuj] Rodzaje poszukiwań

Dwie podstawowe metody wyszukiwania to:

W razie niepowodzenia, jeśli okaże się że w danym zbiorze nie ma poszukiwanego dokumentu, można skorzystać z katalogów centralnych, zawierających informacje o zbiorach większej liczby bibliotek. Jeżeli dokument nie jest dostępny na terenie kraju, należy poszukiwać go przez zagraniczne drukowane katalogi czołowych bibliotek lub katalogi centralne i starać się o sprowadzenie dokumentu za pośrednictwem macierzystej biblioteki w ramach wypożyczeń międzybibliotecznych. Nieco trudniejsze jest wyszukiwanie rzeczowe, na określony temat. Jeżeli mają to być informacje ogólne, poszukiwania mogą się ograniczyć do przejrzenia encyklopedii lub słowników. Jeśli jednak informacja ma być szczegółowa, strategia wyszukiwawcza musi być bardziej skomplikowana. Tak jak w poprzedniej sytuacji warto zajrzeć do encyklopedii lub słowników, gdyż informacje tam zdobyte pozwolą nam umiejscowić przedmiot zainteresowania w systematyce nauk. Poszukiwania należy rozpocząć teraz od katalogów rzeczowych. Należy znaleźć termin odzwierciedlający obiekt zainteresowania, ustalić odpowiadające mu hasła i odszukać je w katalogu alfabetycznym.

Wskaźniki efektywności działań wyszukiwawczych są konsekwencją zastosowanych sposobów wyszukiwania informacji, z których najbardziej popularne to:

Jeżeli stosowane rodzaje wyszukiwania informacji nie zapewniają pożądanych efektów, użycie odpowiednich heurystyk może przyczynić się do zwiększenia liczby odwołań lub wzrostu precyzji odpowiedzi. Aby poprawić pierwszy z przytoczonych wyżej wskaźników efektywności działań wyszukiwawczych należy stosować reguły, które uwzględniają:

[edytuj] Zobacz też