Tomasz Jach
Systemy wspomagania decyzji. Wydawnictwo Uniwersytetu Śląskiego, Katowice, 2009, s. 369-376
Publication year: 2009

W pracy przedstawiono proces sprawdzania poprawności słów dla języka polskiego (będącego przykładem języka fleksyjnego, a co za tym idzie – trudnego do automatycznej analizy słownikowej) oraz angielskiego. Przybliża się również największe problemy związane z tym procesem, omawia sposób działania programu Hunspell (wykorzystywanego m.in w Firefoxie, Thunderbirdzie i OpenOffice’ie), budowę i sposób generowania list słów oraz wzorców odmiany (z dokonaniem porównania ilościowego złożoności tychże plików dla języka angielskiego i polskiego).

W podsumowaniu nakreśla się możliwość wykorzystywania Hunspella do analizy semantycznej tekstu, docelowo – do automatycznej analizy dokumentów pod kątem grupowania na podstawie automatycznie generowanych słów kluczowych.