Извличане на информация
From Wikipedia, the free encyclopedia
Извличане на информация (на френски: recherche d'information, на английски: information retrieval [1][2]) е област от информатиката и компютърната лингвистика, чийто предмет е извличането на документи, на информация от документи и на метаданни за документите, чрез търсене в релационни бази данни и Интернет. Областта е интердисциплинарна, на границата между информатиката, математиката, библиотечното дело, когнитивната психология, лингвистиката, статистиката и физиката.
Съществува известно припокриване между понятията извличане на информация, извличане на данни, извличане на текст, извличане на знания от данни (сондиране на данни, data mining), но за всяко от тях може да се посочи самостоятелен корпус от научна литература, теоретико-приложни резултати и технологии.
Автоматизираните системи за извличане на информация се използват, за да се намалят ефектите от феномена „информационно пренасищане“. Най-популярните приложения за извличане на информация са уеб-базираните търсачки. Много университети и публични библиотеки използват такива системи, за да осигурят достъп до книги, списания и други документи.