بالاترین سوالات
زمانبندی
چت
دیدگاه

بازیابی سند

از ویکی‌پدیا، دانشنامه آزاد

Remove ads

بازیابی سند (انگلیسی: Document retrieval)، رساندن مدرک یا سند ذیربط در موضوعی خاص به متقاضی آن است.

بازیابی سند

بازیابی سند به عنوان تطبیق برخی از پرس و جوهای اعلام شده کاربر با مجموعه ای از رکوردهای متن آزاد تعریف می‌شود.

بازیابی سند گاهی به عنوان شاخه ای از بازیابی متن نامیده می‌شود. بازیابی متن شاخه ای از بازیابی اطلاعات است که در آن اطلاعات عمدتاً به صورت متن ذخیره می‌شود. پایگاه داده‌های متنی به لطف رایانه شخصی غیرمتمرکز شدند. امروزه بازیابی متن یک حوزه مهم مطالعه است، زیرا اساس اساسی همه موتورهای جستجوی اینترنتی است.

Remove ads

پایگاه داده

یک سیستم بازیابی اسناد شامل یک پایگاه داده از اسناد، یک الگوریتم طبقه‌بندی برای ایجاد یک فهرست متن کامل و یک رابط کاربری برای دسترسی به پایگاه داده‌است.

یک سیستم بازیابی اسناد دو وظیفه اصلی دارد:

  1. اسناد مربوط به درخواست‌های کاربر را بیابید
  2. نتایج تطبیق را ارزیابی کنید و با استفاده از الگوریتم‌هایی مانند PageRank، آنها را بر اساس ارتباط مرتب کنید.

موتورهای جستجوی اینترنتی کاربردهای کلاسیک بازیابی اسناد هستند. اکثریت قریب به اتفاق سیستم‌های بازیابی که در حال حاضر استفاده می‌شوند، از سیستم‌های ساده بولی گرفته تا سیستم‌هایی با استفاده از تکنیک‌های پردازش آماری یا زبان طبیعی را شامل می‌شوند.

Remove ads

تغییرات

دو دسته اصلی از طرحواره‌های نمایه سازی برای سیستم‌های بازیابی اسناد وجود دارد: نمایه سازی مبتنی بر فرم (یا مبتنی بر کلمه)، و نمایه سازی مبتنی بر محتوا. طرح طبقه‌بندی اسناد (یا الگوریتم نمایه سازی).

فرم

الگوریتم درخت پسوند نمونه ای برای نمایه سازی مبتنی بر فرم است.

پاب‌مد

موتور جستجوی PubMed[۱] در جستجوی موضوعات از طریق مقایسه کلمات از عنوان اسناد، چکیده، و اصطلاحات MeSH با استفاده از یک الگوریتم وزنی کلمه کار می‌کند.[۲]

جستارهای وابسته

منابع

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads