بالاترین سوالات
زمانبندی
چت
دیدگاه
بازیابی سند
از ویکیپدیا، دانشنامه آزاد
Remove ads
بازیابی سند (انگلیسی: Document retrieval)، رساندن مدرک یا سند ذیربط در موضوعی خاص به متقاضی آن است.
بازیابی سند
بازیابی سند به عنوان تطبیق برخی از پرس و جوهای اعلام شده کاربر با مجموعه ای از رکوردهای متن آزاد تعریف میشود.
بازیابی سند گاهی به عنوان شاخه ای از بازیابی متن نامیده میشود. بازیابی متن شاخه ای از بازیابی اطلاعات است که در آن اطلاعات عمدتاً به صورت متن ذخیره میشود. پایگاه دادههای متنی به لطف رایانه شخصی غیرمتمرکز شدند. امروزه بازیابی متن یک حوزه مهم مطالعه است، زیرا اساس اساسی همه موتورهای جستجوی اینترنتی است.
Remove ads
پایگاه داده
یک سیستم بازیابی اسناد شامل یک پایگاه داده از اسناد، یک الگوریتم طبقهبندی برای ایجاد یک فهرست متن کامل و یک رابط کاربری برای دسترسی به پایگاه دادهاست.
یک سیستم بازیابی اسناد دو وظیفه اصلی دارد:
- اسناد مربوط به درخواستهای کاربر را بیابید
- نتایج تطبیق را ارزیابی کنید و با استفاده از الگوریتمهایی مانند PageRank، آنها را بر اساس ارتباط مرتب کنید.
موتورهای جستجوی اینترنتی کاربردهای کلاسیک بازیابی اسناد هستند. اکثریت قریب به اتفاق سیستمهای بازیابی که در حال حاضر استفاده میشوند، از سیستمهای ساده بولی گرفته تا سیستمهایی با استفاده از تکنیکهای پردازش آماری یا زبان طبیعی را شامل میشوند.
Remove ads
تغییرات
دو دسته اصلی از طرحوارههای نمایه سازی برای سیستمهای بازیابی اسناد وجود دارد: نمایه سازی مبتنی بر فرم (یا مبتنی بر کلمه)، و نمایه سازی مبتنی بر محتوا. طرح طبقهبندی اسناد (یا الگوریتم نمایه سازی).
فرم
الگوریتم درخت پسوند نمونه ای برای نمایه سازی مبتنی بر فرم است.
پابمد
موتور جستجوی PubMed[۱] در جستجوی موضوعات از طریق مقایسه کلمات از عنوان اسناد، چکیده، و اصطلاحات MeSH با استفاده از یک الگوریتم وزنی کلمه کار میکند.[۲]
جستارهای وابسته
منابع
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads