کاربر:Parsa.nyb/سلسله مراتب حافظه نهان

این مقاله در حال ترجمه از ویکی انگلیسی است لطفا حذف نشود. سلسله مراتب حافظه نهان یا کش های چند سطحی به معماری حافظه ای اشاره دارد که از سطوح مختلف از کش ها براساس دسترسی سریعتر به داده ها استفاده می‌ کند . داده‌ های پر استفاده در حافظه‌های سطح پایین تر ذخیره می‌شوند و امکان دسترسی سریع‌تر توسط هسته‌های واحد پردازش مرکزی (CPU) را فراهم می‌کنند.

سلسله مراتب کش یک مدل حافظه و بخشی از سلسله مراتب حافظه است و می توان آن را نوعی ذخیره سازی لایه ای در نظر گرفت. ^[1] هدف از این شکل لایه ای باتوجه به تأخیر دسترسی به حافظه اصلی، ایجاد دسترسی سریعتر هسته‌های CPU به داده ها است . تاخیر دسترسی به حافظه اصلی یک سرعتگیر در عملکرد هسته های CPU است چرا که CPU منتظر داده است و در این فاصله کاری انجام نمیدهد، هنگامی که هزینه دسترسی سریع به تمامی حافظه اصلی می‌تواند بسیار پرهزینه باشد. حافظه نهان سریع راهکاری است که امکان دسترسی پرسرعت به داده هایی را که بیشتر توسط CPU استفاده می شود، فراهم می کند و باعث می شود تا نرخ کلاک پردازنده سریعتر شود. ^[2]

در تاریخ توسعه کامپیوتر و تراشه های الکترونیکی، دوره ای وجود داشت که افزایش سرعت CPU از بهبود سرعت دسترسی به حافظه پیشی گرفت. ^[3] تاخیر حافظه نسبت به پردازنده به این معنی است که CPU اغلب بیکار است. ^[4] پیشرفت CPU ها باعث شده بود تا آنها به مقدار قابل توجهی قادر به اجرای دستورهای بیشتری در یک زمان معین بودند، اما زمان مورد نیاز برای دسترسی به داده ها از حافظه اصلی مانع از بهره مندی کامل برنامه ها از این ظرفیت می شد. ^[5] این موضوع انگیزه توسعه حافظه های جدید با دسترسی سریعتر و آسان تر جهت استفاده حداکثری از پتانسیل پردازنده های سریعتر را ایجاد کرد. ^[6]

این منجر به مفهوم حافظه نهان شد که اولین بار توسط موریس ویلکس ، دانشمند کامپیوتر بریتانیایی در دانشگاه کمبریج در سال 1965 ارائه شد. او چنین مدل های حافظه ای را حافظه برده ای (slave memory) نامید. ^[7] تقریباً بین سال‌های 1970 و 1990، مقالاتی از آنانت آگاروال ، آلن جی اسمیت ، مارک دی هیل ، توماس آر پوزاک و دیگران درباره طراحی‌های حافظه کش بهتر بحث کردند. اولین مدل‌های حافظه نهان در آن دوره ساخته و به کارگرفته شدند، اما حتی زمانی که محققان در حال پژوهش و ساخت مدل های بهتر از حافظه کش بودند، نیاز به مدل‌های حافظه سریع‌تر همچنان ادامه داشت. دلیل نیاز به کش های سریعتر این است که اگرچه سرعت دسترسی به حافظه به کمک کش تا حد بسیار خوبی کاهش می یابد اما امکان ساخت کش با ظرفیتی حتی نزدیک به حافظه اصلی اصلا به صرفه نیست و حتی از لحاظ فنی مشکل است. از سال 1990 به بعد، ایده هایی مانند افزودن حافظه نهان سطح دوم، به عنوان پشتیبان برای حافظه نهان سطح اول ارائه شد. ژان لوپ بائر ، ون هان وانگ، اندرو دبلیو. ویلسون و دیگران تحقیقاتی را در مورد این مدل انجام داده‌اند. بعد از چندین شبیه سازی و پیاده سازی و مشخص شدن مزایای کش دو سطحی را نشان دادند، مفهوم کش چند سطحی به عنوان یک مدل جدید و به طور کلی بهتر از حافظه های کش مورد توجه قرار گرفت. از سال 2000، مدل‌های کش چند سطحی مورد توجه گسترده قرار گرفته‌اند و در حال حاضر در بسیاری از سیستم‌ها پیاده سازی می‌شوند، مانند کش‌های سه سطحی که در محصولات Core i7 اینتل وجود دارند. ^[8]

زمان صرف شده برای دسترسی به حافظه اصلی برای هر اجرای دستورالعمل ممکن است بسته به سرعت کلاک سیستم برای یافتن و قراردادن داده ها، منجر به کند شدن پردازش شود. به منظور پنهان کردن این تاخیر حافظه از پردازنده، از کش داده ها استفاده می شود. ^[9] هر زمان که داده مورد نظر در پردازنده نیاز باشد، از حافظه اصلی در حافظه کوچکتر به نام کش منتقل شده و ذخیره می شود. هنگامی که استفاده از آن داده نیاز می‌شود، در ابتدا در حافظه نهان جستجو شده و سپس در صورت عدم وجود در حافظه اصلی جستجو می‌شود. ^[10] در این صورت سرعت پردازش پردازنده با سرعت بارگیری داده در پردازنده متناسب تر از حافظه اصلی است. ^[11] مزایای استفاده از حافظه نهان را با محاسبه متوسط زمان دسترسی(AAT) به حافظه در ساختار حافظه نهان چند سطحی اثبات کرد. ^[12]

متوسط زمان دسترسی (AAT)

از آنجایی که حافظه نهان، از لحاظ اندازه از حافظه اصلی بسیار کوچک تر است ، ممکن است جستجوی داده در آن نا موفق باشد و داده مورد نظر در کش موجود نباشد. در این صورت نیاز است تا این داده از حافظه اصلی فراخوانی شود. از این رو، متوسط زمان دسترسی تحت تأثیر میزان موفقیت جستجو در هر ساختاری است که از آن داده‌ها را جستجو می‌کند.

{\text{AAT}}={\text{hit time}}+(({\text{miss rate}})\times ({\text{miss penalty}}))

از این رو میانگین زمان دسترسی به داده از رابطه زیر محاسبه می‌شود:

زمان دسترسی به کش + ( ضریب شکست جستجو در کش × زمان دسترسی به حافظه اصلی پس از شکست جستجو در کش ).

زمان دسترسی به حافظه پنهان بسیار کمتر از زمان دسترسی به حافظه اصلی می‌باشد، به همین دلیل متوسط زمان دسترسی با حضور کش در ساختار با اختلاف قابل توجهی از زمان دسترسی به حافظه اصلی کمتر است. ^[13]

مصالحه

با اینکه استفاده از کش به طور متوسط تاخیر حافظه را کاهش می‌دهد اما گاهی ممکن است به دلیل نحوه سازماندهی و جستجو در حافظه نهان، زمان واکشی داده ها سریعتر نباشد . مثلا، حافظه های نهان با نقشه مستقیم که اندازه یکسانی دارند، معمولاً نسبت به کش های کاملاً ارتباطی، نرخ اشتباه بالاتری دارند. البته این موضوع می‌تواند به الگوی دستورهای کامپیوتر نیز مربوط باشد اما به طور کلی کش هایی با ساختار کاملا مرتبط انرژی بیشتر مصرف کرده اما ضریب موفقیت بالاتری دارند. در هرصورت برقراری تعادل میان مصرف انرژی و گرمای مربوطه به میزان موفقیت الزامی است . ^[14]

سیر تکاملی

در صورت عدم جستجوی موفق در حافظه پنهان، هدف از استفاده از چنین ساختاری کاملا بی فایده است و پردازنده باید برای لود کردن داده های مورد نیاز به حافظه اصلی مراجعه کند. با این حال، با یک کش چند سطحی ، اگر کامپیوتر داده را در نزدیکترین کش به پردازنده یعنی کش L1 از دست بدهد آن را در سطح دوم یا سوم یا بالاتر جستجو می‌کند و در آخرین مرحله در صورت شکست در تمامی حافظه ها به حافظه اصلی جستجو می‌کند. روند کلی این است که حافظه نهان سطح یک با ظرفیت کم و در فاصله 1 تا 2 سیکل ساعت پردازنده از پردازنده نگه داشته شود، در سطوح بالاتر حافظه نهان برای ذخیره بیشتر داده ها نسبت به L1 حجم بیشتری در نظر گرفته می‌شود، بنابراین در فاصله دورتری از پردازنده واقع شده اما نرخ شکست جستجو در آن کمتر است که خود منجر به متوسط زمان دسترسی بهتری می شود. ^[15] تعداد سطوح کش توسط معماران بر اساس نیازهای آنها پس از بررسی و ایجاد تعادل بین هزینه، متوسط زمان دسترسی و اندازه طراحی کرد. ^[16] ^[17]

دستاوردهای عملکردی

با پیشرفت فناوری مقیاس بندی ها که به ساختار حافظه ای امکان قراردادن تعداد بیشتری حافظه نهان در یک پردازنده می‌دهد، اکثر پردازنده‌های مدرن تا سه یا چهار سطح کش دارند. ^[18] کاهش متوسط زمان دسترسی را می توان با این مثال درک کرد، جایی که کامپیوتر متوسط زمان دسترسی را برای پیکربندی های مختلف تا حافظه نهان L3 بررسی می کند.

مثال: حافظه اصلی = ۵۰ نانوثانیه، کش سطح یک = ۱ نانوثانیه با ۱۰٪ نرخ شکست، کش سطح دو = ۵ نانوثانیه با ۱٪ نرخ شکست و کش سطح ۳ با ۰.۲٪ نرخ شکست.

بدون کش، AAT = 50 ns
حافظه نهان سطح ۱ ، AAT = 1ns + (0.1 × 50 ns) = 6 ns
حافظه نهان سطح ۱ و ۲ ، AAT = 1 ns + (0.1 × [5 ns + (0.01 × 50 ns)]) = 1.55 ns
حافظه نهان سطح ۱ تا ۳ ، AAT = 1 ns + (0.1 × [5 ns + (0.01 × [10 ns + (0.002 × 50 ns)])]) = 1.5101 ns

معایب

حافظه کش هزینه نهایی بیشتری نسبت به حافظه اصلی دارد و بنابراین می تواند هزینه کل سیستم را افزایش دهد. ^[19]
داده‌های ذخیره‌شده تنها تا زمانی ذخیره می‌شوند که اتصال برق به کش برقرار باشد.
افزایش سطح روی تراشه مورد نیاز برای سیستم حافظه. ^[20]
عدم کاربرد سیستم کش در برنامه های بزرگ با موقعیت زمانی ضعیف، که اغلب به حافظه اصلی نیازدارند. ^[21]

کش جدا شده دربرابر یکپارچه

در یک کش جدا شده، حافظه نهان به دو بخش ذخیره سازی دستورالعمل ها و یک بخش اختصاص داده شده به داده ها تقسیم می شود. در مقابل، یک کش یکپارچه حاوی دستورالعمل ها و داده ها در یک بخش است. ^[22] در طول یک فرآیند، حافظه نهان L1 (یا نزدیکترین سطح حافظه نهان به پردازنده) برای بازیابی دستورالعمل ها و داده های موردنیاز گاهی نیاز به اقدام به چند پورت و استفاده همزمان از داده و دستورالعمل دارد که اجرای این فرآیند در یک کش یکپارچه زمان دسترسی بیشتری می‌طلبد. داشتن چندین پورت بیشتر نیازمند سخت افزار بیشتر و سیم کشی بیشتر است که ساختار پردازنده را تغییر می دهد. ^[23] برای جلوگیری از این مشکلات، حافظه نهان سطح یک بیشتر اوقات یک کش جدا شده است تا از پورت های کمتر و سخت افزار کمتر استفاده شده و زمان دسترسی کاهش یابد. ^[14]

پردازنده‌های مدرن دارای حافظه‌های پنهان جدا شده هستند و سیستم هایی با ساختار حافظه پنهان چند سطحی، حافظه‌های پنهان سطح بالاتر ممکن است یکپارچه شوند در حالی که سطوح پایین‌تر به دوبخش تقسیم می‌شوند. ^[24]

ساختار دربرگیری لایه ای

شرط اینکه آیا یک بلاک کش که در لایه بالایی قرار دارد می‌تواند در کش پایینی نیز وجود داشته باشد یا خیر، توسط استراتژی دربرگیری سیستم حافظه ای مشخص می شود، که می‌تواند، انحصاری(کاملا جدا) یا غیر انحصاری(دربرگرفته شده توسط لایه بالاتر) یا غیرفراگیر و غیر انحصاری (NINE) باشد.

در یک استراتژی دربرگیرنده، تمام بلوک های موجود در کش سطح بالاتر باید در حافظه نهان سطح پایین نیز وجود داشته باشند. و در واقع هر جز حافظه سطح بالایی حاوی حافظه نهان سطح پایینی است. در این حالت، از آنجایی که حافظه ها تکراری هستند، مقداری از حافظه در هر سطح کش هدر می رود. با این حال مزیت این روش تاخیر کمتر در دسترسی به حافظه است.

تحت یک استراتژی انحصاری کش، تمام سطوح و لایه های حافظه نهان از یکدیگر کاملا جدا شده و انحصاری هستند، به صورتی که هیچ بلوک تکراری در تمامی سطوح کش وجود ندارد و هیچ حافظه ای تکراری نیست. این امکان استفاده کامل از حافظه کش را فراهم می کند. با این حال، تاخیر دسترسی به حافظه بالا است. ^[25]

سیاست های فوق مستلزم رعایت مجموعه ای از قوانین برای اجرای آنها است. اگر این موارد به طول کامل اجرا نشوند یا به نحوی متفاوت اجرا شوند، سیاست دربرگیری حاصل را غیر فراگیر غیر انحصاری (NINE) می نامند. این بدان معنی است که کش سطح بالا ممکن است در حافظه نهان سطح پایین وجود داشته باشد یا نباشد.

خط مشی رونویسی

دو خط مشی وجود دارد که نحوه به روز رسانی یک بلوک کش تغییرکرده در حافظه اصلی را مشخص می‌کند: نوشتن مستقیم و نوشتن بازگشتی .

در مورد خط مشی نوشتن مستقیم، هر زمان که مقدار بلوک کش تغییر کند، در همان لحظه بقیه سطوح حافظه نیز تغییر کرده و اصلاح می‌شود. ^[26] این خط مشی تضمین می کند که داده ها به طور ایمن ذخیره می شوند، همانطور که در سراسر سطوح حافظه ذخیره شده اند.

با این حال، در مورد سیاست بازنویسی بازگشتی، بلوک تغییر یافته در کش هنگامی که تنها زمانی در سطوح پایینتر اپدیت خواهد شد که بلوک حافظه از کش خارج شود. به این صورت که یک "بیت کثیف"(dirty bit) به هر بلوک کش متصل شده و تا زمانی که بلوک کش اصلاح نشود باقی می ماند. ^[27] به هنگام خارج شدن، بلوک هایی از حافظه که در سطوح پایین با بیت کثیف مشخصه شده اند تغییر می‌کنند. تحت این سیاست، خطر از دست رفتن داده وجود دارد، زیرا آخرین نسخه تغییر یافته از یک داده تنها در کش ذخیره شده و در بخش های دیگر حافظه موجود نیست و بنابراین باید برخی از تکنیک های اصلاحی را رعایت کرد.

هنگام بازنویسی بایتی که در بلوک کش وجود ندارد، بایت می تواند طبق دو سیاست بازنویسی نوشتن تخصیصی یا نوشتن عدم تخصیصی به حافظه پنهان آورده شود. در سیاست حافظه تخصیصی در صورت اشتباه نوشتن یک بلوک، آن را از حافظه اصلی واکشی کرده و قبل از نوشتن در حافظه پنهان قرار می دهیم. ^[28] در سیاست نوشتن بدون تخصیص، اگر بلوک در حافظه نهان گم شود، درسطوح پایین تر حافظه بدون واکشی در حافظه پنهان نوشته میشود. ^[29]

اشتراکی در مقابل خصوصی

یک کش خصوصی تنها توسط یک هسته از پردازنده قابل دسترسی است و هیچ هسته دیگری نمی تواند به آن دسترسی داشته باشد. در برخی از معماری ها، هر هسته حافظه پنهان خصوصی خود را دارد. که البته این روش ممکن است به تکراری شدن بلوک های حافظه در هر کدام از کش های هسته ها شود و استفاده حداکثری از ظرفیت محقق نشود. با این حال، این نوع انتخاب طراحی در معماری کش چند لایه نیز می تواند برای کاهش زمان دسترسی به داده ها خوب باشد. ^[30] ^[31] ^[32]

کش اشتراکی به کشی اطلاق میشود که توسط چندین هسته قابل دسترسی است. ^[33] از آنجایی که تمامی هسته ها به کش دسترسی دارند و هیچ بلوک تکراری در کش وجود ندارد نرخ موفقیت در جستجوی بالاتری نسبت به کش خصوصی دارد. با این حال، هنگامی که چندین هسته برای دسترسی به حافظه پنهان اقدام می‌کنند، تاخیر دسترسی به داده ها می تواند افزایش یابد. ^[34]

در پردازنده‌های چند هسته‌ای ، عملکرد پردازنده بسته به طراحی مشترک یا خصوصی حافظه نهان می تواند متفاوت باشد. ^[35] در عمل، کش سطح بالایی L1 (یا گاهی اوقات L2) ^[36] ^[37] به صورت خصوصی و کش های سطح پایین به صورت اشتراکی پیاده سازی می شوند.مزیت این طراحی دسترسی بهتر و سریع تر برای کش های سطح بالا است و برای کش های سطح پایین نرخ موفقیت بیشتر در جستجو است. ^[35]

ریزمعماری اینتل برادول (2014)

حافظه نهان سطح یک (دستورالعمل و داده) - 64 کیلوبایت در هر هسته
حافظه نهان سطح دوم - 256 کیلوبایت در هر هسته
حافظه نهان سطح سوم - 2 مگابایت تا 6 مگابایت به اشتراک گذاشته شد
حافظه نهان سطح چهارم - 128 مگابایت eDRAM (فقط مدل‌های Iris Pro) ^[36]

ریزمعماری اینتل Kaby Lake (2016)

حافظه نهان سطح یک (دستورالعمل و داده) - 64 کیلوبایت در هر هسته
حافظه نهان سطح دو - 256 کیلوبایت در هر هسته
حافظه نهان سطح سه - 2 مگابایت تا 8 مگابایت به اشتراک گذاشته شده ^[37]

ریزمعماری AMD Zen (2017)

حافظه نهان سطح یک - 32 KB داده و 32 کیلوبایت دستورالعمل در هر هسته، 8 طرفه
حافظه نهان سطح دو – 512 کیلوبایت در هر هسته، شامل 8 جهت
حافظه نهان سطح سه – 16 مگابایت محلی به ازای هر CCX 4 هسته ای، 2 CCX در هر چیپلت، 16 جهته غیر فراگیر. تا 64 مگابایت در پردازنده های دسکتاپ و 256 مگابایت در پردازنده های سرور

ریزمعماری AMD Zen 2 (2019)

حافظه نهان سطح یک - 32 KB داده و 32 کیلوبایت دستورالعمل در هر هسته، 8 طرفه
حافظه نهان سطح دو – 512 کیلوبایت در هر هسته، شامل 8 جهت
حافظه نهان سطح سه – 16 مگابایت محلی به ازای هر CCX 4 هسته ای، 2 CCX در هر چیپلت، 16 جهته غیر فراگیر. تا 64 مگابایت در CPUهای دسکتاپ و 256 مگابایت در CPUهای سرور

IBM POWER7 (2010)

حافظه نهان سطح یک (دستورالعمل و داده) – هر بانک دارای 64 بانک است، هر بانک ۳۲ کیلوبایت ، اشتراکی 8 طرفه، بلوک 128B،روش بازنویسی مستقیم
حافظه نهان سطح دو - 256 کیلوبایت، بلوک 8 طرفه، 128B، نوشتن بازگشتی، شامل کش سطح یک ، تاخیر ۲ نانو ثانیه ای دسترسی
حافظه نهان سطح سه - 8 بخش 4 مگابایتی (مجموع 32 MB)، بخش موضعی ۶ نانو ثانیه، ریموت ۳۰ نانوثانیه، هر بخش 8 طرفه اشتراکی، به صورت آرایه DRAM، آرایه تگ های SRAM ^[39]

[1]
Hennessy, John L; Patterson, David A; Asanović, Krste; Bakos, Jason D; Colwell, Robert P; Bhattacharjee, Abhishek; Conte, Thomas M; Duato, José; Franklin, Diana; Goldberg, David; Jouppi, Norman P; Li, Sheng; Muralimanohar, Naveen; Peterson, Gregory D; Pinkston, Timothy Mark; Ranganathan, Prakash; Wood, David Allen; Young, Clifford; Zaky, Amr (2011). Computer Architecture: a Quantitative Approach (به انگلیسی) (Sixth ed.). ISBN 978-0128119051. OCLC 983459758.
[2]
"Cache: Why Level It" (PDF).
[3]
Ronald D. Miller; Lars I. Eriksson; Lee A Fleisher, 2014. Miller's Anesthesia E-Book. Elsevier Health Sciences. p. 75. شابک ‎۹۷۸−۰−۳۲۳−۲۸۰۱۱−۲.
[4]
Albert Y. Zomaya, 2006. Handbook of Nature-Inspired and Innovative Computing: Integrating Classical Models with Emerging Technologies. Springer Science & Business Media. p. 298. شابک ‎۹۷۸−۰−۳۸۷−۴۰۵۳۲−۲.
[5]
Richard C. Dorf, 2018. Sensors, Nanoscience, Biomedical Engineering, and Instruments: Sensors Nanoscience Biomedical Engineering. CRC Press. p. 4. شابک ‎۹۷۸−۱−۴۲۰۰−۰۳۱۶−۱.
[6]
David A. Patterson; John L. Hennessy, 2004. Computer Organization and Design: The Hardware/Software Interface, Third Edition. Elsevier. p. 552. شابک ‎۹۷۸−۰−۰۸−۰۵۰۲۵۷−۱.
[7]
"Sir Maurice Vincent Wilkes | British computer scientist". Encyclopædia Britannica. Retrieved 2016-12-11.
[8]
Berkeley, John L. Hennessy, Stanford University, and David A. Patterson, University of California. "Memory Hierarchy Design - Part 6. The Intel Core i7, fallacies, and pitfalls". EDN. Retrieved 2022-10-13.
[9]
Shane Cook, 2012. CUDA Programming: A Developer's Guide to Parallel Computing with GPUs. Newnes. pp. 107–109. شابک ‎۹۷۸−۰−۱۲−۴۱۵۹۸۸−۴.
[10]
Bruce Hellingsworth; Patrick Hall; Howard Anderson; 2001. Higher National Computing. Routledge. pp. 30–31. شابک ‎۹۷۸−۰−۷۵۰۶−۵۲۳۰−۸.
[11]
Reeta Sahoo, Gagan Sahoo. Infomatic Practices. Saraswati House Pvt Ltd. pp. 1–. شابک ‎۹۷۸−۹۳−۵۱۹۹−۴۳۳−۶.
[12]
Phillip A. Laplante; Seppo J. Ovaska; 2011. Real-Time Systems Design and Analysis: Tools for the Practitioner. John Wiley & Sons. pp. 94–95. شابک ‎۹۷۸−۱−۱۱۸−۱۳۶۵۹−۱.
[13]
Cetin Kaya Koc, 2008. Cryptographic Engineering. Springer Science & Business Media. pp. 479–480. شابک ‎۹۷۸−۰−۳۸۷−۷۱۸۱۷−۰.
[14]
Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann.Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann.
[15]
David A. Patterson; John L. Hennessy; 2008. Computer Organization and Design: The Hardware/Software Interface. Morgan Kaufmann. pp. 489–492. شابک ‎۹۷۸−۰−۰۸−۰۹۲۲۸۱−۲.
[16]
Harvey G. Cragon, 2000. Computer Architecture and Implementation. Cambridge University Press. pp. 95–97. شابک ‎۹۷۸−۰−۵۲۱−۶۵۱۶۸−۴.
[17]
Baker Mohammad, 2013. Embedded Memory Design for Multi-Core and Systems on Chip. Springer Science & Business Media. pp. 11–14. شابک ‎۹۷۸−۱−۴۶۱۴−۸۸۸۱−۱.
[18]
Gayde, William. "How CPUs are Designed and Built". Techspot. Retrieved 17 August 2019.
[19]
Vojin G. Oklobdzija, 2017. Digital Design and Fabrication. CRC Press. p. 4. شابک ‎۹۷۸−۰−۸۴۹۳−۸۶۰۴−۶.
[20]
"Memory Hierarchy".
[21]
Solihin, Yan (2016). Fundamentals of Parallel Multicore Architecture. Chapman and Hall. pp. Chapter 5: Introduction to Memory Hierarchy Organization. ISBN 9781482211184.
[22]
Yan Solihin, 2015. Fundamentals of Parallel Multicore Architecture. CRC Press. p. 150. شابک ‎۹۷۸−۱−۴۸۲۲−۱۱۱۹−۱.
[23]
Steve Heath, 2002. Embedded Systems Design. Elsevier. p. 106. شابک ‎۹۷۸−۰−۰۸−۰۴۷۷۵۶−۵.
[24]
Alan Clements, 2013. Computer Organization & Architecture: Themes and Variations. Cengage Learning. p. 588. شابک ‎۱−۲۸۵−۴۱۵۴۲−۶.
[25]
"Performance Evaluation of Exclusive Cache Hierarchies" (PDF).
[26]
David A. Patterson; John L. Hennessy; 2017. Computer Organization and Design RISC-V Edition: The Hardware Software Interface. Elsevier Science. pp. 386–387. شابک ‎۹۷۸−۰−۱۲−۸۱۲۲۷۶−۱.
[27]
Stefan Goedecker; Adolfy Hoisie; 2001. Performance Optimization of Numerically Intensive Codes. SIAM. p. 11. شابک ‎۹۷۸−۰−۸۹۸۷۱−۴۸۴−۵.
[28]
Harvey G. Cragon, 1996. Memory Systems and Pipelined Processors. Jones & Bartlett Learning. p. 47. شابک ‎۹۷۸−۰−۸۶۷۲۰−۴۷۴−۲.
[29]
David A. Patterson; John L. Hennessy; 2007. Computer Organization and Design, Revised Printing, Third Edition: The Hardware/Software Interface. Elsevier. p. 484. شابک ‎۹۷۸−۰−۰۸−۰۵۵۰۳۳−۶.
[30]
Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann. ISBN 9780123704900.
[31]
"Software Techniques for Shared-Cache Multi-Core Systems". 2018-05-24.
[32]
"An Adaptive Shared/Private NUCA Cache Partitioning Scheme for Chip Multiprocessors" (PDF). Archived from the original (PDF) on 2016-10-19.
[33]
Akanksha Jain; Calvin Lin; 2019. Cache Replacement Policies. Morgan & Claypool Publishers. p. 45. شابک ‎۹۷۸−۱−۶۸۱۷۳−۵۷۷−۱.
[34]
David Culler; Jaswinder Pal Singh; Anoop Gupta; 1999. Parallel Computer Architecture: A Hardware/Software Approach. Gulf Professional Publishing. p. 436. شابک ‎۹۷۸−۱−۵۵۸۶۰−۳۴۳−۱.
[35]
Stephen W. Keckler; Kunle Olukotun; H. Peter Hofstee; 2009. Multicore Processors and Systems. Springer Science & Business Media. p. 182. شابک ‎۹۷۸−۱−۴۴۱۹−۰۲۶۳−۴.
[36]
"Intel Broadwell Microarchitecture".
[37]
"Intel Kaby Lake Microrchitecture".
[38]
"The Architecture of the Nehalem Processor and Nehalem-EP SMP Platforms" (PDF). Archived from the original (PDF) on 2014-08-11.
[39]
"IBM Power7".

[[رده:حافظه رایانه]] [[رده:سخت‌افزار رایانه]] [[رده:معماری رایانه]] [[رده:حافظه نهان]]

[CA:QA-1] [1]
Hennessy, John L; Patterson, David A; Asanović, Krste; Bakos, Jason D; Colwell, Robert P; Bhattacharjee, Abhishek; Conte, Thomas M; Duato, José; Franklin, Diana; Goldberg, David; Jouppi, Norman P; Li, Sheng; Muralimanohar, Naveen; Peterson, Gregory D; Pinkston, Timothy Mark; Ranganathan, Prakash; Wood, David Allen; Young, Clifford; Zaky, Amr (2011). Computer Architecture: a Quantitative Approach (به انگلیسی) (Sixth ed.). ISBN 978-0128119051. OCLC 983459758.

[2] [2]
"Cache: Why Level It" (PDF).

[3] [3]
Ronald D. Miller; Lars I. Eriksson; Lee A Fleisher, 2014. Miller's Anesthesia E-Book. Elsevier Health Sciences. p. 75. شابک ‎۹۷۸−۰−۳۲۳−۲۸۰۱۱−۲.

[4] [4]
Albert Y. Zomaya, 2006. Handbook of Nature-Inspired and Innovative Computing: Integrating Classical Models with Emerging Technologies. Springer Science & Business Media. p. 298. شابک ‎۹۷۸−۰−۳۸۷−۴۰۵۳۲−۲.

[5] [5]
Richard C. Dorf, 2018. Sensors, Nanoscience, Biomedical Engineering, and Instruments: Sensors Nanoscience Biomedical Engineering. CRC Press. p. 4. شابک ‎۹۷۸−۱−۴۲۰۰−۰۳۱۶−۱.

[6] [6]
David A. Patterson; John L. Hennessy, 2004. Computer Organization and Design: The Hardware/Software Interface, Third Edition. Elsevier. p. 552. شابک ‎۹۷۸−۰−۰۸−۰۵۰۲۵۷−۱.

[7] [7]
"Sir Maurice Vincent Wilkes | British computer scientist". Encyclopædia Britannica. Retrieved 2016-12-11.

[8] [8]
Berkeley, John L. Hennessy, Stanford University, and David A. Patterson, University of California. "Memory Hierarchy Design - Part 6. The Intel Core i7, fallacies, and pitfalls". EDN. Retrieved 2022-10-13.

[9] [9]
Shane Cook, 2012. CUDA Programming: A Developer's Guide to Parallel Computing with GPUs. Newnes. pp. 107–109. شابک ‎۹۷۸−۰−۱۲−۴۱۵۹۸۸−۴.

[10] [10]
Bruce Hellingsworth; Patrick Hall; Howard Anderson; 2001. Higher National Computing. Routledge. pp. 30–31. شابک ‎۹۷۸−۰−۷۵۰۶−۵۲۳۰−۸.

[11] [11]
Reeta Sahoo, Gagan Sahoo. Infomatic Practices. Saraswati House Pvt Ltd. pp. 1–. شابک ‎۹۷۸−۹۳−۵۱۹۹−۴۳۳−۶.

[12] [12]
Phillip A. Laplante; Seppo J. Ovaska; 2011. Real-Time Systems Design and Analysis: Tools for the Practitioner. John Wiley & Sons. pp. 94–95. شابک ‎۹۷۸−۱−۱۱۸−۱۳۶۵۹−۱.

[13] [13]
Cetin Kaya Koc, 2008. Cryptographic Engineering. Springer Science & Business Media. pp. 479–480. شابک ‎۹۷۸−۰−۳۸۷−۷۱۸۱۷−۰.

[:1-14] [14]
Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann.Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann.

[15] [15]
David A. Patterson; John L. Hennessy; 2008. Computer Organization and Design: The Hardware/Software Interface. Morgan Kaufmann. pp. 489–492. شابک ‎۹۷۸−۰−۰۸−۰۹۲۲۸۱−۲.

[16] [16]
Harvey G. Cragon, 2000. Computer Architecture and Implementation. Cambridge University Press. pp. 95–97. شابک ‎۹۷۸−۰−۵۲۱−۶۵۱۶۸−۴.

[17] [17]
Baker Mohammad, 2013. Embedded Memory Design for Multi-Core and Systems on Chip. Springer Science & Business Media. pp. 11–14. شابک ‎۹۷۸−۱−۴۶۱۴−۸۸۸۱−۱.

[18] [18]
Gayde, William. "How CPUs are Designed and Built". Techspot. Retrieved 17 August 2019.

[19] [19]
Vojin G. Oklobdzija, 2017. Digital Design and Fabrication. CRC Press. p. 4. شابک ‎۹۷۸−۰−۸۴۹۳−۸۶۰۴−۶.

[20] [20]
"Memory Hierarchy".

[:4-21] [21]
Solihin, Yan (2016). Fundamentals of Parallel Multicore Architecture. Chapman and Hall. pp. Chapter 5: Introduction to Memory Hierarchy Organization. ISBN 9781482211184.

[22] [22]
Yan Solihin, 2015. Fundamentals of Parallel Multicore Architecture. CRC Press. p. 150. شابک ‎۹۷۸−۱−۴۸۲۲−۱۱۱۹−۱.

[23] [23]
Steve Heath, 2002. Embedded Systems Design. Elsevier. p. 106. شابک ‎۹۷۸−۰−۰۸−۰۴۷۷۵۶−۵.

[24] [24]
Alan Clements, 2013. Computer Organization & Architecture: Themes and Variations. Cengage Learning. p. 588. شابک ‎۱−۲۸۵−۴۱۵۴۲−۶.

[25] [25]
"Performance Evaluation of Exclusive Cache Hierarchies" (PDF).

[26] [26]
David A. Patterson; John L. Hennessy; 2017. Computer Organization and Design RISC-V Edition: The Hardware Software Interface. Elsevier Science. pp. 386–387. شابک ‎۹۷۸−۰−۱۲−۸۱۲۲۷۶−۱.

[27] [27]
Stefan Goedecker; Adolfy Hoisie; 2001. Performance Optimization of Numerically Intensive Codes. SIAM. p. 11. شابک ‎۹۷۸−۰−۸۹۸۷۱−۴۸۴−۵.

[28] [28]
Harvey G. Cragon, 1996. Memory Systems and Pipelined Processors. Jones & Bartlett Learning. p. 47. شابک ‎۹۷۸−۰−۸۶۷۲۰−۴۷۴−۲.

[29] [29]
David A. Patterson; John L. Hennessy; 2007. Computer Organization and Design, Revised Printing, Third Edition: The Hardware/Software Interface. Elsevier. p. 484. شابک ‎۹۷۸−۰−۰۸−۰۵۵۰۳۳−۶.

[:0-30] [30]
Hennessey and Patterson. Computer Architecture: A Quantitative Approach. Morgan Kaufmann. ISBN 9780123704900.

[31] [31]
"Software Techniques for Shared-Cache Multi-Core Systems". 2018-05-24.

[32] [32]
"An Adaptive Shared/Private NUCA Cache Partitioning Scheme for Chip Multiprocessors" (PDF). Archived from the original (PDF) on 2016-10-19.

[33] [33]
Akanksha Jain; Calvin Lin; 2019. Cache Replacement Policies. Morgan & Claypool Publishers. p. 45. شابک ‎۹۷۸−۱−۶۸۱۷۳−۵۷۷−۱.

[34] [34]
David Culler; Jaswinder Pal Singh; Anoop Gupta; 1999. Parallel Computer Architecture: A Hardware/Software Approach. Gulf Professional Publishing. p. 436. شابک ‎۹۷۸−۱−۵۵۸۶۰−۳۴۳−۱.

[Keckler_(2009)-35] [35]
Stephen W. Keckler; Kunle Olukotun; H. Peter Hofstee; 2009. Multicore Processors and Systems. Springer Science & Business Media. p. 182. شابک ‎۹۷۸−۱−۴۴۱۹−۰۲۶۳−۴.

[:2-36] [36]
"Intel Broadwell Microarchitecture".

[:3-37] [37]
"Intel Kaby Lake Microrchitecture".

[38] [38]
"The Architecture of the Nehalem Processor and Nehalem-EP SMP Platforms" (PDF). Archived from the original (PDF) on 2014-08-11.

[39] [39]
"IBM Power7".

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

کاربر:Parsa.nyb/سلسله مراتب حافظه نهان

متوسط زمان دسترسی (AAT)

مصالحه

سیر تکاملی

دستاوردهای عملکردی

معایب

کش جدا شده دربرابر یکپارچه

ساختار دربرگیری لایه ای

خط مشی رونویسی

اشتراکی در مقابل خصوصی

ریزمعماری اینتل برادول (2014)

ریزمعماری اینتل Kaby Lake (2016)

ریزمعماری AMD Zen (2017)

ریزمعماری AMD Zen 2 (2019)

IBM POWER7 (2010)

Wikiwand in your browser!

کاربر:Parsa.nyb/سلسله مراتب حافظه نهان

متوسط زمان دسترسی (AAT)

مصالحه

سیر تکاملی

دستاوردهای عملکردی

معایب

کش جدا شده دربرابر یکپارچه

ساختار دربرگیری لایه ای

خط مشی رونویسی

اشتراکی در مقابل خصوصی

ریزمعماری اینتل برادول (2014)

ریزمعماری اینتل Kaby Lake (2016)

ریزمعماری AMD Zen (2017)

ریزمعماری AMD Zen 2 (2019)

IBM POWER7 (2010)

Wikiwand in your browser!

پیشینه

حافظه نهان چند سطحی

جزییات

مدل های اجرایی اخیر

همچنین ببینید

منابع