שאלות נפוצות
ציר זמן
צ'אט
פרספקטיבה
קישור שבור
קישור שמוביל לאתר אינטרנט או מקור אחר שהפך לא זמין באופן קבוע מוויקיפדיה, האנציקלופדיה החופשית
Remove ads
קישור שבור הוא מונח המתייחס לתופעה של קישורים הנוטים עם הזמן להפסיק להצביע על דף האינטרנט, הקובץ או השרת אליו הצביעו במקור, בגלל שהאובייקט הזה (למשל דף אינטרנט) הועבר לכתובת חדשה או הפך לא זמין לצמיתות.

שיעור הקישורים השבורים הוא נושא ללימוד ומחקר בשל משמעותו ליכולת האינטרנט לשמר מידע. ההערכות לגבי שיעור זה משתנות באופן דרמטי בין המחקרים. מומחי מידע הזהירו כי תופעת הקישורים השבורים עלולה לגרום לנתוני ארכיון חשובים להיעלם, מה שעלול להשפיע על מערכת המשפט ועל נגישות ידע בעולם האקדמי.
Remove ads
שכיחות
סכם
פרספקטיבה
מספר מחקרים בחנו את השכיחות של קישורים שבורים ברשת הכלל עולמית (ה-World Wide Web), בספרות אקדמית המשתמשת בכתובות URL כדי לצטט תוכן אינטרנט, ובתוך ספריות דיגיטליות.
מחקר משנת 2002 העלה כי התפתחות קישורים שבורים בספריות דיגיטליות היא איטית במידה ניכרת מאשר באינטרנט, ומצא שכ-3% מהאובייקטים כבר לא היו נגישים לאחר שנה אחת.[1]
מחקר משנת 2003 מצא שברשת האינטרנט, נשבר בערך קישור אחד מכל 200 קישורים מדי שבוע.[2] שיעור זה אושש במידה רבה על ידי מחקר שנערך בשנים 2016–2017 על קישורים ב-Yahoo! Directory (שהפסיקה להתעדכן ב-2014 לאחר 21 שנות פיתוח).[3]
מחקר משנת 2004 הראה שבקבוצות ספציפיות של קישורי אינטרנט (כגון אלה המכוונים לסוגי קבצים ספציפיים או אלה המתארחים בשרתים של מוסדות אקדמיים) שיעור התפתחות הקישורים השבורים עשוי להיות שונה באופן דרמטי.[4] נראה שקישורים שנבחרו לפרסום נהנים מחיים ארוכים יותר מאשר קישורים לאתרים אחרים.
מחקרים אחרים מצאו שיעורים גבוהים יותר של הישברות קישורים בספרות אקדמית.[5][6]
במחקר משנת 2021 על קישורים חיצוניים במאמרי ניו יורק טיימס שפורסמו בין 1996 ל-2019 מצא יציבות טובה יחסית של הקישורים (עם שונות משמעותית בין נושאי התוכן), אך ציין כי 13% מהקישורים הפונקציונליים אינם מובילים עוד לתוכן המקורי - תופעה הנקראת סחף תוכן (content drift).[7]
מחקר משנת 2013 מצא ש-49% מהקישורים באתר פרסומי דעה של בית המשפט העליון בארצות הברית הם קישורים שבורים.[8]
מחקר משנת 2023, שבחן לוחות מחוונים (Dashboard) של COVID-19 בארצות הברית, מצא ש-23% מלוחות המחוונים של מדינות ארצות הברית שהיו זמינים בפברואר 2021 כבר לא היו זמינים בקישורים המקוריים שלהם באפריל 2023 (כלומר - הקישורים אליהם היו שבורים).[9]
Remove ads
סיבות
קישור שבור יכול להיגרם עקב מספר סיבות. ייתכן שדף אינטרנט שאליו הצביע הקישור הוסר. ייתכן שיש תקלה בשרת שמארח את דף היעד, או שהשרת הוסר מהשירות או הועבר לשם דומיין חדש. עוד בשנת 1999, צוין כי עם כמות החומר שניתן לאחסן בכונן קשיח, "כשל בדיסק בודד יכול להיות דומה לשריפת הספרייה באלכסנדריה."[10] הרישום של שם דומיין עלול לפוג או לעבור לידי גורם אחר. סיבות מסוימות עלולות לגרום לכך שהקישור לא יוביל ליעד כלשהו ויחזיר שגיאה כגון HTTP 404. סיבות אחרות עלולות לגרום לקישור להצביע לתוכן שונה מזה שההקישור הצביע אליו במקור.
סיבות נוספות לקישורים שבורים כוללות:
- ארגון מחדש של אתרים שגורם לשינויים בכתובות URL (למשל, domain.net/pine_tree עלול לעבור ל-domain.net/tree/pine)
- העברה של תוכן שהיה חינמי בעבר אל מאחורי חומת תשלום[9]
- שינוי בארכיטקטורת השרת שגורם לכך שקוד (למשל PHP) פועל בצורה שונה
- תוכן דף דינמי כגון תוצאות חיפוש עשוי להשתנות בהתאם לכוונת מתכנני האתר
- מחיקת עמוד היעד ו/או תוכנו
- נוכחות של מידע ספציפי למשתמש (כגון שם התחברות) בתוך הקישור
- חסימה מכוונת על ידי מסנני תוכן או חומות אש (Firewalls)
- פקיעת רישום שם דומיין
Remove ads
מניעה וגילוי
סכם
פרספקטיבה
אסטרטגיות למניעת קישורים שבורים יכולות להתמקד בהצבת תוכן במקומות שבהם הסבירות שלו לשרוד גבוהה יותר, יצירת קישורים באופן שיקטין את הסיכוי שהם יישברו, נקיטת צעדים לשימור קישורים קיימים או תיקון קישורים שהאובייקטים שלהם הועברו או הוסרו.
יצירת כתובות URL שלא ישתנו עם הזמן היא השיטה הבסיסית למניעת קישורים שבורים. טים ברנרס-לי וחלוצי רשת אחרים קידמו את הרעיון של תכנון מניעתי לצמצום הישברות קישורים.[11]
אסטרטגיות ליצירת קישורים יציבים כוללות
- קישור למקורות ראשוניים ולא משניים, ותעדוף אתרים יציבים[4]
- הימנעות מקישורים המפנים לאובייקטים בדפים האישיים של חוקרים[12]
- שימוש בכתובות URL נקיות או שימוש אחר בנורמליזציה של כתובות אתרים או קנוניזציה של כתובות אתרים[13]
- שימוש ב-permalinks או persistent identifiers כגון ARKs, DOIs, Handle System references, PURLs, או content addressing.[14]
- הימנעות מקישור למסמכים שאינם דפי אינטרנט[13]
- הימנעות מקישורים עמוקים[15]
- קישור לארכיוני אינטרנט כגון Internet Archive,[16]WebCite, archive.today,[17]Perma.cc,[18] או Arweave.[19]
אסטרטגיות הנוגעות להגנה על קישורים קיימים כוללות
- שימוש במנגנוני ניתוב מחדש כגון HTTP 301 כדי להפנות אוטומטית דפדפנים וסורקים לתוכן שהועבר למקום אחר.
- שימוש במערכות ניהול תוכן, שיכולות לעדכן קישורים באופן אוטומטי כאשר תוכן בתוך אותו אתר מועבר למיקום אחר, או להחליף באופן אוטומטי קישורים בכתובות URL קנוניות[20]
- שילוב משאבי חיפוש בדפי HTTP 404[21]
זיהוי קישורים שבורים עשוי להתבצע באופן ידני או אוטומטי. שיטות אוטומטיות כוללות תוספות עבור מערכות ניהול תוכן וכן בודקים עצמאיים של קישורים שבורים כמו למשל Link Sleuth של Xenu. ייתכן שבדיקה אוטומטית לא תזהה קישורים שמחזירים soft 404 או קישורים שמחזירים 200 OK[22] אך מצביעים על תוכן שהשתנה בפועל.[23]
ראו גם
לקריאה נוספת
- Markwell, John; Brooks, David W. (2002). "Broken Links: The Ephemeral Nature of Educational WWW Hyperlinks". Journal of Science Education and Technology. 11 (2): 105–108. doi:10.1023/A:1014627511641. S2CID 60802264. (באנגלית)
- Gomes, Daniel; Silva, Mário J. (2006). "Modelling Information Persistence on the Web" (PDF). Proceedings of the 6th International Conference on Web Engineering. ICWE'06. אורכב מ-המקור (PDF) ב-2011-07-16. נבדק ב-14 בספטמבר 2010.
{{cite conference}}
: (עזרה)(באנגלית) - Dellavalle, Robert P.; Hester, Eric J.; Heilig, Lauren F.; Drake, Amanda L.; Kuntzman, Jeff W.; Graber, Marla; Schilling, Lisa M. (2003). "Going, Going, Gone: Lost Internet References". Science. 302 (5646): 787–788. doi:10.1126/science.1088234. PMID 14593153. S2CID 154604929. (באנגלית)
- Koehler, Wallace (1999). "An Analysis of Web Page and Web Site Constancy and Permanence". Journal of the American Society for Information Science. 50 (2): 162–180. doi:10.1002/(SICI)1097-4571(1999)50:2<162::AID-ASI7>3.0.CO;2-B. (באנגלית)
- Sellitto, Carmine (2005). "The impact of impermanent Web-located citations: A study of 123 scholarly conference publications" (PDF). Journal of the American Society for Information Science and Technology. 56 (7): 695–703. CiteSeerX 10.1.1.473.2732. doi:10.1002/asi.20159. (באנגלית)
Remove ads
קישורים חיצוניים
הערות שוליים
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads