בין לקוחותינו
פייג ראנק – PageRank
מה זה פייג'ראנק?
פייג'ראנק - ערך מספרי למדידת החשיבות של עמוד אינטרנט. מנוע החיפוש גוגל קובע את חשיבותו של העמוד ע"י בדיקת כמות ואיכות הקישורים המפנים אליו.
כאשר אנו אומרים "חשיבותו של עמוד" הכוונה היא לחשיבותו הכללית באינטרנט ללא קשר למילות המפתח המצויות בו. אתר בנושא השכרת רכב עם פייג'ראנק 5 הוא בעל חשיבות אינטרנט כללית של 5 ולא רק לנושא השכרת רכב.
קביעת פייג'ראנק
תהליך קביעת הפייג'ראנק של עמוד מתחיל באיסוף כל הנתונים אודות הקישורים המצביעים על אותו עמוד.
הנתונים מתרכזים לקביעת שני פרמטרים עיקריים.
פייג'ראנק העמודים המקשרים
ושוב, הגודל כן קובע.
חשיבותו של אתר פופולארי ורחב תוכן גדולה מחשיבותו של אתר זניח וקטן.
לכן עדיף לקבל קישור אחד מאתר חזק מאשר עשרות קישורים מאתרים חלשים.
כמו כן גם חשיבותם של קישורים חיצוניים (מאתרים אחרים) גדולה מחשיבותם של קישורים פנימיים (מאותו האתר).
כמות הקישורים בעמוד המקשר-
כמה שיותר קישורים יוצאים מאותו עמוד, כך גם ערך ההצבעה שלו נמוך יותר.
כמובן שזה גם עובד הפוך - במידה ובעמוד המקשר אין קישורים לאתרים אחרים - כח ההצבעה שלו יהיה אופטימלי (העמוד המקושר יקבל את כל כח ההצבעה של העמוד המקשר הנ"ל).
רקע
קצת היסטוריה
בשנת 1995 מייסדי גוגל לעתיד, לארי פייג' וסרגי ברין, החלו לעבוד ביחד באוניברסיטת סטנפורד בארה"ב.
נקפוץ קצת קדימה, ואנחנו נמצאים בעיצומה של תקופה שבה פייג' וברין מפתחים את מה שעתיד לשנות את פני האינטרנט - מנוע חיפוש שבשבריר שניה יתן לגולש את כל המידע אותו הוא מחפש, בסדר חשיבות יורד.
בשביל להגיע לתוצאה הזאת, היה צורך בשני דברים מרכזיים שיכפול כל המידע הנמצא באינטרנט לשרת של המנוע חיפוש
ושיטת דירוג אפקטיבית שתוציא מכל מיליוני האתרים והעמודים האלה את מה שהגולש רוצהכמובן, שהפתרון לבעיה הראשונה לא מעניין אותנו במאמר הזה - מה שחשוב זה שהם מצאו דרך לעשות את זה.
הבעיה השניה, היא מה שמביא אותנו לעיקרנו.
פייג' וברין חיפשו פתרון מתמטי לדירוג העמודים המופיעים במנוע החיפוש שלהם.
הפתרון של פייג'
מעקב וספירת כמות הקישורים המצביעים על אתר תיתן את דירוג הפופולאריות של אתר זה, וקישור מאתר פופולארי אוטומטית מעלה את רמת הפופולאריות של האתר המקושר לזאת של המקשר. ובמילים אחרות - לא כל הקישורים שווים. קישור מאתר פופולארי מקבל הרבה יותר משקל מאשר קישור מאתר פחות מוכר. שיטה זו הביאה לפריצת דרך בביצועי החיפוש, ולארי מיד מצא לנכון להטמיע את שם משפחתו (פייג' - עמוד באנגלית) בשם הנוסחה -
PageRank.
הנוסחה
הכל פשוט במילים
ובכן, אנחנו מבינים מה זה פייג' ראנק ולמה המציאו אותו.
עכשיו ננסה להבין את הפן המתמטי של הנוסחה.נוסחאת הפייג'ראנק (בערך) נראית כך
כן, זה לא בגרות 3 יחידות.
לאלה מכם שלא חזרו לעמוד הקודם ננסה להסביר מה הולך.
פייג'ראנק של עמוד אינטרנט A = (פייג'ראנק של עמוד מקשר B חלקי מספר קישורים היוצאים מהעמוד) + (פייג'ראנק של עמוד מקשר C חלקי מספר קישורים היוצאים מהעמוד) + (פייג'ראנק של עמוד מקשר D חלקי מספר קישורים היוצאים מהעמוד) וכן הלאה
כמובן שנוסחא זו היא הגירסא הפשוטה, ובנוסחא המלאה קיימת כ100 פרמטרים שונים, אך את העיקר הבנו.
מכל הנוסחא הזאת ניתן להבין שמדד החשיבות (פייג'ראנק) של עמוד אינטרנט שווה לפייג'ראנק של סך כל האתרים המקשרים אליו לחלק למספר הקישורים היוצאים מהם.
TrustRank
מדד אמינות.
שיטת ניתוח קישורים שפותחה בשיתוף של אוניברסיטת סטנפורד ויאהו! על מנת ליצור הפרדה אוטומטית בין עמודים מועילים ברשת ועמודי ספאם.
באינטרנט יש אתרי ספאם רבים.
אתרים אלה נוצרו לרוב מסיבות פרסום, ובמטרה לעבוד על מנועי החיפוש משתמשים בטכניקות מגוונות על מנת להעניק תוצאות חיפוש גבוהות מהמוצדק.בעוד שרוב בני האדם יכולים בקלות לזהות מהו קישור לא רלוונטי ומהו אתר ספאם, זה בלתי אפשרי לבדוק ידנית כל אתר באינטרנט.
שיטה פופולארית במיוחד של מניפולציה על מנועי חיפוש, היא ניפוח מלאכותי של החשיבות של אתר מסויים ע"י הפניית קישורים מאסיבית מאתרי קש (ספאם).
מנועי חיפוש ושיטותיהם לקביעת חשיבות העמוד, ביניהם גוגל ונוסחאות קודמות של פייג'ראנק, נוצלו לרעה בקלות ע"י האתרים האלה.
שיטת טראסט ראנק מורה על בדיקת מומחה, של מספר אתרי מפתח "סמכותיים" בנושא נתון, הנקראים אתרי גרעין.
כאשר אתרי הגרעין מוגדרים מראש, כל קישור (הצבעת אמון) מהם מקבלת חשיבות עליונה, ואתרים המקושרים מהם מקבלים דירוג גבוה בהתאם.
אתרים אלו, ממשיכים את השרשרת, רק שמשקל הקישור מהם קטן מהמשקל של אתר גרעין.הסמכות של הטראסט ראנק נעלמת ככל שמרחיקים לכת מהאתר או עמוד גרעין המקורי
החוקרים שפיתחו את השיטה המשיכה לפתח והגיעו להגדרת גורמים נוספים, למשל הגדרה למאסה של קישורים - מהי מאסה אבסולוטית (ספאם) ומאסה רלוונטית (פופלאריות)
פייג'ראנק - ערך מספרי למדידת החשיבות של עמוד אינטרנט. מנוע החיפוש גוגל קובע את חשיבותו של העמוד ע"י בדיקת כמות ואיכות הקישורים המפנים אליו.
כאשר אנו אומרים "חשיבותו של עמוד" הכוונה היא לחשיבותו הכללית באינטרנט ללא קשר למילות המפתח המצויות בו. אתר בנושא השכרת רכב עם פייג'ראנק 5 הוא בעל חשיבות אינטרנט כללית של 5 ולא רק לנושא השכרת רכב.
קביעת פייג'ראנק
תהליך קביעת הפייג'ראנק של עמוד מתחיל באיסוף כל הנתונים אודות הקישורים המצביעים על אותו עמוד.
הנתונים מתרכזים לקביעת שני פרמטרים עיקריים.
פייג'ראנק העמודים המקשרים
ושוב, הגודל כן קובע.
חשיבותו של אתר פופולארי ורחב תוכן גדולה מחשיבותו של אתר זניח וקטן.
לכן עדיף לקבל קישור אחד מאתר חזק מאשר עשרות קישורים מאתרים חלשים.
כמו כן גם חשיבותם של קישורים חיצוניים (מאתרים אחרים) גדולה מחשיבותם של קישורים פנימיים (מאותו האתר).
כמות הקישורים בעמוד המקשר-
כמה שיותר קישורים יוצאים מאותו עמוד, כך גם ערך ההצבעה שלו נמוך יותר.
כמובן שזה גם עובד הפוך - במידה ובעמוד המקשר אין קישורים לאתרים אחרים - כח ההצבעה שלו יהיה אופטימלי (העמוד המקושר יקבל את כל כח ההצבעה של העמוד המקשר הנ"ל).
רקע
קצת היסטוריה
בשנת 1995 מייסדי גוגל לעתיד, לארי פייג' וסרגי ברין, החלו לעבוד ביחד באוניברסיטת סטנפורד בארה"ב.
נקפוץ קצת קדימה, ואנחנו נמצאים בעיצומה של תקופה שבה פייג' וברין מפתחים את מה שעתיד לשנות את פני האינטרנט - מנוע חיפוש שבשבריר שניה יתן לגולש את כל המידע אותו הוא מחפש, בסדר חשיבות יורד.
בשביל להגיע לתוצאה הזאת, היה צורך בשני דברים מרכזיים שיכפול כל המידע הנמצא באינטרנט לשרת של המנוע חיפוש
ושיטת דירוג אפקטיבית שתוציא מכל מיליוני האתרים והעמודים האלה את מה שהגולש רוצהכמובן, שהפתרון לבעיה הראשונה לא מעניין אותנו במאמר הזה - מה שחשוב זה שהם מצאו דרך לעשות את זה.
הבעיה השניה, היא מה שמביא אותנו לעיקרנו.
פייג' וברין חיפשו פתרון מתמטי לדירוג העמודים המופיעים במנוע החיפוש שלהם.
הפתרון של פייג'
מעקב וספירת כמות הקישורים המצביעים על אתר תיתן את דירוג הפופולאריות של אתר זה, וקישור מאתר פופולארי אוטומטית מעלה את רמת הפופולאריות של האתר המקושר לזאת של המקשר. ובמילים אחרות - לא כל הקישורים שווים. קישור מאתר פופולארי מקבל הרבה יותר משקל מאשר קישור מאתר פחות מוכר. שיטה זו הביאה לפריצת דרך בביצועי החיפוש, ולארי מיד מצא לנכון להטמיע את שם משפחתו (פייג' - עמוד באנגלית) בשם הנוסחה -
PageRank.
הנוסחה
הכל פשוט במילים
ובכן, אנחנו מבינים מה זה פייג' ראנק ולמה המציאו אותו.
עכשיו ננסה להבין את הפן המתמטי של הנוסחה.נוסחאת הפייג'ראנק (בערך) נראית כך
כן, זה לא בגרות 3 יחידות.
לאלה מכם שלא חזרו לעמוד הקודם ננסה להסביר מה הולך.
פייג'ראנק של עמוד אינטרנט A = (פייג'ראנק של עמוד מקשר B חלקי מספר קישורים היוצאים מהעמוד) + (פייג'ראנק של עמוד מקשר C חלקי מספר קישורים היוצאים מהעמוד) + (פייג'ראנק של עמוד מקשר D חלקי מספר קישורים היוצאים מהעמוד) וכן הלאה
כמובן שנוסחא זו היא הגירסא הפשוטה, ובנוסחא המלאה קיימת כ100 פרמטרים שונים, אך את העיקר הבנו.
מכל הנוסחא הזאת ניתן להבין שמדד החשיבות (פייג'ראנק) של עמוד אינטרנט שווה לפייג'ראנק של סך כל האתרים המקשרים אליו לחלק למספר הקישורים היוצאים מהם.
TrustRank
מדד אמינות.
שיטת ניתוח קישורים שפותחה בשיתוף של אוניברסיטת סטנפורד ויאהו! על מנת ליצור הפרדה אוטומטית בין עמודים מועילים ברשת ועמודי ספאם.
באינטרנט יש אתרי ספאם רבים.
אתרים אלה נוצרו לרוב מסיבות פרסום, ובמטרה לעבוד על מנועי החיפוש משתמשים בטכניקות מגוונות על מנת להעניק תוצאות חיפוש גבוהות מהמוצדק.בעוד שרוב בני האדם יכולים בקלות לזהות מהו קישור לא רלוונטי ומהו אתר ספאם, זה בלתי אפשרי לבדוק ידנית כל אתר באינטרנט.
שיטה פופולארית במיוחד של מניפולציה על מנועי חיפוש, היא ניפוח מלאכותי של החשיבות של אתר מסויים ע"י הפניית קישורים מאסיבית מאתרי קש (ספאם).
מנועי חיפוש ושיטותיהם לקביעת חשיבות העמוד, ביניהם גוגל ונוסחאות קודמות של פייג'ראנק, נוצלו לרעה בקלות ע"י האתרים האלה.
שיטת טראסט ראנק מורה על בדיקת מומחה, של מספר אתרי מפתח "סמכותיים" בנושא נתון, הנקראים אתרי גרעין.
כאשר אתרי הגרעין מוגדרים מראש, כל קישור (הצבעת אמון) מהם מקבלת חשיבות עליונה, ואתרים המקושרים מהם מקבלים דירוג גבוה בהתאם.
אתרים אלו, ממשיכים את השרשרת, רק שמשקל הקישור מהם קטן מהמשקל של אתר גרעין.הסמכות של הטראסט ראנק נעלמת ככל שמרחיקים לכת מהאתר או עמוד גרעין המקורי
החוקרים שפיתחו את השיטה המשיכה לפתח והגיעו להגדרת גורמים נוספים, למשל הגדרה למאסה של קישורים - מהי מאסה אבסולוטית (ספאם) ומאסה רלוונטית (פופלאריות)