פרסום פרוגרמטי – כך תעשו את זה נכון
05/12/2017
עובדים בשיווק? אלו האתגרים בשוק הפרסום של 2018 שצריך להתכונן אליהם
עובדים בשיווק? אלו האתגרים בשוק הפרסום של 2018 שצריך להתכונן אליהם
17/01/2018
רוצה לראות הכל

האם נתוני ה-Data Studio וה-Spreadsheet שלי מסומפלים?

מאת: ערן שילה, אנליסט
14/12/2017

אם אתם משתמשים בגוגל אנליטיקס, אתם בטח יודעים לזהות אם המידע בכל מסך הוא מלא או מסומפל. אבל איך תדעו מה מצב הסימפול בכלים אחרים? והאם יש דרך לעקוף את הסימפול?

כמעט כל מי שעובד עם גוגל אנליטיקס מכיר את סמל המגן שנמצא מעל הגרף בדוחות השונים. סמל זה מספר לנו האם הדאטה שבדו"ח בו אנו צופים מסומפלת – האם התצוגה כוללת 100% מהנתונים האמיתיים, או שהמערכת מציגה לנו הערכות על בסיס נתונים חלקיים. כידוע, מגן ירוק מעיד שהדו"ח מציג נתונים מלאים, ואילו מגן צהוב מסמן שהדאטה שמולנו מסומפלת, ולכן יש לגשת אליה בזהירות המתבקשת.

עד כאן לגבי התצוגה בתוך ממשק גוגל אנליטיקס. אבל הרבה פעמים אנחנו ניגשים לנתונים דרך Data Studio או Spreadsheets, ובהם לא ברור באופן מיידי האם הנתונים מאנליטיקס מסומפלים. במאמר זה אלמד כיצד לזהות דאטה מסומפלת בספרדשיט ובדאטה סטודיו, אשתף אתכם בטיפ שיכול לעזור במניעת טעויות ואסיים בטריק שיעזור לכם לעקוף סימפול של דאטה באמצעות שימוש בספרד שיט.

איך עובד הסימפול בדאטה סטודיו, וכיצד נזהה אותו?

הסמפלינג בדאטה סטודיו עובד לפי אותם כללים של אנליטיקס – אם הדו"ח שאתם מריצים מסומפל באנליטיקס, סביר להניח שגם בדאטה סטודיו הנתונים שתקבלו יהיו מסומפלים. אבל איך אפשר לבדוק האם הדשבורד שלנו מכיל מידע מסומפל?

מתחת לכל דשבורד בדאטה סטודיו, בפינה הימנית, כתוב מתי הנתונים בדשבורד התעדכנו בפעם האחרונה. אם הדו"ח מכיל נתונים מסומפלים, ליד תאיך העדכון יופיע גם Show Sampling (מסומן בצהוב בתמונה).

לחיצה על Show Sampling תציג את אחוזי הסימפול עבור כל גרף – וכאן נמצא אחד המאפיינים הבולטים של דאטה סטודיו. בשונה מאנליטיקס בו כל מסך הינו דו"ח, דאטה סטודיו הינו כלי ליצירת דשבורדים, וכל טבלה או גרף בדשבורד מהווים למעשה דו"ח בפני עצמו. לכן יתכן מצב שבו גרף אחד יהיה עם אחוזי סימפול שונים מגרף אחר, או שבאותו דשבורד חלק מהגרפים יכילו דאטה מסומפלת וחלק דאטה לא מסומפלת.

ככה זה נראה:

איך עובד הסימפול בספרדשיט, וכיצד נזהה אותו?

בדומה לדו"חות האנליטיקס, גם בספרדשיט ניתן לשלוט במידה מסוימת על רמת הסימפול ולהחליט האם נעדיף עיבוד מהיר ודאטה מסומפלת יותר, או עיבוד איטי ודאטה מלאה יותר. על מנת להגדיר זאת ניגש לטאב Report Configuration, דרכו מגדירים את הדו"חות ב- add-on של אנליטיקס בספרדשיט, ונרד לשורה 13 – Sampling Level. עבור כל עמודה נוכל לבחור ב-"faster" לעיבוד מהיר יותר או ב- higher_precision לרמת דיוק גבוהה יותר. ישנה גם אפשרות לכתוב "default" עבור ברירת המחדל, אבל אין צורך בכך מכיוון שאם נשאיר את התא ריק אפשרות זו תבחר באופן אוטומטי.

כמו בדאטה סטודיו, גם בספרדשיט כל עמודה יוצרת דו"ח נפרד בטאב נפרד, וייתכנו הבדלים ברמת הסימפול בין טאב לטאב. על מנת לבדוק האם הדאטה בדו"ח מסויים מסומפלת או לא ניגש לתא B6 ונבדוק אם כתוב Contains Sampled Data, Yes או No. במידה והדאטה מסומפלת, תאים B7 ו-B8 יציגו לנו את מספר הביקורים עליהם מבוסס הדו"ח ואת אחוז הדגימה.

טיפ – על מנת לבדוק בקלות שכל הדו"חות עודכנו ואינם מכילים דאטה מסומפלת, מומלץ לייצר טאב בקרה שימשוך את ערכי התאים A1, B2 ו-B6 מכל אחד מהדו"חות, כך שתתקבל טבלה שתיראה כך:

אז מה הטריק שמאפשר לעקוף את הסימפול דרך ספרדשיט?

בגלל שכל עמודה בטאב Report Configuration מייצרת למעשה דו"ח נפרד, אם הגורם לסימפול הוא הרצון להסתכל על דאטה מתקופה ארוכה, נוכל לייצר עמודות זהות שלכל אחת מהן נגדיר טווח זמן קצר שלא גורם לסימפול. לאחר מכן נפתח טאב נוסף ונסכום את התוצאות מהטאבים השונים.

אם הדו"חות מתבססים על מימדים (dimensions) עם ערכים קבועים, למשל Device Category, נוכל להגדיר ב-Report Configuration שהעמודות יסודרו לפי מימד זה. במידה ומודבר במימד עם ערכים משתנים כמו Source / Medium, נוכל להיעזר בנוסחת vlookup או ב-pivot table.