תקציר מאמר שהתפרסם ב- Journal of Sports Sciences

נשים וגברים במרתון דבלין
נשים וגברים במרתון דבלין


מבוא


נתוני עולם-אמיתי (Real-world data) מתייחסים לנתונים הנאספים באמצעים שאינם ניסויים מסורתיים במעבדה. בתחום הספורט, נתונים אלה כוללים מידע שמקורו ברשומות רפואיות אלקטרוניות, מערכות מעקב אחרי ספורטאים, תוצאות תחרויות, טכנולוגיות לבישות ומחקרי תצפית. כאשר נעשה בהם שימוש נכון, נתוני עולם-אמיתי מספקים דרך חשובה ליצירת ראיות עולם-אמיתי (real-world evidence) היכולות לשמש לצורך קביעת מדיניות.
לדוגמה, במשחקים האולימפיים בבייג׳ינג 2008, ‏23 מתוך 25 שיאי העולם בשחייה נקבעו על ידי ספורטאים שלבשו חליפות שחייה מפוליאוריתן, מה שהוביל לשיפור גדול בהישגים ולאחר מכן לאיסור על השימוש בחליפות אלו.
ככל שזמינות הנתונים גדלה והגישה לטכניקות אנליטיות מתקדמות משתפרת, סביר שנראה יותר מחקרים המשתמשים בנתוני עולם-אמיתי בספרות מדעי הספורט. כתוצאה מכך, גובר גם הסיכון להיות מוטעים על ידי ניתוחים מוטים או כאלה המושפעים ממשתנים מתערבים (Confounding variables) ולהיות מוצפים במאמצים מדעיים מבוזבזים, אם נתוני עולם-אמיתי אינם מטופלים כראוי.
בשנת 2015 פורסם בכתב העת Medicine & Science in Sports & Exercise מחקר של Deaner ושותפיו שטען כי גברים נוטים להאט יותר את מהירות הריצה במהלך מרתון, בהשוואה לנשים. המחקר היה המבוסס על נתוני עולם-אמיתי. הוא בחן את חלוקת הכוחות בריצה (pacing) של גברים ונשים במרתון. המחקר זכה לציטוטים רבים, הן בספרות המדעית והן בתקשורת הפופולרית, כראיה לכך שקיימים הבדלים “מולדים” בקצב הריצה המבוססים על מין או מגדר. לאור היקף הנתונים הגדול במחקר (91,929 רצים, מהם 41.5% נשים) והחשיבות העכשווית של העבודה, המחקר מהווה דוגמה דידקטית טובה לבחינת תקפות הטענות המקוריות ולהדגמה כיצד החלטות אנליטיות שונות עשויות להוביל לפרשנות מורכבת יותר ופחות מוטה של נתוני עולם-אמיתי.
כדי לבחון את תקפותן של טענות ממחקרים המשתמשים בנתוני עולם-אמיתי, ניתן לבדוק סדרה של עקרונות ונהלים מקובלים לניתוח נתונים מסוג זה. גם ניסויים מעבדתיים פרוספקטיביים וגם ניתוחי נתוני עולם-אמיתי צריכים להיות מונחים על ידי אותם עקרונות “מבוססי-תכנון":

  1. מומלץ לתעד את תכנון המחקר לפני ביצוע הניתוחים, כדי להבטיח ששאלת המחקר היא שמכוונת את הניתוח ומובילה לתשובה בעלת משמעות.
  2. יש לכמת ולהבין את הנתונים החסרים, כדי לדעת כיצד החוסר משפיע הן על הניתוח והן על יכולת הנתונים לענות על שאלת המחקר .
  3. יש לוודא את איכות הנתונים מבחינת סבירות ביולוגית ותוקף הקשרי (context validity ). למשל, ערכי גובה, משקל או גיל כמו “99” — המשמשים לעיתים קרובות כסמן לנתונים חסרים, צריכים להיבחן בקפידה.
  4. יש להצהיר במפורש על ההנחות לגבי תהליך יצירת הנתונים, אשר עשויות להשפיע על ההטיה או על פרשנות התוצאות, ולבחון את תקפותן באופן ביקורתי.
    ארבעת העקרונות הללו צריכים להנחות את תכנון ניסוי נתוני העולם-האמיתי, ולאחר מכן יש לבנות מודל אנליטי שמסוגל לענות על שאלת המחקר. שימוש במודל אנליטי יחיד מאפשר טיפול נכון בנתונים חסרים ויכול לייצג באופן ישיר את ההנחות שהוגדרו קודם לכן ובכך להימנע מריבוי בדיקות חד-פעמיות בעלות הטיות ומתאמים מבלבלים רבים.
    לבסוף, יש לאמת את הנחות המודל, ואם יש צורך, לנסח מחדש את המודל עד שהוא תקף, לפני הסקת מסקנות.
    במאמר זה בוחנים החוקרים מחדש את הטענות שלפיהן גברים נוטים להאט יותר מנשים במהלך ריצת מרתון. באופן ספציפי, נבדקו שני דברים:
  5. הטענה כי ההבדל בין המינים בחלוקת הכוחות בריצה הוא יציב ועקבי .(robust)
  6. האם חלק מההבדלים הגדולים לכאורה (למשל: “גברים האטו, בממוצע, ב-25% יותר מנשים”) אכן סבירים לאור הראיות, או שהם משקפים בחירות אנליטיות מסוימות.
    כדי לבחון את פרשנות העבודה המקורית, נבדקו שוב הנתונים של זמני ריצות המרתון שעליהן מבוססת העבודה המקורית, כדי לראות אם יש בהם ערכים לא סבירים. לאחר מכן נבדקו שיטות הניתוח של הנתונים.

שיטת המחקר


המטרה האנליטית המרכזית של המחקר הייתה להעריך את תקפות הטענה שלפיה “ההבדל בין המינים בקצב הריצה הוא יציב ועקבי”. לשם כך היה חשוב להקפיד על שלושה שלבים ראשוניים:

לשחזר באופן מדויק את הממצאים האנליטיים המרכזיים, כדי לאפשר הערכה הוגנת.

לבחון את תקפות הניתוחים המרכזיים בעבודות קודמות.

להעריך ידנית את הנתונים הגולמיים כדי לזהות דפוסים חריגים המעידים על אפשרות לארטיפקטים (נתונים שגויים או משתנים מתערבים שעלולים להשפיע על התוצאות).


לאחר השלמת שלבים אלה בוצע ניתוח אחר של הנתונים שנחשב בעיני החוקרים לעמיד יותר מבחינה אנליטית, תקף יותר ואינפורמטיבי יותר. בניתוח זה כל התוצאות והמסקנות נגזרות ממודל יחיד, במקום ממספר רב של בדיקות סטטיסטיות נקודתיות, כפי שמקובל לעיתים בספרות המדעית. מטרת הניתוח הסופי הייתה להדגים כיצד “חלוקה לקבוצות" (binning) של נתונים רציפים, הוספת התאמות שרירותיות לנתונים, ושימוש בבדיקות סטטיסטיות מנותקות זו מזו, יכולים לעוות את הממצאים ולהוביל לטענות מטעות.


סקירה של הממצאים האנליטיים המרכזיים שלפיהם גברים נוטים להאט יותר במרתון


המחקר של Deaner ושותפיו השתמש בנתונים מ-14 מרתונים בארצות הברית, שנערכו בשנת 2011. המחקר הגדיר שמירת הקצב (pace maintenance) באמצעות חישוב אחוז השינוי בקצב במחצית השנייה של המרתון, יחסית למחצית הראשונה.
המחקר הנוכחי שכפל במדויק את ממצאי המחקר המקורי, שלפיהם היו 91,929 זמנים שנמדדו במרתונים, 41.5% מהם של נשים. הגיל הממוצע של הגברים היה 38.9 עם סטיית תקן של 10.8 שנים והגיל הממוצע של הנשים היה 35.5 עם סטיית תקן של  9.7 שנים. זמן הסיום הממוצע של הגברים היה 4 שעות ו-28 דקות עם סטיית תקן של 53 דקות וזמן הסיום הממוצע של הנשים היה 4 שעות ו-54 דקות עם סטיית תקן של 52 דקות.
השינוי הממוצע בקצב של הגברים במחצית השנייה היה 15.6% עם סטיית תקן של 14.2% ואילו אצל הנשים רק 11.7% עם סטיית תקן 10.9%, בדיוק כמו שנמצא במחקר של Deaner ושותפיו. אולם בבחינת התפלגות נתוני "אחוז ההאטה" היה ברור כי הנחת השונות הקבועה (המכונה גם הומוגניות של שונות או שוויון שונויות) עלולה להיות שגויה, דבר שעלול להוביל לממצאים שגויים.
ואכן, שלושה מבחנים סטטיסטיים שונים לבדיקת שוויון שונויות, כולם הראו כי הנחה מרכזית זו הופרה.


בדיקה ידנית של הנתונים הגולמיים לזיהוי דפוסים חריגים


בדיקה ידנית של נתונים מהעולם האמיתי לצורך זיהוי דפוסים חריגים היא שלב חיוני, שכן חריגות גדולות או מבנים לא מזוהים בנתונים יכולים להשפיע באופן משמעותי על המסקנות. הבדיקה הידנית של הנתונים הגולמיים הראתה כי היה רץ בן שנה אחת שסיים מרתון בזמן של 3 שעות ו-51 דקות, וכן עשרה בני 99 שסיימו מרתונים בזמן ממוצע של 4 שעות ו-35 דקות. כל 11 התצפיות הללו אינן סבירות והיו צריכות להיות מוסרות מהנתונים לפני ביצוע הניתוח. בהתחשב במספר הקטן של תצפיות אלה ביחס לגודל המדגם, חריגות אלו אינן מקור השגיאה העיקרי בניתוח. עם זאת, חוסר הקפדה על שלמות הנתונים עלול להשפיע לרעה על האמידה, ההסקה הסטטיסטית ועל מידת האמון הכללית באיכות העבודה.
המחקר המקורי (המחקר של Deaner ושותפיו) חילק את הנתונים בדרכים שונות, למשל על ידי חלוקת הנבדקים לקבוצות לפי מרווחים של חצי שעה בזמן הסיום: 3:00–3:30, ‏3:30–4:00, וכן הלאה. בוצעה גם התאמה של גבולות הקטגוריות הללו ב-12 אחוז כדי להשוות בין גברים ונשים (ההנחה של מחברי המחקר הייתה כי גברים מהירים מנשים בממוצע ב-12%). מהנחה זו משתמע שמרתון של 3:00 שעות אצל גברים שקול בערך למרתון של 3:22 שעות אצל נשים, בשל הבדלים ביולוגיים בתכונות כמו צריכת חמצן מרבית, מסת שריר וריכוז תאי דם אדומים. אם משווים ישירות בין רצים ורצות עם זמן של 3:00, האישה היא ברמה גבוהה יותר, כלומר סביר שהיא מתאמנת יותר ויש לה יותר ניסיון, מה שעשוי להתבטא גם בחלוקת כוחות טובה יותר. הניתוח הצביע על כך שההאטה הגדולה ביותר בחצי השני של המרתון מתרחשת אצל רצים איטיים יותר, במיוחד אם הם גברים. עם זאת הדגישו Deaner ושותפיו כי הבדל בין המינים בקצב הריצה התרחש בכל קבוצות הגיל ובכל קבוצות זמני הסיום. לפי טענתם מדובר בהבדל גדול: גברים מהירים האטו ב25% יותר מנשים מהירות, וגברים איטיים האטו ב-30% יותר.


הגישה המתוקנת


מחברי המחקר הנוכחי, טנאן ובורג, מתעניינים ב“נתונים מהעולם האמיתי”, קטגוריה רחבה מאוד שמתייחסת למעשה למידע שאינו נאסף בניסויי מעבדה מסורתיים. זהו מקור נתונים חשוב וגדול ברפואה ובאישורי תרופות, וגם מקור נתונים שעדיין ברובו לא מנוצל בתחום הספורט. אך יש בו בעיות: אם לא מטפלים בו בזהירות, תוך תשומת לב למקורות של הטיה או שגיאה ושימוש בשיטות ניתוח מתאימות, המסקנות עלולות להיות שגויות.
בהתאם לכך, טנאן ובורג ניתחו מחדש את הנתונים הגולמיים של Deaner ושותפיו במטרה לשחזר את התוצאות, לבדוק את תקפות ההנחות, ולבצע ניתוח עצמאי בשיטות שונות כדי לראות אם הן מובילות לאותן מסקנות.
החששות הרציניים יותר נוגעים לעומקם של עניינים מתודולוגיים סטטיסטיים: הדרכים שבהן הנתונים הגולמיים חורגים מהתפלגות נורמלית בצורת פעמון, ההחלטה לקבץ מסיימים לפי מרווחים של חצי שעה, וההתאמה של 12 אחוז לזמני הנשים. הגורמים הללו, לטענתם של טנאן ובורג, עלולים להוביל למסקנות שגויות.
הניתוח החדש השתמש בגישה סטטיסטית אחרת כדי להתמודד עם החסרונות הללו. הוא הראה שהבדלים בחלוקת הכוחות בין גברים לנשים אינם יציבים (robust) וכי הם הופיעו רק כאשר זמני הסיום היו יחסית איטיים (מעל 4 שעות) ואצל רצים מתחת לגיל 40. יתרה מכך, גם כאשר נמצאו עדויות להבדלי קצב בין גברים לנשים, גודל ההבדלים היה מתון יחסית. ההנחה במחקר המקורי כי ההבדל של 12% בזמנים בין נשים וגברים מתקיים באופן שווה בכל הגילים והרמות היא כנראה לא מדויקת. בניתוח של זמני הסיום של מרתון ניו יורק בשנים 2006 עד 2010 נמצא כי ההבדל במהירות הריצה בין גברים לנשים לא היה עקבי בין קבוצות הגיל. הוא נע בין 12.7% (בקבוצת הגיל 30–39) ל-20.8% (בקבוצת הגיל 70–79).
המאמר של Deaner ושותפיו מתאר את ההבדלים בין המינים כ“יציבים" (robust) כאלה שנמצאים בכל טווח הגילים ובכל טווח זמני הסיום, וככאלה שסביר שהם משקפים הבדלים פיזיולוגיים בין המינים ו/או הבדלים בקבלת החלטות. לעומת זאת, הניתוח של טנאן ובורג במחקר הנוכחי, השתמש באותם נתונים כדי להראות שההבדלים הללו תלויים גם בגיל וגם בזמן הסיום. אם זה המצב, טוענים טנאן ובורג, סביר יותר שדפוסי הקצב משקפים “הבדל חברתי” ולא אמת ביולוגית או אבולוציונית בסיסית.
בנוסף לכך, הטענה שגברים מאטים ב-25% יותר מנשים מגזימה בגודל האפקט. בקרב מסיימי שלוש שעות, גברים האטו ב-6.9% ונשים מקבילות ב-5.5%. באופן פורמלי, זה אכן הבדל של 25%, אך טנאן ובורג טוענים כי תיאור מדויק יותר יהיה הבדל של 1.4 יחידות אחוז.


סיכום


בניגוד לטענות שהועלו במחקר המקורי של Deaner ושותפיו, לא נמצא במחקר של טנאן ובורג הבדל שיטתי בחלוקת הכוחות בין המינים. השונות בקצב הריצה מתחלקת לפי זמן סיום המרתון, גיל ומין. טנאן ובורג סבורים שממצא זה פחות סביר שיבטא מנגנון ביולוגי, כפי שנטען קודם לכן, ויותר משקף הבדל חברתי באוכלוסיות.
טנאן ובורג מקווים שהמאמר שלהם ישמש דוגמה לגבי המכשולים שבניתוח נתונים מהעולם האמיתי, ויתקן את התיעוד המדעי בנוגע להבדלים בין המינים בחלוקת הכוחות במרתון. בסופו של דבר, אף מסד נתונים של תוצאות מרוץ, גדול ככל שיהיה, אינו יכול לומר לנו מה גורם להבדלים בקצב הריצה. התמונה הפשוטה של גברים שרצים מרתון "כמו טיפשים” היא כנראה פשטנית מדי, למרות שורה של מחקרים דומים שדיווחו על תוצאות דומות באמצעות שיטות דומות. נתונים מהעולם האמיתי הם מורכבים, אין לצפות מהם לספק תשובות פשוטות.


מקורות:

1.Tenan MS, Borg DN. Improving real-world data analysis: Revisiting claims that gender meaningfully impacts marathon pacing. J Sports Sci. 2025 Dec 29:1-14.

2.Alex Hutchinson. Do Women Really Pace Marathons Better than Men? Outside Magazine. May 6, 2026


3.Deaner, R. O., Carter, R. E., Joyner, M. J., & Hunter, S. K. (2015). Men are more likely than women to slow in the marathon. Medicine and Science in Sports and Exercise, 47(3), 607. https://doi.org/10.1249/MSS.0000000000000432

יש לך שאלה למומחים של המרכז האקדמי לוינסקי-וינגייט? אין צורך להתבייש, רק ללחוץ כאן