סטנדרטים מערכתיים ואות The Zioneer
איך The Zioneer מדווח: דירוג המהימנות בן חמש הדרגות של האות, הכללים שאנו אוכפים בקוד, מדיניות המקורות הפתוחים, והסבר ישר על האופן שבו בינה מלאכותית ופיקוח אנושי פועלים יחד.
איך אנחנו מדווחים
The Zioneer הוא מחלקת מודיעין מבוססת בינה מלאכותית. אנחנו מנטרים מקורות פתוחים וציבוריים מסביב לשעון, מנסחים ועורכים כל ידיעה דרך צנרת מובנית, ומצמידים לכל אחת דירוג מהימנות גלוי — אות The Zioneer — כדי שתוכלו לראות במבט אחד עד כמה טענה מבוססת.
העמוד הזה הוא התיאור המלא של השיטה הזאת. הוא איננו הצהרת כוונות; הכללים החשובים ביותר המתוארים כאן כתובים בתוך המערכת כקוד, לא כהמלצה. במקום שבו מגבלה נאכפת אוטומטית, אנחנו אומרים זאת ומסבירים בדיוק מה היא עושה. אנחנו מעדיפים להבטיח פחות ולזכות באמון, מאשר להבטיח יותר ולהיתפס חסרים.
הערה על השלב שבו אנו נמצאים: The Zioneer בתחילת דרכו, ואנחנו מעלים את הצנרת האוטומטית המתוארת בעמוד הזה לאוויר בשלבים. במקום שבו בדיקה עדיין אינה מיושמת על כל ידיעה אנחנו אומרים זאת, ולא מרמזים אחרת. האות שמרני במכוון: הוא עולה מעל דרגת “מתפתח” רק כאשר ידיעה מאוששת על ידי מקורות עצמאיים באמת, וידיעה ממקור יחיד לעולם אינה מוצגת מעל “מתפתח”, ויהא הדבר סביר ככל שיהיה. שום דבר בעמוד הזה אינו יכולת שאנו רק מקווים לה; היא קיימת בפועל, או מסומנת ככזו שנמצאת בתהליך עלייה לאוויר.
אמת המידה שלנו פשוטה לניסוח וקשה לקיום: לדווח מהר, להציג את מידת הביטחון שלנו ביושר, להפריד בין מה שאומת לבין מה שרק דווח, ולעולם לא להציג טענה שנוצרה כאילו היא נושאת ודאות רבה יותר ממה שמקורותיה מתירים.
אות The Zioneer
כל ידיעה שאנחנו מפרסמים נושאת את אות The Zioneer — דירוג בן חמש דרגות למידת הביסוס של הטענה המרכזית על ידי המקורות שבידינו. האות מוצג כסולם בן חמישה שנתות עם סמל ומילת דרגה, כך שהדירוג לעולם אינו תלוי בצבע בלבד. עיינו בדוגמית החיה שלהלן.
מאומת — אושש על ידי כמה מקורות בלתי-תלויים; ביטחון גבוה.
מבוסס — כמה מקורות; מבוסס היטב, אך טרם אומת במלואו.
מתפתח — מקור יחיד או שלב מוקדם; דווח, אך טרם אושש.
מוטל בספק — מפוקפק; מקורות סותרים או חלשים.
שקרי — הוערך כלא-נכון או הופרך.
האות אינו קבוע. ככל שמגיע אישוש, ידיעה יכולה לטפס ממתפתח למבוסס למאומת; ככל שטענה נחלשת, היא יכולה לרדת. כשזה קורה, הידיעה מתעדכנת במקומה והשינוי מתועד — היא אינה מוחלפת בחשאי. האות עונה על שאלה אחת בלבד: עד כמה כדאי לכם לבטוח בטענה הזאת, כרגע, לאור מה שאנחנו רואים.
- מאומת
אושש על ידי כמה מקורות בלתי-תלויים; ביטחון גבוה.
- מבוסס
כמה מקורות; מבוסס היטב, אך טרם אומת במלואו.
- מתפתח
מקור יחיד או שלב מוקדם; דווח, אך טרם אושש.
- מתפתח
מפוקפק; מקורות סותרים או חלשים.
- שקרי
הוערך כלא-נכון או הופרך.
דוגמה חיה — ידיעה ממקור יחיד לעולם לא תיקרא כ“מאומת”. המכשיר מצמיד אותה ל“מתפתח” ומראה מדוע.
מה האות — ומה איננו
אות The Zioneer הוא הערכת המהימנות של המחלקה שלנו עצמה. הוא איננו בדיקת עובדות של צד שלישי. איננו מוסמכים על ידי, ואיננו טוענים לחברות באף רשת בדיקת-עובדות חיצונית; האות אינו פסיקת ClaimReview ואין לקרוא אותו כך. זהו שיקול הדעת של המחלקה לגבי מצב הראיות, חשוף לעין.
ההבחנה הזאת חשובה. דירוג מאומת אומר שהתהליך שלנו מצא כמה אותות בלתי-תלויים המאששים את הטענה המרכזית — לא שגורם חיצוני ביקר את הידיעה. אנחנו מציגים את ספירת האישוש לצד האות בדיוק כדי שאפשר יהיה לשקול את הדירוג, לא רק לבטוח בו.
אנחנו מחייבים את עצמנו במשמעת הדירוג. יושרת האות תלויה בכללים שבחלק הבא, הנאכפים אוטומטית במקום שיופקדו בידי כוונות טובות.
כללים שאנחנו אוכפים בקוד
חלק מהסטנדרטים חשובים מכדי להותירם לשיקול דעת תחת לחץ של דדליין, ולכן בנינו אותם לתוך הצנרת עצמה. אלה אינם העדפות מערכתיות; אלה מגבלות קשיחות שהמערכת אינה יכולה לעקוף. ככל שאנו מעלים כל שלב של הצנרת לאוויר, אלה הכללים שתחתם הוא פועל.
פחות משני מקורות לעולם אינו יכול להיות מאומת או מבוסס. אם לידיעה יש מקור אחד בלבד, המערכת מצמצמת את דירוגה אוטומטית למתפתח ומציגה הערה גלויה — “מקור יחיד · לא ניתן לאישור”. אין עקיפה. (הצמצום הזה פעיל כבר היום.)
כל טענה חייבת להיקשר למקור. שלב ביקורת בודק שכל טענה עובדתית בידיעה מעוגנת במקור. טענה ללא ביסוס חוסמת פרסום באופן מוחלט — הידיעה אינה מתפרסמת עד שהפער נסגר.
האשמות לא-מוכחות נגד אנשים בשמם מנותבות לבדיקה אנושית. ידיעה המטיחה האשמה לא-מוכחת באדם מזוהה מוצאת מהמסלול האוטומטי ומוחזקת בבדיקה אנושית, שם היא מופיעה במצב “בבדיקה” במקום להתפרסם מעצמה.
לעולם איננו ממציאים מקורות או ציטוטים. המחלקה אינה ממציאה מובאות, ייחוסים או ציטוטים כדי לסתום פער. טענה ללא מקור אמיתי נחשבת כבלתי-מבוססת — ראו הכלל שלמעלה.
כל מאמר שמתפרסם קיים בעברית ובאנגלית כאחת. אף שפה אינה מחשבה שנייה; ידיעה אינה שלמה עד ששתי הגרסאות קיימות.
המערכת נכשלת לכיוון הבטוח. בכל שגיאה, או בהגעה למגבלת תקציב, הצנרת אינה מפרסמת. ברירת המחדל הבטוחה היא שתיקה, לעולם לא ידיעה שלא נבדקה.
אם אחד מהכללים האלה מתנגש עם מהירות, הכלל מנצח.
מקורות: קליטה פתוחה, אחריות הדסק
אנחנו מדווחים מחומר גלוי הזמין לציבור: ערוצים ציבוריים, הזנות RSS וחדשות, ודיווח פומבי. איננו מציגים את עצמנו כמי שיש בידיו מודיעין חסוי, גישה בלעדית, או מקורות סמויים שאיננו יכולים לתאר.
המפרסם הציבורי של ידיעות שגרתיות הוא מחלקת המודיעין של The Zioneer. ערוצי הקליטה הגולמיים הם פרובננס תפעולי, לא חתימות משנה ולא המלצות. אנחנו נוקבים בשם כלי תקשורת, ערוץ, מסמך או רשות ציבורית כאשר הדבר מסייע מהותית לקורא לבחון טענה מסוימת; אחרת המחלקה נושאת באחריות לחשבון שפורסם.
מכיוון שהמקורות שלנו פתוחים, ניתן לבחון אותם. דירוג מאומת או מבוסס משקף כמה אותות פתוחים בלתי-תלויים המתכנסים אל אותה טענה; דירוג מתפתח משקף אות יחיד או תיאור שטרם התייצב. אנחנו שוקלים עצמאות, לא כמות — עשרה כלי תקשורת המהדהדים מקור אחד הם עדיין מקור אחד, והתהליך שלנו בנוי לזהות זאת ולא להיתעות מהֵד.
זהו הגבול הישר של מה שאנחנו עושים. אנחנו מעלים, מאששים ומדרגים את מה שהרשומה הפתוחה מראה. אנחנו מפורשים לגבי ההיקף הזה כדי שתוכלו לקרוא את עבודתנו בדיוק כפי שהיא.
בינה מלאכותית ופיקוח אנושי, בלי כחל ושרק
The Zioneer נשען על בינה מלאכותית מהיסוד. הידיעות שלנו נוצרות ומורכבות בידי בינה מלאכותית בפיקוח עריכה אנושי. אנחנו אומרים לכם זאת ישירות מפני שמגיע לכם לדעת כיצד העבודה נעשית, ומפני שיושר בעניין הזה הוא חלק מאמת המידה שלנו.
הנה מה שזה אומר. מערכות בינה מלאכותית קוראות את המקורות הפתוחים, מנסחות טיוטת ידיעה, משוות אותה למה שכבר פרסמנו כדי למנוע כפילות בסיקור, מחליטות אם היא חדשה, עדכון, או לא ראויה לפרסום, מקצות את אות The Zioneer, ובודקות שכל טענה נקשרת למקור. כללי היושרה שבחלק שלמעלה שולטים בכל השרשרת הזאת, ואנחנו מעלים את שלביה לאוויר בזה אחר זה.
אנחנו ישרים גם לגבי המגבלות. בינה מלאכותית עלולה לקרוא לא-נכון, לייחס בטעות, או להגזים. הערך של המודל שלנו אינו שהמכונה אינה טועה — היא כן — אלא שאותו תהליך ממושמע רץ על כל ידיעה, במהירות, כשמכשור המהימנות מובנה וגלוי. החוזקות הן עקביות, מהירות והאות; ההגנה מפני החולשות היא הכללים הנאכפים בקוד והשער האנושי המתואר להלן. לא נלביש על הבינה המלאכותית משהו שאיננה, ולא נעמיד פנים שיש לנו מערכת חדשות אנושית מסורתית שאין לנו.
השער האנושי
פרסום אוטונומי מכובה כברירת מחדל. שער אנושי ניצב בקצה הצנרת, והוא דולק עד שאדם מכבה אותו במפורש. עד אז, המחלקה פועלת עם-אדם-בלולאה: הבינה המלאכותית מכינה את העבודה, אדם עומד בפתח.
שני סוגים לעולם אינם תלויים במתג ההוא. האשמות לא-מוכחות נגד אנשים בשמם מנותבות תמיד לבדיקה אנושית, וכל ידיעה המפעילה כלל יושרה נחסמת תמיד, ללא קשר למצב השער. אלה מוחלטים.
אנחנו מתארים את העמדה הנוכחית ביושר, ולא מבטיחים מצב-קצה קבוע לנצח. אם וכאשר יופעל פרסום אוטונומי לידיעות שגרתיות ומאוששות היטב, כללי היושרה ובדיקת ההאשמות-בשם נשארים בתוקף — אלה אינם מתכבים. מהירות לעולם אינה גוברת על אמצעי ההגנה.
האשמות, טעויות, והרשומה
נקיבת שמו של אדם נושאת נטל גבוה יותר, ואנחנו נוהגים בה כך. האשמה לא-מוכחת נגד אדם מזוהה אינה יכולה להתפרסם מעצמה; היא מוחזקת בבדיקה אנושית ומופיעה במצב “בבדיקה” עד שאדם יכריע. איננו מתירים לאלגוריתם להיות השופט הראשון והיחיד של טענה נגד שמו של אדם אמיתי.
כשאנחנו טועים, אנחנו מתקנים בגלוי. אנחנו מגרסים את הידיעה, מסמנים מה השתנה, ושומרים את הרשומה — איננו מוחקים בחשאי או משכתבים את ההיסטוריה. הסרה נשארת על העמוד כהסרה. מדיניות התיקונים וההסרות המלאה שלנו, ובכללה כיצד לדווח על טעות, מפורטת בעמוד נפרד.
החוט המקשר של כל סטנדרט כאן זהה: להציג את הביטחון שלנו, להציג את משמעת המקורות שלנו, להציג את השינויים שלנו, ולעולם לא להתיר למהירות לקנות לטענה ודאות רבה יותר משזכתה בה.