סטנדרטים מערכתיים

סטנדרטים מערכתיים ואות The Zioneer

איך The Zioneer מדווח: דירוג המהימנות בן חמש הדרגות של האות, הכללים שאנו אוכפים בקוד, מדיניות המקורות הפתוחים, והסבר ישר על האופן שבו בינה מלאכותית ופיקוח אנושי פועלים יחד.

⁦31°46′40.7″N 35°14′07.7″E⁩

איך אנחנו מדווחים

The Zioneer הוא מחלקת מודיעין מבוססת בינה מלאכותית. אנחנו מנטרים מקורות פתוחים וציבוריים מסביב לשעון, מנסחים ועורכים כל ידיעה דרך צנרת מובנית, ומצמידים לכל אחת דירוג מהימנות גלוי — אות The Zioneer — כדי שתוכלו לראות במבט אחד עד כמה טענה מבוססת.

העמוד הזה הוא התיאור המלא של השיטה הזאת. הוא איננו הצהרת כוונות; הכללים החשובים ביותר המתוארים כאן כתובים בתוך המערכת כקוד, לא כהמלצה. במקום שבו מגבלה נאכפת אוטומטית, אנחנו אומרים זאת ומסבירים בדיוק מה היא עושה. אנחנו מעדיפים להבטיח פחות ולזכות באמון, מאשר להבטיח יותר ולהיתפס חסרים.

הערה על השלב שבו אנו נמצאים: צנרת v2 האוטומטית המתוארת כאן היא מסלול הפרסום החי. היא מנסחת, מסירה כפילויות, מבקרת, מפעילה בקרות פרסום ומפיקה תוכן דו-לשוני. פריטים שגרתיים יכולים להתפרסם באופן אוטונומי לאחר הבדיקות האלה; בני אדם מנטרים את המערכת, מבקרים את תוצריה, חוקרים חריגים ומטפלים בתיקונים, אך אינם קוראים מראש כל פריט. האות שמרני במכוון: הוא עולה מעל דרגת “מתפתח” רק כאשר ידיעה מאוששת על ידי מקורות עצמאיים באמת, וידיעה ממקור יחיד לעולם אינה מוצגת מעל “מתפתח”, ויהא הדבר סביר ככל שיהיה.

אמת המידה שלנו פשוטה לניסוח וקשה לקיום: לדווח מהר, להציג את מידת הביטחון שלנו ביושר, להפריד בין מה שאומת לבין מה שרק דווח, ולעולם לא להציג טענה שנוצרה כאילו היא נושאת ודאות רבה יותר ממה שמקורותיה מתירים.

אות The Zioneer

כל ידיעה שאנחנו מפרסמים נושאת את אות The Zioneer — דירוג בן חמש דרגות למידת הביסוס של הטענה המרכזית על ידי המקורות שבידינו. האות מוצג כסולם בן חמישה שנתות עם סמל ומילת דרגה, כך שהדירוג לעולם אינו תלוי בצבע בלבד. עיינו בדוגמית החיה שלהלן.

מאומת — אושש על ידי כמה מקורות בלתי-תלויים; ביטחון גבוה.

מבוסס — כמה מקורות; מבוסס היטב, אך טרם אומת במלואו.

מתפתח — מקור יחיד או שלב מוקדם; דווח, אך טרם אושש.

מוטל בספק — מפוקפק; מקורות סותרים או חלשים.

שקרי — הוערך כלא-נכון או הופרך.

האות אינו קבוע. ככל שמגיע אישוש, ידיעה יכולה לטפס ממתפתח למבוסס למאומת; ככל שטענה נחלשת, היא יכולה לרדת. כשזה קורה, הידיעה מתעדכנת במקומה והשינוי מתועד — היא אינה מוחלפת בחשאי. האות עונה על שאלה אחת בלבד: עד כמה כדאי לכם לבטוח בטענה הזאת, כרגע, לאור מה שאנחנו רואים.

דוגמית · אות The Zioneer

מאומת
אושש על ידי כמה מקורות בלתי-תלויים; ביטחון גבוה.
מבוסס
כמה מקורות; מבוסס היטב, אך טרם אומת במלואו.
מתפתח
מקור יחיד או שלב מוקדם; דווח, אך טרם אושש.
מתפתח
מפוקפק; מקורות סותרים או חלשים.
שקרי
הוערך כלא-נכון או הופרך.

מתפתח· 3/5מקור יחיד · לא ניתן לאישור

דוגמה חיה — ידיעה ממקור יחיד לעולם לא תיקרא כ“מאומת”. המכשיר מצמיד אותה ל“מתפתח” ומראה מדוע.

מה האות — ומה איננו

אות The Zioneer הוא הערכת המהימנות של המחלקה שלנו עצמה. הוא איננו בדיקת עובדות של צד שלישי. איננו מוסמכים על ידי, ואיננו טוענים לחברות באף רשת בדיקת-עובדות חיצונית; האות אינו פסיקת ClaimReview ואין לקרוא אותו כך. זהו שיקול הדעת של המחלקה לגבי מצב הראיות, חשוף לעין.

ההבחנה הזאת חשובה. דירוג מאומת אומר שהתהליך שלנו מצא כמה אותות בלתי-תלויים המאששים את הטענה המרכזית — לא שגורם חיצוני ביקר את הידיעה. אנחנו מציגים את ספירת האישוש לצד האות בדיוק כדי שאפשר יהיה לשקול את הדירוג, לא רק לבטוח בו.

אנחנו מחייבים את עצמנו במשמעת הדירוג. יושרת האות תלויה בכללים שבחלק הבא, הנאכפים אוטומטית במקום שיופקדו בידי כוונות טובות.

כללים שאנחנו אוכפים בקוד

חלק מהסטנדרטים חשובים מכדי להותירם לשיקול דעת תחת לחץ של דדליין, ולכן בנינו אותם לתוך הצנרת החיה. אלה אינם העדפות מערכתיות; אלה מגבלות שהמסלול האוטומטי חייב לעמוד בהן.

פחות משני מקורות לעולם אינו יכול להיות מאומת או מבוסס. אם לידיעה יש מקור אחד בלבד, המערכת מצמצמת את דירוגה אוטומטית למתפתח ומציגה הערה גלויה — “מקור יחיד · לא ניתן לאישור”. אין עקיפה. (הצמצום הזה פעיל כבר היום.)

כל טענה חייבת להיקשר למקור. שלב ביקורת בודק שכל טענה עובדתית בידיעה מעוגנת במקור. טענה ללא ביסוס חוסמת פרסום באופן מוחלט — הידיעה אינה מתפרסמת עד שהפער נסגר.

טענות על אנשים מזוהים נושאות נטל גבוה יותר. הן חייבות להיקשר לרשומת המקור, לזהות מי מעלה את הטענה, ולהיכתב בשפה מסויגת כאשר הטענה לא הוכחה. שלבי הביקורת ובקרת הפרסום יכולים לחסום פריט לקוי. בדיקה אנושית זמינה לחריגים ולהשגות, אך אינה מתבצעת באופן אוניברסלי לפני פרסום.

לעולם איננו ממציאים מקורות או ציטוטים. המחלקה אינה ממציאה מובאות, ייחוסים או ציטוטים כדי לסתום פער. טענה ללא מקור אמיתי נחשבת כבלתי-מבוססת — ראו הכלל שלמעלה.

כל מאמר שמתפרסם קיים בעברית ובאנגלית כאחת. אף שפה אינה מחשבה שנייה; ידיעה אינה שלמה עד ששתי הגרסאות קיימות.

המשימה המושפעת נכשלת לכיוון הבטוח. אם שלב אוטומטי נדרש נתקל בשגיאה, בדיקת היושרה שלו נכשלת, או שבקרת הוצאה עוצרת אותו, אותה משימה אינה מתפרסמת. אין פירוש הדבר שכל תקלה אפשרית בשירות עוצרת את הפרסום כולו.

אם אחד מהכללים האלה מתנגש עם מהירות, הכלל מנצח.

מקורות: קליטה פתוחה, אחריות הדסק

אנחנו מדווחים מחומר גלוי הזמין לציבור: ערוצים ציבוריים, הזנות RSS וחדשות, ודיווח פומבי. איננו מציגים את עצמנו כמי שיש בידיו מודיעין חסוי, גישה בלעדית, או מקורות סמויים שאיננו יכולים לתאר.

המפרסם הציבורי של ידיעות שגרתיות הוא מחלקת המודיעין של The Zioneer. ערוצי הקליטה הגולמיים הם פרובננס תפעולי, לא חתימות משנה ולא המלצות. אנחנו נוקבים בשם כלי תקשורת, ערוץ, מסמך או רשות ציבורית כאשר הדבר מסייע מהותית לקורא לבחון טענה מסוימת; אחרת המחלקה נושאת באחריות לחשבון שפורסם.

מכיוון שהמקורות שלנו פתוחים, ניתן לבחון אותם. דירוג מאומת או מבוסס משקף כמה אותות פתוחים בלתי-תלויים המתכנסים אל אותה טענה; דירוג מתפתח משקף אות יחיד או תיאור שטרם התייצב. אנחנו שוקלים עצמאות, לא כמות — עשרה כלי תקשורת המהדהדים מקור אחד הם עדיין מקור אחד, והתהליך שלנו בנוי לזהות זאת ולא להיתעות מהֵד.

זהו הגבול הישר של מה שאנחנו עושים. אנחנו מעלים, מאששים ומדרגים את מה שהרשומה הפתוחה מראה. אנחנו מפורשים לגבי ההיקף הזה כדי שתוכלו לקרוא את עבודתנו בדיוק כפי שהיא.

בינה מלאכותית ופיקוח אנושי, בלי כחל ושרק

The Zioneer נשען על בינה מלאכותית מהיסוד. הידיעות שלנו נוצרות ומורכבות בידי בינה מלאכותית בפיקוח עריכה אנושי. אנחנו אומרים לכם זאת ישירות מפני שמגיע לכם לדעת כיצד העבודה נעשית, ומפני שיושר בעניין הזה הוא חלק מאמת המידה שלנו.

הנה מה שזה אומר. מערכות בינה מלאכותית קוראות מקורות פתוחים, מנסחות טיוטת ידיעה, משוות אותה למה שכבר פרסמנו כדי למנוע כפילות בסיקור, מחליטות אם היא חדשה, עדכון, או לא ראויה לפרסום, מקצות את אות The Zioneer, ובודקות את הטיוטה מול רשומת המקור שלה. השלבים האלה הם מסלול הפרסום האוטומטי החי.

אנחנו ישרים גם לגבי המגבלות. בינה מלאכותית עלולה לקרוא לא-נכון, לייחס בטעות, או להגזים. הערך של המודל שלנו אינו שהמכונה אינה טועה — היא כן — אלא שתהליך מובנה פועל במהירות כשמכשור המהימנות מובנה וגלוי. בדיקות אוטומטיות מפחיתות סיכון; הן אינן מבטלות אותו. מפעילים אנושיים מנטרים ביצועים, מבקרים תוצרים, חוקרים חריגים ומתקנים את הרשומה. לא נלביש על הבינה המלאכותית משהו שאיננה, ולא נעמיד פנים שיש לנו מערכת חדשות אנושית מסורתית שאין לנו.

פיקוח אנושי ופרסום אוטונומי

פרסום אוטונומי פעיל עבור חומר שגרתי שעובר בהצלחה את הצנרת האוטומטית. איננו טוענים שאדם מאשר כל פריט לפני הופעתו.

הפיקוח האנושי פועל ברמת המערכת והעריכה: מפעילים מנטרים תורים ותקלות, מבקרים תוצרים, מכוונים בקרות, חוקרים השגות ויכולים להחזיק, לתקן, למשוך או לעצור פרסום. בדיקות אוטומטיות נדרשות ובקרות הוצאה נשארות במסלול; משימה שנכשלת בהן אינה מתפרסמת.

ההבחנה הזאת חשובה: פיקוח מפעיל אינו זהה לבדיקה אנושית שורה אחר שורה. אנחנו חושפים את מודל הבקרה בפועל כדי שהקוראים יוכלו לשפוט את העבודה בלי להניח שקיים אמצעי הגנה שאינו קיים.

האשמות, טעויות, והרשומה

נקיבת שמו של אדם נושאת נטל גבוה יותר, ואנחנו נוהגים בה כך. האשמה לא-מוכחת חייבת להישען על רשומת המקור, להיות מיוחסת לאדם או לארגון שמעלה אותה, ולהיכתב בשפה המבהירה שלא הוכחה. ביקורת אוטומטית ובקרות פרסום יכולות לחסום נוסח לקוי; בדיקה אנושית משמשת לחריגים ולהשגות אמינות, ואינה מובטחת לכל פריט לפני פרסומו.

כשאנחנו טועים, אנחנו מתקנים בגלוי. אנחנו מגרסים את הידיעה, מסמנים מה השתנה, ושומרים את הרשומה — איננו מוחקים בחשאי או משכתבים את ההיסטוריה. הסרה נשארת על העמוד כהסרה. מדיניות התיקונים וההסרות המלאה שלנו, ובכללה כיצד לדווח על טעות, מפורטת בעמוד נפרד.

החוט המקשר של כל סטנדרט כאן זהה: להציג את הביטחון שלנו, להציג את משמעת המקורות שלנו, להציג את השינויים שלנו, ולעולם לא להתיר למהירות לקנות לטענה ודאות רבה יותר משזכתה בה.

⁦EOF · 31°46′40.7″N 35°14′07.7″E⁩