שיחת ויקיפדיה:תחזוקה/שתי שקל
הוספת נושאערך זה צוטט במי הבוט: הכירו את הכוחות הנסתרים שעורכים את ויקיפדיה, באתר ערוץ עשר, 22.01.2018.
על שתי שקל ובעיות מין אחרות של מספרים
[עריכת קוד מקור]השיבוש "שתי שקל" מוכר וידוע, ואפילו ראש ממשלתנו הנערץ עמד על חומרתו [1]. יש לי רושם שאנו מודעים פחות לעובדה שגם במספרים גדולים יותר יש להבחין בין זכר לנקבה. פעמים רבות אני נתקל, בוויקיפדיה ומחוצה לה, בצירופים שבהם מספר נכתב בצורה המתאימה לזכר בזמן שלאחריו מופיעה מילה בנקבה, למשל הצירוף "שלושת המעצמות", כשצריך להיות "שלוש המעצמות", או "ארבעת הקושיות", כשצריך להיות "ארבע הקושיות", ואפילו "חמשת המגילות" כשצריך להיות "חמש המגילות" ו"עשרת המכות" כשצריך להיות "עשר המכות". שימו לב ותקנו כאשר אפשר לתקן.
מומחי הבוטים מוזמנים לכתוב בוט שיציג את הצירופים החשודים כשגויים, כלומר מספר בזכר (מ"שלושת" ועד "עשרת") שאחריו מילה המסתיימת ב"ות". מובן שלא כל הצירופים שגויים ("עשרת הדברות", למשל, תקין), אבל זה ישמש בסיס לתיקון (אולי באמצעות שכלול של הבוט) דוד שי - שיחה 07:41, 18 באפריל 2013 (IDT)
- אנשים פשוט לא יודעים שיש הבדל בין זכר ונקבה במספרים אורדינליים בסמיכות. במספרים אורדינאליים רגילים עוד יודעים משהו. והצירוף שמונa עשרה הורג אותי כל פעם מחדש. • חבר לחיים - אמצו כלב! Ori • PTT 14:36, 18 באפריל 2013 (IDT)
- לא לשכוח גם שכשקוראים מתוך ויקיפדיה בקול, יש להגות "שְלוש המעצמות" עם שוא בראש המילה "שלוש", שהרי זוהי סמיכות... Liad Malone - שיחה 14:48, 18 באפריל 2013 (IDT)
- יצרתי דף שמרכז צירופים שתואמים את התבנית שהציע דוד בויקיפדיה:תחזוקה/שתי שקל. אפשר להסתייע ברשימה כדי למצוא טעויות ולתקן ידנית, ואם יש טעויות נפוצות במיוחד נוכל לתקנן עם בוט. ערן - שיחה 20:40, 18 באפריל 2013 (IDT)
- ערן, תודה רבה!! צעד גדול לשיפור המשלב הלשוני בוויקיפדיה. אגב, קבוצת "שלושת הקבוצות" וכו' (הייתה) גדולה במיוחד, ולא רק בערכי כדורגל, אז אנא שימו לב לכך במהלך כתיבתכם בעתיד . Ravit - שיחה 21:41, 18 באפריל 2013 (IDT)
- תודה רבה על הבוט המצוין. מתברר שיש לא מעט מילים שהן בזכר ומסתיימות ב"ות", אבל גם לאחר שסיננתי אותן נותרו מאות מילים לתיקון (כדאי ללמד את הבוט את המילים התקינות, כדי שיתעלם מהן בהרצה הבאה שלו). מצאתי מקרים מעטים שבהם הבוט זיהה מספר במקום שלא התכוון למספר ("שבעת" במשמעות "שבזמן", "להעשרת התרבות", "חוששת לגלות"). אני מציע להתעלם מה"א הידיעה, כך ש"עונות" ו"העונות" יופיעו יחד. אני מציע שאת כל המקרים של 7+ מופעים ומעלה הבוט יתקן. אם לא יהיו הפתעות, נרחיב ל-4 מופעים ומעלה. דוד שי - שיחה 22:00, 18 באפריל 2013 (IDT)
- דוגמאות נוספות לטעויות בזיהוי מספר: נשבע/להישבע (ולא שבע). כשמריצים בוט לתיקון הוא לא מבצע תיקונים לגבי "שבע" בגלל שזו החלפה מסוכנת יותר. ערן - שיחה 01:49, 19 באפריל 2013 (IDT)
- תודה רבה על הבוט המצוין. מתברר שיש לא מעט מילים שהן בזכר ומסתיימות ב"ות", אבל גם לאחר שסיננתי אותן נותרו מאות מילים לתיקון (כדאי ללמד את הבוט את המילים התקינות, כדי שיתעלם מהן בהרצה הבאה שלו). מצאתי מקרים מעטים שבהם הבוט זיהה מספר במקום שלא התכוון למספר ("שבעת" במשמעות "שבזמן", "להעשרת התרבות", "חוששת לגלות"). אני מציע להתעלם מה"א הידיעה, כך ש"עונות" ו"העונות" יופיעו יחד. אני מציע שאת כל המקרים של 7+ מופעים ומעלה הבוט יתקן. אם לא יהיו הפתעות, נרחיב ל-4 מופעים ומעלה. דוד שי - שיחה 22:00, 18 באפריל 2013 (IDT)
- ערן, תודה רבה!! צעד גדול לשיפור המשלב הלשוני בוויקיפדיה. אגב, קבוצת "שלושת הקבוצות" וכו' (הייתה) גדולה במיוחד, ולא רק בערכי כדורגל, אז אנא שימו לב לכך במהלך כתיבתכם בעתיד . Ravit - שיחה 21:41, 18 באפריל 2013 (IDT)
- יצרתי דף שמרכז צירופים שתואמים את התבנית שהציע דוד בויקיפדיה:תחזוקה/שתי שקל. אפשר להסתייע ברשימה כדי למצוא טעויות ולתקן ידנית, ואם יש טעויות נפוצות במיוחד נוכל לתקנן עם בוט. ערן - שיחה 20:40, 18 באפריל 2013 (IDT)
- לא לשכוח גם שכשקוראים מתוך ויקיפדיה בקול, יש להגות "שְלוש המעצמות" עם שוא בראש המילה "שלוש", שהרי זוהי סמיכות... Liad Malone - שיחה 14:48, 18 באפריל 2013 (IDT)
בעקבות התוצאות הנפלאות של הבוט הזה, אני מבקש גם את הבוט המקביל, זה שיגלה שיבושים מהצורה "ארבע שערים". אני משער שיתגלו פחות תוצאות. דוד שי - שיחה 00:32, 19 באפריל 2013 (IDT)
- יצרתי רשימה של מופעים כאלו (בלי "עשר שערים", שעשוי להיות "חמישה עשר שערים"). הרשימה מזובלת גם אחרי שסיננתי ממנה מילים נפוצות (פעמים/שנים), אבל יש גם בעיות אמתיות כמו "ארבע חודשים". אני מקווה ללמד את הבוט לזהות זכר/נקבה בהמשך לפחות לגבי המילים שהופיעו בתוצאות קודמות (לפי "תקין/תוקן") כך שבהרצות עתידיות התוצאות יהיו ממוקדות יותר. ערן - שיחה 01:44, 19 באפריל 2013 (IDT)
- ערן, זה נפלא! תודה. טוסברהינדי (שיחה) 07:10, 20 באפריל 2013 (IDT)
עוד עבודה רבה לפנינו לתיקון השגיאות שהבוט גילה עד כה, אבל אני מבקש לקבל מקבץ שלישי של שגיאות (וריאציה של המקבץ הראשון): מספר בזכר ("שני", "שלושה" עד "תשעה") שאחריו מילה המסתיימת ב"ות". דוד שי - שיחה 14:37, 20 באפריל 2013 (IDT)
- הרצתי פעם נוספת את הבוט ועדכנתי את הפסקה המתאימה. כעת הרשימה כוללת גם שלושה/ארבעה וכו' ומילים שסווגו כ"נקבה" למרות שמסתיימות ב"ים" (פעמים). אנא ציינו "תקין" רק לגבי מילים שהן ממין זכר (בפסקה המתאימה) ואם השימוש תקין מסיבה אחרת (למשל "שבעת" במשמעות של "שבזמן") לא להשתמש ב"תקין" אלא בניסוח אחר. הבוט נעזר אחר"כ במה שסומן כ"תקין" או כ"תוקן" כדי לזהות מילים כזכר/נקבה. לגבי דברים תקינים/תוקנו אפשר להסיר את ה' הידיעה (הבוט יודע להוסיף את ה' הידיעה לכל המילים במילון). ערן - שיחה 22:14, 20 באפריל 2013 (IDT)
- אפשר להריץ את הבוט שוב ולעדכן את הדף ? יהיה יותר קל לעבוד על דף נקי. גיא - שיחה 22:28, 2 במאי 2013 (IDT)
- העותק האחרון של מסד הנתונים בtoolserver הוא מ-17 באפריל ולכן התוצאות אמורות להיות זהות לאלו שהיו בהרצה הקודמת. אריץ את הבוט פעם נוספת כשיהיה dump עדכני. ערן - שיחה 23:33, 2 במאי 2013 (IDT)
- אפשר להריץ את הבוט שוב ולעדכן את הדף ? יהיה יותר קל לעבוד על דף נקי. גיא - שיחה 22:28, 2 במאי 2013 (IDT)
שלושת, ארבעת
[עריכת קוד מקור]מתי משתמשים ב"שלושת", "ארבעת" וכו' ? גיא - שיחה 11:41, 24 באפריל 2013 (IDT)
- כאשר מתייחסים לעצם ממין זכר, והמספר הוא בסמיכות, למשל: שלושת המוסקטרים, ארבעת המינים, חמשת מלכי מדין. דוד שי - שיחה 19:23, 24 באפריל 2013 (IDT)
- תודה. גיא - שיחה 00:25, 26 באפריל 2013 (IDT)
הצעות להרצה הבאה
[עריכת קוד מקור]- להתעלם מהמלה חשש + Xים (למשל: "...בשל חשש האמריקנים מפצצת אטום בידי הגרמנים..." מתוך פיתוחים טכנולוגיים במלחמת העולם השנייה
- להתעלם מ- באר שבע + Xים. איתמר ק. - שיחה 18:55, 5 במאי 2013 (IDT)
- אני בונה רשימה חדשה על סמך dump שיצא היום. הוספתי זאת ומעט מקרים כלליים נוספים. ערן - שיחה 21:48, 5 במאי 2013 (IDT)
- מתי צפויה הרצה הבאה ? גיא - שיחה 09:39, 26 במאי 2013 (IDT)
- כנראה לקראת סוף השבוע. בברכה, ערן - שיחה 20:51, 26 במאי 2013 (IDT)
- רק חצי מהרשימה עודכנה ? גיא - שיחה 08:41, 2 ביוני 2013 (IDT)
- הסקריפט מורץ בנפרד ליצירת רשימה של זכר ורשימת נקבה. כרגע עודכנה רק רשימה נקבה, ואח"כ תעודכן גם רשימת זכר. (אגב הריצה היא על DUMP מאתמול - כלומר נכנסים לשם גם תכנים שנוספו ממש לאחרונה). ערן - שיחה 08:53, 2 ביוני 2013 (IDT)
- יש הרבה תוצאות מסוג "באר שבע Xים" בתוצאות הריצה האחרונה. לייבניץ - שיחה 11:50, 12 באפריל 2017 (IDT)
- הסקריפט מורץ בנפרד ליצירת רשימה של זכר ורשימת נקבה. כרגע עודכנה רק רשימה נקבה, ואח"כ תעודכן גם רשימת זכר. (אגב הריצה היא על DUMP מאתמול - כלומר נכנסים לשם גם תכנים שנוספו ממש לאחרונה). ערן - שיחה 08:53, 2 ביוני 2013 (IDT)
- רק חצי מהרשימה עודכנה ? גיא - שיחה 08:41, 2 ביוני 2013 (IDT)
- כנראה לקראת סוף השבוע. בברכה, ערן - שיחה 20:51, 26 במאי 2013 (IDT)
- מתי צפויה הרצה הבאה ? גיא - שיחה 09:39, 26 במאי 2013 (IDT)
'שתי מיליון'
[עריכת קוד מקור]באותו הנושא גם לפני מליון חובה שיבוא המספר המונה בזכר לפי כללי האקדמיה.[2] יש מספר חזרות של חמש מיליון וכו', יש להוסיפן או לבוט או לרשימת התחזוקה, בברכה, Nurick - שיחה 13:48, 18 במאי 2013 (IDT)
- תוקן ידנית, אולי יש טעם עדיין להכניס לבוט האוטומטי, יש מספר גבוה של חזרות באופן יחסי, בברכה, Nurick - שיחה 17:48, 14 ביוני 2013 (IDT)
טון או טונות ?
[עריכת קוד מקור]מה נכון: "חמישה טון" או "חמש טונות" ? או אולי "חמישה טונות" ? גיא - שיחה 13:11, 2 ביוני 2013 (IDT)
- יחידת המשקל קרויה "טון" (זכר) וגם "טונה" (נקבה), לכן כל הצורות שמנית תקינות, אבל הצורה שתים עשרה טון אינה תקינה. דוד שי - שיחה 06:07, 3 ביוני 2013 (IDT)
פי שניים/ פי שתיים
[עריכת קוד מקור]מה נכון ? גיא - שיחה 09:04, 16 ביוני 2013 (IDT)
- פי שניים, פי שלושה - תמיד בזכר. דוד שי - שיחה 09:23, 16 ביוני 2013 (IDT)
- תודה. אולי כדאי להוסיף את הבדיקה לבוט. גיא - שיחה 09:34, 16 ביוני 2013 (IDT)
הצעות להרצה הבאה (סיבוב שני)
[עריכת קוד מקור]נראה לי הגיע הזמן להרצה נוספת (לחכות לdump גם לוקח קצת זמן), בכל אופן כדאי להתעלם מהביטוי 'בת שבע' + X. בברכה, Nurick - שיחה 13:32, 16 ביוני 2013 (IDT)
- ערן - אפשר להריץ את הבוט ? גיא - פתרון למחיקה 22:53, 7 בינואר 2015 (IST)
כבשים
[עריכת קוד מקור]לא ברור לי מתי זה נקבה ומתי זכר. גיא - שיחה 15:33, 10 ביולי 2013 (IDT)
תוצאות חוזרות
[עריכת קוד מקור]אני לא יודע אם מתוכננת ריצה נוספת, אבל כדאי שהבוט יוכל להתייחס לעמוד התוצאות ולא לתת שוב את כל התוצאות שכתוב עליהן תקין. במצב אידאלי היינו יכולים לכתוב ב"התעלמות" את כל התקינים, אבל זה לא קורה. לכן, כדי שלא נסמן שוב ושוב את אותן תוצאות כתקינות, כדאי שהבוט יעבוד גם לפי הדף הזה. תודה, בריאן - שיחה 16:56, 25 ביולי 2013 (IDT)
- בהרצה הבאה אשנה את הבוט כך שיזכור תוצאות קודמות. בברכה, ערן - שיחה 20:55, 25 ביולי 2013 (IDT)
- תודה! בריאן - שיחה 22:18, 25 ביולי 2013 (IDT)
- אבל צריך לשים לב - אם כתוב תקין על מילה מסויימת זה לא אומר שלא צריך לבדוק את המילה בכלל אלא רק בערכים מסויימים. גיא - שיחה 15:07, 26 ביולי 2013 (IDT)
- תודה! בריאן - שיחה 22:18, 25 ביולי 2013 (IDT)
הרצה נוספת
[עריכת קוד מקור]לאחר כמעט שנתיים מהסבב הקודם, אני חושב שיש מקום להרצה נוספת ולסבב תיקונים חוזר. כרגע תיקנתי למעלה מ-10 טעויות מסוג "שלושה פעמים" וכדומה. ערן, לעזרתך אודה. בריאן - שיחה 22:01, 7 במאי 2015 (IDT)
- אני משכתב את הבוט שיצר את הרשימה כך שיתן תוצאות יותר רלוונטיות. ערן - שיחה 21:53, 8 במאי 2015 (IDT)
- בריאן, כתבתי את הבוט מחדש והוספתי כעת פלט חלקי לדף ובהמשך יורץ על כל ויקיפדיה. בגרסה החדשה לא נעשה שימוש יותר במילון יוצאי דופן אלא בHspell שיודע להגיד לגבי מילה אם היא זכר/נקבה (אפשר לבדוק את התוצאה שלו בממשק אינטרנטי כשמפעילים "מידע לשוני") ולהציע משמעויות שונות. יכול להיות שבהמשך אוסיף מחדש אפשרות להתעלם ממילים מסוימות. ערן - שיחה 01:49, 9 במאי 2015 (IDT)
- מעולה! תודה! בריאן - שיחה 09:13, 9 במאי 2015 (IDT)
- את הטעויות הנפוצות (קבוצות, מדינות, דרכים) כדאי לתקן אוטומטית, אולי כהרחבה של בוט ההחלפות. כמו בוט ההחלפות, יש לאפשר גם כאן את תבנית:ללא בוט, לסימון חריגים שאין לתקן. דוד שי - שיחה 11:24, 9 במאי 2015 (IDT)
- מעולה! תודה! בריאן - שיחה 09:13, 9 במאי 2015 (IDT)
- בריאן, כתבתי את הבוט מחדש והוספתי כעת פלט חלקי לדף ובהמשך יורץ על כל ויקיפדיה. בגרסה החדשה לא נעשה שימוש יותר במילון יוצאי דופן אלא בHspell שיודע להגיד לגבי מילה אם היא זכר/נקבה (אפשר לבדוק את התוצאה שלו בממשק אינטרנטי כשמפעילים "מידע לשוני") ולהציע משמעויות שונות. יכול להיות שבהמשך אוסיף מחדש אפשרות להתעלם ממילים מסוימות. ערן - שיחה 01:49, 9 במאי 2015 (IDT)
אפשר להפוך כל מילה לפרק כדי שיהיה יותר נוח לסמן את התיקון ? גיא - פתרון למחיקה 14:01, 9 במאי 2015 (IDT)
- כל מילה יצור כנראה יותר מדי פרקים, אבל אפשר לחלק למקבצים קטנים יותר כרצונך :) ערן - שיחה 14:12, 9 במאי 2015 (IDT)
ערן, תוכל לבנות את הרשימה מחדש בבקשה ? היו הרבה תיקונים, כולל תיקוני בוט. גיא - פתרון למחיקה 22:44, 23 במאי 2015 (IDT)
- גיא, בשלב זה אי אפשר ליצור את הרשימה מחדש, כיוון שעדיין לא נוצר dump חדש - אפשר לראות ב[3] (ובאופן ספציפי ב[4] צריך שיהיה זמין All pages, current versions only.), עדיף לחכות ליצירת הdump הבא. בברכה, ערן - שיחה 23:20, 23 במאי 2015 (IDT)
- ערן, מה לגבי עכשיו ? גיא - פתרון למחיקה 21:18, 12 ביוני 2015 (IDT)
- הרצתי. ערן - שיחה 01:05, 13 ביוני 2015 (IDT)
- ערן, אפשר להריץ עוד פעם ? גיא - פתרון למחיקה 16:40, 24 ביולי 2015 (IDT)
- אני לא חושב שצריך להריץ כל חודש. בואו נסיים את רוב הרשימה הנוכחית ואז יהיה כדאי להריץ שוב. בריאן - שיחה 11:02, 25 ביולי 2015 (IDT)
- ערן, GuySh, נותרה רק הפסקה של "1" לתיקון ועברו כמעט 4 חודשים מאז ההרצה הקודמת. אפשר לסיים את התיקונים או להריץ שוב, לשיקולכם. בריאן - שיחה 14:25, 7 באוקטובר 2015 (IDT)
- אני בעד להריץ. גיא - פתרון למחיקה 14:36, 8 באוקטובר 2015 (IDT)
- ערן, GuySh, נותרה רק הפסקה של "1" לתיקון ועברו כמעט 4 חודשים מאז ההרצה הקודמת. אפשר לסיים את התיקונים או להריץ שוב, לשיקולכם. בריאן - שיחה 14:25, 7 באוקטובר 2015 (IDT)
- אני לא חושב שצריך להריץ כל חודש. בואו נסיים את רוב הרשימה הנוכחית ואז יהיה כדאי להריץ שוב. בריאן - שיחה 11:02, 25 ביולי 2015 (IDT)
- ערן, אפשר להריץ עוד פעם ? גיא - פתרון למחיקה 16:40, 24 ביולי 2015 (IDT)
- הרצתי. ערן - שיחה 01:05, 13 ביוני 2015 (IDT)
- ערן, מה לגבי עכשיו ? גיא - פתרון למחיקה 21:18, 12 ביוני 2015 (IDT)
ערן, ראיתי שהרצת ועדכנת, תודה. אך יש טעות משום מה: התוצאה הגדולה ביותר היא של המילה "המעמדות", אך כל המופעים הם תקינים והיא אף מופיעה במילון כחריגה. כדאי לבדוק איך בכל זאת נוצרה הטעות. בריאן - שיחה 20:06, 6 בנובמבר 2015 (IST)
- גם את "עשרת הדברות" כדאי לסמן כחריג תקין. דוד שי - שיחה 20:25, 6 בנובמבר 2015 (IST)
- עוד חריג תקין: "פי X מאות", כאשר X הוא מספר בנקבה (למשל "פי ארבע מאות"). דוד שי - שיחה 20:37, 6 בנובמבר 2015 (IST)
- הוספתי תיקון שיכנס לשימוש בהרצה הבאה. ערן - שיחה 21:00, 6 בנובמבר 2015 (IST)
- עוד חריג תקין: "פי X מאות", כאשר X הוא מספר בנקבה (למשל "פי ארבע מאות"). דוד שי - שיחה 20:37, 6 בנובמבר 2015 (IST)
- גם את "עשרת הדברות" כדאי לסמן כחריג תקין. דוד שי - שיחה 20:25, 6 בנובמבר 2015 (IST)
- כעת כשהבוט מתבסס על hspell (וללא החרגות), אם יש טעויות של ניתוח לשוני שגוי של מילה, זה כנראה יהיה בגלל שהמילה חסרה במילון של hspell. אפשר לוודא בבממשק ה-webי (עם מידע לשוני) כיצד hspell מנתח מילה, ואם הניתוח שגוי אפשר לשלוח מייל ל nyh@math.technion.ac.il ולבקש שיוסיפו/יתקנו מילה (אני מניח שנוח יותר לטפל ברשימה מסודרת ולא במייל בודד לכל מילה - אז אפשר לקראת סוף הטיפול ברשימה לשלוח רשימה מסודרת). בצורה הזו פרויקטים אחרים שנהנים מ-hspell יוכלו גם כן לקבל את התיקונים.
- מעמדות - נראה שהמילה לא מנותחת כמו שצריך/חסרה
- הדברות - hspell מבין (ולדעתי בצדק) שהכוונה היא להדברות (נגד מזיקים), ולא לעשרת הדיברות (עם י'). ערן - שיחה 20:47, 6 בנובמבר 2015 (IST)
- לכן ביקשתי להחריג את "עשרת הדברות" (זה האיות הנכון) הסיכוי שמישהו ידבר על עשרת הדברות ויתכוון לעשר הדברות של מזיקים קלוש ביותר. דוד שי - שיחה 21:04, 6 בנובמבר 2015 (IST)
- כעת כשהבוט מתבסס על hspell (וללא החרגות), אם יש טעויות של ניתוח לשוני שגוי של מילה, זה כנראה יהיה בגלל שהמילה חסרה במילון של hspell. אפשר לוודא בבממשק ה-webי (עם מידע לשוני) כיצד hspell מנתח מילה, ואם הניתוח שגוי אפשר לשלוח מייל ל nyh@math.technion.ac.il ולבקש שיוסיפו/יתקנו מילה (אני מניח שנוח יותר לטפל ברשימה מסודרת ולא במייל בודד לכל מילה - אז אפשר לקראת סוף הטיפול ברשימה לשלוח רשימה מסודרת). בצורה הזו פרויקטים אחרים שנהנים מ-hspell יוכלו גם כן לקבל את התיקונים.
EranBot
[עריכת קוד מקור]ערן, ראיתי תיקונים של הבוט. יש משהו שאנחנו צריכים לדעת ? גיא - פתרון למחיקה 19:57, 15 במאי 2015 (IDT)
- גיא, ניסיתי להריץ בוט שיטפל בחלק מהבעיות שנראו פחות מסוכנות אבל בוט לא יכול לרוץ בצורה עצמאית לגמרי על הרשימה כיוון שיש יותר מדי מקרים שבהם החלפה תהיה שגויה ("זקן שבע ימים", "לחמש עבדים בנשק" וכו') אבל אני מנסה להגדיר כלי חצי אוטומטי שיאפשר לתקן בצורה שיטתית בעיות כאלו. בברכה, ערן - שיחה 01:12, 16 במאי 2015 (IDT)
- את בעיית "שבע ימים" במשמעות של זקן תיקנתי באמצעות הוספת נקודה של שי"ן שמאלית. במהלך התיקון נתקלתי בבעיה אחרת שיוצר צירוף זה: המוסף "7 ימים" של "ידיעות אחרונות", שנכתב פעמים אחדות בטעות כפולה כ"שבע ימים" - תיקנתי מופעים אלה. דוד שי - שיחה 06:14, 16 במאי 2015 (IDT)
- אם נתקן את כל הרשימה - הבוט לא יוכל להתאמן :) גיא - פתרון למחיקה 13:40, 16 במאי 2015 (IDT)
- עדכון: הוספתי בדיקה כזו בצ'קטי. ערן - שיחה 22:49, 16 במאי 2015 (IDT)
- אם נתקן את כל הרשימה - הבוט לא יוכל להתאמן :) גיא - פתרון למחיקה 13:40, 16 במאי 2015 (IDT)
- את בעיית "שבע ימים" במשמעות של זקן תיקנתי באמצעות הוספת נקודה של שי"ן שמאלית. במהלך התיקון נתקלתי בבעיה אחרת שיוצר צירוף זה: המוסף "7 ימים" של "ידיעות אחרונות", שנכתב פעמים אחדות בטעות כפולה כ"שבע ימים" - תיקנתי מופעים אלה. דוד שי - שיחה 06:14, 16 במאי 2015 (IDT)
עדכון
[עריכת קוד מקור]ערן, תוכל לעדכן את הרשימה? בברכה, אור • שיחה • 18:03, 10 באפריל 2017 (IDT)
כמה מילים וביטויים שיש להחריג
[עריכת קוד מקור]לריצות הבאות:
- קארמפות - זכר
- בודהיסטוות - זכר
- באר שבע - לא מספר
- גיל חמש/ארבע/תשע וכו' - לא מספר
- דשבועות - לא ריבוי
- ימותו - לא ריבוי
- ארבע בבות - כך במקור
- קרח תשע - לא מספר
- איקונות - נקבה
- קולבונות - זכר
- אבונה, אבונאות - זכר
- מצעות - נקבה
- שלש עשרה מידות
- ארבע גלגליים
- מעמדות - זכר
- עקבות, עקבה - נקבה
- הולכי על ארבע - לא מספר
- סטואה, סטואיי - נקבה
- מלוות - נקבה
- פחה, פאשה, פאשות - זכר
גיא - פתרון למחיקה 10:03, 5 ביוני 2017 (IDT)
- ערן, אפשר להחריג את הרשימה הזו ? גיא - פתרון למחיקה 10:50, 15 ביוני 2017 (IDT)
- גיא, לדעתי נכון יותר לטפל לפי מקרים:
- במקרים שבהם הטעות היא במילון שמציין מילה כזכר/נקבה למרות שזה ההפך (למשל מעמדות), כדאי לעדכן בויקיפדיה:תחזוקה/שתי שקל/הצעות ל-hspell ונוכל בהמשך לשלוח תיקונים למיזם hspell בצורה מרוכזת. כשהמילון מתוקן גם לא נטעה, וגם נמצא טעויות בכיוון ההפוך.
- במקרים של טעות במקור - אני צריך ללמד את הבוט בהזדמנות לדלג על ציטוטים. בינתיים כדאי שבמקומות שבהם יש טעות במקור לוודא שהמקור מופיע בתבנית:ציטוט, תבנית:ציטוטון או תבנית דומה אחרת לציטוט (כל עוד זה מתאים)
- החרגות - אני צריך ללמד בהזדמנות את הבוט להתעלם ממושגים שכוללים מספר, למשל "באר שבע". הדרך הנכונה לעשות את זה היא כנראה אינפורמציה הדדית על זוגות מילים סמוכות בוויקיפדיה.
- ערן - שיחה 22:59, 15 ביוני 2017 (IDT)
- עוד משהו: כאשר לפני מספר נכתב "בני" או "בגיל", למשל "ילדים בני תשע" או "ילדים בגיל תשע", המספר צריך להיות בנקבה ואין לבדוק את המילה שלאחר המספר. דוד שי - שיחה 06:49, 16 ביוני 2017 (IDT)
- גיא, לדעתי נכון יותר לטפל לפי מקרים:
- ערן, רשמתי כמה דברים בויקיפדיה:תחזוקה/שתי שקל/הצעות ל-hspell, לא יודע אם זה תקין. גיא - פתרון למחיקה 13:22, 20 ביוני 2017 (IDT)
- גיא: בגדול אם מילה צריכה להופיע במילון היא יכולה להתאים לשם, ואם היא לא מתאימה למילון אז לא צריכה - למשל אני לא בטוח ש"בודהיסטווה" מתאים. מבחינת הפורמט של המילון - אני חושב שזה נכון אבל מודה שמעולם לא ערכתי את המילון ואין לי נסיון בזה. ערן - שיחה 20:55, 20 ביוני 2017 (IDT)
- גם לא ברור איך לסמן את המין של המילה. גיא - פתרון למחיקה 23:26, 20 ביוני 2017 (IDT)
- ברשימה הנוכחית סימנתי מופעים בערכים שונים שאין לתקן, מסיבות שונות. יש לאפשר לסמן מספר בערך ככזה שאין לתקן, למשל: "בני באר {{מספר תקין|שבע}} הולכים לים". דוד שי - שיחה 06:26, 20 באוקטובר 2017 (IDT)
- זה יסבך את הערכים. אני עדיין מאמין שאפשר ללמד את הבוט. גיא - פתרון למחיקה 20:30, 21 באוקטובר 2017 (IDT)
- כאשר זו מילה שיש להחריג את כל מופעיה, כמו "מעמדות", ניתן ללמד את הבוט (או את hspell). כאשר מדובר בחריג נקודתי, אין טעם ללמד את הבוט. דוד שי - שיחה 20:40, 21 באוקטובר 2017 (IDT)
- אני לא הייתי רוצה שייווצר מצב שאנחנו עושים שינויים בערכים רק במטרה שמא לא תתווסף רשומה בדף תחזוקה. גיא - פתרון למחיקה 15:59, 22 באוקטובר 2017 (IDT)
- זה עיקרון מצוין, אבל כבר חרגנו ממנו בבוט החלפות. אפשר לצמצם את הנזק בכך שמידע לבוט לא יופיע בגוף הערך אלא בסופו, כך שכאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים". דוד שי - שיחה 19:08, 22 באוקטובר 2017 (IDT)
- ערן, תוכל לממש את הצעתי האחרונה? כוונתי: כאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים" בערך זה. דוד שי - שיחה 09:59, 15 בנובמבר 2017 (IST)
- זה אומנם עשוי להיחשב באג, אבל כבר כעת הבוט מתעלם ממילים שיש לפניהן סימן "|". ערן - שיחה 22:37, 15 בנובמבר 2017 (IST)
- ערן, תוכל לממש את הצעתי האחרונה? כוונתי: כאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים" בערך זה. דוד שי - שיחה 09:59, 15 בנובמבר 2017 (IST)
- זה עיקרון מצוין, אבל כבר חרגנו ממנו בבוט החלפות. אפשר לצמצם את הנזק בכך שמידע לבוט לא יופיע בגוף הערך אלא בסופו, כך שכאשר בסוף הערך מופיע {{מספר תקין|שבע בנים}} הבוט ידע שלא להעיר על שגיאה הקשורה בצירוף "שבע בנים". דוד שי - שיחה 19:08, 22 באוקטובר 2017 (IDT)
- אני לא הייתי רוצה שייווצר מצב שאנחנו עושים שינויים בערכים רק במטרה שמא לא תתווסף רשומה בדף תחזוקה. גיא - פתרון למחיקה 15:59, 22 באוקטובר 2017 (IDT)
- כאשר זו מילה שיש להחריג את כל מופעיה, כמו "מעמדות", ניתן ללמד את הבוט (או את hspell). כאשר מדובר בחריג נקודתי, אין טעם ללמד את הבוט. דוד שי - שיחה 20:40, 21 באוקטובר 2017 (IDT)
- זה יסבך את הערכים. אני עדיין מאמין שאפשר ללמד את הבוט. גיא - פתרון למחיקה 20:30, 21 באוקטובר 2017 (IDT)
- ברשימה הנוכחית סימנתי מופעים בערכים שונים שאין לתקן, מסיבות שונות. יש לאפשר לסמן מספר בערך ככזה שאין לתקן, למשל: "בני באר {{מספר תקין|שבע}} הולכים לים". דוד שי - שיחה 06:26, 20 באוקטובר 2017 (IDT)
- גם לא ברור איך לסמן את המין של המילה. גיא - פתרון למחיקה 23:26, 20 ביוני 2017 (IDT)
- גיא: בגדול אם מילה צריכה להופיע במילון היא יכולה להתאים לשם, ואם היא לא מתאימה למילון אז לא צריכה - למשל אני לא בטוח ש"בודהיסטווה" מתאים. מבחינת הפורמט של המילון - אני חושב שזה נכון אבל מודה שמעולם לא ערכתי את המילון ואין לי נסיון בזה. ערן - שיחה 20:55, 20 ביוני 2017 (IDT)
במפגש ויקיפדיה לפני שבוע הזכיר לי דוד שי את הדיון הנ"ל, ובעקבות זאת עדכנתי את הסקריפט (מתייג גם את GuySh). השינויים בסקריפט יחולו מהרשימה הבאה (מפורסמת ב15 בחודש) וכוללים:
- ביטויים שמופיעים בתוך תבניות ציטוט לא יופיעו
- ניתן להחריג ביטויים באמצעות תבנית:שתי שקל (מעצם זה שהיא תבנית ציטוט)
- מילים שבהן מופיע גרש יופיעו מעתה ברשימה (למשל נינג'ה)
- הבוט משתמש בגרסה מעט חדשה יותר של hspell שכוללת אוצר מילים גדול במעט
ערן - שיחה 17:39, 13 בינואר 2018 (IST)
- ערן, בערך בריכות שלמה יש ביטוי "שתי קצותיה" אבל זה מופיע ברשימה למרות שזה בתוך ציטוט. גיא - פתרון למחיקה 10:08, 17 בינואר 2018 (IST)
שם קובץ
[עריכת קוד מקור]איך מבקשים שינוי שם קובץ ? https://commons.wikimedia.org/wiki/File:%D7%94%D7%94%D7%A8%D7%99%D7%9D_%D7%94%D7%9B%D7%97%D7%95%D7%9C%D7%99%D7%9D_-_%D7%A9%D7%9C%D7%95%D7%A9%D7%AA_%D7%94%D7%90%D7%97%D7%99%D7%95%D7%AA.JPG#.7B.7Bint:filedesc.7D.7D גיא - פתרון למחיקה 22:00, 18 בספטמבר 2017 (IDT)
מטרופולינים
[עריכת קוד מקור]מדוע הבוט חושב שזאת נקבה ? גיא - פתרון למחיקה 10:22, 21 בדצמבר 2017 (IST)
נינג'ה
[עריכת קוד מקור]נינג'ה הוא זכר או נקבה ? גיא - פתרון למחיקה 16:46, 15 בינואר 2018 (IST)
- דוד שי ?
- קיבלתי תשובה שזה כמו ג'ודוקא - גם זכר וגם נקבה. גיא - פתרון למחיקה 16:26, 21 בינואר 2018 (IST)
כמה בקשות
[עריכת קוד מקור]ערן, יש לי כמה בקשות:
- להריץ את הבוט גם על מרחב קטגוריות ותבניות.
- צריך ללמד את הבוט ש"שלוש עשרה" זה נקבה ולא "עשרה" שהוא זכר.
- וכנ"ל "שניים עשר" זה זכר ולא "עשר" שהיא נקבה.
- תודה לך. גיא - פתרון למחיקה 10:25, 18 ביולי 2018 (IDT)
- גיא:
- תוכל להביא דוגמאות ל2 ול3? ערן - שיחה 10:50, 18 ביולי 2018 (IDT)
- ערן, למשל: אזכרה אלהים ואהמיה - "שלש עשרה מידות".
- ישראל באירוויזיון - "שתיים עשרה נקודות". גיא - פתרון למחיקה 11:04, 18 ביולי 2018 (IDT)
שכלול הבוט
[עריכת קוד מקור]לאור נוחות השימוש בבוט ויקיפדיה:תיקון תקלדות בקליק, אני מציע שגם הבוט שלפנינו יפעל בטכניקה דומה, כלומר יציג קטע מהמשפט הבעייתי ויאפשר תיקון או הסרה בקליק. ערן וUziel302, לטיפולכם. דוד שי - שיחה 11:40, 13 באפריל 2019 (IDT)
- דוד שי, תודה על ההצעה. אני אישית ממוקד בשיפור הגאדג'ט של תיקון תקלדות. Uziel302 - שיחה 11:43, 13 באפריל 2019 (IDT)
- זה בסדר גמור. התכוונתי שתעביר לערן את הידע והתוכנה שצברת שם, כדי שישלב אותם בבוט שלפנינו. דוד שי - שיחה 11:45, 13 באפריל 2019 (IDT)
שתי דיברות או שני דיברות ?
[עריכת קוד מקור]צריך עזרת הציבור. מה נכון ? מתוך הערך טיעון מן הנס. גיא - פתרון למחיקה 00:31, 20 בנובמבר 2019 (IST)
- כיוון שמוכר לנו הביטוי "עשרת הדיברות", מתבקשת הצורה "שני דיברות". דוד שי - שיחה 06:52, 20 בנובמבר 2019 (IST)
- תודה, דוד, החלפתי. גיא - פתרון למחיקה 01:14, 22 בנובמבר 2019 (IST)
מודעה של מלון אמריקן קולוני
[עריכת קוד מקור]מלון אמריקן קולוני פרסם אתמול מודעה על עמוד שלם בפתח מוסף "הארץ", מודעה שבוודאי שולמו בגינה אלפי שקלים למשרד הפרסום ועוד אלפי שקלים ל"הארץ". ומה מופיע במרכזה:
כך, "ארבעת נשותיו". כמה חבל ש"בוט שתי שקל" אינו מגיה את מוסף "הארץ". גם בלי הבוט, לוּ קראו את הערך היו מוצאים בו ש"המבנה הראשי של המלון היה במקורו ארמון, שנבנה בידי רבאח אל-חוסייני עבור ארבע נשותיו". דוד שי - שיחה 17:11, 15 בפברואר 2020 (IST)
בדיקת סמיכות
[עריכת קוד מקור]ערן, האם הבוט בודק גם שגיאות כגון "שתי ענפי הספורט" ? גיא - פתרון למחיקה 11:41, 16 בפברואר 2020 (IST)