לדלג לתוכן

נושא בדף שיחת משתמש:Mikey641

יונה בנדלאק (שיחהתרומות)

האם אתה יודע לבצע שאילתות על כל הפריטים בויקינתונים? אם כן, אתה יכול ליצור דוח שבו יופיע מספר הפריטים הכללי וכמות הפריטים שלהם תווית בכל אחת מהשפות?

לדוגמא: מספר הפריטים - 2,098,543 תווית באנגלית - 1,678,764 תווית בגרמנית - 1,443,109 תווית בעברית - 1,005,343 וכו'

Mikey641 (שיחהתרומות)

אני לא יודע לבצע שאילתות על כל הפריטים. מסיבה כלשהי זה אף פעם לא אפשר לי על הכול. בכל מקרה, העברתי את הבקשה שלך לוויקינתונים. d:wikidata:request a query

Mikey641 (שיחהתרומות)
Mikey641 (שיחהתרומות)

יש לנו כ-3,979,107 תיאורים (15.9%) וכ-304,961 תוויות (1.2%)

יונה בנדלאק (שיחהתרומות)

מצב גרוע. גם באנגלית יש רק 60% והשפות אחריה באיזור ה-30%!!!!

דרך אגב. 15% התיאורים רובם הם קטגוריות ותבניות שהתיאור נוסף אליהם אוטומטית על ידי בוט שרץ מידי פעם.

Mikey641 (שיחהתרומות)

דרך אגב. על התיאורים. הוספתי את השפה העברית לבוט שמוסיף תיאורים על בסיס אנגלית:

  1. תיאורים לסרטים - בעברית הוא מוסיף רק שנה ללא יוצר הסרט כי אי אפשר לשלב לועזית עם עברית
  2. אישים - מוסיף תיאור לאישים של מקצוע ואזרחות
  3. אחרים תרכובות, שמות פרטיים, שמות משפחה, שנה בלוח העברי/מוסלמי. דרך אגב, יש שם שמות של genus (טקסון) שלא ידעתי בדיוק איך לתרגם. אם אתה מעונין אשמח שתתרגם.
יונה בנדלאק (שיחהתרומות)

מייקי אתה יכול להוסיף שם:

  • algae - אצה
  • amphibians - דו־חיים
  • arachnids - עכבישיים
  • birds - ציפור
  • fungi - פטריה
  • insects - חרק
  • mammals - יונק
  • molluscs - רכיכה
  • plants - צמח
  • reptiles - זוחל

כמובן שכל אחד צריך להתחיל ב"סוג של ___"

Mikey641 (שיחהתרומות)

תודה. הוספתי

ערן (שיחהתרומות)
Mikey641 (שיחהתרומות)

עוד מעט יורץ כלי שיכול לתרגם שמות מכל שפה לעברית, ונריץ בוט שיוסיף תוויות אוטומטית, רק צריך לחכות למישהו בשם אמיר מהוויקיפדיה הפרסית

יונה בנדלאק (שיחהתרומות)

נחכה ונראה עד כמה זה ישפר. ואמיר מהשפה הפרסית הוא משתמש בשם Ladsgroup (בכוונה לא תייגתי אותו אבל אתה מוזמן לפנות אליו בדף השמתשמ שלו בויקינתונים)

Mikey641 (שיחהתרומות)

כבר פניתי אליו. הוא אמר לי שהוא צריך לכתוב תיעוד לכלי וכולי ך

Mikey641 (שיחהתרומות)

דרך אגב. עכשיו יש לנו כ-4,089,126 (16.3%) זאת אומרת שעלה ב110,019 שהם 0.4% תוך 11 ימים. ובתוויות יש כ-311,971, כלומר עלה ב-7,010. בכל מקרה, אם חושבים על זה זה מספר יפה, יש לנו 200,000 ערכים, זאת אומרת שיש לנו 100,000 תוויות לא קשורות לערכים בוויקינתונים שזה מאוד יפה.

בכל מקרה. השבוע הביאו לי קוד בפייתון לבוט שמוסיף שמות לוויקינתונים (ולא Ladsgroup/אמיר) שאני צריך להריץ ולבדוק.

ערן (שיחהתרומות)

אתמול הרצתי בוט שהוסיף כ-2500 תוויות (דומה לבוט שעובר על {{אנ}} ו{{אנגלית}} אבל כזה שמחפש [[שם ערך]] (ENGLISH TERM) - כדי להריץ בוט כזה בצורה סבירה צריך להשתמש בdump, והיה צריך לסנן ממנו גם ביטויים כללים. נראה לי שמבחינת תוויות השלב הבא הוא באמת לנסות את הסקריפט של אמיר - כשבשלב הראשון כדאי לעשות זאת בזהירות

Mikey641 (שיחהתרומות)

דרך אגב, חשבתי לומר לך על זה הרבה זמן אבל לא עשיתי את זה מטעמי עצלנות בעיקר תודה שעשית את זה.

Mikey641 (שיחהתרומות)

ערן אם כבר מדברים על סקריפטים אני צריך ממך עזרה במשהו. אז כפי שכתבתי משתמש מסוים הביא לי קישור לקוד בgithub. הורדתי כzip פרקתי את הקובץ, שמתי בתיקייה. עשיתי בדיוק כמו שעשיתי אז עם enharvest. הרצתי את הקובץ, ונסגר ישר, בדקתי בpythonshell ויצא לי missing parenthesis in call to 'print' בדקתי באינטרנט ומצאתי למה זה קרה - כי זה לא מותאם לpython 3. תיקנתי את כל הprint ועכשיו יצאה לי שגיאה חדשה: זה מחפש את module: Levenshtein ואין לי מושג מה זה המודול הזה.. האם אתה מכיר במקרה?

ערן (שיחהתרומות)

כן - בכל סקריפט פייתון השורות הראשונות יהיו import ושמות של מודולים שבהם רוצים להשתמש. אם מותקן לך המודול - זה צריך לעבוד, אם לא אתה צריך להתקין מודול. דרך פשוטה להתקין מודול היא להריץ בשורת הפקודה pip install MODULENAME (כמובן צריך להחליף לשם המודול המתאים). אפשר להתקין גם באמצעות conda או באמצעות easy_install

איפה שאפשר להסתבך זה אם המודול לא תומך בפייתון 3 אלא רק בפייתון 2, ואז תצטרך למצוא מודול אחר או לבקש מהמפתחים של המודול שיתאימו אותו. על כל פנים תוכל לראות שבצורה רשמית זה נתמך גם ב2 וגם ב3: https://pypi.python.org/pypi/python-Levenshtein/0.12.0

Mikey641 (שיחהתרומות)

תודה רבה על ההסבר

Mikey641 הסתיר את הרשומה הזאת (היסטוריה)
ערן (שיחהתרומות)

קוראים לה python-Levenshtein. (לא תמיד השם בimport זהה לשם באתר). אגב אפשר לעשות pip search MODULENAME כדי לראות אילו מודולים קיימים שיש להם שם דומה

Mikey641 (שיחהתרומות)

נוצרת שגיאה. זה אומר שדרושה גרסה 14 של Microsoft Visual C++ אבל הקטע הוא שיש לי גרסה יותר גבוהה מ-14, ואחרי זה עוד הורדתי גם את הגרסה של 2017 ועדיין לא פועל.

Command "c:\users\mikey\appdata\local\programs\python\python36-32\python.exe -u -c "import setuptools, tokenize;__file__='C:\\Users\\mikey\\AppData\\Local\\Temp\\pip-build-9_x_xt2p\\python-Levenshtein\\setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, __file__, 'exec'))" install --record C:\Users\mikey\AppData\Local\Temp\pip-ponponm2-record\install-record.txt --single-version-externally-managed --compile" failed with error code 1 in C:\Users\mikey\AppData\Local\Temp\pip-build-9_x_xt2p\python-Levenshtein\

ערן (שיחהתרומות)

לא מכיר את השגיאה ולכן לא יכול לעזור, הייתי מציע לנסות לחפש את השגיאה של Microsoft Visual C++ 14.0 is required בstackoverflow ולפעול על פי העצות שם

IKhitron (שיחהתרומות)

נשמע כמו שימוש בספרייה שנתמכת רק בגרסאות חדשות.

Mikey641 (שיחהתרומות)

בסופו של דבר הסתדרתי. תודה

תגובה ל"שאילתה על ויקינתונים"