ויקיטקסט:ויקיטקסט והספריה הלאומית/מכתבים לספריה/טיוטת מכתב ראשון

ברכות

עריכה

שלום וברכה

כחלק משיתוף הפעולה הפורה שקיים בין הספרייה הלאומית לעמותת ויקימדיה ישראל, בעיקר בתחומי הפעילות של ויקיפדיה, היינו מעוניינים, פעילי ויקיטקסט, להציע הרחבה של שיתוף הפעולה גם למיזם ויקיטקסט.

מה זה ויקיטקסט?

עריכה

ויקיטקסט (באנגלית: Wikisource) הוא מיזם של w:קרן ויקימדיה ומיזם-אחות לוויקיפדיה. הפרויקט מיועד להיות ספרייה הכוללת מאגר חופשי של w:טקסטים.

המהדורה העברית של ויקיטקסט נפתחה ב-2 באוגוסט 2004. מספטמבר 2005 ויקיטקסט הוא פרויקט רב-לשוני בדומה לרוב הפרויקטים של קרן ויקימדיה.

מכיוון שעל טקסטים שמחברם נפטר לפני פחות משבעים שנה יש זכויות יוצרים, בוויקיטקסט ניתן למצוא בעיקר ספרי קודש. ספרי חול שפגו עליהם זכויות יוצרים ניתן למצוא בw:פרויקט בן יהודה. בספטמבר 2013 הגיע האתר לכמות של 100,000 יחידות טקסט.

הטקסטים בויקיטקסט יכולים להיות מועתקים מאתר כמו "w:פרויקט גוטנברג" באנגלית, או "w:פרויקט בן-יהודה" בעברית, שכן אלה אתרים המכילים תוכן חופשי. אין צורך בהקלדה-מחדש של אותם טקסטים, אבל טקסטים כאלה עדיין דורשים התאמה לממשק w:ויקי: עיצוב, עריכה (כמו חלוקה לפסקאות, פיסוק), הגהה, קישורים וכדומה (במיוחד כאשר מדובר בטקסטים קלאסיים).

טקסטים אחרים, שאין להם מקור דיגיטלי, דורשים הקלדה ידנית מהמקור. במידה וקיים צילום של ספר מודפס, ניתן להיעזר בתוכנת זיהוי אותיות (OCR), אולם (בעיקר בעברית), הדבר דורש הגהה יסודית; ולפעמים גם ניקוד, בין אם ידני או בעזרת תוכנה.

איך נוכל לשתף פעולה?

עריכה
  • מכיוון שכל הטקסטים של ויקיטקסט הינם ברשיון חופשי, הספרייה הלאומית יכולה לשלב טקסטים מעובדים מתוך ויקיטקסט שקיימים לספרים שהיא מציגה באתר שלה, אם על ידי קישור לספר בוויקיטקסט ואם על ידי העתקת הטקסט ושילובו באתר הספרייה, כרצונכם. תוכלו גם לפתוח דפים כאן בוויקיטקסט לכל ספר שברצונכם לעשות לו דיגיטציה ולהפנות לשם מתנדבים, שישתמשו במנשק הידידותי של ויקיטקסט כדי להפוך את הספר המצולם לטקסט זמין ונגיש, שישולב אח"כ גם באתרכם.
  • ויקיטקסט מצידה יכולה להיעזר במאגר הרב של ספרים שקיים בספרייה הלאומית, הן אותם שהספרייה כבר סרקה והן כאלה שאנחנו נוכל לבקש בעתיד מכם לסרוק עבורנו, ואנחנו נעשה לזה דיגיטציה ועריכה באתר שלנו, משם תוכלו כאמור לשלב אחר כך באתרכם.

נושאים מעשיים

עריכה
  1. נגישות לספרים הסרוקים: מאוד יעזור לנו הנגשה של הספרים שכבר נסרקו כך שיהיה קל למצוא אותם, האם קיימת כוונה שיהיה מידע מקוטלג המיועד דווקא לאוסף של הספרים הסרוקים בנחלת הכלל, לפחות לפי כותרת ומחבר ונושא? זה דבר חשוב, ואולי דבר שהציבור שלנו אפילו יכול לעזור בהכנתו.
  2. הורדת הספרים הסרוקים (סוג הקבצים): כדי להוריד ספר סרוק שאין עליו זכויות יוצרים, כעת צריך להוריד כל דף בתור JPG. זה יעזור מאוד תהיה אפשרות להוריד ספרים שלמים בקבצים יעילים כגון PDF ו-DJVU (עדיפה אפשרות אוטומטית לשניהם ביחד כמו ב-archive.org). זה חשוב לא רק בגלל שהוא יותר שימושי לציבור, אלא גם בשביל ויקיטקסט. כי עד עכשיו לא עבדנו לרוב ב"Proofread Page", וזה בגלל שאנחנו עובדים על ספרים קלסיים שיצאו בהרבה מהדורות, ואין חשיבות לחלוקת העמודים. אבל אחרי שרוב הספרות הזו כבר תהיה קיימת, אז יהיה יותר רצון לאנשים לעבוד עם "Proofread Page" ולערוך ספרים מול עמודים מצולמים. בשביל זה צריך הורדה קלה ב-PDF או ב-DJVU.
  3. הורדת הספרים הסרוקים (OCR): ככל שה-OCR לספרים הסרוקים בספרייה הלאומית תהיה איכותית יותר, כך העברתם למהדורות דיגיטליות בוויקיטקסט תתקדם יותר. חשוב שאנחנו נדע מה התוכניות שלהם בתחום הזה, ואולי אף נוכל לעזור בתהליך ע"י בדיקות והצעות. אנחנו גם נוכל בעתיד לעזור בהתנדבות באמצעות תוכנה שנרכשה לא מכבר על ידי העמותה.
  4. כתבי יד מצולמים: האם יש כוונה, עד כמה שאפשר מבחינת תנאי שימוש, לסרוק גם עשרות אלפים צילומים של כתבי יד במיקרופילם הנמצאים במכון החשוב המיועד לכך?
  5. תוכניות סריקה וסדר עדיפות: יהיה ממש יפה אם ניתן יהיה לקבל מידע על התקדמותו של מפעל הסריקה (כגון מה כבר נעשה, מה נעשה בזמן האחרון, ומה מיועד להיות הבא בתור), ואולי אפילו להשתתף בקביעת סדר העדיפויות. למשל שיבוא מישהו לוויקיטקסט וירצה לעשות הקלדה/הגהה דיגיטלית לספר מסויים בנחלת הכלל. אפשרות שבקשתו של אותו אדם לסריקה תוכל להיכנס לתוך תהליך הסריקה של הספרייה תוכל מאוד להועיל לפעילות ויקיטקסט.

מסקנות וסיום

עריכה

להערכתנו ניתן לעשות רבות על ידי שיתוף פעולה בין ויקיטקסט לספרייה הלאומית, ונשמח לשמוע את דעתכם על כך ולעמוד בקשר איתכם.