שיחה:ערוך השולחן העתיד
יישר כוח
עריכהתולדות אדם, תודה רבה שהתחלת לעסוק במלאכה הזאת!
המלצה: להעביר את הדף לערוך השולחן העתיד זרעים וכו', זה באמת חיבור אחר הואיל ואינו מבוסס על סדר השולחן ערוך.
להלן שני נושאים פרקטיים לגבי הספר הזה. תודה שעשית את הצעד הראשון כדי לפתח את התחום הזה!
זכויות יוצרים
עריכהלגבי זכויות יוצרים צריך לעשות קצת חשיבה: בשאר הכרכים שיצאו לאור בשנות ה-60 יש כנראה בעיה, והיה לנו פעם דיון ארוך ומפורט על זה, ללא תוצאות ברורות.
אבל הלכות זרעים יצאו לאור עוד קודם לכן, ולכן ב-hebrewbooks.org או שהיו יכולים לקבל רשות (ממי?), או שהם לא כל-כך חששו בגלל תאריך ההוצאה לאור המוקדמת. כרכי זרעים יצאו לאור בין השנים תרצ"ח-תש"ו על ידי הרב מאיר בר-אילן זצ"ל, שנפטר בשנת תש"ט. עד כה יצאו רק 60 שנה ולא 70 שנה למותו, אבל מצד שני לא ברור שבתור עורך זכויות היוצרים תלויים בו בכלל. בכל מקרה נראה לי שאם הספרים בכל מקרה נמצאים באתר hebrewbooks אז זה פחות "מסוכן" גם אצלנו.
- הערה לגבי זכויות יוצרים: מהקדמת ההוצאה נראה שבעל הזכויות, במידה ואיננו רק הרב אפשטיין עצמו, הרי הוא נכדו, הרב מאיר בר-אילן, החתום על ההקדמה. הרב בר-אילן נפטר ב-1949, ואם כן, יצירותיו חופשיות לציבור החל מ-01.01.2020. בברכה, נחום - שיחה 10:29, 1 בפברואר 2021 (IST)
- זה נכון, אבל יש גם את זכויות היוצרים של היברובוקס. כתוב בעמוד השער: "הועתק והוכנס לאינטרנט www.hebrewbooks.org ע״י חיים תשס״ט". סיני כהן (שיחה) 15:09, 1 בפברואר 2021 (IST)
- למיטב ידיעתי, העלאת קובץ לאינטרנט, לכשעצמה, איננה מקנה זכויות חדשות. אין להיברובוקס אלא הזכויות שהוא עשוי לקבל מיורשיו של המחבר או מיורשיו של הרב בר-אילן, או מי שהזכויות היו שלו במקור, והן אינן תקפות ליותר משבעים שנה מפטירת בעל הזכויות המקורי.--נחום - שיחה 18:33, 1 בפברואר 2021 (IST)
- אתם יכולים להביא מקורות לכך? סיני כהן (שיחה) 21:07, 3 בפברואר 2021 (IST)
- למיטב ידיעתי, העלאת קובץ לאינטרנט, לכשעצמה, איננה מקנה זכויות חדשות. אין להיברובוקס אלא הזכויות שהוא עשוי לקבל מיורשיו של המחבר או מיורשיו של הרב בר-אילן, או מי שהזכויות היו שלו במקור, והן אינן תקפות ליותר משבעים שנה מפטירת בעל הזכויות המקורי.--נחום - שיחה 18:33, 1 בפברואר 2021 (IST)
- זה נכון, אבל יש גם את זכויות היוצרים של היברובוקס. כתוב בעמוד השער: "הועתק והוכנס לאינטרנט www.hebrewbooks.org ע״י חיים תשס״ט". סיני כהן (שיחה) 15:09, 1 בפברואר 2021 (IST)
נחום צודק לגבי הכרכים שנערכו ע"י הרב מאיר בר-אילן: אם פגו זכויות היוצרים על הכרכים שהוא ערך אז אין להיברו-בוקס זכויות בלעדיות עליהם. אמנם הוא ערך רק שני כרכים (מתוך שלושה) על סדר זרעים, ואילו שאר הכרכים על זרעים, קדשים וטהרות יצאו לאור ע"י מוסד הרב קוק ולא ציינו מי ערך אותם. צריך לעשות בירור רציני כדי להבין מה מצבם לגבי זכויות יוצרים. אני מזדהה מאוד עם הרצון לשחרר את הספר החשוב הזה לציבור, שיהיה נגיש וחופשי. Dovi (שיחה) 20:29, 1 בפברואר 2021 (IST)
שאלתי בוויקישיתוף וענו לי בפשטות שאם המחבר נפטר בשנת 1908 למניינם, אז גם אם הוציאו ספר על פי כתד היד שלו רק בשנות ה-60 עדיין פגו זכויות היוצרים. אם זה נכון (כי באמת חשבתי שיש הגנה מיוחדת על "unpublished works" בחוקי זכויות היוצרים המסובכים), אז קיימות שתי אפשרויות:
- אם הוציאו את הספרים לאור על פי כתב יד קדשו של המחבר בלבד, אז כבר פגו זכויות היוצרים על כל היצירה.
- אם המוציא לאור טוען שיש עריכה יצירותית בהוצאה לאור, אז אין לי מושג מתי פגות זכויות היוצרים. אמנם לא ראיתי שום טענה כזאת בכרכים עצמם. אשמח אם עוד אנשים יעיינו בהם ויחוו את דעתם על טיב העריכה.
סה"כ יהיה צורך בחוות דעת מוסמכת לגבי היצירה החשובה הזאת. Dovi (שיחה) 15:55, 2 בפברואר 2021 (IST)
- זכויות היוצרים פגו 70 שנה ממותו של המחבר, בעל ערוך השולחן. אם העורך הוסיף הערות, הוא זכאי לזכויות יוצרים על ההערות והעריכה שלו שאינם רלוונטיים לויקיטקסט. סריקה בוודאי שאינה מזכה בזכויות יוצרים. יעקב (שיחה) 11:37, 17 באוקטובר 2021 (IDT)
הקלדה
עריכהאיך אתה מקליד, על ידי OCR או ידנית לגמרי? --דובי
- תש/גובות
- לגבי שם הספר:
- אתה צודק, הטעות שלי היתה, שחיפשתי את הספר ב"היברובוקס" ושם מצאתי רק על הלכות זרעים, לכן דמיתי לחשוב שזה רק על זה. התברר שטעיתי ואכן יש לחלק את הספר "ערוך השולחן העתיד" לפי כל חלקי ההלכות שחילקם המחבר.
- לגבי זכויות היוצרים:
- בטעות סברתי שהזכויות נגמרות מ-70 שנה מאז ההוצאה לאור ולא מפטירת המחבר, אך בזאת ניתן לסמוך על מה שכתבת, שזה אמנם אקטואלי רק לגבי חלק "הלכות זרעים". מה גם שחלק זה חשיבותו רבה, כיון שהוא הלכות הנוגעות למעשה, ומעטים הספרים שנתחברו על הלכות אלו, ואלו שנתחברו רובם מוגנים בוודאות בזכויות יוצרים.
- הקלדה:
- התחלתי ידנית, אך תוך כדי שמתי לב שאפשר לעבוד בOCR (זה מתאפשר רק אם הטקסט בדפוס הוא ברור יחסית) אז אולי אפשר להתחיל לעבוד כך.
- -- תּוֹלְדֹת אָדָם • שיחה • כ"ד חשוון ה'תש"ע • 16:41 (21/12/2024)
- יש לך תוכנת OCR? או אולי יש לך דרך לגשת לטקסט שיצרו על ידי OCR באתר hebrewbooks ? בויקיטקסט באנגלית יש OCR אבל הוא מזהה רק אותיות באנגלית - מעניין אם יהיה אפשר להגיש "באג" שהמתכנתים של ויקימדיה יסדרו שזה יעבוד גם בעברית... -- אוֹרי 21:51, 11 בנובמבר 2009 (IST)
- אורי, ניתן לקחת דף בהיר מהספרים ב-hebrewbooks.org, ולעשות "העתק-הדבק" לטקסט המסומן. התוצאות ל"ערוך השולחן העתיד" הן לא רעות. גם אני הייתי רוצה לדעת איך לגשת ישר את ה-OCR שם בלי לעשות העתק-הדבק לכל עמוד ועמוד.
- נראה לי שכדי להגיש באג על OCR בוויקיטקטס-עברית, צריך קודם כל שתהיה תוכנת OCR בשפה העברית בקוד פתוח, שתוכנת מדיה-ויקי יכולה להשתמש בו. האם קיימת תוכנה כזו? Dovi 00:12, 12 בנובמבר 2009 (IST)
- למה אתה מתכוון ב"דף בהיר"? תוכל לתת קישור לדוגמה?
- אני לא מכיר תוכנת OCR חינמית בעברית, אבל אולי להוסיף את אותיות הא"ב לתוכנה הקיימת זה לא סיפור גדול. -- אוֹרי 07:32, 12 בנובמבר 2009 (IST)
- אורי, בתור דוגמה תקח איזה עמוד שתרצה מהספר המדובר עליו. הדפוס הוא יחסית בהיר, ולכן ה-OCR הוא יחסית טוב. בדפוסים פחות בהירים ה-OCR עובד פחות טוב ועושה יותר טעויות.
- למיטב ידיעתי הפיתוח לתוכנה כזאת לוקח זמן, עד שהתוכנה "לומדת להכיר" אותיות באופן סביר. אגב, הוא צריך להיות לא רק חינמי אלא גם "קוד פתוח" עבור תוכנת מדיה-ויקי. אולי יש ב-Sourceforge, המקום המרוכז לתוכנות בקוד פתוח [1]. חבל שאני לא יודע תכנות... שבת שלום, Dovi 14:07, 12 בנובמבר 2009 (IST)
אני אכן מתכוון ל-OCR של היברובוקס, בוחרים את הטקסט, מעתיקים אותו ללוח ומדביקים אותו. תּוֹלְדֹת אָדָם • שיחה • כ"ה חשוון ה'תש"ע • 08:54 (21/12/2024)
- כן, זה פתרון סביר בינתיים. אולי ניתן אפילו לעשות את זה על ידי בוט? שבת שלום, Dovi 14:07, 12 בנובמבר 2009 (IST)
- אני לא מכיר דרך לעשות "העתק" בPDF על ידי בוט. מצטער. -- אוֹרי 15:25, 12 בנובמבר 2009 (IST)
- מה אם מורידים את הספר למחשב האישי? האם יש דרך להוציא את המידע של ה-OCR ולערוך אותו בתור קובץ, ואח"כ להעלות אותו? Dovi 16:30, 12 בנובמבר 2009 (IST)
- עכשיו ניסיתי ומצאתי איך עושים את זה: פותחים את הקובץ הסרוק של הספר בתוכנת Adobe Reader. אח"כ לוחצים על Edit ואח"כ על "Copy File to Clipboard". אח"כ עושים "הדבק" לתוך קובץ וורד ויש לך OCR לכל הספר בקובץ אחד!
- אורי, לדעתי זה מאד חשוב! אנחנו לא צריכים תוכנת OCR בקוד פתוח, כי הקובץ כבר כולל את זה (ומשתמשת אגב בתוכנה איכותית לדעתי). זה יכול לעזור לנו הרבה כבר עכשיו. לעתיד, השאלה איך ניתן להציג את ה-OCR הזה (שכבר קיים בקובץ!) ביישום של Proofread Page? בהזדמנות אנסה לשאול את תומס, המפתח של הקוד לתוספת זו. Dovi 16:45, 12 בנובמבר 2009 (IST)
- אני מסכים איתך שזה מאוד חשוב. אם תהיה דרך קלה להמיר את קבצי הPDF של היברובוקס ולשים את הטקסט אצלנו במהירות, זה יהיה צעד גדול לוויקיטקסט.
- ניסיתי כפי שהסברת, ומה שהצלחתי לעשות זה לפתוח את קובץ ה-PDF, לבחור את כל הטקסט, לעשות העתק-הדבק לתוך pixiesoft.com/flip. העברית מסתדרת לא רע אבל הסדר של העמודות לא נכון - עמודה שמאלית באה לפני העמודה הימנית, ואני לא רואה דרך לזהות מתי מתחלף עמוד. אם היתה דרך לשלוף את הטקסט מהPDF ולחלק אותו לפי העמודים של הספר אוטומטית ואז לטעון את הטקסט במקביל לצילומים במפתח:ערוך השולחן העתיד זרעים חלק א זה היה נהדר. צריך לשאול מומחים בPDF אם אפשר לעשות את פעולת ה"העתק-הדבק" על ידי תוכנית ושהתוכן יופרד לעמודים.
- בינתיים מה שעשיתי זה להמיר את הPDF לDJVU והעליתי לCommons ופתחתי שם קטגוריה חדשה שאני מקוה שאם הזמן תתמלא. -- אוֹרי 17:13, 12 בנובמבר 2009 (IST)
- עדכון: הצלחתי למצא תוכנה לשפת PERL שאני יכול איתה לשתות את הקובץ PDF ולהפריד לדפים. נשאר רק לסדר שהתוכנית תהפוך העברית מויזואלית ללוגית ואז אפשר לטעון את הדפים לאתר. עדיין, זה יקח לי לא מעט זמן להגיע לתוצאה טובה - שווה להשקיע? -- אוֹרי 21:25, 14 בנובמבר 2009 (IST)
שבוע טוב אורי. לגבי ה"ויזואלית ללוגית": אני פשוט מדביק את זה כל הטקסט של הספר לתוך קובץ "וורד" וזה יוצא בסדר גמור בלי שום בעיות (חוץ מסדר העמודים). אולי לא הבנתי מה הבעיה? Dovi 22:07, 14 בנובמבר 2009 (IST)
- מעניין. לי כל העברית יוצאת הפוכה. אולי זה תלוי בגירסה של הacrobat reader או בווינדוס.
- אגב, מה אתה חושב על כל הנושא הזה מבחינת זכויות יוצרים? מילא שאנחנו לוקחים מהם את הצילום של הספרים, אבל האם לגבי ה-OCR הם לא יוכלו לטעון ליצירה שלהם? אולי כדאי ליצור איתם קשר ולהציע סוג של שיתוף פעולה? -- אוֹרי 22:12, 14 בנובמבר 2009 (IST)
- יש תוכנת http://hocr.berlios.de/index.html] ocr] בעיברית בחינם ,אם זה מה שחיפשתם (לא לגמרי הבנתי), איתי גל 23:15, 14 בנובמבר 2009 (IST)
- תודה, אך hebrewbooks כבר עשו OCR והטקסט מוטמע בתוך קבצי הPDF. השאלה היא איך אפשר להוציא את הטקסט משם ולשים אצלינו. והאם זה בסדר והאם זה כדאי... -- אוֹרי 23:26, 14 בנובמבר 2009 (IST)
שלום איתי, וממש תודה על ההפניה. אולי נוכל לבקש את יישום התוכנה הזאת בתוך הפונקציה של proofread page. אורי, מבחינת זכויות יוצרים אין שום משמעות ל-OCR כי זה מיכני לחלוטין. לגבי יצירת קשר, בעבר דברתי כמה פעמים עם האדם שמפעיל את הירבובוקס. אדם נחמד. קבלתי את הרושם שהוא לא כל-כך התעניין בשיתוף פעולה עם וויקיטקסט אז (הצעתי). אבל בהחלט ניתן לפנות אליו שוב, עדיף במכתב מכמה מאתנו שבו נציע כיצד נוכל לתרום. Dovi 00:49, 15 בנובמבר 2009 (IST)
- OCR זה אמנם מכני אבל זה הרבה עבודה. (אגב יש כאן סרט שמראה את תהליך הסריקה וה-OCR אצל hebrewbooks).
- בכל אופן, לפני שנפנה אליהם, כדאי שתהיה לנו דוגמה טובה לאיך שיכול להראות שיתוף פעולה איתם. שיפצתי את העמוד הראשון בספר (וכן את דף המפתח) אבל משום מה אני לא מצליח להכליל את הטקסט משם אל תוך ערוך השולחן העתיד זרעים א. למישהו יש רעיון? -- אוֹרי 08:01, 15 בנובמבר 2009 (IST)
- בדקתי וראיתי שזה בגלל תג poem - כשמורידים אותו זה עובד. זה נראה לי כמו באג. --אראל סגל • שיחה • כ"ח בחשוון ה'תש"ע 15:17, 15 בנובמבר 2009 (IST)