Google's Translation Overhaul – Interview on IDF Radio

17 אפריל, 2017 בשעה 17:48 | פורסם ב15 דקות, English, אנגלית, עולם דיגיטלי, תרגום | תגובה אחת

This February, I gave an interview to Ido Kenan on Galei Tzahal (IDF Radio) about Google's upgraded Machine Translation system, including its claims that it learns an intermediary abstract language representation, an "Interlingua".

You can listen to the interview above this line, or here on Kenan's blog, where you can also read my writeup. Problem is, it's all in Hebrew! Well, what better than to use the fancy new Google Translate to render the thing into English?

Here it is, untouched. See how much you understand. (Retrieved March 16, 2017)

Continue Reading Google's Translation Overhaul – Interview on IDF Radio…

Series of tubes

27 דצמבר, 2013 בשעה 12:53 | פורסם בEnglish, אנגלית, עולם דיגיטלי, פוליטיקה, תרבות | תגובה אחת

In 2006 (here I go, topical as ever) Senator Ted Stevens made his infamous "series of tubes" gaffe, winning him eternal ridicule.

My pet theory for Stevens's misconception has been that he'd heard of Youtube (the timeframe checks out; this is about the time it started emerging) and mis-analyzed it as "U-tube", a serial letter coding a type of tube. Generalizing, the whole Internet must be a series of the A-tube, B-tube, 1-tube and HL/9-tube, no?

I recently tried searching for some verification to this theory, or at least fellow holders of this opinion. To my surprise, I found none. Stevens himself did not give this as an explanation, but I assume it would have been an embarrassing admission the higher Youtube's popularity soared. When asked, he claimed some Internet mavens actually gave him positive feedback for the tube description (equating tubes with "pipes"). Sadly, we can't ask him anymore.

Are you a fellow U-tube-theorist?

Do you know of any?

Alternatively, can you clearly refute this theory?

הספאמרי-הונאה האלה נהיים לא רעים

4 דצמבר, 2013 בשעה 10:33 | פורסם בכשל, עולם דיגיטלי, ראיתי-שמעתי, תרגום | כתיבת תגובה

הספאמרי-הונאה האלה נהיים לא רעים

מכתובת המייל: TelAviv@webmaster.com

אל תנדבו לי מידע

21 דצמבר, 2012 בשעה 14:00 | פורסם בעולם דיגיטלי, עידוק, צרכנות, ראיתי-שמעתי, תחבורה | כתיבת תגובה

אני משתמש חצי-מרוצה של תל-אופן. מבחינתי, על המחיר הדי-מגוחך שהם לוקחים למנוי שנתי (240 ש"ח), משתלם להסתפק בזמינות חלקית ובאופניים דפוקים מדי פעם (מה גם שאיכות השירות משתנה כל הזמן, וכרגע אנחנו בגל חיובי די ממושך). ועם התלונות הרבות שיש והיו לי, אני חייב לומר ששירות הלקוחות מצוין.

לפעמים מצוין מדי: בטבלה שיש באתר למעקב אחרי ההשכרות האחרונות, יש עמודה בשם "דריכת מנעול". בכל בדיקותי עד עכשיו היא תמיד היתה על "דרוך". השבוע מצאתי אותה על "לא דרוך", ותהיתי אם יש השלכות על סגירת ההשכרה שלי.

פרוק ונצור

לפחות שיהיה פרוק ונצור

המוקדנית בשירות הלקוחות איששה את תחושתי – אם יש שם תחנת החזרה, ומשך זמן, אין מה לדאוג. ההחזרה נקלטה. מצב ה"לא דרוך" דווח כנראה כתוצאה מכך שעבר זמן רב יחסית בין השלחת מוט הנעילה של האופניים לעמדה ובין דריכת המנעול, ואינו רלוונטי למצב ההשכרה.

אז למה, מתכנני אתר תל-אופן, לדווח על כך בכלל? למה אני כמשתמש מסוג "לקוח" צריך את העמודה הזו בממשק שלי? אתם אוהבים שיחות-סרק מודאגות-למחצה למוקד השירות?

קופרטינו, פלשת

30 נובמבר, 2012 בשעה 15:06 | פורסם בכשל, כתיב, עברית, עולם דיגיטלי, פוליטיקה, ראיתי-שמעתי | כתיבת תגובה

בענף חקר השטויות שעושים מעבדי תמלילים מקובל השימוש במונח Cupertino למקרה שבו שגיאת כתיב מתוקנת למילה הלא-נכונה, בשל העובדה ששם העיר הקליפורנית היא ההצעה הראשונה למי שמקליד בחפזון את המילה cooperation ויוצא לו cooperatino. מקרה טיפה שונה, שנעדר בינתיים שם מקובל (אבל מזוהה עם ה"מילה" clbuttic), הוא תוצאה של החלפה אוטומטית חסרת-עידון של ביטויים גסים למקביליהם הנקיים (כאן, classic נפלה קורבן לחוק אוטומטי שמחליף ass ל-butt ולא מוודא שה-ass הוא יחידה מורפולוגית שלמה במילה. תחשבו בעברית על "דרך חעכוזים").

בטורו של דרור אידר בישראל היום היום נפלו לפחות שתי שגיאות בהיסח-דעת. על הראשונה כבר עמד אורן פרסיקו בסקירה היומית בעין השביעית – במקום "מערכת החינוך" ציטט אידר את נחום ברנע כמדבר על "מערכת הבחירות", מה שהוביל לאמירה קצת עקרה (מנסים להכניס אליה פוליטיזציה מסוכנת…). זו שגיאה מובנת – הצירוף השני נפוץ היום הרבה יותר מהראשון, ואני בטוח שלעוסקים בסיקור בימינו המילה "מערכת" מושלמת אליו אוטומטית.

השגיאה השנייה היא זו שלשמה התכנסנו. שימו לב מה קרה למילה "פלסטיים" בפסקה הבאה:

והעורך (לא) ערך

כן, כן. זו לא טעות של הומופוניה, הומונימיה, הומוקלידיה או צירופים נפוצים. עושה רושם שב-"ישראל היום" מוחל פילטר טיפש (אולי אפילו אנושי) על רצף האותיות הגס "פלסט", שמתקן אותן אוטומטית לביטוי הנקי "פלשת". שלא ישתחל איזה "פלסטיני" בטעות וינתק את הקשר ההיסטורי שבין משפחת חוסייני וגליית.

טעה בסגנון המטאפורה

2 אוגוסט, 2012 בשעה 20:22 | פורסם בסמנטיקה, עברית, עולם דיגיטלי, ראיתי-שמעתי | כתיבת תגובה

זה הפוסט פרסמתי הבוקר בדגש קל, על ביטוי שחוסר העדכניות שבדימוי שבו כנראה גורם לעיוות קל שלו. שימו לב למשפט החותם, אותו נשמור כגלעד ליום שהיה בלונדון.

עדכונים קלים

12 יולי, 2012 בשעה 16:23 | פורסם ב15 דקות, אנגלית, אקדמיה, וידאו, כתיב, עברית, עולם דיגיטלי, תרבות, תרגום | כתיבת תגובה

פוסט חדש העליתי בדגש, והוא כמותני להחריד. עוד על פיסוק ראוי ולא ראוי כתבתי כאן וכאן.

מעבר לכך, אם עוד לא ראיתם את הרצאתי (עם כרמל) על קהילת השפה בויקיפדיה העברית ותרגום ממשק הפייס לעברית, למה אתם מחכים?

תהיה

24 יוני, 2012 בשעה 10:59 | פורסם באקדמיה, עולם דיגיטלי, ראיתי-שמעתי, שיח | 2 תגובות

אם בכנס על שפה וחברה בעידן הדיגיטלי אני שומע הרצאה על מאפייני שיח פייסבוק בקרב נוער מתבגר, ובערך 90% מתארים יפה גם את השיח שלי בפייסבוק, על מי זה מעיד, ומה?

מנפלאות יאהו! מייל

3 דצמבר, 2011 בשעה 22:41 | פורסם בכשל, עולם דיגיטלי, ראיתי-שמעתי | תגובה אחת

זה מה שקורה כשנכנסים להודעה האחרונה בתיבת הדואר הנכנס ולוחצים על "מחק" יותר מפעם אחת.

וכך זה נמשך, אגב

#אפשר-להוציא-את-הבנאדם-מהקיו-איי-אבל-אי-אפשר-להוציא-את-הקיו-איי-מהבנאדם: יצאתי מהחשבון, נכנסתי חזרה, המונה חזר לאפס אבל זה מה שקרה למסך הכניסה:

סטייט אוף דה ארט

מיליות שימוש – כללי הגיה

15 אוקטובר, 2011 בשעה 16:39 | פורסם בעברית, עולם דיגיטלי, קטנונולוגיה, ראיתי-שמעתי, רשימות, תיקון-יתר | 4 תגובות

כתבתי בדגש קל בעבר, וגם כאן הראיתי סימנים, על סלידתי מתיקון-יתר בהגיית מילים עבריות שמוצמדות אליהן מיליות שימוש כמו ו"ו החיבור וה"א הידיעה. בעקבות הדגימה האחרונה של קרייני חדשות (?) שמתקנים-עצמם-יתר נתבקשתי להכין רשימת חוקים להגיה תקנית (כלומר – לא טבעית בעליל) של המקרים האלה. הייתי בטוח שתוך דקה של גיגול אמצא רשימה כזו, אך נתבדיתי, אז הנה היא לפניכם. כמה הערות:

  • אין לי שווא במקלדת, ואין לי כח לקפסט שווא שוב ושוב, לכן אשתמש בכתיב פונטי מפושט (x זה הצליל של ח' ו-כ' רפה)
  • הרשימה היא לפי סדר אזוטריות. מוטב ללמוד את המקרים הראשונים קודם, ורק לאחר שמסיימים אחד לעבור לבא. כך נמנעים מתיקון-יתר.
  • טעות – לעולם חוזר. גלו לי אם טעיתי והיכן.

——

ו"ו החיבור:

  • אלא אם חל אחד המקרים הבאים, נהגית בתנועת e: ולכן – ve-laxen. והיום – ve-hayom.
  • אם לפני אחת מאותיות בומ"פ, נהגית בתנועת u: ומצאתי – u-matzati. ופחות – u-faxot.
  • אם לפני שווא, נהגית בתנועת u: שחורים ולבנים – u-lvanim. פגעים וקמטים – u-kmatim. אם לא יודעים אם באמת מדובר בשווא, או שמא בצירה/סגול, עדיף להישאר עם e, כמו בדיבור טבעי.
  • אם לפני שווא ב-י, נהגית בתנועת i: הורים וילדים – vi-ladim.
  • בביטויים קפואים מסויימים לפני הברה מוטעמת, נהגית בתנועת a: בשר ודם – va-dam. כפתור ופרח – va-ferax.
  • אם לפני חטף, מכפילים את תנועת החטף: וחלונות – va-xalonot. ואני – va-ani. ואניה – vo-oniya (כן, כן).

אות שאחרי ו"ו החיבור: דגש קל נופל. וכיום ve-xayom. ובטח – u-vetax. אם לא בטוחים באיזו אות מתחילה המילה, עדיף להשאיר אותה לפי ההגיה הרגילה. (ע"ע "כל קצין וחצין")

——

ה"א הידיעה:

  • אלא אם חל אחד המקרים הבאים, נהגית בתנועת a: החלבן – ha-xalban.
  • לפני עָ, הָ בלתי מוטעמת, נהגית בתנועת e: העוון – he-avon. ההרים – he-harim.
  • לפני ח' בקמץ/חטף-קמץ, נהגית בתנועת e: החדשים (months) – he-xodashim. החמוד – he-xamud.

אות שאחרי ה"א הידיעה – הגיית דגש נשארת (הוא חזק ולא קל, אבל זה לא עיסוקנו כרגע): הבית – ha-bayit. בבית (=ב+ה+בית) – ba-bayit.

——

ב, כ, ל השימוש – מתנהגות כמו ו"ו החיבור מלבד חוק בומ"פ, ונהגות כ-i לפני שווא. בדברים – bi-dvarim. במקום ביטויים קפואים – כינויי הגוף "זה", "זאת": בזאת – ba-zot.

אם באה אחריהן ה' הידיעה היא "מתמזגת" לתוכן והן מתנהגות כמוה: כ+ה+עיט – ka-ayit. ב+ה+חלל – be-xalal.

מִ, שֶׁ – מתנהגות כמו ה"א הידיעה בענייני האות שאחרי. צורת הבסיס של מ' היא תנועת i, והיא הופכת ל-e לפני אותיות גרוניות. ממחר – mi-maxar. מהיום – me-hayom.

סדר הפעלת החוקים: מסוף המילה להתחלתה: ו+כ+ש+ב+ה+בית – u-x-she-ba-bayit.

[תודה לנילי על תוספות]

העמוד הבא »

יצירה של אתר חינמי או בלוג ב־WordPress.com.
Entries וכן תגובות feeds.