Bureaucratic Path to PhD Studies

12 מאי, 2017 ב- 20:09 | פורסם בEnglish, ג'ון נאש, יצירתי, מנהלי | כתיבת תגובה

Here's the path I took, as a non-US-citizen, before moving to the US and starting a CS PhD program. I took the GRE and TOEFL around summer of 2015 and moved in August 2016.

I provide it as a reference for similar-minded folk, but keep in mind times change, circumstances vary, and I may have forgotten crucial steps. In any case, enjoy.

(Created using GraphViz)

dep-graph-1705121300

מודעות פרסומת

Google's Translation Overhaul – Interview on IDF Radio

17 אפריל, 2017 ב- 17:48 | פורסם ב15 דקות, English, אנגלית, עולם דיגיטלי, תרגום | תגובה אחת

This February, I gave an interview to Ido Kenan on Galei Tzahal (IDF Radio) about Google's upgraded Machine Translation system, including its claims that it learns an intermediary abstract language representation, an "Interlingua".

You can listen to the interview above this line, or here on Kenan's blog, where you can also read my writeup. Problem is, it's all in Hebrew! Well, what better than to use the fancy new Google Translate to render the thing into English?

Here it is, untouched. See how much you understand. (Retrieved March 16, 2017)

Continue Reading Google's Translation Overhaul – Interview on IDF Radio…

Turnout, Burnout

10 נובמבר, 2016 ב- 19:35 | פורסם בEnglish, פוליטיקה | כתיבת תגובה

Since Tuesday's elections, I've been hearing a lot about the alleged irresponsibility of the American voter, not turning out for the elections. At the same time, there has been the usual fuss over the electoral college system and how some states are meaningless to bother going out to vote.

I have yet to see a piece trying to tie the two together (please correct me if I'm wrong).

My claim is simple: citing the nationwide 56.5% figure as a strong indicator for voter apathy is somewhat misleading. If a Californian feels they don't see the point in voting (and registering beforehand), it's different than a Pennsylvania voter (in this elections cycle at least, but pretty much usually). It's unfair, but understandable, if there's a (say) 15 point difference in their turnout rates.

Let's look at the numbers then, shall we? On the x axis, we'll place the ultimate victory margin (collected Thursday from Wikipedia) as a proxy for how inclined an average voter was to believe that his vote would be crucial. It's not a perfect proxy of course, as there were some state-level surprises. Maybe poll margins prior to registration deadlines would have been a better one. The y axis will denote the voting turnout (collected from electproject.org).

Before the chart, observational data: of the 11 states with highest voter turnout rate, 10 ended up with a margin under 5%. Of the 10 states with margin under 4%, only one had a turnout of less than 60%. Now you can look at the chart, including a simple linear trend line.

2016-state-voting

Forgive my dataviz-unsavviness. I wish I knew how to add state labels to each point on gsheets.

As you can see, the results are pretty straightforward. With a not-bad correlation of 0.21, it seems voters chose to turn out based on how close they anticipated the race to be in their state. I didn't leave out the outliers but they're not shown in this chart (DC is always ridiculous, this time with an 86% victory margin. Hawaii significantly undervoted with a 34% turnout, way under the next, California at 45.5%). It was cool to see Utah as a special case here with its 3-way race – a 19% D-R margin brought significantly less people to the polls than Montana or Washington state who ended up with about the same margin.

All in all, the voters who mattered in this Presidential election (tough phrasing but that's the way it is) came in at about 65%, much higher than the national average.

It's worth noting that the numbers, even for the swing states, are still low compared to most of the democratic world. But I'll also note that the US has other factors going for it, such as the no-day-off thing, or the huge amount of expats allowed to vote, which is a unique characteristic. According to electproject, these compose roughly 2% of the eligible electorate.

Georgia Tech at NAACL 2016

26 יוני, 2016 ב- 13:31 | פורסם באקדמיה | כתיבת תגובה

(Original author: Jacob Eisenstein)

Georgia Tech Computational Linguistics Lab

Georgia Tech had three papers at this year's meeting of the North American Association for Computational Linguistics (NAACL).

Yangfeng Ji (who is on his way to a postdoc at University of Washington after successfully defending his thesis in May!) presented a full paper entitled, A Latent Variable Recurrent Neural Network for Discourse Relation Language Models, which he co-authored with Gholamreza Haffari and me. This paper described a hybrid neural/latent variable architecture for incorporating shallow (PDTB-style) discourse relations into language models. The method improves language modeling as well as discourse relation classification. The paper is based on our work at the JSALT workshop last summer, and we hope to use the method to integrate discourse into multi-sentence generation tasks, such as summarization and machine translation.

Yi Yang presented another full paper, Part-of-Speech Tagging for Historical English. In this paper, we evaluated a number of approaches for accurately tagging the syntax of early modern English texts…

View original post 134 מילים נוספות

כן, אדוני השר המואשם שוב בפלילים

8 אפריל, 2016 ב- 19:31 | פורסם בלקסיקון, עברית, פרגמטיקה, ראיתי-שמעתי | כתיבת תגובה

שרי רוט מפגיזה בהפלוג:

אין מצב להשאיר את הספינה בלי רועה.

אגב, למה שפורר קיבלה שם קריטורת אילוסטרציה ורוט הוותיקה בהרבה לא?

(אין צורך לענות )

אין לי רגע דל

16 ספטמבר, 2015 ב- 12:37 | פורסם במנהלי, ראיתי-שמעתי | תגובה אחת

לא כתבתי פה פוסט כבר כמעט חצי שנה*? סמכו על עיריית חיפה שתעיר אותי מהמתים.

אתר פסטיבל הסרטים ה-ל"א עלה לאוויר בשעה טובה. אפילו שמו תוכניה ברמה היומית של הסרטים עם חלוקת שורות לאולמות.

את ציר הזמן, לעומת זאת, פקדה פשרה מוזרה (שלא לומר מבלבלת שועלים): הימים מסודרים מימין לשמאל. השעות בתוך כל יום מסודרות משמאל לימין. ובתוך כל משבצת זמן, הס פן תעיר, נכתב שם הסרט בכתב אשורי מימין לשמאל. מבולבלים? חכו שתראו את צילום המסך.

haifaff

פינת סטירה

*בדגש דווקא כתבתי פה ושם: הנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה והנה. והצגתי ביסקול וארגננו בהמעבדה טרעק צ'אלאנג'. ועוד ועוד.

** אגב, יש לי גם טאמבלְר. אותו שם משתמש.

טוויסט מעניין על "שעה שמחה"

30 אפריל, 2015 ב- 08:09 | פורסם בראיתי-שמעתי | כתיבת תגובה

בפוסט מלפני זמן רב עמדתי על האבחנה ששעונים אנלוגיים מוצגים לרוב כשהם מכוונים לשעה 10:10. ציינתי גם שעם דיגיטליים כנראה אין קונבנציה מוסכמת.

אתמול חזיתי בדבר הזה ביישומון סיכומי החדשות של יאהו:

1009

קצת פיגרו.

Perfect Ambiguity

12 ינואר, 2015 ב- 13:19 | פורסם בEnglish, אנגלית, אקדמיה, סמנטיקה | תגובה אחת
I just ran into the most perfect case of ambiguity in a signup form to remain of anonymous origin:
Last (Name First)
So, what does the text in parentheses mean?

  1. It's to be parsed as a template: <First> <Last>, meaning the first name should come first;
  2. It's an English-grammatical instruction (as in "first things first"): "Put your first name last", meaning the last name should come first.

I'm going with the first interpretation, but you gotta admit that this is a case where trying to make things clear only makes them confusing.

בישראל היום יבחרו בין להתקשות בלוגיקה לבין לא להצליח בלוגיקה

13 ספטמבר, 2014 ב- 21:01 | פורסם בכשל, סמנטיקה, עברית, ראיתי-שמעתי | כתיבת תגובה

אז יהיה משאל עם בסקוטלנד בשבוע הבא. משמעותה של הצבעת "כן" – עצמאות לסקוטלנד, כלומר פירוק הממלכה המאוחדת.

עורך עמוד השער של המוסף השבועי של "ישראל היום" הבין את המילה "כלומר" כ-"או".

כי למה לחשוב עשר שניות לפני שכותבים כותרת למוסף השבועי היחיד בעיתון

כי למה לחשוב עשר שניות לפני שכותבים כותרת למוסף השבועי היחיד בעיתון

בעיות עם הפיד במייל

30 יוני, 2014 ב- 09:57 | פורסם במנהלי | תגובה אחת

שלום לקוראים,

לפני שעות ספורות יידעו אותי שחלקכם מקבל יותר מדי הודעות מהפיד במייל לאחרונה.

עשיתי Resync לפיד, מקווה שזה יפתור את הסוגיה.

אם הבעיה נמשכת, אנא ספרו לי כאן בתגובות. אם מישהו כאן בעל בלוג ונתקל בבעיה בעבר – אדרבא, ספרו לי איך פותרים אותה.

מתנצל על הספאם,

– יובל

העמוד הבא »

בלוג בוורדפרס.קום.
Entries וכן תגובות feeds.