我對英文的一些觀察 - 1
英文一直是我認為,是全世界最有生產力的一種語言,這也是為什麼最先進的技術都在英語系國家的原因。
第一個,也是最重要的一個根本原因是,內容的 "產出" 成本極低。
英文是全世界, "僅" 使用26個字母加3-5個標點符號(',.!~這些),就可以完成溝通內容構建的語言。以下的內容雖是以中文作為對比,但中,日,韓文面臨的問題不會差太多。
我自己技術人員的經歷尤其深刻。早期還在研究各式各樣不同的Linux作業系統時,中文輸入法一向都是一個問題。大家使用的中文輸入法不盡相同,雖然大多數人使用的是注音輸入,但有些人習慣用拼音輸入(像是中國),而我自己是用嘸蝦米輸入。光是要在作業系統中把語系和輸入法配置到好,往往就可以寫一篇教學文。若今天我是英語系用戶的話呢?就馬上開始使用啦。光是配置環境,英文的部署成本極低。若是一些嵌入式裝置,記憶體或儲存媒體的空間十分有限(例如早期可以顯示內容的LED燈條),能使用的作業系統更是只能用英文。因為英文只需要26個字母,不需要可以顯示超過5000個以上"長相"不同的中文字。
在手機上,中文輸入的成本依然比英文來得高很多。相較於雙手平放輸入的鍵盤,為了能在手機上輸入,我們又多了一個選項叫做「手寫輸入」。從手寫字要辨識成一個字,中文的難度又遠超過英文(都是要用機器學習的技術辨識,但中文需要的資料可是遠超過英文)。英文有一個很有趣,也很有效率的輸入法叫「滑行(Swipe)」輸入法。比如說我們想輸入「think」這個字,我們就把一根手指,以「t」為起點,分別滑過「h」,「i」,「n」和「k」這幾個字,就完成一個「think」的輸入。這個過程不用很精準的點擊正確的字母位置,只要有 "經過" 那些字母即可。演算法的正確度很高,在實務使用上,要完全用一隻手完成一整篇文章(甚至包含字與字之間的空格,標點符號,大小寫等),唯一的磨擦力是自己的大腦,而不會是輸入法。中文雖也有滑行輸入法,但以目前的實作水平來看,完全只是有長相而已,其準確度完全就像個雛型作品,無法應付實務需求。
輸入速度呢?雖然在受過足夠訓練的前提下,中文的輸入速度也可以有跟上口述的能力,但中文就是需要先投入一筆時間和心力去訓練。使用注音/倉頡類中文碼輸入的輸入法而言,即便編碼規則是每個輸入法一樣的學習成本,但要熟悉鍵盤上的那些「碼」在哪裡,長什麼樣子,就是一個很大的阻力(若在沒有中文標示的鍵盤上,這甚至會成為一種限制)。許多人仍有需要輸入中英混雜的內容需求,就算中打的速度夠了,還得再投入訓練英打的時間及心力,才能在「輸入」這件事獲得和英語系用戶一樣的起跑點。我自己慣用的嘸蝦米輸入法,它直接使用英文字母作為中文的編碼,很大的好處就是同時練好中打和英打,而且不受鍵盤中文標示的限制,都可以順利的輸入中文(全形符號,甚至是日文)。熟悉這個輸入法是很好的投資,不過仍舊是一筆成本,而且也仍舊是一個限制,因為系統不會內建這個輸入法。回過頭來看英語系用戶,英打是他們唯一需要投入的訓練,一但有足夠的訓練(而且很快),「輸入」這件事對他們就再也不是問題,而且沒有輸入裝置(不論是哪種鍵盤,或是只能觸控),也沒有作業系統(任何作業系統至少一定有英文)的限制,就可以馬上開始產出內容。
這裡做個簡單的澄清。若是以「保存」的成本討論,英文可能會比中文大。因為中文的每一個字(word),都比英文所佔的容量(bytes)要小得多。意思是指「apple」會比「蘋果」多1個byte,「psycology」會比「心理學」多3個bytes,連帶在整個句字的描述上,整句英文所佔用的"成本",不管是印在紙上的,還是記在記憶體內的,都會比中文來得多。但以歷史的演進來看,因為有這個"缺點"的關係,怎麼儲存這些資料的技術,反倒是歐美國家的研究更為深入(想想大數據,雲端空間,更大的硬碟這些東西都是誰先發明的,就可以理解了…)。所以這裡不討論「保存」這個主題,因為它基本上不是問題。