Friday, February 07, 2014

用 Windows 版 gcin 來輸入客家話

先前介紹的客家話拼音輸入法,是把拼音與漢字的關聯製作成 cin 格式的檔案,利用香草輸入法 (介紹文) 或者 Yahoo 奇摩輸入法 (介紹文) 架構來運作。過了這幾年,物換星移,這些輸入法已經停止在 Windows 平台上開發了。所以,Windows 平台的使用者要如何使用客家話拼音輸入法呢?


Saturday, January 19, 2013

「鼠鬚管」拼音輸入法與繁體中文

緣起

由於過去在國外唸書的緣故,鍵盤上沒有注音符號,因而習慣了拼音輸入繁體字。在Mac OS 7, 8 的時代,用的是蘋果 Chinese Language Kit (CLK) 裏的漢音輸入法。這個輸入法是由日本松下研究所開發,可以用注音、拼音輸入,會自動比對內建的詞庫來更換還在輸入區的同音詞。和當時主流的輸入法一個字、一個字的從同音字挑正確的字的使用經驗比較起來,已經很厲害了。

在進入Mac OS X朝代後,漢音輸入法一度因爲青黃不接,而出現空窗期。因為找尋可用的輸入法而開始接觸「得意輸入法」(後來改名為「奇易輸入法」)。奇易輸入法最令我激賞的是,它會自動學習詞彙,不必像漢音輸入法那樣,要手動加入詞庫。如鄭先生自己說的,打字越打越輕鬆。過去十多年一直使用鄭安巽先生開發的「奇易輸入法」。也因爲好用,前後買了三套授權碼,給不同的電腦用。

隨着 Mac OS X 版本的更新,Microsoft Office的版本的更新,奇易輸入法已經開始出現不相容的情況。以下是我在oikos 論壇的提問
我在使用 MS Office 2011 裏的 WORD 時候,有一種情況常會 (但是不保證一定發生) 把 WORD crash,然後  -DerYi-OS-X-IntPPC-5500r3 的 CPU 使用量飆高。必須用 Activity monitor 把「-DerYi-OS-X-IntPPC-5500r3」與「得意輸入法」結束 (非強制結束)。還好,重新啟動 WORD,當輸入法切換到奇易輸入法後,一切重新載入,就好了。

要把 WORD 當掉的方法是:當輸入法是奇易輸入法時 (in-line行內輸入模式),緩衝區是空的情況下,如果滑鼠去點擊功能帶上的字型選單、工具箱裏的樣式選單、或以右鍵點擊欲叫出 contextual menu 時,就當掉。

似乎這新版的 WORD 這些選單從系統看來都是某種視窗,奇易輸入法以為我從文稿切換到另一個文稿視窗,準備建立 hook 替即將要用到的 in-line input 做準備,結果掉入陷阱,引起 WORD 與奇易輸入法當機?(香草輸入法開發者也提過類似的問題)

我現在不敢把輸入法留在奇易,每次輸入完中文,就切換回英文,免得不小心滑鼠按下 WORD 的選單就毀了。

我的機器的狀況:
Mac OS X 10.6.8
MacBookPro 2 GHz i7 (2011 early)
8 GB

奇易輸入法 5500r3
MS WORD 14.2.4 (120824)
從鄭先生的回信,他目前不再維護奇易輸入法了。所以,要開始物色替代方案。

QIM 輸入法

目前 Mac OS X 內建的拼音輸入法與 iOS 裏的智慧程度一樣不如意。如果在緩衝區裏的同音字不是我要的,又留在那裏等後文鍵入時自動更正,往往還沒等到,錯字就送出到前端應用程式了。以至於思緒常 常要注意在這裏。以前在用「奇易輸入法」時,思緒完全在構思文字,不必煩這些事。

我找到了 QIM (Quickcore Input Method)。智慧程度用起來和奇易輸入法一樣 (但是沒有自動聯想功能)。原先是 shareware,最近變成免費的。耶魯大學 Chinese Mac 網頁對它讚譽有加。是中國的軟體個人作家 Glider 製作,可以設定成輸出成繁體中文。詞庫用起來也是有因應台灣的用法。說明文件在此。

從2012年11月中旬開始使用 QIM 以來,初期遇到的轉移陣痛是
  1. 不需要加音調。習慣了奇易輸入法每個字後面加調號,現在暫時要繃緊神經、提醒自己不要按調號。
  2. 隨時都是選字模式,不需特別按space bar。
  3. 按space bar是把首選字送出。
  4. 按esc直接清空input buffer。
  5. 按return可以直接把拼音或英文字送出。
不過,最不適應的是,QIM 開發者相當堅持中國拼音的正確性,所以沒有把臺灣慣用的發音納入。可是,臺灣有些字的發音就是不一樣 (教育部的國語詞典也這樣呀)。例如,

中文字臺灣慣用發音QIM
zhan (ㄓㄢˋ)zan (ㄗㄢˋ)
zou (ㄗㄡˋ)zhou (ㄓㄡˋ)
yao (ㄧㄠˊ)xiao (ㄒㄧㄠˊ)
shou (ㄕㄡˊ)shu (ㄕㄨˊ)
yi (ㄧˋ) 或
ye (ㄧㄝˋ)
ye (ㄧㄝˋ)
yi (ㄧˋ)ye (ㄧㄝˋ)
she (ㄕㄜˊ)shi (ㄕˊ),  shen (ㄕㄣˊ)
yao (ㄧㄠˋ) 或
yue (ㄩㄝˋ)
yue (ㄩㄝˋ)
sai (ㄙㄞ) 或
se (ㄙㄜˋ)
se (ㄙㄜˋ)
qiong (ㄑㄩㄥˊ)xiong (ㄒㄩㄥ)
gua (ㄍㄨㄚ) 或
kuo (ㄎㄨㄛˋ)
kuo (ㄎㄨㄛˋ)
han (ㄏㄢˋ) 或
he (ㄏㄜˊ)
he (ㄏㄜˊ)

鼠鬚管

就在一個星期前,在 oikos 論壇得知另一個可以用的拼音輸入繁體中文的方案,叫做「中州韻輸入法 RIME」。它是跨平臺、開放源碼的輸入法引擎方案。在linux平臺名叫「ibus-rime」,在Windows平臺名叫「weasel/小狼毫」,它在Mac OS X平臺的名稱是「squirrel/鼠鬚管」。以毛筆種類來稱呼,很別緻。

目前的版本號碼是 0.9.14.5,還沒到 1.0,有點嚇人。但是使用這一個星期以來,我決定從 QIM 轉到「鼠鬚管」來。還沒有遇到不成熟、不相容的問題。上述的臺灣慣用發音,都有包含在內。目前唯一不如人的,是所有的設定都沒有程式界面,反而要使用者打開設定的文字檔,自己加入、更改設定指令。所幸它的網頁上有許多現成的設定指令可以參考。我還能接受。輸入法選單 (顯示幕選單條右上角) 選擇了「鼠鬚管」後 (圖像是方框裏有個「中」字),再次進入這個輸入法選單則會出現與「鼠鬚管」相關的選項列在中區段,如下圖。選擇「Settings……(設定)」則會請 Finder 叫出設定檔的資料夾,方便點選某個設定檔案打開編輯。


鼠鬚管的設定

參考了網友 Pingveno《在 Mac 使用中州韻輸入法》、網友部落格 Beyond the Void 裏的文章《推薦一個神級輸入法——Rime》,以及各式修改設定的集散地《RIME定製指南》,我做了如下的設定:

1. default.custom.yaml
     * 除了內定的拼音 (朙月拼音) 之外,再多列了可以追加聲調的拼音 (地球拼音)、朙月拼音・語句流、以及注音。
     * 把候選字的選單長度,從內定的5個升到9個。
     * 把中西文臨時切換鍵,從 shift 改成 control。
     * 修改時可以參考 default.yaml 裏所列的整體設定的語法。

patch:
  schema_list:
    - schema: luna_pinyin   # 朙月拼音
    - schema: terra_pinyin  # 地球拼音 dì qiú pīn yīn
    - schema: luna_pinyin_fluency  # 朙月拼音・語句流
    - schema: bopomofo      # 注音
  "menu/page_size": 9  # 候選字的選單長度
  ascii_composer/switch_key:
    Shift_L: noop
    Shift_R: noop
    Control_L: inline_ascii
    Control_R: inline_ascii 



2.  luna_pinyin.custom.yaml
     * 把「朙月拼音」內定的減號鍵、等號鍵、逗號鍵、句號鍵借去當候選字選單的游標移動鍵,關掉,恢復本來標點符號兼候選字送出鍵。
     * 把圓括弧鍵對應,從全形圓括弧改成半形。
     * 修改時可以參考 luna_pinyin.custom.yaml 裏所列的整體設定的語法。
patch:
  "key_binder/bindings":
    - accept: minus
      send: minus
      when: has_menu
    - accept: equal
      send: equal
      when: has_menu
    - accept: comma
      send: comma
      when: has_menu
    - accept: period
      send: period
      when: has_menu
  punctuator/half_shape:
    "(": "("
    ")": ")"
  3. squirrel.custom.yaml
     * 候選窗從直向改成横向顯示。
     * 候選窗口圓角半徑設成5。
     * 配色方案設成 google 模式。
     * 修改時可以參考 squirrel.yaml 裏所列的整體設定的語法。     
patch:
#  us_keyboard_layout: true      # 鍵盤選項:應用美式鍵盤佈局
#  show_notifications_when: growl_is_running  # 狀態通知,默認裝有Growl時顯示,也可設爲    全開(always)全關(never)
  style/horizontal: true        # 候選窗横向顯示
#  style/font_face: "儷黑 Pro"    # 我喜歡的字體名稱
#  style/font_point: 21          # 字號
  style/corner_radius: 5       # 窗口圓角半徑
#  style/border_height: 0        # 窗口邊界高度,大於圓角半徑才有效果
#  style/border_width: 0         # 窗口邊界寬度,大於圓角半徑才有效果
  style/color_scheme: google      # 選擇配色方案

# 註:預設的配色方案及代碼(指定爲 style/color_scheme )
#   碧水 - aqua
#   青天 - azure
#   明月 - luna
#   墨池 - ink
#   孤寺 - lost_temple
#   暗堂 - dark_temple
#   星際我爭霸 - starcraft
#   谷歌 - google
這些設定檔的語法:
  • 忽略「#」字元之後的字串,把它們當成註解。要關掉某行設定,但是又不想整行刪掉,也許以後還會用到,就把這「#」字元放在行首。
  • 每一個設定檔,都有副檔名「.yaml」。
  • 每一個設定檔想要修改自己的喜好,要另外在檔名有「custom」的設定檔。如果資料夾沒有,則自己建立一個。例如 default.yaml (所有預設值) 要修改,要把設定值寫在 default.custom.yaml 這個檔案裏。
  • 「custom」的設定檔內,只能出現一次「patch:」,所以,所有後來繼續追加的設定,都要寫在它的管轄範圍。
  •  用「縮進 (indent)」來表示屬於某個指令的管轄範圍。每層級內縮兩個空格。
修改了設定檔案,存檔後,記得要在輸入法選單上選擇「Deploy」(部署、套用) 就會生效。如果沒效果,應該是設定的指令語法有誤,很可能是內縮層級沒做好。

鼠鬚管使用心得

 以下是我目前從奇易輸入法轉移到鼠鬚管的心得:
  1. 不需要加音調。
  2. 隨時都是選字模式,不需特別按space bar。
  3. 按space bar是把首選字送出。
  4. 按esc直接清空input buffer。
  5. 按return可以直接把拼音或英文字送出。
  6. 刪節號是 ^  破折號是 _
  7. 左右方括號鍵對應到「」【】〔〕[] 左右大括號對應到『』〖〗{}
  8. \ 對應到 、\\  
  9. ~$%*<>/ 這些按鍵都有多個以上的中文字型符號對應。
  10. 以上符號鍵的定義都可以自己在 luna_pinyin.custom.yaml 設定檔案裏自己修改。
  11. 數字直接以英數模式送出。數字緊接著的句點會以英數模式送出。冒號也是。
  12. 要用到英數模式的逗號、句點、左右圓括弧 (這已經從設定檔改好了),只能用西文模式按出。
  13. 臨時的西文模式可以按一下 SHIFT 鍵進入 (可以改成按 CONTROL),再按一次跳出。
  14. 按 Caps Lock 鈕也會進入西文模式,但是字母一律大寫。
  15. 按逗號、句號等標點符號,就直接送出目前的首選字串。
  16. Facebook message 收信人欄,這些會動態依照使用者鍵入字符搜尋資料庫的行為,Squirrel不相容。在文字欄除了中文字之外,還會留有拼音。
  17. 左、右箭頭按鍵:在拼音輸入緩衝區裏移動游標;上下箭頭按鍵:移動候選字的選擇 (這些行爲原先是以直向候選清單而設計,不會因爲橫向候選清單而改變);Page Up 與 Page Down 鍵:候選字換頁。
  18. 按下 control ` 可以叫出操作模式清單,例如,要換成「地球拼音」、「朙月拼音・語句流」、「注音」,或者半形、全形切換,中文西文模式切換,繁體簡體切換。按下模式的編號即可切換,如果不要做任何更動,按esc。
  19. 「朙月拼音・語句流」模式,有點類似奇易輸入法輸入暫存區、候選字清單兩層的概念。選字、改字都先在輸入暫存區,最後在打標點符號時或按return鍵才把整個暫存區內的「句子」整個送到前端應用程式。而「朙 (ㄇㄧㄥˊ) 月拼音 luna pinyin」則是在候選清單選了詞/字後就直接送到前端了。
  20. 所選的詞/字也會自動學習,記錄到使用者的詞庫裏。
  21. 如果選用鼠鬚管的注音,有個很重要的不同點 (與一般常用的注音比較),那就是第一聲不可用空格鍵,而是不按任何聲調鍵代表第一聲,繼續按第二字的注音。這是因爲整個輸入法引擎的設計理念裏,空格鍵是把候選字送出。如果這個第一聲的字還要接受後續的同音字詞庫校對,則還不能把它「送出」,要把它留在輸入法裏。
  22. 【注音】如果要的是注音的拼法,可以拼好後按 shift-return 送出,例如 朙 (ㄇㄧㄥˊ)。

Saturday, August 13, 2011

給女兒的睡前故事

暑假沒有規律的學校作息,女兒晚上變得不容易入睡。我們重拾起睡前講故事,一方面穩定睡前的情緒,一方面增進親子感情。只是家裏的故事書,適合睡覺前講的,她都讀過了,沒有新鮮感;一時也沒有機會到圖書館借書。拿起〈客家話小王子〉,心想,她沒聽過〈小王子〉,應該可以做為睡前故事書。也可以練習客家話。

果然,〈小王子〉的故事內容很對她的胃口。但因為是客家話發音,她聽了兩、三頁後,就被催眠說可以停,要睡了。雖然如此,接下來每天晚上她都很期待〈小王子〉時間。

徐兆泉老師用客家話漢字、音標翻譯這本世界名著 Le Petit Prince,也讓我熟悉許多客家話的特有詞彙。不過,由於是 2000 年出版的,裏面有些語詞,所選的漢字不是那麼嚴謹。但是,如果對照著徐老師於 2009 年出版的客家話辭典,就可以找到比較有考據的漢字。

由於這本〈客家話小王子〉的排版,是一半漢字,一半拼音。我比較無法適應。我主要是讀漢字,但是如果遇到不知如何以客家話發音時,要跳到拼音的那一半就會迷失找不到了。所以,也練習客家話打字輸入,以類似日語的 Ruby 音標的方式排版。以自己做的工具 (輸入法、排版) 達到自己想要的成果,很有成就感。

以下是書的資料:

  • 〈客家話小王子〉, 徐兆泉譯,南天書局出版,2000 年,ISBN 957-638-552-2
  • 〈臺灣四縣腔海陸腔客家話辭典〉,徐兆泉編著,南天書局出版,2009 年,ISBN 978-957-638-7-15-9

我練習打字以及排版的樣式:

Sunday, November 02, 2008

Yahoo keykey and hakka cin 奇摩輸入法也可以用客語拼音輸入法

台灣 Yahoo 於今年 (2008) 5 月推出免費的輸入法。由於是以 OpenVanilla 為本所開發的,跨平台的特性仍是它的一大特色。好消息是,它也可以使用客語拼音輸入,只要下載安裝我之前介紹的「客家話輸入法表格檔」,下載所得的 tp_hakka_sy.cin (Si Yen 四縣腔) 與 tp_hakka_hl.cin (Hoi Liuk 海陸腔) 這兩個 cin 檔,依奇摩輸入法的「詳細功能介紹:新增自訂輸入法與自訂選項」說明,安裝在特定的檔案夾裏,就可以了。
最長字根長度設成 7 或更大的數字,其他的設定選項可以依自己的需求而作設定。
[update 12/19/2008] 台灣 Yahoo 已於日前發佈更新,版本 1.0 已可以很方便的用鼠標點擊的方式安裝 cin 檔。詳情可看官方網站之詳細功能介紹 > 自定輸入法支援加強這一項。
[update 3/24/2010] 台灣 Yahoo 輸入法的網址有些變動,所以本文的聯結也做了更正。
[update 2/3/2012] 台灣 Yahoo 輸入法的網址有些變動,所以本文的聯結也做了更正。
[update 2/7/2014] 因應 Yahoo 輸入法已經停止維護、開發,請看這篇談替代方案。

Monday, January 28, 2008

Hakka Short Rhyms 客家童謠—月光光

(ngiet) (gong) (góng)() (zhung) (gióng)
(gióng) (bịt) (mụk)() (zhung) (zhụk)
(zhụk) (koi) ()() (zhung) (gúa)
(gúa) (mang) (tai)(sún) (è) (zạk) (loi) (mai)
(mai) () (liong) (ge) (cien)(hok) () (mien)
(mien) (sien) (tón)(hok) () (zhón)
(zhon) (dui) (ziẹt)(hok) () (tiẹt)
(tiẹt) (sang) ()(hok) (chii) (zhú)
(zhu) (voi) (zèu)(hok) (chii) (gièu)
(gièu) (voi) (ngáu)(hok) (chii) (diáu)
(diau) (voi) (búi)(bui) (do) (tai) (shu) ()
(ngiám) () (rhịt) (ge) (lan) 西(si) (gúa)(ciẹt) (bun) (cin) (ga) (shiit)(sia) (do) 滿(mán) (tong) ()
(上文如果是由 FireFox 瀏覽器加上 Ruby support extension 就可以直接看到在漢字上方有拼音加註。如果是用一般瀏覽器,則只能看到拼音以括號放在漢字後面。)

這是一首流傳好幾代的客家童謠。每一句都有押韻,讓孩童朗朗上口。附圖是加註了通用拼音,方便閱讀的排版圖樣。這樣的排版,用的是開放源碼的免費程式,詳情可以看我寫的介紹文:
用 LaTeX 編排有客家話拼音的文稿
如果只是要寫出可以貼在部落格網頁上的 HTML 碼,可以不必理會 LaTeX 系統安裝,該拼音加註程式仍然可以使用。該程式會自動把文稿的漢字的客家話拼音,從資料檔調出配上。
[update 8/14/2011] 上述〈用 LaTeX 編排有客家話拼音的文稿〉的網址已修正,已指向新的伺服器位址。令外,Mac OS X Safari 現在從 4.x 版開始,也支援 Ruby tag,所以也能正確的顯示拼音在漢字之上。

Tuesday, November 20, 2007

通用拼音客家話輸入法模組使用說明

A. 下載「香草輸入法」

本模組需要在「 香草輸入法」框架下使用。目前有 Mac OS X、MS Windows 等平台上使用的版本。請從「 香草輸入法 Download」處下載。目前 (Nov. 5, 2007) 最新版本是 0.8.0, 隨時可能有更新版。

B. 安裝「香草輸入法」

請參考「 香草輸入法使用手冊」。

C. 設定

  1. Mac OS X 平台:在顯示幕右上角的輸入法選單,選擇香草輸入法後,再一次點選輸入法選單,可以看到香草輸入法的偏好設定選項;
  2. MS Windows 平台:在 Start > OpenVanilla > OVPreferences 可以作設定。
此設定視窗至少要叫出一次後,才能安裝客家輸入法表格檔。

D. 下載客語輸入法模組

按此連結下載: 客家話 / 客語輸入法表格檔

E. 安裝「通用拼音客家話 / 客語輸入法」表格檔

下載所得的 tp_hakka_sy.cin (Si Yen 四縣腔) 與 tp_hakka_hl.cin (Hoi Liuk 海陸腔),要放在香草輸入法的的泛用輸入法模組的資料夾裏:
  1. Mac OS X 平台:
    • 個人用: 個人Home/Library/OpenVanilla/(版本號碼)/UserSpace/OVIMGeneric/ 裏面
    • 大家共用: /Library/OpenVinilla/(版本號碼)/Modules/OVIMGeneric/ 裏面
  2. MS Windows 平台:C:\Windows\OpenVanilla\Modules\OVIMGeneric\ 裏面
目前 Mac OS X 平台的香草輸入法支援「字根反查」,請把下載所得的 lookup-tp_hakka_sy.cin 與 lookup-tp_hakka_hl.cin 放在反查表格的資料夾裏:
  • 個人用: 個人Home/Library/OpenVanilla/(版本號碼)/UserSpace/OVOFReverseLookup/ 裏面
  • 大家共用: /Library/OpenVinilla/(版本號碼)/Modules/OVOFReverseLookup/ 裏面

F. 客家話模組設定

底下兩張圖是在 Mac OS X 平台的香草輸入法 0.8.0  版的偏好設定畫面,原理相通,MS Windows 平台的使用者可以參考依樣設定:

請在模組載入清單 (Load list and shortcuts) 裏把客家話的模組勾選,四縣腔、海陸腔可以視需要個別勾選,或全選。如果平台的版本支援字根反查,則可以勾選所對應的 Lookup 表格。香草輸入法其他模組,當然也可以視需要勾選。
在個別模組設定裏,泛用模組類別針對 TP Hakka SiYen 與 TP Hakka HoiLiuk 做如圖的設定。最長字根長度設成 7 或更大的數字,其他的選項不必勾選。
設定完成後,關掉設定視窗或者執行存檔,才會生效。

G. 使用

  1. Mac OS X 平台:在顯示幕右上角的輸入法選單,選擇香草輸入法。如果是第一次使用,再一次點選輸入法選單,點選四縣腔或海陸腔客家話模組;下一次再進入香草輸入法則會記住前次所用之模組,在能接受文字的應用程式下,開始鍵入文字。
  2. MS Windows 平台:在螢幕底端狀態欄處,作輸入法的切換,選擇香草輸入法,並確認所選的模組是四縣腔或海陸腔客家話模組。在能接受文字的應用程式下,開始鍵入文字。
在 caps lock 啟動 (鍵盤燈亮) 的情況下,可以用英數模式鍵入英文字母、英文標點符號、數字。
在 caps lock 關閉 (鍵盤燈滅) 的情況下,可以鍵入客家話的通用拼音。調號標記是以鍵盤上現有的符號,最後鍵入,而不是在有調號的母音之後鍵入。各調號標記介紹如下:
  • 高平調 (例如 seu 笑):相當於無調號,直接在拼音字母輸入完後,以空白鍵表示組字;
  • 低昇調 (séu 搜):以單引號 ' (在鍵盤 RETURN (Mac OS X 平台) / ENTER (MS Windows 平台) 之左側),或以注音鍵盤的二聲符號 (與 6 同鍵), 輸入 seu' 或 seu6
  • 低平調 (seu 愁):以減號表示;seu-
  • 高降調 (sèu 小):以 ` 號表示 (在鍵盤左上角 ESC 鍵下側),或以注音鍵盤的四聲符號 (與 4 同鍵), 輸入 seu` 或 seu4
  • 海陸腔特有的中平調 (siōng 匠):以 = 號表示;siong=
  • 低入調 (ạp 鴨):以小數點 . 或注音鍵盤的輕聲符號 (與 7 同鍵), 輸入 ap. 或 ap7
  • 高入調,相當於無調號,同樣以空白鍵表示組字;luk 鹿
  • 另外,鼻化音 (啊 àⁿ ) 以 nn 表示;例如 ann`
行政院客委會網頁有「客語教學」可以參考通用拼音的用法。
選項以橫向 (Mac OS X) 或直向 (MS Windows) 列出,以 1, 2, ..., 9, 0 來選字。第一選項是通用拼音以正規格式顯示。例如鍵入 hang- 可得如下之畫面。如果想要的是通用拼音正規格式,再按 1 或空白鍵選之;如果想要的是「行」這個字,就按 7選之。如果多於十個候選字,候選欄最後會顯示有多少頁,如果顯示 1/2表示有兩頁,目前在第一頁。可以用空白鍵或向右、向下方向鍵往下跳頁,左方向鍵、上方向鍵往以前的頁面跳頁。
常用的標點符號 (中文全形) 逗號、問號、驚嘆號、冒號與鍵盤標記同位置,句號與鍵盤句點 (小數點) 同,頓號與分號共用分號鍵,左右方括號可以叫出「」『』﹁﹂﹃﹄〔〕︹︺【】︻︼,大小於符號可以叫出《》〈〉︽︾︿﹀, 其餘符號可以用香草輸入架構裏的符號輸入模組找到。
如果平台版本有支援反查,可以在輸入法選單裡勾選 TP Hakka-S Lookup (四縣腔反查) 或 TP Hakka-H Lookup (海陸腔反查)。在每個字輸入完畢後,香草輸入法會在顯示幕上告知此字有那些念法,如下圖:
這裏顯示「行」字有三種念法,可以用這三種拼音輸入此字。

H. 目前已知問題

低平調的標註是以 unicode 裡底線疊字 (U+320) 的方式組成,但不是每個應用程式都能如此處理疊字,可能會變成字母與底線分家的情形。遇此情形,又非得在文中使用通用拼音正規格式時,請以劃底線的方式代替。
唔 m̀ 的其中一種發音是 m 的高降調。這也是用疊字 (U+300) 的方式處理,也可能遇到同樣的問題。至於在 m 上加低昇調、在 n 上加低昇調、高降調,ḿ (U+1E3F), ń (U+144), ǹ (U+1F9) 都有字母直接支援,較無問題。

I. 使用的資料

通用拼音客家話輸入法模組表格 tp_hakka_sy.cin, tp_hakka_hl.cin, lookup-tp_hakka_sy.cin, lookup-tp_hakka_hl.cin 等檔案是由陳念波 <nienpo @ yahoo dot com> 依據《台灣客家話辭典》(ISBN 957-638-581-4) 編者徐兆泉老師提供的同音字檢索資料,使用 python script 製作。並加入「四海話」發音 (詳見下述)。

J. 罕用字

此 cin 檔含不少平常普通話較少用到的字,有些甚至是只有在康熙字典裏才找得到的。例如客家話裏的「我」是用「亻厓」這個字,此字的 unicode 編碼是 U+2028E,是十六進位的五位數,已超越 BMP (Basic Multilingual Plane),屬於 CJK Unified IdeographsExtension B, 含有此字的字型檔不是每個人都有。但是,為了方便一般使用狀況,把這個字的發音 ngai(四縣腔) ngai (海陸腔) 也對應到「我」這個字。
建議可以下載 Han Nom A 與 Han Nom B 全字集字型,是 The Institute of Vietnamese Studies(在美國加州的越學院)製作釋出的,可以在非商業用途領域使用,細節可以參看在 CLE 關於 Han Nom 字型的討論。下載方法如下:
  1. 造訪網頁 < http://sourceforge.net/projects/vietunicode/>, 在綠色長條方塊「Download VietUnicode」壓一下
  2. 在 package 清單 hannom 那一行, 在右邊的綠色方塊「Download」壓一下
  3. 在清單選 hanomH.zip (那大寫 H 代表高品質字型) 那一行, 在右邊的綠色方塊壓一下,會跳出詢問從何處下載,確認勾選 Taiwan 的伺服器,會比較快。約有 28 MB。
  4. zip檔解開後,會有兩個 TrueType 字型檔 HAN NOM A.ttf 與 HAN NOMB.ttf。如同一般字型安裝程序裝設於系統中即可。Mac OS X 的 FontBook 會有警告,說是此字缺乏 open type描述;硬著頭皮安裝應無妨。
即便如此,此檔仍含有 11 個 Privat Usage Area 編碼段 (U+E000 to U+F8FF) 的字,目前沒有收錄於 unicode 中,是徐老師造的字,這些字如下圖:
此造字檔不對外發佈,但是本輸入法檔另外以示意方式表示這些字,如 (亻恩),並加入 LaTeX 組合這些字的指令 (使用 LaTeX 時可用),應不會造成一般使用者的困擾。

K. 四海話

四縣腔 (苗栗腔) 檔案中含有新竹地區的四海話發音,海陸腔 (新竹腔) 含有苗栗地區的四海話發音。是以電腦程式針對海陸腔特有的子音 zh, ch, sh, rh,把含有此發音的字,將這些子音,在四縣腔與海陸腔的拼音中互換,如「針 (zíim / zhìm)」變成(zhíim / zìm);還有,不限於特定子音,只要四縣腔與海陸腔的拼音中母音不同,如「介」(gie / gai), 就保留調號,交換拼法,求得四海話 (gai / gie); 針 (zíim / zhìm)」變成(zhím / zìim)。

L. 授權

徐兆泉、陳念波同意本輸入法模組檔案依據 Creative Commons 依「姓名標示」、「相同方式分享」、「禁止商業使用」授權,歡迎各界散佈及使用。
授權詳情請參閱 < http://creativecommons.org/licenses/by-nc-sa/2.5/tw/deed.zh_TW>。

陳念波 於 Nov. 5, 2007.
[updated] Jan. 2, 2008.
本文依據 Creative Commons 依「姓名標示」、「相同方式分享」、「禁止商業使用」授權。

[updated] Nov. 2, 2008.
本輸入法也可以在奇摩輸入法上使用,請參考我的另外一篇 「Yahoo keykey and hakka cin 奇摩輸入法也可以用客語拼音輸入法」。

[update] Feb. 7, 2014.
OpenVanilla 與 Yahoo奇摩輸入法現今皆已離開 Windows 平台。Windows 平台的使用者請看此篇談替代方案。

Thursday, April 07, 2005

Hello World!

我想,實驗室的網頁做成 blog 會比靜態的實驗室介紹、人員介紹的傳統網頁會較有活力一些。

這裡會設定成實驗室裡每個人都能在這裡 post 文,寫下平時的感想,分享心得。應該會是很不錯的「部落格」。