Saturday, August 13, 2011

給女兒的睡前故事

暑假沒有規律的學校作息,女兒晚上變得不容易入睡。我們重拾起睡前講故事,一方面穩定睡前的情緒,一方面增進親子感情。只是家裏的故事書,適合睡覺前講的,她都讀過了,沒有新鮮感;一時也沒有機會到圖書館借書。拿起〈客家話小王子〉,心想,她沒聽過〈小王子〉,應該可以做為睡前故事書。也可以練習客家話。

果然,〈小王子〉的故事內容很對她的胃口。但因為是客家話發音,她聽了兩、三頁後,就被催眠說可以停,要睡了。雖然如此,接下來每天晚上她都很期待〈小王子〉時間。

徐兆泉老師用客家話漢字、音標翻譯這本世界名著 Le Petit Prince,也讓我熟悉許多客家話的特有詞彙。不過,由於是 2000 年出版的,裏面有些語詞,所選的漢字不是那麼嚴謹。但是,如果對照著徐老師於 2009 年出版的客家話辭典,就可以找到比較有考據的漢字。

由於這本〈客家話小王子〉的排版,是一半漢字,一半拼音。我比較無法適應。我主要是讀漢字,但是如果遇到不知如何以客家話發音時,要跳到拼音的那一半就會迷失找不到了。所以,也練習客家話打字輸入,以類似日語的 Ruby 音標的方式排版。以自己做的工具 (輸入法、排版) 達到自己想要的成果,很有成就感。

以下是書的資料:

  • 〈客家話小王子〉, 徐兆泉譯,南天書局出版,2000 年,ISBN 957-638-552-2
  • 〈臺灣四縣腔海陸腔客家話辭典〉,徐兆泉編著,南天書局出版,2009 年,ISBN 978-957-638-7-15-9

我練習打字以及排版的樣式:

Sunday, November 02, 2008

Yahoo keykey and hakka cin 奇摩輸入法也可以用客語拼音輸入法

台灣 Yahoo 於今年 (2008) 5 月推出免費的輸入法。由於是以 OpenVanilla 為本所開發的,跨平台的特性仍是它的一大特色。好消息是,它也可以使用客語拼音輸入,只要下載安裝我之前介紹的「客家話輸入法表格檔」,下載所得的 tp_hakka_sy.cin (Si Yen 四縣腔) 與 tp_hakka_hl.cin (Hoi Liuk 海陸腔) 這兩個 cin 檔,依奇摩輸入法的「詳細功能介紹:新增自訂輸入法與自訂選項」說明,安裝在特定的檔案夾裏,就可以了。

最長字根長度設成 7 或更大的數字,其他的設定選項可以依自己的需求而作設定。

[update 12/19/2008] 台灣 Yahoo 已於日前發佈更新,版本 1.0 已可以很方便的用鼠標點擊的方式安裝 cin 檔。詳情可看官方網站之詳細功能介紹 > 自定輸入法支援加強這一項。

[update 3/24/2010] 台灣 Yahoo 輸入法的網址有些變動,所以本文的聯結也做了更正。

[update 2/3/2012] 台灣 Yahoo 輸入法的網址有些變動,所以本文的聯結也做了更正。

Monday, January 28, 2008

Hakka Short Rhyms 客家童謠—月光光

(ngiet) (gong) (góng)() (zhung) (gióng)
(gióng) (bịt) (mụk)() (zhung) (zhụk)
(zhụk) (koi) ()() (zhung) (gúa)
(gúa) (mang) (tai)(sún) (è) (zạk) (loi) (mai)
(mai) () (liong) (ge) (cien)(hok) () (mien)
(mien) (sien) (tón)(hok) () (zhón)
(zhon) (dui) (ziẹt)(hok) () (tiẹt)
(tiẹt) (sang) ()(hok) (chii) (zhú)
(zhu) (voi) (zèu)(hok) (chii) (gièu)
(gièu) (voi) (ngáu)(hok) (chii) (diáu)
(diau) (voi) (búi)(bui) (do) (tai) (shu) ()
(ngiám) () (rhịt) (ge) (lan) 西(si) (gúa)(ciẹt) (bun) (cin) (ga) (shiit)(sia) (do) 滿(mán) (tong) ()
(上文如果是由 FireFox 瀏覽器加上 Ruby support extension 就可以直接看到在漢字上方有拼音加註。如果是用一般瀏覽器,則只能看到拼音以括號放在漢字後面。)

這是一首流傳好幾代的客家童謠。每一句都有押韻,讓孩童朗朗上口。附圖是加註了通用拼音,方便閱讀的排版圖樣。這樣的排版,用的是開放源碼的免費程式,詳情可以看我寫的介紹文:
用 LaTeX 編排有客家話拼音的文稿
如果只是要寫出可以貼在部落格網頁上的 HTML 碼,可以不必理會 LaTeX 系統安裝,該拼音加註程式仍然可以使用。該程式會自動把文稿的漢字的客家話拼音,從資料檔調出配上。
[update 8/14/2011] 上述〈用 LaTeX 編排有客家話拼音的文稿〉的網址已修正,已指向新的伺服器位址。令外,Mac OS X Safari 現在從 4.x 版開始,也支援 Ruby tag,所以也能正確的顯示拼音在漢字之上。

Tuesday, November 20, 2007

通用拼音客家話輸入法模組使用說明

A. 下載「香草輸入法」

本模組需要在「 香草輸入法」框架下使用。目前有 Mac OS X、MS Windows 等平台上使用的版本。請從「 香草輸入法 Download」處下載。目前 (Nov. 5, 2007) 最新版本是 0.8.0, 隨時可能有更新版。

B. 安裝「香草輸入法」

請參考「 香草輸入法使用手冊」。

C. 設定

  1. Mac OS X 平台:在顯示幕右上角的輸入法選單,選擇香草輸入法後,再一次點選輸入法選單,可以看到香草輸入法的偏好設定選項;
  2. MS Windows 平台:在 Start > OpenVanilla > OVPreferences 可以作設定。

此設定視窗至少要叫出一次後,才能安裝客家輸入法表格檔。

D. 下載客語輸入法模組

按此連結下載: 客家話 / 客語輸入法表格檔

E. 安裝「通用拼音客家話 / 客語輸入法」表格檔

下載所得的 tp_hakka_sy.cin (Si Yen 四縣腔) 與 tp_hakka_hl.cin (Hoi Liuk 海陸腔),要放在香草輸入法的的泛用輸入法模組的資料夾裏:

  1. Mac OS X 平台:
    • 個人用: 個人Home/Library/OpenVanilla/(版本號碼)/UserSpace/OVIMGeneric/ 裏面
    • 大家共用: /Library/OpenVinilla/(版本號碼)/Modules/OVIMGeneric/ 裏面
  2. MS Windows 平台:C:\Windows\OpenVanilla\Modules\OVIMGeneric\ 裏面

目前 Mac OS X 平台的香草輸入法支援「字根反查」,請把下載所得的 lookup-tp_hakka_sy.cin 與 lookup-tp_hakka_hl.cin 放在反查表格的資料夾裏:

  • 個人用: 個人Home/Library/OpenVanilla/(版本號碼)/UserSpace/OVOFReverseLookup/ 裏面
  • 大家共用: /Library/OpenVinilla/(版本號碼)/Modules/OVOFReverseLookup/ 裏面

F. 客家話模組設定

底下兩張圖是在 Mac OS X 平台的香草輸入法 0.8.0  版的偏好設定畫面,原理相通,MS Windows 平台的使用者可以參考依樣設定:

請在模組載入清單 (Load list and shortcuts) 裏把客家話的模組勾選,四縣腔、海陸腔可以視需要個別勾選,或全選。如果平台的版本支援字根反查,則可以勾選所對應的 Lookup 表格。香草輸入法其他模組,當然也可以視需要勾選。


在個別模組設定裏,泛用模組類別針對 TP Hakka SiYen 與 TP Hakka HoiLiuk 做如圖的設定。最長字根長度設成 7 或更大的數字,其他的選項不必勾選。

設定完成後,關掉設定視窗或者執行存檔,才會生效。

G. 使用

  1. Mac OS X 平台:在顯示幕右上角的輸入法選單,選擇香草輸入法。如果是第一次使用,再一次點選輸入法選單,點選四縣腔或海陸腔客家話模組;下一次再進入香草輸入法則會記住前次所用之模組,在能接受文字的應用程式下,開始鍵入文字。
  2. MS Windows 平台:在螢幕底端狀態欄處,作輸入法的切換,選擇香草輸入法,並確認所選的模組是四縣腔或海陸腔客家話模組。在能接受文字的應用程式下,開始鍵入文字。

在 caps lock 啟動 (鍵盤燈亮) 的情況下,可以用英數模式鍵入英文字母、英文標點符號、數字。

在 caps lock 關閉 (鍵盤燈滅) 的情況下,可以鍵入客家話的通用拼音。調號標記是以鍵盤上現有的符號,最後鍵入,而不是在有調號的母音之後鍵入。各調號標記介紹如下:

  • 高平調 (例如 seu 笑):相當於無調號,直接在拼音字母輸入完後,以空白鍵表示組字;
  • 低昇調 (séu 搜):以單引號 ' (在鍵盤 RETURN (Mac OS X 平台) / ENTER (MS Windows 平台) 之左側),或以注音鍵盤的二聲符號 (與 6 同鍵), 輸入 seu' 或 seu6
  • 低平調 (seu 愁):以減號表示;seu-
  • 高降調 (sèu 小):以 ` 號表示 (在鍵盤左上角 ESC 鍵下側),或以注音鍵盤的四聲符號 (與 4 同鍵), 輸入 seu` 或 seu4
  • 海陸腔特有的中平調 (siōng 匠):以 = 號表示;siong=
  • 低入調 (ạp 鴨):以小數點 . 或注音鍵盤的輕聲符號 (與 7 同鍵), 輸入 ap. 或 ap7
  • 高入調,相當於無調號,同樣以空白鍵表示組字;luk 鹿
  • 另外,鼻化音 (啊 àⁿ ) 以 nn 表示;例如 ann`

行政院客委會網頁有「客語教學」可以參考通用拼音的用法。

選項以橫向 (Mac OS X) 或直向 (MS Windows) 列出,以 1, 2, ..., 9, 0 來選字。第一選項是通用拼音以正規格式顯示。例如鍵入 hang- 可得如下之畫面。如果想要的是通用拼音正規格式,再按 1 或空白鍵選之;如果想要的是「行」這個字,就按 7選之。如果多於十個候選字,候選欄最後會顯示有多少頁,如果顯示 1/2表示有兩頁,目前在第一頁。可以用空白鍵或向右、向下方向鍵往下跳頁,左方向鍵、上方向鍵往以前的頁面跳頁。


常用的標點符號 (中文全形) 逗號、問號、驚嘆號、冒號與鍵盤標記同位置,句號與鍵盤句點 (小數點) 同,頓號與分號共用分號鍵,左右方括號可以叫出「」『』﹁﹂﹃﹄〔〕︹︺【】︻︼,大小於符號可以叫出《》〈〉︽︾︿﹀, 其餘符號可以用香草輸入架構裏的符號輸入模組找到。

如果平台版本有支援反查,可以在輸入法選單裡勾選 TP Hakka-S Lookup (四縣腔反查) 或 TP Hakka-H Lookup (海陸腔反查)。在每個字輸入完畢後,香草輸入法會在顯示幕上告知此字有那些念法,如下圖:


這裏顯示「行」字有三種念法,可以用這三種拼音輸入此字。

H. 目前已知問題

低平調的標註是以 unicode 裡底線疊字 (U+320) 的方式組成,但不是每個應用程式都能如此處理疊字,可能會變成字母與底線分家的情形。遇此情形,又非得在文中使用通用拼音正規格式時,請以劃底線的方式代替。

唔 m̀ 的其中一種發音是 m 的高降調。這也是用疊字 (U+300) 的方式處理,也可能遇到同樣的問題。至於在 m 上加低昇調、在 n 上加低昇調、高降調,ḿ (U+1E3F), ń (U+144), ǹ (U+1F9) 都有字母直接支援,較無問題。

I. 使用的資料

通用拼音客家話輸入法模組表格 tp_hakka_sy.cin, tp_hakka_hl.cin, lookup-tp_hakka_sy.cin, lookup-tp_hakka_hl.cin 等檔案是由陳念波 <nienpo @ yahoo dot com> 依據《台灣客家話辭典》(ISBN 957-638-581-4) 編者徐兆泉老師提供的同音字檢索資料,使用 python script 製作。並加入「四海話」發音 (詳見下述)。
 

J. 罕用字

此 cin 檔含不少平常普通話較少用到的字,有些甚至是只有在康熙字典裏才找得到的。例如客家話裏的「我」是用「亻厓」這個字,此字的 unicode 編碼是 U+2028E,是十六進位的五位數,已超越 BMP (Basic Multilingual Plane),屬於 CJK Unified IdeographsExtension B, 含有此字的字型檔不是每個人都有。但是,為了方便一般使用狀況,把這個字的發音 ngai(四縣腔) ngai (海陸腔) 也對應到「我」這個字。

建議可以下載 Han Nom A 與 Han Nom B 全字集字型,是 The Institute of Vietnamese Studies(在美國加州的越學院)製作釋出的,可以在非商業用途領域使用,細節可以參看在 CLE 關於 Han Nom 字型的討論。下載方法如下:

  1. 造訪網頁 < http://sourceforge.net/projects/vietunicode/>, 在綠色長條方塊「Download VietUnicode」壓一下
  2. 在 package 清單 hannom 那一行, 在右邊的綠色方塊「Download」壓一下
  3. 在清單選 hanomH.zip (那大寫 H 代表高品質字型) 那一行, 在右邊的綠色方塊壓一下,會跳出詢問從何處下載,確認勾選 Taiwan 的伺服器,會比較快。約有 28 MB。
  4. zip檔解開後,會有兩個 TrueType 字型檔 HAN NOM A.ttf 與 HAN NOMB.ttf。如同一般字型安裝程序裝設於系統中即可。Mac OS X 的 FontBook 會有警告,說是此字缺乏 open type描述;硬著頭皮安裝應無妨。

即便如此,此檔仍含有 11 個 Privat Usage Area 編碼段 (U+E000 to U+F8FF) 的字,目前沒有收錄於 unicode 中,是徐老師造的字,這些字如下圖:

此造字檔不對外發佈,但是本輸入法檔另外以示意方式表示這些字,如 (亻恩),並加入 LaTeX 組合這些字的指令 (使用 LaTeX 時可用),應不會造成一般使用者的困擾。

K. 四海話

四縣腔 (苗栗腔) 檔案中含有新竹地區的四海話發音,海陸腔 (新竹腔) 含有苗栗地區的四海話發音。是以電腦程式針對海陸腔特有的子音 zh, ch, sh, rh,把含有此發音的字,將這些子音,在四縣腔與海陸腔的拼音中互換,如「針 (zíim / zhìm)」變成(zhíim / zìm);還有,不限於特定子音,只要四縣腔與海陸腔的拼音中母音不同,如「介」(gie / gai), 就保留調號,交換拼法,求得四海話 (gai / gie); 針 (zíim / zhìm)」變成(zhím / zìim)。

L. 授權

徐兆泉、陳念波同意本輸入法模組檔案依據 Creative Commons 依「姓名標示」、「相同方式分享」、「禁止商業使用」授權,歡迎各界散佈及使用。

授權詳情請參閱 < http://creativecommons.org/licenses/by-nc-sa/2.5/tw/deed.zh_TW>。


陳念波 於 Nov. 5, 2007.
[updated] Jan. 2, 2008.

本文依據 Creative Commons 依「姓名標示」、「相同方式分享」、「禁止商業使用」授權。


[updated] Nov. 2, 2008.
本輸入法也可以在奇摩輸入法上使用,請參考我的另外一篇 「Yahoo keykey and hakka cin 奇摩輸入法也可以用客語拼音輸入法」。

Thursday, April 07, 2005

Hello World!

我想,實驗室的網頁做成 blog 會比靜態的實驗室介紹、人員介紹的傳統網頁會較有活力一些。

這裡會設定成實驗室裡每個人都能在這裡 post 文,寫下平時的感想,分享心得。應該會是很不錯的「部落格」。