CSC中文語(yǔ)義詞庫(kù) (原名 CWB中文詞庫(kù)) 是自主研制的軟件系統(tǒng)。其核心是一個(gè)初具規(guī)模的中文詞庫(kù)。該詞庫(kù)目前收入了超過 190,000 的書面形式的詞條 (帶230,000 以上的義項(xiàng)) ,包括單詞、固定詞組、成語(yǔ)、一定比例的專名、少量在中文文獻(xiàn)中較常見的英文縮寫或含有字母的詞語(yǔ),等等。該系統(tǒng)還在不斷發(fā)展之中。它也是一種較簡(jiǎn)化的知識(shí)本體 (ontology) 或知識(shí)庫(kù),有類似著名英文詞庫(kù)WordNet 的用途,可作為智能搜索、自然語(yǔ)言處理等領(lǐng)域的輔助資源。
主要特點(diǎn)
·對(duì)詞庫(kù)中的每個(gè)詞條,盡量給出與它關(guān)系比較密切的各種相關(guān)詞,例如同義詞、反義詞、上位詞、下位詞等等。目前詞庫(kù)中絕大多數(shù)詞有所屬的意義類別,130,000 以上的詞或義項(xiàng)有較準(zhǔn)確的同義詞,14,000 以上的詞或義項(xiàng)有反義或并列詞,多數(shù)詞條中還帶有其它相關(guān)詞,總共含有 2,100,000 以上個(gè)關(guān)系實(shí)例,主體內(nèi)容的文本形式超過 12,400,000 字符。整個(gè)詞庫(kù)在一些方面類似英文詞庫(kù) WordNet,但兩者也有不少差別。與一些知識(shí)圖譜不同,這種語(yǔ)義庫(kù)比較側(cè)重通用的日常詞語(yǔ)或概念的描述。
·多種檢索途徑。能夠以詞形、讀音、意義為入口快速地查詞?赏ㄟ^意義上的聯(lián)系在詞條之間漫游?墒褂猛ㄅ浞:樵~。內(nèi)置的拼音輸入法能提高查詞的效率。
·多種顯示方式?梢园雌匆簟㈤L(zhǎng)度等順序顯示相關(guān)詞,可以用樹形顯示一些單詞中的上下位等關(guān)系的等級(jí)層次。
相關(guān)搜索:詞庫(kù)
進(jìn)入 CSC 系統(tǒng)并輸入詞之后出現(xiàn)如下窗口 (本手冊(cè)所舉的例子在該系統(tǒng)的某些版本中可能略有變化,恕不另外說明):
左上角是主詞窗口,其中的“電腦”稱為主詞。其右邊是義項(xiàng)號(hào)窗口和工具按鈕。中間占據(jù)最大面積的是相關(guān)詞窗口。其左邊是關(guān)系窗口。最下面是釋義窗口。
主詞窗口是一個(gè)下拉組合框,可在里面輸入要查閱的詞條。義項(xiàng)號(hào)窗口是下拉列表組合框,可選擇要顯示的義項(xiàng)。關(guān)系窗口列出主詞的當(dāng)前義項(xiàng)所具有的關(guān)系。關(guān)系的各種類型將在后面介紹。相關(guān)詞窗口顯示主詞的各種相關(guān)詞。釋義窗口顯示主詞或相關(guān)詞的釋義或提示信息,但目前這里經(jīng)常沒有內(nèi)容。
除了使用鼠標(biāo)外,還可以使用 Tab 或 Shift+Tab 鍵在各個(gè)窗口之間切換。關(guān)系窗口、相關(guān)詞窗口和釋義窗口構(gòu)成了切分窗口,可以用鼠標(biāo)拖動(dòng)邊框或窗棱調(diào)整各窗格的大小。
目前界面不美觀,因?yàn)橛脩敉ǔV豁氄{(diào)用數(shù)據(jù)而不需要這里的界面。