公務(wù)員期刊網(wǎng) 論文中心 正文

談銀行信息系統(tǒng)生僻字問(wèn)題

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談銀行信息系統(tǒng)生僻字問(wèn)題范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

談銀行信息系統(tǒng)生僻字問(wèn)題

一、信息系統(tǒng)字符集情況介紹

(一)字符集概述字符是各種文字和符號(hào)的總稱,包括各國(guó)文字、標(biāo)點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字等。字符集(Characterset)是多個(gè)字符的集合,字符集種類較多,每個(gè)字符集包含的字符個(gè)數(shù)不同,目前漢字字符集主要有:《信息交換用漢字編碼字符集基本集》(GB2312-1980),《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK),《信息技術(shù)信息交換用漢字編碼字符集基本集的擴(kuò)充》(GB18030-2000),《信息技術(shù)中文編碼字符集》(GB18030-2005),《信息技術(shù)通用多八位編碼字符集(UCS)》(GB13000-2010)。國(guó)外軟件系統(tǒng)考慮跨語(yǔ)言、跨平臺(tái)處理需求,常用的字符集為Unicode,在操作系統(tǒng)、應(yīng)用程序中廣泛應(yīng)用。從執(zhí)行效力看,Unicode與GBK為行業(yè)性規(guī)范,GB2312-1980、GB13000-2010為國(guó)家推薦性標(biāo)準(zhǔn),GB18030-2000和GB18030-2005為國(guó)家強(qiáng)制性標(biāo)準(zhǔn)。GB18030-2005現(xiàn)已代替GB18030-2000,其與GB18030-2000相同部分為強(qiáng)制性。從兼容、支持角度看,GB18030-2005能夠與GB2312-1980完全兼容,與GBK基本兼容,支持Unicode4.0的全部統(tǒng)一漢字。GB13000-2010等同于國(guó)際標(biāo)準(zhǔn)化組織(ISO)的通用多八位編碼字符集(ISO/IEC10646:2003)和多語(yǔ)言軟件制造商聯(lián)盟的統(tǒng)一碼(Unicode4.0)。詳細(xì)信息見(jiàn)表1。

(二)銀行字符集采用情況以某省城市商業(yè)銀行和農(nóng)聯(lián)社的487個(gè)信息系統(tǒng)為樣本,統(tǒng)計(jì)其所涉操作系統(tǒng)、數(shù)據(jù)庫(kù)、對(duì)外接口及應(yīng)用(包括中間件、報(bào)文傳輸、源代碼)字符集情況。從統(tǒng)計(jì)結(jié)果看,操作系統(tǒng)、數(shù)據(jù)庫(kù)、對(duì)外接口及應(yīng)用采用的字符集主要是Unicode、GBK,少數(shù)為GB2312、GB18030,且支持GB18030的全部為L(zhǎng)inux平臺(tái),行業(yè)性規(guī)范成為應(yīng)用主流,國(guó)家標(biāo)準(zhǔn)反而應(yīng)用較少,詳細(xì)情況見(jiàn)表2。造成這一現(xiàn)象的主要原因是:國(guó)際上,Unicode由大的軟件制造商組成的聯(lián)盟制定,具有跨語(yǔ)言、跨平臺(tái)優(yōu)勢(shì),使其成為應(yīng)用主流。國(guó)內(nèi)來(lái)講,作為基礎(chǔ)軟件的Windows操作系統(tǒng)自帶字符集還是GBK,對(duì)于GB18030-2005,Windows雖然提供了擴(kuò)展支持包,卻沒(méi)有實(shí)現(xiàn)全面的支持。加之GB18030-2005的宣傳、推廣不足,多年下來(lái),形成了GBK的市場(chǎng)應(yīng)用存量與慣性,一定程度上限制了對(duì)GB18030-2005的應(yīng)用。

二、生僻字原因分析

金融行業(yè)生僻字是信息系統(tǒng)在存儲(chǔ)、傳輸、顯示等過(guò)程中無(wú)法正常處理的字符,按照產(chǎn)生原因可劃分為三種情況:一是采用不同字符集的系統(tǒng)交互導(dǎo)致部分字符無(wú)法處理。比如當(dāng)采用GB18030字符集的應(yīng)用與采用GBK字符集的應(yīng)用交互時(shí),由于GBK字符只有21003個(gè),在這范圍之外的字符就會(huì)無(wú)法處理。二是部分字符“一字多碼”導(dǎo)致無(wú)法處理?!耙蛔侄啻a”的出現(xiàn)主要是因?yàn)閁nicode的編碼空間內(nèi)存在用戶自定義區(qū)(PUA),允許自定義編碼來(lái)處理一些生僻字,這些生僻字后期又被Unicode正式收錄,造成一個(gè)漢字既有PUA編碼又有Unicode正式碼的“一字多碼”問(wèn)題。例如“䶮”字,其在Unicode自定義區(qū)編碼為“E863”,而其正式編碼為“4DAE”。由于GB18030-2005與Unicode編碼的一一對(duì)應(yīng)關(guān)系,“一字多碼”問(wèn)題同樣存在于GB18030-2005編碼空間。這部分字大約有3000多個(gè),包括GBK在1995年制定時(shí)收錄的52個(gè)漢字和公安部人口信息系統(tǒng)中收錄的方正自定義字中的大部分。三是終端設(shè)備字庫(kù)和常用輸入法不支持生僻字。一方面,很多終端設(shè)備字庫(kù)和輸入法支持的規(guī)范、標(biāo)準(zhǔn)內(nèi)的字符不全,有的僅支持GBK的21003個(gè)字,有的雖然支持GB18030的4字節(jié)字符,但不全面,導(dǎo)致終端無(wú)法輸入、顯示和打印。另一方面,公安部人口信息系統(tǒng)中存在大約4700個(gè)生僻字,屬于方正公司自定義字,需要購(gòu)買方正字庫(kù)獲得,否則這4700個(gè)生僻字終端無(wú)法輸入、顯示和打印。

三、生僻字應(yīng)對(duì)方法

(一)技術(shù)層面處理方法一是按照“存量升級(jí)、增量符合”“先輔助后核心”的原則升級(jí)改造。原先使用GBK、GB2312字符集的存量系統(tǒng)升級(jí)為GB18030-2005字符集,擴(kuò)大支持的字符集范圍;原先使用UTF-8、UTF-16編碼方式但僅支持Unicode基本多語(yǔ)言平面(BMP)的存量系統(tǒng),升級(jí)為支持Unicode全部平面。新增信息系統(tǒng)則強(qiáng)制支持GB18030-2005字符集。二是針對(duì)特殊情況個(gè)案處理。對(duì)于采用GBK字符集的DB2數(shù)據(jù)庫(kù),目前升級(jí)字符集難度較大,需要DB2廠商的開(kāi)發(fā)支持,金融機(jī)構(gòu)可采用傳輸、存儲(chǔ)時(shí)不進(jìn)行GBK轉(zhuǎn)碼,直接按照GB18030編碼格式進(jìn)行二進(jìn)制存儲(chǔ)作為過(guò)渡解決方案。對(duì)于“一字多碼”問(wèn)題,則是在存儲(chǔ)環(huán)節(jié)統(tǒng)一轉(zhuǎn)化為其Unicode正式碼或其Unicode正式碼對(duì)應(yīng)的GB18030編碼,從而實(shí)現(xiàn)字符編碼的統(tǒng)一。三是升級(jí)終端字庫(kù)和輸入法,擴(kuò)大終端支持的字符數(shù)量,解決終端生僻字的輸入、顯示和打印問(wèn)題。

(二)業(yè)務(wù)層面處理方法業(yè)務(wù)層面的生僻字處理主要有兩個(gè)環(huán)節(jié):一是客戶信息錄入環(huán)節(jié)。在征得客戶同意后,商業(yè)銀行業(yè)務(wù)人員通常采用拆字、拼音、繁體字代替等方法變通處理。例如通過(guò)拆字方法將客戶姓名“王陹”錄入為“王(耳升日)”;使用拼音將“張䶮”錄入為“張YAN”,并在備注欄輸入“張(上龍下天)”;使用繁體字將“讠永”錄入為“詠”。二是客戶信息校驗(yàn)環(huán)節(jié)。各商業(yè)銀行生僻字處理方法、規(guī)則不一,導(dǎo)致跨行轉(zhuǎn)賬、綁卡等業(yè)務(wù)環(huán)節(jié)客戶信息自動(dòng)校驗(yàn)無(wú)法通過(guò),商業(yè)銀行業(yè)務(wù)人員通常采取人工干預(yù)方式處理。例如跨行來(lái)賬業(yè)務(wù)因生僻字問(wèn)題出現(xiàn)戶名不符時(shí),通過(guò)電話聯(lián)系客戶或向付款行發(fā)出查詢,確認(rèn)相同后再進(jìn)行入賬處理;或者要求客戶臨柜進(jìn)行業(yè)務(wù)辦理,增加社保卡、機(jī)動(dòng)車駕駛證、戶口簿等作為輔助核驗(yàn)手段。

四、生僻字應(yīng)對(duì)建議

(一)加快金融業(yè)生僻字處理指南的制定標(biāo)準(zhǔn)化、規(guī)范化的生僻字業(yè)務(wù)處理流程有助于克服各銀行處理標(biāo)準(zhǔn)不一導(dǎo)致的識(shí)別、處理問(wèn)題,也是當(dāng)前條件下金融業(yè)應(yīng)對(duì)生僻字問(wèn)題、提升金融服務(wù)體驗(yàn)最直接、有效的方法。建議進(jìn)一步加快金融業(yè)生僻字處理指南的制定,統(tǒng)一規(guī)定拆字、拼音、繁體字代替等方法的具體使用情形。整理全行業(yè)遇到的生僻字,建立生僻字替代查找?guī)?,方便一線業(yè)務(wù)人員使用,從而發(fā)揮金融行業(yè)標(biāo)準(zhǔn)的標(biāo)桿和促進(jìn)作用,不斷提升金融服務(wù)水平與效率。

(二)循序推進(jìn)金融行業(yè)字符集升級(jí)金融行業(yè)信息系統(tǒng)眾多,對(duì)所有信息系統(tǒng)進(jìn)行字符集升級(jí),涉及核心系統(tǒng)、柜面系統(tǒng)、支付平臺(tái)、網(wǎng)銀互聯(lián)平臺(tái)、網(wǎng)銀及手機(jī)銀行等系統(tǒng),需對(duì)數(shù)以萬(wàn)計(jì)的代碼源文件進(jìn)行改動(dòng),其中的開(kāi)發(fā)和測(cè)試投入成本較大,也面臨一定的時(shí)間與風(fēng)險(xiǎn)考驗(yàn),因此,推動(dòng)金融行業(yè)信息系統(tǒng)字符集升級(jí)將是一個(gè)長(zhǎng)期過(guò)程,必須堅(jiān)持循序漸進(jìn)原則,區(qū)分“存量系統(tǒng)”與“新增系統(tǒng)”“輔助系統(tǒng)”與“核心系統(tǒng)”,綜合考量各項(xiàng)影響因素,合理制定推進(jìn)計(jì)劃,逐步完成字符集升級(jí)改造。

(三)加大國(guó)家強(qiáng)制標(biāo)準(zhǔn)宣傳實(shí)施力度面向開(kāi)發(fā)商、行業(yè)用戶開(kāi)展針對(duì)性宣傳,增強(qiáng)標(biāo)準(zhǔn)貫徹意識(shí),落實(shí)標(biāo)準(zhǔn)為民利企的發(fā)展理念。對(duì)不符合GB18030-2005強(qiáng)制要求的基礎(chǔ)軟件產(chǎn)品,如操作系統(tǒng)、數(shù)據(jù)庫(kù)等,應(yīng)禁止核發(fā)銷售許可;對(duì)已經(jīng)納入標(biāo)準(zhǔn)、擁有正式編碼的字符,不得使用自定義編碼,杜絕“一字多碼”現(xiàn)象;對(duì)尚未納入正式編碼且在公民身份信息系統(tǒng)中已經(jīng)廣泛使用的自定義字符,由標(biāo)準(zhǔn)管理部門統(tǒng)一管理,公開(kāi)自定義字符、編碼對(duì)應(yīng)關(guān)系,建立專門字庫(kù),供各方免費(fèi)獲取使用。

(四)強(qiáng)化部門協(xié)同一體推進(jìn)生僻字問(wèn)題涉及多個(gè)部門和環(huán)節(jié):在管理層面,生僻字問(wèn)題涉及稅務(wù)、電信、社保、金融、公安、工信等諸多部門;在技術(shù)層面,生僻字問(wèn)題涉及操作系統(tǒng)、數(shù)據(jù)庫(kù)、對(duì)外接口、中間件、源文件等諸多環(huán)節(jié)。單個(gè)部門、單個(gè)環(huán)節(jié)努力無(wú)法根本解決問(wèn)題。建議由標(biāo)準(zhǔn)主管部門牽頭組織,各行業(yè)部門根據(jù)業(yè)務(wù)場(chǎng)景配合協(xié)同,由點(diǎn)到面、由縱向到橫向一體推進(jìn),才能從根本上解決生僻字問(wèn)題。

作者:馬征 單位:中國(guó)人民銀行濟(jì)南分行