汉字代码是汉字最基本的符号,是文字信息在计算机中的数字表示方式。掌握汉字代码能够有效提高对中文信息的处理效率。汉字代码实际上是由两部分组成,一部分是由六位两个字节的编码表示汉字的内码,另一部分是由八位二个字节的表示拼音音节的音码。
汉字内码采用unicode编码,它是国际通用的汉字编码,每个汉字都有唯一的一个unicode码。在unicode码之上,我国发展了GB2312、GBK、GB18030编码等多种汉字标准,这些标准实现了汉字内码的压缩和扩展。例如常用的GB2312编码,将所有的中文字符压缩成了6763个汉字编码,在windows系统中使用GBK编码,支持超过21 0000个汉字和符号,其它系统还有GB18030、BIG5等编码。
汉字内码的实际应用,除了可以作为汉字显示系统外,还可以用于中文信息检索、智能处理、语音合成、机器翻译等领域。另外,中文互联网的普及也使得汉字编码得到了广泛的应用,例如微型软公司微软必应搜索,就可以用汉字代码取得良好的检索效果。