久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    計算機中字符的表示

     吶喊oqzde1fbyd 2017-02-15

          在計算機中,對非數值的文字和其他符號進行處理時,要對文字和符號進行數字化,即用二進制編碼來表示文字和符號。其中西文字符最常用到的編碼方案有ASCII編碼和EBCDIC編碼。對于漢字,我國也制定的相應的編碼方案。

          1、ASCII編碼

          微機和小型計算機中普遍采用ASCII碼(American Standard Code for Information Interchange,美國信息交換標準代碼)表示字符數據,該編碼被ISO(國際化標準組織)采納,作為國際上通用的信息交換代碼。
          ASCII碼由7位二進制數組成,由于27=128,所以能夠表示128個字符數據。參照如表3-2所示的ASCII表,我們可以看出ASCII碼具有以下特點:
          (1)表中前32個字符和最后一個字符為控制字符,在通訊中起控制作用。
          (2)10個數字字符和26個英文字母由小到大排列,且數字在前,大寫字母次之,小寫字母在最后,這一特點可用于字符數據的大小比較。
          (3)數字0~9由小到大排列,ASCII碼分別為48~57,ASCII 碼與數值恰好相差48。
          (4)在英文字母中,A的ASCII碼值為65,a的ASCII碼值為97,且由小到大依次排列。因此,只要我們知道了A和a的ASCII碼,也就知道了其他字母的ASCII碼。

          表1 ASCII碼表

          ASCII碼是7位編碼,為了便于處理,我們在ASCII碼的最高位前增加1位0,湊成8位的一個字節,所以,一個字節可存儲一個ASCII碼,也就是說一個字節可以存儲一個字符。ASCII碼是使用最廣的字符編碼,數據使用ASCII碼的文件稱為ASCII文件。

          2、 ANSI編碼和其他擴展的ASCII碼

          ANSI(美國國家標準協會)編碼是一種擴展的ASCII碼,使用8個比特來表示每個符號。8個比特能表示出256個信息單元,因此它可以對256個字符進行編碼。ANSI碼開始的128個字符的編碼和ASCII碼定義的一樣,只是在最左邊加了一個0。例如:在 ASCII編碼中,字符“a”用1100001表示,而在ANSI編碼中,則用01100001表示。除了ASCII碼表示的128個字符外,ANSI碼還可以表示另外的128個符號,如版權符號、英鎊符號、希臘字符等。
          除了ANSI編碼外,世界上還存在著另外一些對ASCII碼進行擴展的編碼方案,ASCII碼通過擴展甚至可以編碼中文、日文和韓文字符。不過令人遺憾的是,正是由于這些編碼方案的存在導致了編碼的混淆和不兼容性。

          3、EBCDIC編碼

          盡管ASCII碼是計算機世界的主要標準,但在許多IBM大型機系統上卻沒有采用。在IBM System/360計算機中,IBM研制了自己的8位字符編碼——EBCDIC碼(Extended Binary Coded Decimal Interchange Code,擴展的二-十進制交換碼)。該編碼是對早期的BCDIC 6位編碼的擴展,其中一個字符的EBCDIC碼占用一個字節,用8位二進制碼表示信息,一共可以表示出256 種字符。

          4、Unicode編碼

          在假定會有一個特定的字符編碼系統能適用于世界上所有語言的前提下,1988年,幾個主要的計算機公司一起開始研究一種替換ASCII碼的編碼,稱為Unicode編碼。鑒于ASCII碼是7位編碼,Unicode采用16位編碼,每一個字符需要2個字節。這意味著Unicode的字符編碼范圍從0000h~FFFFh,可以表示65536個不同字符。
          Unicode編碼不是從零開始構造的,開始的128個字符編碼0000h~007Fh就與ASCII碼字符一致,這樣就能夠兼顧已存在的編碼方案,并有足夠的擴展空間。從原理上來說,Unicode可以表示現在正在使用的、或者已經沒有使用的任何語言中的字符。對于國際商業和通訊來說,這種編碼方式是非常有用的,因為在一個文件中可能需要包含有漢語、英語和日語等不同的文字。并且, Unicode還適合于軟件的本地化,也就是針對特定的國家修改軟件。使用Unicode,軟件開發人員可以修改屏幕的提示、菜單和錯誤信息來適合于不同的語言和地區。目前,Unicode編碼在Internet中有著較為廣泛的使用,Microsoft和Apple公司也已經在他們的操作系統中支持Unicode編碼。
          盡管Unicode對現有的字符編碼做了明顯改進,但并不能保證它能很快被人們接受。ASCII碼和無數的有缺陷的擴展ASCII碼已經在計算機世界中占有一席之地,要把它們逐出計算機世界并不是一件很容易的事。

          3.4.6 國家標準漢字編碼(GB2312-80)

          國家標準漢字編碼簡稱國標碼。該編碼集的全稱是“信息交換用漢字編碼字符—基本集”,國家標準號是“GB2312-80”。該編碼的主要用途是作為漢字信息交換碼使用。
          GB2312-80標準含有6763個漢字,其中一級漢字(最常用)3755個,按漢語拼音順序排列;二級漢字3008個,按部首和筆畫排列;另外還包括682個西文字符、圖符。 GB2312-80標準將漢字分成94個區,每個區又包含94個位,每位存放一個漢字,這樣以來,每個漢字就有一個區號和一個位號,所以我們也經常將國標碼稱為區位碼。例如:漢字“青”在39區64位,其區位碼是3964;漢字“島”在21區26位,其區位碼是2126。
          國標碼規定:一個漢字用兩個字節來表示,每個字節只用前七位,最高位均未作定義。但我們要注意,國標碼不同于ASCII碼,并非漢字在計算機內的真正表示代碼,它僅僅是一種編碼方案,計算機內部漢字的代碼叫做漢字機內碼,簡稱漢字內碼。
          在微機中,漢字內碼一般都是采用兩字節表示,前一字節由區號與十六進制數A0相加,后一字節由位號與十六進制數A0相加,因此,漢字編碼兩字節的最高位都是1,這種形式避免了國標碼與標準ASCII碼的二義性(用最高位來區別)。在計算機系統中,由于機內碼的存在,輸入漢字時就允許用戶根據自己的習慣使用不同的輸入碼,進入計算機系統后再統一轉換成機內碼存儲。

          5、 其他漢字編碼

          除了我們前面談到的國標碼之外,還有另外的一些漢字編碼方案。例如,在我國的臺灣地區,就使用Big5漢字編碼方案。這種編碼就不同于我們的國標碼,因此在雙方的交流中就會涉及到漢字內碼的轉換,特別是Internet的發展使人們更加關注這個問題。現在雖然已經推出了許多支持多內碼的漢字操作系統平臺,但是全球漢字信息編碼的標準化已成為社會發展的必然趨勢。

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 在线 欧美 中文 亚洲 精品| 国产超高清麻豆精品传媒麻豆精品| 国产AV福利第一精品| 四虎国产精品免费久久久| 亚洲欧美日韩精品久久亚洲区| 国产无人区码一区二区| 亚洲愉拍一区二区三区| 久久久久久综合网天天| 秋霞人妻无码中文字幕| 狠狠久久亚洲欧美专区| 免费国产VA在线观看视频| 久久精品中文闷骚内射| 成人午夜福利免费专区无码| 亚洲综合色婷婷六月丁香宅男大增 | 国产女精品视频网站免费蜜芽 | 一卡二卡三卡四卡视频区| 国产欧美日韩VA另类在线播放| 国产精品不卡区一区二| 黑人巨大AV在线播放无码| 在线一区二区中文字幕| 无翼乌工口肉肉无遮挡无码18| 精品一卡2卡三卡4卡乱码精品视频| 丰满少妇被猛男猛烈进入久久| 69天堂人成无码免费视频| 又大又粗又爽A级毛片免费看| 日本一区不卡高清更新二区| 国产精品第一二三区久久蜜芽| 久久99精品久久水蜜桃| 国内少妇人妻偷人精品| 永久黄网站色视频免费直播| 国产成人午夜精品影院| 深夜释放自己在线观看| 国产亚洲精久久久久久无码| 欧美成人VA免费大片视频| 欧美乱妇高清无乱码免费| 大学生被内谢粉嫩无套| 成人免费视频在线观看播放| 国产精品成人中文字幕| 337P日本欧洲亚洲大胆精品| 嫩草院一区二区乱码| 国产成熟妇女性视频电影|