投稿

4月, 2023の投稿を表示しています

技術者が押さえておくべき文字コードの基礎知識が得られる本(プログラマのための文字コード技術入門)

[改訂新版]プログラマのための文字コード技術入門 (WEB+DB PRESS plusシリーズ) 2018/12/28 矢野 啓介 (著) プログラマのための文字コード技術入門 (Amazonで書籍情報を表示) 最近になって「文字」が気になり始め、さらに『 文字や文字コードに興味を持ったら絶対に読むべき本(ユニコード戦記) 』を読んだこともあって、文字に愛着?のようなものを感じ始めたところです。 最終的には JIS や Unicode、ISO/IEC 10646 などの規格書を読まないといけないかな?とは思いつつも、私のような文字の基礎知識が薄い人間は、今の段階で読んでもすぐに飽きてしまいそうな気がしてます(笑)。 そこで、最近の事情をまえた文字技術を概観できるような本はないかと探して読んだのがこの本です。 タイトルに「プログラマのための」とある通り、文字そのものについての話というよりは、主に文字コードの基礎知識や利用上の留意点などが多く取り上げられています。 単なる符号化規則の話だけではなく、歴史的な経緯や、(絵文字も含めた)文字の種類、そして文字(コード)変換やプログラミング上の留意点など、幅広く触れられており、システム開発に関わる人が知っておくべき基礎知識が詰まった良い本だと思いましたので書き留めておきます。 <本の内容> 本書で取り上げられている話題を概観します。 【目次】 第1章 文字とコンピュータ 1.1 コンピュータで文字を扱う基本 1.2 文字を符号化するということ 1.3 文字集合と符号化文字集合 1.4 制御文字 1.5 文字コードはなぜ複雑になるのか 1.6 まとめ 第2章 文字コードの変遷 2.1 最もシンプルな文字コード 2.2 文字コードの構造と拡張方法を定める 2.3 2バイト符号化文字集合の実用化 2.4 1バイト符号化文字集合の広がり 2.5 国際符号化文字集合の模索と成立 2.6 まとめ 第3章 代表的な符号化文字集合 3.1 ASCIIとISO/IEC 646 3.2 JIS X 0201 3.3 JIS X 0208 3.4 JIS X 0212 3.5 JIS X 0213 3.6 ISO/IEC 8859シリーズ 3.7 UnicodeとISO/IEC 10646 第4章 代表的な文字符号化