投稿

12月, 2023の投稿を表示しています

日本語入力を支える技術

日本語入力を支える技術 ~変わり続けるコンピュータと言葉の世界 2012/2/8 徳永 拓之 (著) 日本語入力を支える技術 ~変わり続けるコンピュータと言葉の世界 (Amazonで書籍情報を表示) これまで本ブログで日本語の文字に関する本をいくつか取り上げましたが、今回は日本語入力に関する本を取り上げます。 普段殆ど意識することなく日本語入力していますが、考えてみると、なぜ現在のような入力方式が一般に広がったのか?とか、どのような原理でローマ字入力から漢字交じりの日本語に変換できるのか?など、様々な疑問が湧いてきます。 今回取り上げる本は、そのような疑問に答えてくれる本です。 この本は2012年出版なので少し古い感じもするかもしれません。実は私も新品を買ったのではなく、最近、Amazon の中古品で購入して読みました。 ちなみに、私は先端の日本語入力技術を理解しているわけではありませんので、最新の技術と比較して、この本がどうなのかはわかりません。 しかし、日本語入力技術の経緯や理論的な考え方を、数式とコードを織り交ぜて丁寧に解説してくれており、興味深く読むことができました。理論中心の教科書と違って、コード例を示してくれることで数式の意味も理解しやすいです。 この本に書かれていることは、日本語入力に限らず、一歩進んだ入力支援機能を考える際のヒントが詰まっていると思いましたので、今回取り上げることにしました。 <本の内容> 本書の構成は「はじめに」に以下のように書かれています。 『本書の前半は日本語入力システム全般の知識を解説し、後半ではかな漢字変換を中心に、そこで使われるアルゴリズムやデータ構造などを掘り下げます。かな漢字変換には、自然言語処理という研究分野で用いられる手法がそのまま使えます。逆に、本書を自然言語処理への入門として読むこともできるでしょう。』 【目次】 第1章 日本語と日本語入力システムの歩み 1.1 コンピュータで日本語を扱うということ 1.2 日本語を入力するということ 1.3 日本語入力とかな漢字変換 1.4 日本語入力のはじまり 1.5 かな漢字変換のはじまり 1.6 単文節変換から連文節変換へ 1.7 2強時代の到来~統計・機械学習ベースのアルゴリズムへ 1.8 Web検索各社のかな漢字変換エンジ