日別アーカイブ: 2011年3月23日

文字コード技術入門

ちょっと前から気になっていた本を読んだ

基礎、基礎、基礎

私のように、会社に入ってからプログラムを触り始めた人間は、基礎の積み上げがない。普通であれば、早期にそれらを積み上げて行くんだろうけど、私の適当な性格が災いして結局のところまともな基礎ができていない。
そのせいで、結構苦労していたりする。ただ、それはわかっていても基礎はめんどくさいものだ。

本書が題材としている「文字コード」に関してもやはりそういう基礎の一つだろう。以前どこかのブログか雑誌で紹介されており、プログラマなら必読だ!みたいなことが書いてあったのを覚えている。プログラマってひとくくりにして必読って言うのもなんだかなぁという気がしないではない。
ある程度のところまでは適当にかじった程度で通じるんだけど、それ以上になるとちょっと頭がこんがらがる。そんな内容だ。

前半の文字コードがこれまでどういう変遷をたどってきたのかということに関しては、興味がなければ飛ばしてしまうのが一番のように思える。
なんとなくの文字コードの現在の形。そして、各コード体系間の変換において何が問題となるのかを把握しておくのが大事なんだろう。
。。。
って、そうやって飛ばすと基礎にならないかな。。。?

偶然にも

偶然の産物であるが、本書を読んでいるうちにたまたま文字コードに起因するトラブルを2回ほど経験した。一つはShift_JISから中国の簡体字であるGB2312へのコード変換。
もう一つはありがちではあるがShift_JISとUnicodeとのコード変換時に発生する波ダッシュにまつわる問題。

本書を読んだからと言って直接的な解決に結びつくわけではないんだけど、何が起きているのか?と言うことの理解には間違いなく貢献してくれた。
そういう意味では個人的にはとてもタイムリーでよかったが、そういうことがなければ結局使う場面がなくて忘れてしまったかもしれない。。。

文字にまつわるプログラミングをする人にとっては結構大事な技術要素ではあるんだけど、そんなに複数の異なるコード体系を用いたプロジェクトに従事していなければ、あまり意識しなくてもなんとかなってしまうのもまた事実かと。
人それぞれってところなんでしょうね。