Lazy Diary @ Hatena Blog

PowerShell / Java / miscellaneous things about software development, Tips & Gochas. CC BY-SA 4.0/Apache License 2.0

「外字」とは何か?

あるシステムの設計者に「このシステムでは外字を使いますか?」と質問したとしましょう。そのとき、「はい、使います」と答えたとして、その意味として考えられるものは……

  1. 私用領域のコードポイントにある文字を、正規のデータとして処理する
  2. Windowsの日本語IMEで、変換時に「機種依存文字」と表示される文字(「髙」など)を、正規のデータとして処理する
  3. Windowsの日本語IMEで、デフォルト設定では変換候補に出てこない文字(JIS第3水準・第4水準など)を、正規のデータとして処理する
  4. 上記のような文字を日本語IMEから入力可能にするよう、ユーザ端末をキッティングする
  5. 1~4のような文字を、入力データのバリデーションで明示的に弾いたり、別の文字に置き換えたりするなど、特別扱いする処理を実装している
  6. システムのデフォルトフォントで表示できない文字を、大規模文字セット用のフォントなどをインストールして表示可能にしている
  7. JIS78やJIS90で字形が変わった文字の、古い方の字形を用意している
  8. 旧字体(「學」とか)を新字体(「学」とか)に置き換える処理をしている
  9. ユーザが業務運用中にEUDC.ttfを編集する
  10. アプリケーションが編集したEUDC.ttfを必要とする