Unicode正規化を実施するためのモジュール

Unicodeの文字列を正規化する場合、便利がモジュールが2つある。

  • Javaで内包されているicu4jのモジュール
  • 公式サイトからダウンロードできる最新版のicu4jのモジュール

ライセンス問題などがない限り、基本的には後者をおすすめ。

その理由は、以下の通り

  1. 最新版のicu4jの方が、より新しいUnicodeに対応
  2. icu4jの正規化のモードをNFKCを使用した場合、Java 1.6までに取り込まれている版では文字列長に対して指数的に性能が劣化する。