2018/11/23

hex-m17n: 多言語対応のダンプツール 公開

 hex-m17n: 多言語対応のダンプツール を公開しました。

 日本語のLinux環境はどうしても多種多様な文字コードが入り混じるものですが、日本語含むバイナリファイルを文字化けさせずに読むために、1996年頃にに大学の先輩の多賀さんが作られていた hex というツール が当時はすごく便利で、愛用していました。制御文字を単に 「.」 で表示するのではなくて、色分けしてそれなりに判りやすく表示してくれるのがすごくお気に入りでした。

 でも、その後すっかり UTF-8 が標準になって、自分のコンソールもUTF-8化して、他の文字コードや言語も色々と扱うようになったので、これは自分で欲しいものは自分で作ってしまおう、と思って2年前に一気に書き上げたものです。

 今時作るからには ISO 10646-1 / Unicode ベースで作ることになるのですが、
  • 「読みやすい od -c 相当の機能が欲しいよね」とか、
  • 「そもそも『文字化けしない cat』が欲しいだけなんだよね」、とか
  • 「今時日本語だけ対応のフリーソフトってどうなんだろう」とか、
  • 「2000年頃に自分がこだわっていた、ISO 2022 ベースの多言語化はきちんと対応させたいよね(ISO 2022 で多言語化した昔の文書ファイル、未だに結構持ってるんです)」とか、
結構やりたいことが出てきて、どんどん機能が膨れ上がっています。

作り上げてから自分で愛用しつつ2年くらい放置していたのですが、この際 github 周りを色々整理したので、いっそのこと公開することにしました。

説明のWebページはこれから作りますが、とりあえず github に README を上げておけばいいよねと、ずいぶん気楽な時代になったものです。

0 件のコメント: