Unicodeでテキスト

ちょっとここ数日、UTF-8で外国語のテキストを作ってみるということをやってみている。普段使っているTeraPadだとちょっと無理があるみたいだけれども、メモ帳なら十分複数の外国語が混じったテキストを作成することが可能だということが判明した。文字入力の設定だけ切り替えて使えるようにすれば大丈夫。私はXPなんですけど、保存のときの文字コードを規定のものからUTF-8に変えたぐらい(別に変えなくていいのかもしれないけど、やってみたかったのですよ)で、ほかに何かしてるわけじゃないです。うーん、ただ、右端で折り返す設定にすると、欧文系は勝手に改行が入ってる気がする。フォームに貼り付けると変なところで改行されてるもの。(ちなみに内容を理解しているわけではないです)


で、思ったんですけどね。
漢文が入っているような作品を、メモ帳でUTF-8文字コードでHTML作ったら、中国語も当然書けるわけなんで、カタカナ使わずに漢文書けるんじゃないかな。日本語のパソコンは大抵かなり難しい字も使えるようになっている筈なので文字化けの心配はあんましなくていいかもですよ。だいたい、デフォルトで中国語と韓国語の手描き文字認識まで入っていたりするのでは。(いやわからん。よそのプラットフォームは分からないんで;)
自分のパソコンが文字化けするかどうかは、GoogleNewsで他の言語を試してみれば分かりますよ。たいてい問題なく表示されるはずです。そっちが問題なく表示されて、自分の作ったHTMLが化けるようならどっかダメなんだろうけれども。UTF-8文字コードを数値参照で直書きする方法もなくはないよね。16進法を10進法に関数電卓で計算して直すんだと思ったけど、どうだったかな(非常にうろ覚え)。

ただ、HTML版はそれでいいとしても、テキストファイルは文字コード指定をドキュメントに書けないので通用するかどうかが微妙なんですけどね。ていうか、たぶんメモ帳以外のもので読むことを想定したらちょっとダメそう(試しにオンラインソフトのエディタで開いてみたら、ものの見事にウムラウトが消えていた。何か設定が必要なのかも)。そのへんが面倒そうなんで無理に人に薦めたりはしないんですけど。中国系の難しい文字の入っている小説書いてる人、知り合いにいたかな? 中国系の名詞が出てる作品を書いてる人はいたと思うけど、難しい漢字があったかどうか記憶にないなぁ。えーと、誰か試してみません? ちらっと。ええ、単に自分が見てみたいだけなんですけどね。じゃあ自分でやれって? うーん、まあそうなんですけど、とりあえず如何にも文字化けしそうな字が思いつかないんだよ。漢字はあまり使わない方なので、表示されなくて困ったという記憶があんまりない。
それ以外の外国語は、普通小説のページ作るのに使わないか、画像で事が足りてしまうんだな。英語はそもそも文字化けの心配は不要ですし。
ていうか、BLOGでもいいんなら、ここのはてなグループでそれっぽいグループ作ってクラブ活動くさく活動すればそれですんでしまうんでしょうけどね。まあ、小説はやはりHTMLがいいなというのもあるし。下手にカスタマイズ研究するより読みやすさを実現しやすいですよ。