[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: www.NetBSD.orgの日本語訳was: Re: ports/zaurus/faq.xml: 1.2 -> 1.3



こんにちは。
小野寺です。

XSLと書くのか、XSLTと書くのか良く分からないほど
XMLとかのことが分からないので、誤解していたら
お許しください。

From: Hiroki Sato <hrs@allbsd.org>, Date: Sun, 14 Aug 2011 14:50:15 +0900 (JST)

> ry> とりあえず、1999.xmlとかは昔のTNFにあるものを使って、
> ry> 全体をUTF-8にして、makeできるようにしました。
> ry> これで文字化けは、私の気付く範囲ではなくなりました。
> ry> 現在の状況を
> ry> http://ryo-on.users.sourceforge.net/distrib/20110813-htdocs-js.tar.bz2
> ry> にアップロードしておきました。
> ry> ご確認ください。
> ry>
> ry> 私の意見としては、全体をUTF-8化したらどうかと思っています。
> ry> 最低限の変更ですみますし(当然TNFのツリーにはcommitできないのでしょうが)。
> ry>
> ry> いかがでしょうか?
> 
>  文字が化けるのは、
> 
>   1) 言語共通の XSLT 等々ではエンコーディング指定を明示的に行なず、
>      言語依存のところで指定する、という多層構造にもともとなっていたが、
>      言語依存を(英語も含めて)全部消してしまった。
> 
>   2) 日本語は iso-2022-jp で書いてあった。
> 
>  というのが理由です。本来ならば、英語も iso-8859-1 を指定すべきところ
>  なのですが、そっちは化けないので、誰も気づいていないのでしょう...
> 
>  UTF-8 に統一すること自体は問題ない (XML は指定がなければ UTF-8 を
>  仮定する) のですが、いずれにしても、既定値に頼らず、
>  エンコーディングの指定をちゃんと入れるのが正しい方法だと思います。

XMLファイルでは、全てのファイルの頭にあるISO-2022-JPの文字を
UTF-8に置換しました。もちろん文字コードもUTF-8にしてあります。
例は、
http://ryo-on.users.sourceforge.net/htdocs/ja/changes/1998.xml
です。
これが、「既定値に頼らずエンコーディングの指定をちゃんと入れる」
ことになるでしょうか?

生成されたHTMLファイルにも、charset=UTF-8と入っています。
# こうなるようにxslファイルを変更したんだったと思いますが、
# よく分からないままにやっているので、記憶が不明瞭になりました…

>  また、実用上困ることはまれなのですが、UTF-8 だと
>  表現できない漢字(特に人名等)がいくつかあるので、悩ましいところですね。

htdocs/jaだと、日本人の名前がローマ字のままの箇所ばかりのように
見られるので、当面心配はないのかなと思いました。

--
Ryo ONODERA // ryo_on@yk.rim.or.jp
PGP fingerprint = 82A2 DC91 76E0 A10A 8ABB  FD1B F404 27FA C7D1 15F3