[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: charset of mailing list archive



In message <199905190645.PAA20288@mail.na.rim.or.jp>
	on Wed, 19 May 1999 15:45:28 +0900 (JST),
	OKANO Takayoshi <kano@na.rim.or.jp> wrote:
> In message <199905181521.AAA08379@edge.sky.yamashina.kyoto.jp>
>   Takahiro Kambe <taca@sky.yamashina.kyoto.jp> writes:
> >一応、HTTP/HTML的には上記のcharsetで行うべきだという意見を聞いたことが
> >あるような気がします。
> 
>     http://www.fxis.co.jp/DMS/sgml/html_correct_charset.html
> 
> などに記述があります。
うげっ、私の古巣か...。

> META 要素で指定しても,
> 現実には多くのサーバはそれをもとに HTTP ヘッダをつけたりはしません。
もちろん、そのためにはHTTPサーバの設定をいじいじする必要があります。

o 特定のディレクトリ以下だったら、charset=iso-2022-jp
o 特定のファイルのサフィックスだったら、charset=iso-2022-jp

あたりがapacheでできたはずです。

> また,漢字コードを変換するプロキシなどがあると,
> 実際のコードと META 要素での指定が食い違うおそれがあるといった問題があるわけですね。
そりは、そういうもの(漢字コードを変換するプロキシ)を使った時点で、という
か、「漢字コードを変換するプロキシ」に賢くなって貰わないといけない話でしょ
う。

> 一方, HTTP ヘッダで指定すると,
> ローカルに保存した場合には情報が失われることになります。
これ、よくわかりませんが、ローカルに保存する時点で(少なくともtext/plain
なものは)、システムのローカルな文字エンコーディングに変換するしかないの
ではないでしょうか。

> あと,古いブラウザが対応していないという問題もあります。
> たとえば Lynx 2.4 以前では,
> HTTP ヘッダの Content-Type: で charset を指定されたページは,
ふるーい、w3-modeもそうだった気が...。(というより、最近のは知らないので。)

> 個人的には, ISO-2022-JP で統一していただけると嬉しいです。
統一するのは賛成です。META要素は議論が分かれるかもしれませんが、HTTPヘッ
ダは付けるべきと思います。

--
神戸 隆博(かんべ たかひろ)		at 仕事場