[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: japanese-jisx0208-1978
>>>>> In [emacs-w3m : No.02850]
>>>>> TSUCHIYA Masatoshi <tsuchiya@pine.kuee.kyoto-u.ac.jp> wrote:
ari> japanese-jisx0208-1978 の文字を w3m-euc-japan で encode した時に
ari> 化けているようです。
土> これって化けていると言うよりも,UCS に対応する文字がないのではないでしょ
土> うか?
はい、そのようです。
;; jisx0208-1978 から Unicode へのマッピングルールってあるんでしょうかね?
ari> ;; GNU Emacs でも standard-translation-table-for-decode を
ari> ;; いじって、japanese-jisx0208-1978 から japanese-jisx0208
ari> ;; への変換を行わないようにしていると、同様に化けます。
土> 逆にこの変換を行うように XEmacs を設定するか,問題のページの文字コード
土> の判定が japanese-jisx0208-1978 にならないようにするか,のどちらかの対
土> 応が適切なのではないでしょうか?
思い出しましたが、XEmacs もデフォルトでは iso-2022-jp のデコード時に
japanese-jisx0208-1978 は japanese-jisx0208 に変換されます。
しかし、pces-xm.el にて iso-2022-jp を iso-2022-7bit のコピーに
しているため、変換が行われないようです。
| 1998-01-10 MORIOKA Tomohiko <morioka@jaist.ac.jp>
|
| * emu-x20.el: If coding-system `iso-2022-jp' unifies JIS X
| 0201-Latin to ASCII and JIS X 0208-1978 to JIS X 0208-1983 by
| code-point, copy coding-system `iso-2022-7bit' to `iso-2022-jp' to
| avoid this problem.
なお、w3m-input-coding-system が iso-2022-7bit であっても、
w3m で内部コードに変換する時点で jisx0208-1978 は jisx0208 に
なるので、w3m-euc-japan でも変換しちゃって良い気がします。
Index: w3m-ucs.el
===================================================================
RCS file: /storage/cvsroot/emacs-w3m/w3m-ucs.el,v
retrieving revision 1.9
diff -u -r1.9 w3m-ucs.el
--- w3m-ucs.el 2001/10/28 11:38:26 1.9
+++ w3m-ucs.el 2002/02/28 07:40:28
@@ -105,7 +105,8 @@
;; (2) Latin Part of Japanese JISX0201.1976
;; Convert to ASCII
(write-repeat r0))
- (if (r1 == ,(charset-id 'japanese-jisx0208))
+ (r2 = (r1 == ,(charset-id 'japanese-jisx0208-1978)))
+ (if ((r1 == ,(charset-id 'japanese-jisx0208)) | r2)
;; (3) Characters of Japanese JISX0208.
((r1 = ((r0 & 127) | 128))
(r0 = ((r0 >> 7) | 128))
土> ;; japanese-jisx0208-1978 って,どういう状況で使われているのかを理解し
土> ;; ていないので,今一,確信が持てないのですが.
意図して使われている場面はほとんどないと思うのですが、
意図して使ってみました:-P
http://www.nijino.com/ari/tmp/m17n/jisx0208-1978.html
--
有沢 明宏
;; CCL で or ってこうやるしかないの?