ISO 2022-JP (JIS) 文本编解码器

JIS 编解码器提供 ISO 2022-JP 的转换。

环境变量UNICODEMAP_JP 可用于微调 JIS、Shift-JIS 和 EUC-JP 编解码器。映射名称与日语 XML 工作组的XML 日语简介相同,因为它命名并解释了所有广泛使用的映射。以下是 Serika Kurusugawa 撰写的简要说明:

  • "unicode-0.9 "或 "unicode-0201 "表示 Unicode 风格。假设 JISX0201 表示 0x00-0x7f。(0.9 是用于 Unicode 1.1 的 jisx02xx 映射的表格版本)。
  • "unicode-ascii "假定 0x00-0x7f 为 US-ASCII;某些字符(JISX0208 0x2140 和 JISX0212 0x2237)与统一码 1.1 不同,以避免冲突。
  • "open-19970715-0201"(为方便起见使用 "open-0201")或 "jisx0221-1995 "表示 JISX0221-JISX0201 风格。JIS X 0221 是统一字符编码的 JIS 版本,但有几个字符(0x5c、0x7e、0x2140、0x216f、0x2131)与统一字符编码 1.1 不同。当 0x5c 被视为 "YEN SIGN "时,将使用此字符。
  • "open-19970715-ascii"(为方便起见使用 "open-ascii")表示 JISX0221-ASCII 风格。当 0x5c 被视为 "REVERSE SOLIDUS "时使用。
  • "open-19970715-ms"(为方便起见使用 "open-ms")或 "cp932 "用于 Microsoft Windows 风格。Windows 代码页 932。某些字符(0x2140、0x2141、0x2142、0x215d、0x2171、0x2172)与 Unicode 1.1 不同。
  • "jdk1.1.7 "表示 Sun 的 JDK 风格。与统一码 1.1 相同,但 JIS 0x2140 被映射为 UFF3C。0x00-0x7f 可以使用 ASCII 或 JISX0201。

此外,还支持扩展名 "nec-vdc"、"ibm-vdc "和 "udc"。

例如,如果要使用 Unicode 风格的转换,但使用 NEC 的扩展名,可将UNICODEMAP_JP 设置为unicode-0.9, nec-vdc 。(可能需要在 shell 命令中引用)。

这里的大部分代码是由 Serika Kurusugawa(又名高木淳司)编写的,经作者许可并在 Qt 团队的感谢下被包含在 Qt 中。

另请参阅 文本编解码器:ISO 2022-JP (JIS)

© 2025 The Qt Company Ltd. Documentation contributions included herein are the copyrights of their respective owners. The documentation provided herein is licensed under the terms of the GNU Free Documentation License version 1.3 as published by the Free Software Foundation. Qt and respective logos are trademarks of The Qt Company Ltd. in Finland and/or other countries worldwide. All other trademarks are property of their respective owners.