讨论:GB 2312

此条目已被学术论文引用。该论文为：

申庆永 , 张建忠 , 何云 , 杨洁于2007年03期发表在《计算机工程与应用》的《中文垃圾邮件过滤系统中的实时分词算法设计》。

请同时到Wikipedia:论文中引用维基百科的内容处加入有关资料。（为免自我提及，本模板仅限于放在讨论页的页顶，敬请留意！）

空格

GB和2312之间到底有没有空格？--zy26 (Talk) 14:27 2005年3月22日 (UTC)

中国的国家标准化管理委员会的标准编号是有空格的，即 “GB 2312”

作为经IANA所注册的编码表名称，“GB2312”是没有空格的。

--Hello World! 15:07 2005年4月13日 (UTC)

特殊符号区

文章中说GB 2312的符号区（01-09区）共有682个符号，但是另一些资料中带有的符号数明显大于这个数字。请问682个符号的出处是什么地方？-- 208.53.138.212 2007年9月26日 (三) 08:01‎

1981年发布的 GB 2312，只有 682 个符号。后来的字型标准如 GB 5007.1 和 GB 6345.1 等，在 0xA8BB–A8C0 补上 6 个拼音符号：ɑ ḿ ń ň ǹ ɡ，又在第 10 区（内码 0xAAA1–AAFE）补充 94 个半形 ASCII 符号、在第 11 区（内码 0xABA1–ABC0）补充汉语拼音 a, e, i, o, u, ü 的四声半形字符 (4×6=24) 和 ê, ɑ, ḿ, ń, ň, ǹ, ɡ 的半形字符共 32 个。经这些标准添加后，符号的数目就变成了多至 814 个。至于 GB 2312 本身，从未出现过更新版，即是说，比如“锺”误植为“锺”等，仍然是强制性国家标准内的一部分。-✉Hello World! 2016年4月10日 (日) 09:17 (UTC)[回复]

按照文章的描述，GB2312应该是直接支持俄文（西里尔文）【07区】。也就是说中文系统是可以输入输出俄文的。但为什么显示或者识别的俄文都是按照汉字全角模式了？在特殊符号01~09区到底是怎么来定义识别的方式是全角还是半角？按理英文字符是半角字符，当然我们也能看到全角的输出，那么俄文应该也是半角输出。我对这个概念始终无法理解，有人清楚吗。--125.41.17.75 2013年11月6日 (三) 07:28‎

中文字形01-09区是全形符号（后来第10区和第11区加了半形符号，见上）。西文字形没有全形符号这回事，只有半形符号输出。--✉Hello World! 2016年4月10日 (日) 09:02 (UTC)[回复]

GB 2312-1980 更名 GB/T 2312-1980

在中国国家标准委官网上，写明“根据2017年第7号公告和强制性标准整合精简结论，自2017年3月23日起,该标准转化为推荐性标准，不再强制执行。”Wikipedia是否可以将之更名？ NFSL2001（留言） 2020年4月3日 (五) 12:06 (UTC)[回复]

解释一下为何要移除某些章节

主要是条目涉及到的章节没有可靠来源支撑（Wikipedia:BURDEN中提到“如果某一主题得不到来自可靠第三方来源来的支持，则关于该主题的条目不应出现在维基百科上。”），而这方面的内容确实是属于只有用户生成来源关注，并无写入维基百科的必要（GB2312是GB2312, 通规表是通规表）。写入百科有暗示读者“GB2312收入了不该收入的字”这一观点，属于原创研究。其内容也多有不准确的潜在争议成分（如某些对《简化字总表》的解读）和一些琐碎信息等，按照Wikipedia:非原创研究的方针，有争议无来源的内容应当移除。--Kosaraju7（留言） 2023年6月25日 (日) 10:54 (UTC)[回复]

按照所附 GB 19966，这几个字确实属于不规范字（确实就是 “GB2312收入了不该收入的字”），而其Unicode来源（或 GB13000/同等 ISO/IEC 10646）也只有 G0 源（即GB 2312），因此证明 Unicode 收录该三字（渖、镟、锺）是仅限来源于 GB 2312。综合《简化字总表》《通用规范汉字表》的“规范字”定义，可以得出“GB2312收入了不该收入的字”。“锺”的特例是只有通用规范汉字表后期为人名使用恢复。可以参考 https://zhuanlan.zhihu.com/p/33731580 （渖、镟、锺、后），https://zhuanlan.zhihu.com/p/352877265 （后、麹）， https://www.zhihu.com/question/29199314/answer/43527245 （渖、镟，另提锺）都有明确指示是 GB 2312 先收录这些不规范字。https://www.zhihu.com/question/24364602/answer/27581531 提及为什么 GB 2312 收录“后”。 NFSL2001（留言） 2023年6月25日 (日) 15:24 (UTC)[回复]

我再澄清一下，我不是再讨论这些是不是规范字、能不能用的问题，我的意思是，这些没有可靠的第三方来源支撑，只有一些用户生成的平台（如知乎等）上有相关讨论（参见：维基百科:可靠来源/常见有争议来源列表），而维基百科认为这些是不可靠来源，是不能作为佐证的，无论其说法究竟是不是可靠。事实上，GB2312是GB2312, 通用规范汉字表是通用规范汉字表，二者是性质完全不同的东西，本人并不赞同（即本人质疑）所谓的“不规范字”就不应该收录进入编码字符集这种说法，既然这些内容有暗示这一观点、没有第三方可靠来源支撑，按照维基百科的方针Wikipedia:非原创研究，受质疑没有可靠来源支撑的内容应当移除。另外阁下提到的GB 19966, 这里面GB 13000是20000+字，要比GB 2312大，不等同GB 2312, 所以引用这一材料属于是原创总结。不过就算假设GB 19966直接说是GB2312收录了错字吧，此来源（GB 19966）属于是国家标准文件，相关人员并非语言文字法等方面的专业人员（到底这是不是“错字”大体是属于这一领域专业的判定范围），也未必是可靠的来源。--Kosaraju7（留言） 2023年6月25日 (日) 16:52 (UTC)[回复]

另外这里说一下另外一个话题，阁下最新的版本提到的“但是 ISO-2022-CN-EXT 最终未给国标除了 GB/T 2312 以外的其他辅助集提供逃逸字符串”感觉这是过度细节了，没有给第二、第四辅助集提供Escape sequence的问题和GB 2312其实关系不大，我个人是不建议写入到条目中，可能如果有总体囊括GB2312, 第二、第四辅助集或者讲第二、第四辅助集的条目的话（只是假设有）再写比较合适一些。--Kosaraju7（留言） 2023年6月25日 (日) 16:57 (UTC)[回复]