讨论:GB 2312
此条目已被学术论文引用。该论文为:
|
空格
GB和2312之间到底有没有空格?--zy26 (Talk) 14:27 2005年3月22日 (UTC)
- 中国的国家标准化管理委员会的标准编号是有空格的,即 “GB 2312”
- 作为经IANA所注册的编码表名称,“GB2312”是没有空格的。
- --Hello World! 15:07 2005年4月13日 (UTC)
特殊符号区
文章中说GB 2312的符号区(01-09区)共有682个符号,但是另一些资料中带有的符号数明显大于这个数字。请问682个符号的出处是什么地方?-- 208.53.138.212 2007年9月26日 (三) 08:01
- 1981年发布的 GB 2312,只有 682 个符号。后来的字型标准如 GB 5007.1 和 GB 6345.1 等,在 0xA8BB–A8C0 补上 6 个拼音符号:ɑ ḿ ń ň ǹ ɡ,又在第 10 区(内码 0xAAA1–AAFE)补充 94 个半形 ASCII 符号、在第 11 区(内码 0xABA1–ABC0)补充汉语拼音 a, e, i, o, u, ü 的四声半形字符 (4×6=24) 和 ê, ɑ, ḿ, ń, ň, ǹ, ɡ 的半形字符共 32 个。经这些标准添加后,符号的数目就变成了多至 814 个。至于 GB 2312 本身,从未出现过更新版,即是说,比如“锺”误植为“锺”等,仍然是强制性国家标准内的一部分。-✉Hello World! 2016年4月10日 (日) 09:17 (UTC)
按照文章的描述,GB2312应该是直接支持俄文(西里尔文)【07区】。也就是说中文系统是可以输入输出俄文的。但为什么显示或者识别的俄文都是按照汉字全角模式了?在特殊符号01~09区到底是怎么来定义识别的方式是全角还是半角?按理英文字符是半角字符,当然我们也能看到全角的输出,那么俄文应该也是半角输出。我对这个概念始终无法理解,有人清楚吗。--125.41.17.75 2013年11月6日 (三) 07:28
- 中文字形01-09区是全形符号(后来第10区和第11区加了半形符号,见上)。西文字形没有全形符号这回事,只有半形符号输出。--✉Hello World! 2016年4月10日 (日) 09:02 (UTC)
GB 2312-1980 更名 GB/T 2312-1980
在中国国家标准委官网上,写明“根据2017年第7号公告和强制性标准整合精简结论,自2017年3月23日起,该标准转化为推荐性标准,不再强制执行。”Wikipedia是否可以将之更名? NFSL2001(留言) 2020年4月3日 (五) 12:06 (UTC)
解释一下为何要移除某些章节
主要是条目涉及到的章节没有可靠来源支撑(Wikipedia:BURDEN中提到“如果某一主题得不到来自可靠第三方来源来的支持,则关于该主题的条目不应出现在维基百科上。”),而这方面的内容确实是属于只有用户生成来源关注,并无写入维基百科的必要(GB2312是GB2312, 通规表是通规表)。写入百科有暗示读者“GB2312收入了不该收入的字”这一观点,属于原创研究。其内容也多有不准确的潜在争议成分(如某些对《简化字总表》的解读)和一些琐碎信息等,按照Wikipedia:非原创研究的方针,有争议无来源的内容应当移除。--Kosaraju7(留言) 2023年6月25日 (日) 10:54 (UTC)
- 按照所附 GB 19966,这几个字确实属于不规范字(确实就是 “GB2312收入了不该收入的字”),而其Unicode来源(或 GB13000/同等 ISO/IEC 10646)也只有 G0 源(即GB 2312),因此证明 Unicode 收录该三字(渖、镟、锺)是仅限来源于 GB 2312。综合《简化字总表》《通用规范汉字表》的“规范字”定义,可以得出“GB2312收入了不该收入的字”。“锺”的特例是只有通用规范汉字表后期为人名使用恢复。可以参考 https://zhuanlan.zhihu.com/p/33731580 (渖、镟、锺、后) ,https://zhuanlan.zhihu.com/p/352877265 (后、麹), https://www.zhihu.com/question/29199314/answer/43527245 (渖、镟,另提锺)都有明确指示是 GB 2312 先收录这些不规范字。https://www.zhihu.com/question/24364602/answer/27581531 提及为什么 GB 2312 收录“后”。 NFSL2001(留言) 2023年6月25日 (日) 15:24 (UTC)
- 我再澄清一下,我不是再讨论这些是不是规范字、能不能用的问题,我的意思是,这些没有可靠的第三方来源支撑,只有一些用户生成的平台(如知乎等)上有相关讨论(参见:维基百科:可靠来源/常见有争议来源列表),而维基百科认为这些是不可靠来源,是不能作为佐证的,无论其说法究竟是不是可靠。事实上,GB2312是GB2312, 通用规范汉字表是通用规范汉字表,二者是性质完全不同的东西,本人并不赞同(即本人质疑)所谓的“不规范字”就不应该收录进入编码字符集这种说法,既然这些内容有暗示这一观点、没有第三方可靠来源支撑,按照维基百科的方针Wikipedia:非原创研究,受质疑没有可靠来源支撑的内容应当移除。另外阁下提到的GB 19966, 这里面GB 13000是20000+字,要比GB 2312大,不等同GB 2312, 所以引用这一材料属于是原创总结。不过就算假设GB 19966直接说是GB2312收录了错字吧,此来源(GB 19966)属于是国家标准文件,相关人员并非语言文字法等方面的专业人员(到底这是不是“错字”大体是属于这一领域专业的判定范围),也未必是可靠的来源。--Kosaraju7(留言) 2023年6月25日 (日) 16:52 (UTC)
- 另外这里说一下另外一个话题,阁下最新的版本提到的“但是 ISO-2022-CN-EXT 最终未给国标除了 GB/T 2312 以外的其他辅助集提供逃逸字符串”感觉这是过度细节了,没有给第二、第四辅助集提供Escape sequence的问题和GB 2312其实关系不大,我个人是不建议写入到条目中,可能如果有总体囊括GB2312, 第二、第四辅助集或者讲第二、第四辅助集的条目的话(只是假设有)再写比较合适一些。--Kosaraju7(留言) 2023年6月25日 (日) 16:57 (UTC)
- 按照所附 GB 19966,这几个字确实属于不规范字(确实就是 “GB2312收入了不该收入的字”),而其Unicode来源(或 GB13000/同等 ISO/IEC 10646)也只有 G0 源(即GB 2312),因此证明 Unicode 收录该三字(渖、镟、锺)是仅限来源于 GB 2312。综合《简化字总表》《通用规范汉字表》的“规范字”定义,可以得出“GB2312收入了不该收入的字”。“锺”的特例是只有通用规范汉字表后期为人名使用恢复。可以参考 https://zhuanlan.zhihu.com/p/33731580 (渖、镟、锺、后) ,https://zhuanlan.zhihu.com/p/352877265 (后、麹), https://www.zhihu.com/question/29199314/answer/43527245 (渖、镟,另提锺)都有明确指示是 GB 2312 先收录这些不规范字。https://www.zhihu.com/question/24364602/answer/27581531 提及为什么 GB 2312 收录“后”。 NFSL2001(留言) 2023年6月25日 (日) 15:24 (UTC)