帮助:特殊字母与符号
维基百科,自由的 encyclopedia
在MediaWiki 1.5中,所有的项目都使用了Unicode(UTF-8)字符编码。如果你的操作系统和浏览器不支持Unicode(如网景浏览器或Mac版Internet Explorer),或者没有安装可以显示某些Unicode字符的字体,你将无法正确浏览、编辑带有这类字符的文章。典型的状况是:把不能显示的字符被显示成内有数字的小方框,编辑框内不能显示的字符被显示成一组组字符代码。本文章的下列章节会给出具体的介绍。
维基百科使用手册 |
本页面有特殊字符,操作系统及浏览器须支持特殊字母与符号才能正确显示,否则可能变成乱码、问号、空格等其它符号。 |
概述
你可在在#显示和#相关字体的下载与安装这2章节找到有关的解决方案。
字符编码系统
到2005年6月底,当这个新的版本开始在维基媒体上使用时,英国、荷兰、丹麦和瑞典的维基百科已经使用了windows-1252编码(他们宣布用的是ISO-8859-1编码,但实际上浏览器把二者识别为同一种,而且Mediawiki并没有限制使用windows-1252的历史)。在数据库中准备升级的wiki文档将始终以windows-1252编码保存,并且在加载时转换。此后的更新将作为UTF-8编码储存在数据库内。加载时转换的过程对于用户来说是不可见的。
- Unicode(UTF-8)
- 各字符字节数可变
- 中日韩统一表意文字等特殊字符都可以在网页和编辑框正常显示,亦可用多字符代码,且不会在编辑框自动转换。
- ISO 8859-1
- 各字符仅一字节
- 在此字符集中不可用的特殊字符以多字符代码形式储存,它们通常有两到三个等价表示,例如:€,可表示为€,或€,或€。
- 包含最常见的特殊字符,比如é,也可表示为é,但这样没必要。
注意到Special:Export输出时使用UTF-8,无论数据库使用的是哪种编码。
若想了解某维基使用的编码系统,打开浏览器的“察看原始码”,找以下字符串:
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />
或
<meta http-equiv="Content-type" content="text/html; charset=utf-8" />
编辑
多数电脑键盘的布局都继承自一八六八年由几位美国人发明的打字机,其键位布局都只为英文而设,当中只取廿六键位对应廿六字母,无考虑其他语言文字的字素数,二十世纪发明的美国标准资讯交换码(ASCII)收的字素字符亦只有廿六英字,现今主流的键盘如无软件辅助都打不出其他语言的文字,但许多不在ASCII的字符都对维基十分重要。非ASCII字符有几种方法输入:
- 使用编辑框下的特殊字符以插入文章,但有可能无法显示部分字符。
- 按住ALT键并从数字键区依次输入三位数输入EASCII字符,但超出EASCII范围的数字会转成SOH符号(U+0001)。
- 直接使用特种键盘、该语言的输入法或字符映射程序。在ISO-8859-1的维基将把字符集以外的字符转换为HTML数字字符实体(见下)。
- 使用HTML命名字符实体引用,比如
à
。这对于不同的字符集来说都能非常正确的表达指定字符,即使无法显示。不过可能引起搜索的困难(见下)。 - 使用HTML数字字符引用,比如
¡
。这是输入未命名实体Unicode值的唯一办法,比如土耳其字符。代码点128到159在ISO-8859-1和Unicode中都未使用,因此其间的字符引用是错误的,“非法的”,会引起多种问题。
总的来说,西欧语言一般不出现问题。
为了搜索的成功,特殊字符最好不用字符实体引用,否则搜索会出现问题。比如“Odiliënberg”,伺服器只会以“Odili”、“euml”或“nberg”进行搜索。这其实是个bug,应该被修正。参见:Help:搜索。