トップQs
タイムライン
チャット
視点

文字化け

コンピュータのバグのひとつ、文字が正しく表示されなくなる現象 ウィキペディアから

文字化け
Remove ads

文字化け(もじばけ)とは、コンピュータで文字が正しく表示・印刷されず、 本来とは異なる不規則で意味不明な記号や文字の連なりとして現れること[1]。あるシステムで符号化された文字列が、別のシステムで復号されたときに発生する[2]

Thumb
文字化けの模式図。UTF-8でエンコードされた文字列「文字化け」をShift JISとしてデコードした場合、「譁?ュ怜喧縺?」と文字化けする。

用語

「文字化け」は文字が変形することを意味する日本語であるが[2]、英語においても借用されている[1]久保芳之はこれについて、「アメリカで行われた最初の日本語アプリケーション」である PageMaker の開発時、「英語で文字化けを説明するよりも、 MOJIBAKEとは何かを理解させることの方が簡単であると考え、英語としてMOJIBAK(英語)を定着させました」と述懐している[3]

「文字化け」に相当する用語は他言語にも存在する。たとえば、中国語では同様の現象を乱碼と呼称する[4]。また、ロシア語では同様の現象をБНОПНЯと呼称した[5]

原因

文字コード

Thumb
UTF-8でエンコードされたWikipedia日本語版の「文字化け」の記事をWindows-1252として表示したときの文字化け

文字化けは、特定の文字符号化方式で符号化された文字列を、異なる方式で解釈・表示しようとしたときに発生する[1][2]。たとえば、ASCIIには curly apostrophe( ’ )が収録されていないため、Unicodeに準拠する文字符号化方式で入力した「that’s」といった文字列を、ASCIIで解釈すると「thata.™ s」と表示される[2]

文字化けの問題は、特に日本語をはじめとする東アジアの言語環境において顕著に発生した[6]。日本語環境において文字化けは、電子メールの送受信で起きるケースが多かった[7]。ASCII文字が7ビットであるのに対して、コンピューターでやり取りするデータの最小単位が8ビットであったことを背景に、インターネット黎明期のメーラーは最上位ビットを無視することがあり、8ビットすべてを利用するShift JISEUC-JPで入力された文字列を送受信する際に支障をきたした。また、その後もヘッダーに記載された文字コードの情報に問題があった場合には、文字化けの問題がおこった[8]。また、HTMLを記述する際、そのメタ情報に問題があった場合[9]、ファイルを圧縮・解凍する際の文字コードが異なった場合などにも、文字化けが発生した[10]

フォント

Thumb
日本語をサポートしていない環境での文字化け

文字コードの解釈に問題がなかったとしても、文字列の表示にあたって利用するフォントに問題があれば、文字化けが発生する。これはたとえば、日本語フォントがインストールされていない環境で日本語のウェブサイトを閲覧した際などに生じる[1]。また、丸囲い数字といった一部の文字(機種依存文字)は、標準化に先んじて各企業が独自に文字コードを割りふったため、互換性のうえで問題を生じさせた[11]携帯電話の絵文字についても同様であり、2006年には各キャリアが自社の絵文字を他社の絵文字に変換するサービスを公開していた[12]

ほかに、ビルマ語のコンピュータ環境においては、Unicodeに準拠しないフォントであるZawgyiが広く用いられていたため、Unicodeに準拠するフォントで入力した文字が、Zawgyiを用いた環境では文字化けする現象がおこった[13]。ミャンマー政府はZawgyiからUnicodeへの移行を実行すべく、2019年4月には政府機関で利用されるフォーマットをすべてUnicode準拠のものに変更した。政府は10月1日を「Uデー」に指定し、9月に国内メディアやプロバイダなどに、この日までにUnicodeに対応するよう指示をおこなった[14]

Remove ads

大衆文化への影響

廣田龍平は2020年の論考において、日本語環境において「現在では、対策が周知されていることに加え、多くの環境でUTF-8が標準となっている」ことを背景として、「文字化けは珍しいものとなっている一方、ホラー作品においてはなお文字化けが広く用いられている」と述べている。廣田は2ちゃんねる(5ちゃんねる)の「怖い話」を渉猟し、2000年代には「パソコンや携帯端末の表示が(心霊スポットを訪れるなど)思わぬタイミングで文字化けしていた」といった記述がほとんどであったのに対して、「2009年頃より異常な世界に入ってしまった語り手が同地で判読不明な文字を見る、といったストーリーがあらわれるようになった」と論じる。廣田は文字コード・文字化けの仕組みに触れながら「非人間的な視点から見れば、文字化けも世界の正常な働きの一環なのである」と論じ、「同じものを異なる方式で読み取った結果、まったく判断不能なものが立ち現れる文字化けという現象は、現実世界と異世界の差異を端的に示す『多自然主義グリッチ(一過性のシステム障害)』として理解できる」と総括している[15]

消えない文字化け

Wikipediaで時々文字化けしたページを見かけることができる。実際のページは以下のページだ。

蜻繧上縺溘繝繧

脚注

関連項目

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads