パソコンではいついかなる場合でも日本語の文字表現が自由に使えるわけではありません。利用するケースバイケースで条件や制限があります。これらの規則を無視して使用すると文字化けや文字抜けの原因になります。どのようなケースでどのようなことを注意したらよいかは知識と経験によります。パソコンで正しい日本語を入力・表示するためには日本語入力システムの知識が必須です。
半角文字と全角文字
英数記号文字を表現するには、8ビット(1バイト)の基礎表現が必要となります。このため1バイト文字といいます。かなや漢字のある日本語文字は、8ビット(1バイト)では表現できません。16ビット(2バイト)の基礎表現が必要になります。このため2バイト文字といいます。
かって、パソコンやワープロの基本となる文字表示は等幅でした。このため、2バイト規定コードの表示文字幅と1バイト規定コードの表示文字幅が 2:1 になりました。文字幅が倍または1/2になるため「全角/半角」という呼び方があります。
「漢字」と「ひらがな」は「全角文字」しかありませんが、「カタカナ」と「英数記号」は「全角文字」と「半角文字」の両方がありますので、「全角/半角」で区別します。
1バイト規定コードで表示される英数記号文字の「半角文字」を「ANK文字(アンク) alphanumeric and kana character」と呼ぶこともあります。
かって、パソコンでは文字の書体やサイズを自由に変更することはできませんでした。「全角/半角」を基準に「横倍角・縦倍角・4倍角」程度のサイズしか表示できませんでした。
日本語入力システムとの関係
通常、日本語入力システムを「ON(有効)」にしたときの漢字変換モードでは「全角文字」での日本語入力になります。「OFF(無効)」の場合は「半角文字」の英数記号入力になります。ただし、日本語入力システムには半角モードのカタカナと英数記号の入力も用意されています。日本語入力システムを「OFF(無効)」にしなくても半角の英数記号入力ができます。
また、現在の日本語入力システムの中には、半角文字の大きさの英字で、ローマ字入力のかな漢字変換ができるものもあります。
文字フォントと表示制御
現在、文字表示には「文字フォント」という仕組みを使うため、文字の大きさやスタイルを自由に変更できます。ワープロソフトでは文書体裁を整えるためにいろいろな文字表示制御機能も有効になっています。英字に関してはプロポーショナルフォントが標準で使われます。また、文字の幅や間隔も不自然にならないように字間調整(カーニング)がおこなわれたり、行末が凸凹にならないようジャスティフィケーション処理もされます。
このため、等幅フォントを指定してもかってのような等幅の状態にはなりません。字数が多くなりにつれて誤差ができます。同じ幅にするには「均等割付」などの機能を利用します。
図はワープロソフトで、上部は「MS ゴシック」(等幅フォント)を、下部は「MS Pゴシック」(プロポーショナル) を指定したものです。
図の2行目は半角英字で、3行目は全角英字です。「MS ゴシック」(等幅フォント)ではこの違いが分かりますが、「MS Pゴシック」(プロポーショナル) では半角/全角という割合にはなりません。
「MS 明朝」と「MS ゴシック」は「等幅フォント」です。「MS P明朝」と「MS Pゴシック」は「プロポーショナルフォント」です。「 P 」が付いてるかいなかで判別します。他のものは名称形式では判別できません。検索サイトで「フォント、一覧、等幅」などで検索してください。
予約語
パソコンでは入力できる文字をどのような場合でも自由に使えることではありません。状況により入力できない(使用禁止)の文字があります。
パソコンの基本となる標準文字の半角英数記号には、「システムの予約語」というものがありシステム処理レベルのものには使うことができませ。下記の半角文字と記号はフォルダ名やファイル名には使用できません。
- 「 \ / : ? ” * < > | 」の記号
- 「 AUX,CON,PRN,NUL,CLOCK 」の予約語
上記にない半角記号は使えますが、システムが自動的に作るファイル名によく使われます。また、使える記号でも記号が連続したり、組み合わせによってはエラーになることもあります。複数の機種でやりとりするフォルダ名やファイル名に半角記号はできる限り使わないことをおすすします。
機種依存文字 platform dependent characters
文字コードの規定にはなく、コードの空いているところに、パソコンメーカーが独自に割り当てた記号や漢字などをいいます。代表的なものに丸囲みの数字、ローマ数字、(株)などの略号、単位文字記号などがあります。下図が代表的な機種依存文字です。機種依存文字は「eメール」や「ホームページ」に使うことはできません。文字化けや文字抜けの原因になります。



同様のものに「外字」があります。外字も使用者が独自に作ったも文字をコードの空いているところに登録したものです。機種依存文字や外字は、Webページや電子メールでは使わないことになっています。同じ環境のシステムでは表示はされますが、異なる環境のシステムでは表示されません。携帯電話の絵文字も機種依存文字です。
Windows Vistaで使われているJIS X 0213文字コードには丸囲みの数字が登録されました。今後、従来の機種依存文字でも使用頻度の高いものはJIS規格に含まれるようになると思われます。
下図はJIS規格の記号で機種依存文字ではありません。原則としてJIS規格の記号以外は機種依存文字になります。

顔文字はJIS規格の半角記号を組み合わせたものですので機種依存文字ではありません。
