メインメニュー第19回メニュー > 問題と解説
 

第19回J検3級 情報リテラシー 問題4


問題4 次のデータの表現に関する文章を読み,設問に答えよ。
 
 コンピュータ内部では,数字は多くの場合2進数で表現されている。2進数は0と1しかない数であるから,10進数の0は「0」,10進数の1は「1」,10進数の2は「10」のように表される。
 一方,コンピュータが文字を扱うことができるのは,文字の一つ一つに,特定の2進数が定められていて(これを「文字コード」と呼ぶ),文字という情報を「コード化」しているためである。例えば,1ビットで表現可能な文字数は2文字であり,2ビットでは4文字,3ビットでは8文字というように1ビット増えるごとに割り当て可能な文字数が2倍になる。
 文字情報は,コンピュータ内部での処理だけでなく,他のシステムとの情報交換を行う上で重要な役割を果たすため,規格が定められている。例えば,表1に示すのは,日本で「JIS X 0201」として制定された文字コードの一部である。(一般に「JISコード」と呼ばれる)
 

 
 この表の見方は,8ビットの符号を上位4ビット(b8〜b5)と下位4ビット(b4〜b1)に分けて,上位ビットで示される列と下位ビットで示される行との交点の文字を表すものと解釈する。例えば,01000001 という符号は英字の「A」を表している。
 文字コード標準の先駆けとなったのは,1962年に定められた「ASCII」コードであり,日本では,7ビットの「ローマ字用7単位符号」と8ビットに拡張した「ローマ字・片仮名用8単位符号」や,ひらがなと漢字を追加したJIS漢字コードが定められている。
 ひらがなや漢字を表現するには1バイトでは足りないため,1文字を2バイト(16ビット)で表現する。16ビットのコードで表現される文字は慣用的に「全角文字」と呼ばれる。8ビットのコードで表現される文字は,全角文字と比べて幅が半分であることから,慣用的に「半角文字」と呼ばれている。
 
 
<設問1> 次の各問に答えよ。
(1)  英字の大文字・小文字(A〜Z,a〜z)と数字(0〜9)を一意に識別可能な形でコード化する場合,少なくとも何ビット必要か。適切なものを解答群から選べ。
 
(1)の解答群
ア.6   イ.7   ウ.8   エ.9
 
(2)  JISコードにおいて,01010010 00110001で表現される2つの文字はどれか,適切なものを解答群から選べ。
 
(2)の解答群
ア.3 1    イ.1 R    ウ.5 2    エ.R 1
 
(3)  1ページ400字の文章をフロッピーディスクに保存する。
ディスク1枚に記録可能なページ数はおよそいくつか。適切なものを解答群から選べ。
ただし,ここでは以下のような条件に従うものとする。
 フロッピーディスク1枚の容量は1.4MB(1MB=1,000,000バイト)である。
 1文字16ビットを用いる。
 改行などの制御コード(制御文字)は考えなくてよい。
 
(3)の解答群
ア.218    イ.1250    ウ.1400    エ.1750
 
 
 インターネットの普及によりWebページや電子メールの利用もその頻度を増しているが,さまざまな文字コードが混在していることによる弊害もある。
 例えば,図1はメールを受信したが,その内容が読めない例であり,図2はブラウザで表示した内容が読めない例である。
 

 
 これらの現象は一般的に文字化けと呼ばれるが,文字化けが起こる原因にはさまざまなものがある。
 日本語では「JIS」「シフトJIS」「EUC」などの文字コードが混在しており,ブラウザやメーラの文字コード体系の自動判別が狂うことがある。
 半角カタカナの使用も自動判別が狂う原因となる。
 メーカが独自に拡張した文字コード−機種依存文字−があり,

 これらの文字は別な機種では,異なる文字になったり,まったく読めなかったりする。
 通信の途中でデータの一部が欠落することがある。特に,制御文字という特殊な文字の欠落は,文章全体を化けさせる原因となる。
 
 世界中の文字を,1つの体系のなかで表現できるようにしようという文字コードも開発されている。1993年にISO規格となり,日本では1995年にJIS規格となった(5)この文字コードは,一部の例外を除いて2バイトで表現され,文字コード衝突の心配も少なくなっており,今後普及が進むものと期待されている。
 
<設問2> 次の各問に答えよ。
(4)  電子メールを送る際の心がけとして,適切なものを解答群から選べ。
 
(4)の解答群
ア. 要点をわかりやすく整理するために,「(1)日付 (2)時間 (3)場所・・・」と書いて送った。
イ. 海外宛のメールを送る際,タイトル部分のインパクトを強めるために全角英字を使い見やすくした。
ウ. 文字だけのメールでは寂しいのでなどのマークをそえて送った。
エ. 携帯電話からパソコンにメールを送るときには,絵文字を使わないようにしている。
 
(5)  文中下線部(5)の文字コードの名称として適切なものを解答群から選べ。
 
(5)の解答群
ア.ASCIIコード イ.JANコード
ウ.Unicode エ.EUCコード
 

解説
 
(1)  英大文字はA〜Zで26字,英小文字もa〜zで26字で合わせて52字です。それに0〜9の数字10字を加えると,合計で62字です。6ビットあれば26=64字までの割り当てが可能で,62字をカバーします。
(2)  01010010ですが,前半4ビットは表1のb8〜b5に対応しており,0101は5列目です。後半4ビットは表1のb4〜b1に対応しており,0010は2行目です。したがって,5列2行目のRになります。同様に00110001は,0011は3列目で,0001は1行目なので,3列1行目の1になります。
(3)  1文字が16ビットで1ページ400字ですから,1ページあたり16×400=6,400ビット=800バイトです。1,400,000バイトのフロッピーディスクには,1,400,000÷800=1,750ページが入ります。
(4)  アの丸囲い文字は,代表的な機種依存文字であり不適切です。イは,海外のパソコンは全角文字に対応していない場合があるので,全角文字の使用は不適切です。ウの絵文字は,機種依存文字の一種であり不適切です。
(5)  Unicodeの説明です。1995年にJIS X 0221として定められました。
 

 
メニューに戻る
 

Certain right called neighbouring on copyright kimura-kouichi