平成３１年（H３１）春期基本情報技術者試験アルゴリズム問題解き方解説

2019年4月22日2020年8月14日

このページにはプロモーションが含まれています

平成３１年度春期午後のアルゴリズム問題である問８の私の解き方・考え方について解説していきます。

Contents

問題
問題の概要
設問１
設問２
設問３
解いてみた感想

問題

IPAの公式サイトで公開されています。このページでは問８についての解説を行います。

https://www.jitec.ipa.go.jp/1_04hanni_sukiru/mondai_kaitou_2019h31_1/2019h31h_fe_pm_qs.pdf

問題の概要

ハフマン符号化に関する問題です。ハフマン符号化では例えば文章に出現する文字の多いものから順に、短いビット列を割り当てていく符号化になります。これによりデータを圧縮することが可能です。ハフマン符号化を既に知っている人にとってはとっつきやすい問題だったかもしれないですね。

具体的にどうやって圧縮を行うかは問題中に記載してくれていますのでここでは省略します。

問題としては、設問１はハフマン符号化のアルゴリズムの理解を確認するもの、設問２はハフマン木作成に関するもの、設問３はハフマン木を用いた符号化に関するものになっています。

設問１

設問１はハフマン符号化のアルゴリズムの理解の確認です。設問１よりも前の文章にハフマン符号化のアルゴリズムについて詳しく書いてあるので、これを読みながらハフマン木を実際に作成してみれば解ける問題だと思います。

実際にハフマン木を作ってみましょう！問題に記載されているハフマン木の作成手順に下記の記載があります。

さらに、設問１で与えられた文字列が”ABBBBBBBCCCDD”なので、①と②により下記のような配列が作れます。

手順①②実行後

要素番号は一番左が０です。なので配列の要素番号０には「１」が格納されており、要素番号３には「２」が格納されています。

続いて次の手順③を行います。

ポイントは節の値の小さい順に節を２つ選択するところですね。さらに値が同じものがある場合は要素番号が小さい方が先に選択されます。この③を一度実行すると下記のようになります。

手順③ １回目実行後

分かりやすいように、１つ目に選択した節（要素）を緑枠で囲い、２つ目に選択した節を青枠で囲んでいます。さらに、追加した節を表す要素はオレンジ枠で囲っています。つまり、オレンジ枠で囲った節の左側の子が緑枠の節で、右側の子が青枠の節となります。

さらに具体的にいうと、要素番号０と要素番号３の値を足した値が配列の要素番号４に格納され、要素番号４が要素番号０と要素番号３の親となります。親の左側の子は要素番号０の節が、親の右側には要素番号３の節となります。

これで手順③の１度目の実行は完了です。

下記の手順④によると手順③を親が作成されていない節が一つになるまで繰り返せということですので、言われた通りに繰り返します。

手順③ ２回目実行後

１回目の実行とほとんどやることは同じですが、今度は同じ値がありますので、要素番号が小さい方のものが最初に選択され、左側の子になります。

手順③ ３回目実行後

この時点で親が作成されていない節が１つになりますので手順④が終了します。これでハフマン木の作成は完了です。この配列の親の要素番号を辿って木の形に構成すると下のようになります。丸が各節を表し、中に要素番号を記載しています。

文字”A”〜”D”の符号化結果は上記の木を根からその文字の節まで辿ることで取得できます。

例えばAの場合は下記のように辿れるので「010」となります。

同様にして他の文字も符号化結果を取得すると下記のようになります。

A : 010
B : 1
C : 00
D : 011

これが設問１の[ a ]の答えとなります。設問１の[ a ]の正解はアです。

[ b ]に関しては、ハフマン木による符号化を行うと、各文字を2ビットで表した時に比べてサイズがどれほど変わるかを問う問題です。実際に文字列”ABBBBBBBCCCDD”をハフマン符号化すると”0101111111000000011011″のビット列になります。これは各文字をハフマン符号化結果に置き換えてやれば取得できます。例えば”A”は”010″に、”B”は”1″に置き換えてやれば上記のビット列となります。

このビット列の長さは22であり、各文字を2ビットで表した場合のビット長は13文字 × 2ビットで26です。これを問題の先に当てはめて計算すると、0.85となります。ですので[ b ]の答えは0.85のイとなります。

設問２

設問２はハフマン木作成のプログラムの穴埋め問題です。

まずどういうプログラムであるかをじっくり読みましょう。また副プログラム Huffman はハフマン木を作成プログラムですので、問題の頭の方に記載されていたハフマン木の作成手順①〜④と照らし合わせて考えると分かりやすいと思います。

イメージ的には、副プログラム Huffman とハフマン木の作成手順とは下記のような関係にあります。

副プログラム Huffman にはハフマン木の作成手順①と②が実行された後の結果が入力される

副プログラム Huffman の下記の囲った部分がハフマン木の作成手順③に相当する

副プログラム SortNode がハフマン木の作成手順③の下記の下線部分を実行する

残った副プログラム Huffman の下記の囲った部分がハフマン木の作成手順④に相当する

最後は予測ですが、[ c ]の左側には下記の記号がありますので、繰り返しを行う条件を埋める必要があると考えるのが自然だと思います。

親が作成されていない節が１つになるまで繰り返す（つまり１つになったら終了する）とのことですので[ c ]に入る繰り返し条件は「親が作成されていない節が２つ以上」となります。さらに SortNode の説明に下記の記載があります。

これより、親が作成されていない節の数は nsize に格納されていることが分かります。したがって、「親が作成されていない節が２つ以上」は「nsize ≧ 2」で判断でき、[ c ]の答えはウとなります。

[ d ]は副プログラム SortNode の穴埋めになります。下記の通り行番号19〜24は親が作成されていない要素番号を抽出する処理が行われます。

行番号21では Sort 関数に渡す配列に要素番号を格納し、行番号22では要素番号の数をカウントアップして nsize に格納しています。これらの処理は、親が作成されている要素に対して実行してしまうと、親が作成された要素を含んだ node 配列を Sort に渡してしまいますし、nsize には親が作成されている要素を含んだ要素数になってしまいますので、SortNode の説明と話が合いません。

そのため、行番号20の条件には「要素番号 i の節が親を持たないこと」が入ると考えられます。さらに、[プログラム１の説明]より、parent 配列の全要素は”-1″で初期化されること、[プログラム１]の行番号11と12より parent 配列には親が作成されないと値が格納されないことが分かります。なので、要素番号 i が親を持たない場合、parent[i] は”-1″のままとなります。

そのため「要素番号 i の節が親を持たないこと」は「parent[i] が “0”未満であること」で判断することが可能です。したがって[ d ]の答えはエとなります。

設問３

設問３はハフマン木を用いた符号化に関する問題です。

副プログラム Encode の中で第一引数を parent[k]にして Encode を再帰呼び出しする事で、葉から根に辿る処理が実現されています。

例えば設問１で書いたハフマン木を用いて k を 0 とした場合は下記のように辿ることになります。

根は親を持たないため、根に辿り着いたかどうかは、parent[k] の値で判断できます。つまり、parent[k] が “-1” でない限り Encode の再帰呼び出しを実行する必要があります。従って[ e ]はオの「parent[k] ≧ 0」となります。

さらに、根まで辿り着けば再帰呼び出しの実行が終わり、今度は Encode 以降の処理が葉の方向に辿りながら実行されることになります。

プログラム的には行番号4〜7が実行されていきます。

要素番号 k の節が、k の親の左側の子である場合に”0″を、右側の子である場合に”1″を出力すればよいため、[ f ]には「 k の親の左側の子の要素番号が k である」という条件を入れれば話が合います。従って[ f ]の答えはイの「left[parent[k]] = k」となります。

ちなみに設問１の”ABBBBBBBCCCDD”に対して生成されるハフマン木と、それを用いた文字”A”の符号化の様子は下記のようになります。再帰呼び出しがどのように実行されているかが分かりやすいかなと思って書いたのですが、ちょっとは伝わりますかね…。

解いてみた感想

今回の問題は割と解きやすかったのではないかと思います。まずプログラムが副プログラム毎に途切れているので、プログラムの説明とプログラムがどう対応しているのかが分かりやすかったです。さらに設問１はプログラムとは関係ない問題だったので、プログラムが苦手な方でも設問１を解けたという方も多いと思います。

設問１と設問２に関しては問題をしっかり読めれば解ける問題だと思います。ただ設問３は再帰呼び出しの問題なのでちょっと難易度は高めですね…。私は再帰呼び出し苦手です…。

★オススメページ★
下記ページから他の回の解説もたどれます。他の回のアルゴリズム問題の解き方がわからない場合は是非読んでみてください！

基本情報技術者試験午後問題「アルゴリズム」過去問の解き方解説まとめ

本ページの図・プログラム・問題文について

図やプログラム、問題文はIPA公開の過去問題から引用しています。また図やプログラムに関しては説明に必要な部分に関してのみ加工して使用させていただいております。

出典：平成３１年度 春期 基本情報技術者試験（FE）試験区分 午後 問８

アルゴリズム問題の対策（PR）

過去問を解いてみて感触はいかがだったでしょうか？

全く分からなかった...という方もいらっしゃるかもしれません。はっきりいってアルゴリズム問題は、特に慣れないと難易度は高いです。

なので、こういった方にはもっと "簡単なアルゴリズム問題を解いて慣れていく" ことをオススメします。で、この簡単なアルゴリズム問題を解くのにオススメの本が下記のうかる！基本情報技術者　[午後・アルゴリズム編] です。

うかる！基本情報技術者　[午後・アルゴリズム編]　2022年版

posted with ヨメレバ

福嶋宏訓日経BP 日本経済新聞出版本部 2021年11月25日頃

楽天ブックス

Amazon

Kindle

オススメする理由は、特に本の前半部分で難易度の低いアルゴリズムの紹介や解説が行われているところです。こういったアルゴリズムの動作などを実際にトレースして追ってみたりすることで簡単な問題からアルゴリズム問題に慣れていくことができます。

また、「アルゴリズムとは？」といったアルゴリズム入門から解説してくれているので、プログラミングをやったことない方にも親切な内容になっています。

アルゴリズム問題に全く手がつかないというような方は、まずは上記のような本でアルゴリズムに慣れるのがオススメです。

慣れてきたら、あとは実際の過去問を解いて "さらに考える力を養う" ＆ "実際のアルゴリズム問題に慣れる" のが良いと思います。

私のサイトでも過去問の解説をしていますので是非参考にしてください。私の解説だけでなく、他の人の解説も参考にしたいような場合には、下記のような過去問の参考書もオススメです（アルゴリズム問題だけでなく、全問題の解説も充実しています）。

令和04年【上期】基本情報技術者パーフェクトラーニング過去問題集

posted with ヨメレバ

山本三雄技術評論社 2021年11月26日頃

20 COMMENTS

文 2019年4月23日

解説ありがとうございます。
試験中解答cとfをまちがえてしまったのでなぜ間違ってしまったかが理解することができました。

問題

問題の概要

設問１

設問２

設問３

解いてみた感想

20 COMMENTS

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル