12.3 文字列とポインタ

文字型のところで学習したように、C 言語では文字と文字列は全く違った扱いをする。日本語の漢字なども文字列として扱うが、では文字列はどのようにして扱われるのであろうか。

実は、我々は既に文字列を扱っている。printf() で "this" などと使っているのが文字列なのである。では、この文字列はどのような仕組みになっているのかというと、文字列としてプログラム中で指定したものは必ずメモリ中のどこかに存在するようになっている。しかし、メモリ中のどこかはこのままでは分からない。今までの使い方では、場所がどこか分からなくても一回しか使わないので問題はなかった。同じ文字列を何度も扱ったり、変更したりするにはどうすれば良いのであろうか。

例2 char *s = "this"; printf("address of string is %u\n", s); printf("letter is %s\n", s);

この例では、まず、最初に文字型のポインタ変数 s を宣言し、同時に初期化を行っているが、この初期化方法の意味をまず解説しよう。プログラム中に書かれた文字列は必ずメモリ中の何処かに存在するようになる。しかし、そのままでは何処にあるかは分からない。そこで、C 言語では文字列はアドレスを持つように定義されているのである。従って、最初の宣言の右辺はアドレスである。それを、初期化によって、ポインタ変数 s にセットしている訳である。しかし、文字列のアドレスといっても、この場合は "this" という 4 個の文字からなっているので、全ての文字へのアドレスを覚えているのではなく、先頭の文字へのアドレスを持たせている。この場合、2 番目以降の文字は次々にアドレスを変化させて見て行く事になるのだが、何処で終わるかという事が分からなければ果てしなく続く事になってしまうので、C 言語では、文字列の終わりを表す印として '\0' という目印を最後に書き込む決まり になっている。従って、4 個の文字だけがメモリ中にあるのではなく、実は 5 個の文字がメモリ中にあることになる。このようにして、ポインタ変数 s に入っているアドレスは、文字 't' へのアドレスになっている。ちなみに、printf() の書式制御に %s を指定し、文字列へのアドレスを渡すと文字列を出力出来る。この状況を図に示したのが上図である。

$\begin{figure}\begin{center} \epsfile{file=string} \end{center}\end{figure}$

例3 char *s = "this"; printf("string is %s\n", s);

printf("%s", 文字列へのアドレス);

最初のページ戻る次へ最後のページ目次

Hiroyasu Asami