Stacks and Postfix notation (Gforth マニュアル)

Next: Your first Forth definition, Previous: Introducing the Text Interpreter, Up: An Introduction to Standard Forth [Contents][Index]

4.2 Stacks, postfix notation and parameter passing ¶

手続き型プログラミング言語(C や Pascal など)では、プログラムの構成要素は関数(function)やプロシージャ(procedure)です。これらの関数またはプロシージャは、明示的なパラメーターを使用して呼び出されます。たとえば、 C では以下のように記述できます:

total = total + new_volume(length,height,depth);

ここで、 new_volume は別のコード片への関数呼び出し(function-call)であり、 total, length, height, depth はすべて変数です。 length, height, depth は関数呼び出しのパラメーターです。

Forth では、関数またはプロシージャに相当するのは「定義」(definition)であり、パラメーターはプログラマから見える共有スタックを使用して定義間で暗黙的に渡されます。 Forth は変数をサポートしていますが、スタックの存在は、他のほとんどのプログラミング言語よりも変数が使用される頻度がはるかに低いことを意味します。テキスト・インタープリターは数値を検出すると、それをスタックに置きます(プッシュ)。何種類かのスタックがあり(いくつあるかは実装依存です)、操作に使用されるスタックは、実行される操作によって明確に示されます。すべての整数演算に使用されるスタックは「データ・スタック」と呼ばれ、これが最も一般的に使用されるスタックであるため、「データ・スタック」への参照は多くの場合「スタック」と省略されます。

スタックには後入れ先出し(last-in, first-out;LIFO)構成が採用されています。以下のように打ち込むと:

1 2 3RET  ok

これはテキスト・インタープリターに 3 つの数値を (データ)スタックに配置するように指示します。スタックの振る舞いはトランプの扱いに例えられます。トランプの箱から、 (スートは何でもいいですが、) エース(1)のカードと2のカードと3のカードをテーブルの上の山に配ります。 3のカードは山の最後のカード (last-in)であり、山からカードを 1 枚取ると、あなたがシャッフルとか何もいじってない限り、取り出すカードは 3のカードになります(first-out)。スタックから最初に取り出されるであろう(スタック上の)数値はスタック頂上(スタック・トップ;top of stack)と呼ばれ、多くの場合「TOS」と省略されます。

Forth でパラメーターがどのように渡されるかを理解するために、定義 + (「プラス」と発音します) の振る舞いを見てみましょう。あなたは、この定義が加算を実行することを知っても驚かないでしょう。より正確には、これは 2 つの数値を加算して結果を生成します。さて、その 2 つの数値はどこから取得されるのでしょうか？これはスタック頂上から上位 2 つの数値を取り除きます。その結果はどこに配置されるのでしょうか？それはスタックです。あなたは以下のように、トランプを使って + の振る舞いを演ずることができます。

テーブル上の山(the steck)カードを 2 枚取り出します
あなたは、それらをじっと見つめて、「これら 2 つの数字の合計は何であるか」を自問してください。
答えは 5 であると判明しました
2 枚のカードをシャッフルしてトランプの箱に戻し、トランプの箱の中から 5のカードを見つけます
テーブル上にある残りのエース(1)のカードの上に 5のカードを置きます。

トランプの箱はないですが、 Forth の実行中は、定義 .s を使用して、スタックに影響を与えることなく、スタックの現在の状態を表示できます。以下の様に打ち込みます:

clearstacks 1 2 3RET ok
.sRET <3> 1 2 3  ok

テキスト・インタープリターはワード clearstacks を検索して実行します。スタック(データおよび浮動小数点スタック)を整理し、以前の例の実行によってスタックに残された可能性のあるエントリをすべて削除します。続けてテキスト・インタプリタは、 3 つの数値をそれぞれ順番にスタックにプッシュします。最後に、テキスト・インタープリターはワード .s を検索して実行します。 .s を実行すると、「<3>」 (スタック上の項目の合計数) に続いて、スタック上のすべての項目のリストが出力されます。一番右側の項目が TOS です。

あなたは今や以下のように打ち込めます:

+ .sRET <2> 1 5  ok

現在スタックには 2 つの項目があり、 (そのうちの項目の1つである)加算の結果は 5 となっていれば正解です。

あなたが引き続きトランプで遊んでいるなら、この結果に対して 2 回目の足し算を行ってみましょう。 2 枚のカードを手に取り、その合計が 6 であることを計算し、手に取った2枚のカードをシャッフルして箱に入れ、箱から 6のカードを探してテーブルに置きます。これで、スタックにはアイテムが 1 つだけになりました。あなたが 3 回目の足し算を実行しようとするとどうなるでしょうか？あなたは、 1枚目のカードを手に取り、 2枚目のカードを手に取ろうとします – ああ! でも 2枚目のカードはありません。これは「スタック・アンダーフロー」と呼ばれ、エラーとなります。 Forth で同じことを行おうとすると、多くの場合、エラーが報告されます(おそらく、スタック・アンダーフロー(Stack Underflow)エラー、または、無効なメモリーアクセス(Invalid Memory Address)エラー)。

スタック・アンダーフローの逆の状況が「スタック・オーバーフロー」です。これは、あなたがたが、スタック用に予約されている有限量のストレージ・スペースがあることを単に受け入れるだけで済みます。トランプの例えを拡張すると、沢山の数のトランプのカードがあり、それらのカードをテーブルに積み上げた場合、天井にぶつかってしまい、最終的には別のカードを追加できなくなります。 Gforth を使用すると、スタックの最大サイズを設定できます。一般に、スタック・オーバーフローが発生するのは、定義にバグがあり、制御不能にスタック上にデータを生成している場合のみです。

トランプの例えには、最後にもう 1 つ適用例があります。トランプを使用してスタックをモデル化した場合、スタック上のアイテムの最大数は 52 になります(ジョーカーを使用しなかったと仮定して)。スタック上のアイテムの最大値は13(キング)です。実際は、使用できる数値は 1 ～ 13 の正の整数のみ(つまり、 13個の数)です。 (たとえば) 0や27や3.52や-2は使用できません。そこで、一部のカードについて考え方を変え、さまざまな数値に対応できるようにします。たとえば、ジャックは 0 を表し、クイーンは -1 を表し、キングは -2 を表すと見なします。すると、表現できる数値の幅は変更されません(合計 13 個の数値のみを表すことができます)が、 -2 から 10 の数値を表す事ができるようになりました。

この例えでは、制限は 1 つのスタック・エントリが保持できる情報の量であり、 Forth にも同様の制限があります。 Forth では、スタック・エントリのサイズは「セル」(cell)と呼ばれます。セルの実際のサイズは実装に依存し、スタック・エントリが保持できる最大値に影響します。標準 Forth は少なくとも 16 ビットのセル・サイズを提供し、ほとんどのデスクトップ・システムは 32 ビットのセル・サイズを使用します。

Forth は型チェックを一切行わないため、スタック項目を自由に操作したり組み合わせたりできます。スタック項目を 2 の補数の符号付き整数として扱う便利な方法は、 + などの標準ワードもやっています。それゆえ、以下のように入力できます:

-5 12 + .sRET <1> 7  ok

あなたが、 Forth を電卓にするために、数値や + のような定義を使用すると、それが通常の電卓とはかなり異なることがわかるでしょう。あなたは 2 + 3 = と入力するのではなく、 2 3 + と入力する必要があります(ここでは、結果を確認するには .s を使用する必要があるという事実は無視してください)。この違いを説明するために使用される用語は、電卓は「中置記法」(Infix Notation;パラメーターと演算子が混合されている)を使用するのに対し、 Forth は「後置記法」(Postfix Notation;パラメーターと演算子が分かれている)、またの名を「逆ポーランド記法」(Reverse Polish Notation)と呼ばれるものを使用します。

後置記法は最初はわかりにくいように見えるかもしれませんが、いくつかの重要な利点があります:

明白です
より簡潔です
スタックベースのシステムに自然に適合します

これらの主張をさらに詳しく調べるために、以下の計算について見てみましょう:

6 + 5 * 4 =
4 * 5 + 6 =

あなたが、算数を勉強中の場合、または算数が非常に苦手な場合は、最初の答えは 44、 2 番目の答えは 26 になるでしょう。あなたが算数に少し詳しい人なら、乗算は加算よりも優先されるという法則を覚えているでしょう。そして、どちらの場合も答えは 26 になるでしょう。答え 44 だと言った人に、なぜ答えが 26 かを説明するには、最初の計算を以下のように書き換えることになるでしょう:

6 + (5 * 4) =

あなたが、もし、乗算より優先して加算を実行したい場合は、かっこを使用して強制的に加算させる必要があります。

上記 2 つの計算を電卓で計算する場合、以下のキーストローク・シーケンスを使用して、入力ミスしない限り、おそらく正しい答えが得られるでしょう:

6 + 5 = * 4 =
4 * 5 = + 6 =

Postfix notation is unambiguous because the order that the operators are applied is always explicit; that also means that parentheses are never required後置記法では演算子が適用される順序は常に明示的です。これは、括弧が決して必要ないことも意味します。演算子はアクティブです(演算子を引用する行為によって演算操作が実行されます)。これにより、「=」が必要なくなります。

計算 6 + 5 * 4 は、以下の 2 つの同等の方法で(後置表記で)書くことができます:

6 5 4 * +
または:
5 4 * 6 +

この表記法に関して注意すべき重要な点は、数値の順番は変わらないことです。 10 から 2 を減算する場合は、 10 2 - と入力します。

Forth が後置表記を使用する理由は非常に簡単に説明できます。これにより実装が非常に単純になり、パラメーターを渡すためのメカニズムとしてスタックを使用することが自然な流れになります。これについての別の考え方としては、すべての Forth 定義がアクティブであると認識することです。これらは、テキスト・インタープリターによって検出されると実行されます。この結果、 Forth の構文は何の努力も必要とせずシンプルになります。