(cache)Rust の関連型はジェネリクスではだめなのか？

これは関連型に対する自分の理解をまとめたものです。高度なトレイト - The Rust Programming Languageの関連型の項を補足する形でもあります。これは変だ、またはもっと正確な認識がある、という場合はぜひぜひ教えていただけると嬉しいです。コードは少し古いですが rustc 1.34.0-nightly (097c04cf4 2019-02-24) により確認しています。

トレイトにおけるジェネリクス・関連型とは

Rust のトレイトは、トレイトにおいて型を抽象化するためにジェネリクスや関連型を用いることができます。まずはこれらについて説明します。まだ本題でないので、知っている方は読み飛ばしていただいて大丈夫です。

ジェネリクスの例

例えば、標準ライブラリの std::convert::From トレイトはある型を別の型の値から生成できることを表すトレイトですが、概ね次のように定義されています。

pub trait From<T> {
    fn from(from: T) -> Self;
}

この定義の <T> となっているところがジェネリクスで、 T という名前の型変数を宣言しています。

このトレイトを使うと、たとえば型 u8 の値を型 i32 に変換できることを表すには impl From<u8> for i32 とできます。また型 U に対して U: From<T> という制約が与えられた場合、型 U は型 T から変換できることを表します。

本題 : 関連型はジェネリクスではだめなのか？

先の std::iter::Iterator の例を見ていると、関連型を使わなくても

pub trait Iterator<Item> {
    fn next(&mut self) -> Option<Item>;
}

のように、ジェネリクスを使って Item を実装すればいい気がしますが、どうなのでしょうか？

結論から言うと、 この例では、 そのようにトレイトを定義しても使えないことはないです。ただしジェネリクスと関連型は意味が違うので、いくつかの面倒と問題を引き起こします。ざっくり言うと次のような違いです。

※ これでない例で、そもそも 関連型が必要になる例 というのもあります¹。ただし今回はそこには踏み込みません。

ジェネリクスは「トレイト」と「型変数がとりえる型」が 1 対多
関連型は「トレイト」と「関連型がとりえる型」が 1 対 1

ジェネリクスでは、 Iterator<u8> と Iterator<char> は別のトレイトなので、両方を同じ型 T に対して実装することもできてしまいます。すると T に実装されている Iterator<Item> の Item は u8 と char になります。これが 1 対多です。一方、関連型では、トレイトとしてはあくまで Iterator というトレイトなので、これは同じ型 T に対しては一回しか実装できません。その一回の実装の中で Item に型を結び付けるため、やはり Item は一つの型でしかありえません。これが 1 対 1 です。

従って、関連型を使うべき場合とは「ある型に対して別の型が一意に定まる場合」といえます。Iterator などはまさにそうです。型 Vec<u8> をイテレートすると型 u8 の要素が出てくるのが自然でしょう。普通 String や i32 は出てきません。 String のようにバイト列 [u8] か文字列 [char] か曖昧なコンテナは String::bytes() や String::chars() を一旦経由しないとイテレータに変換できないようになっています。いずれにせよ、ある Iterator が存在したとき、そのイテレータが生成できる型が複数あるというのは不自然ですよね。

逆にジェネリクスを使うべき場合とは「ある型に対して別の型がいくつでも有り得る場合」と言えます。From などはまさにそうです。「型 i64 に失敗なく変換できる型」は決して一つとは限らず、 i32 や u32 や u8 や... といくらでも考えられます。 From の定義に関連型を使ってしまうと「変換元になる型は何か一つしかない」ことを示すことになります。

では、一意に定まる場合にジェネリクスを使うと何が問題になるかを見ていきましょう。

説明に使うトレイト

「コンテナ型の値から先頭の要素をとりだすことができる」ことを表すトレイト、 GetFirst というものを考えることにします。コンテナ型というのはどのような型の要素を持っているかわかりませんから、ジェネリクスか関連型を使って要素の型を抽象化する必要があります。この場合「コンテナ型の要素の型」というのは Vec<u8> なら u8 、 String なら char 、 (i32, i32) なら i32 というふうにコンテナ型に対応して一通りに定まりますから、ここでは関連型を使うのが正しいです。しかしあえてジェネリクスにしてみましょう。

なお、 String は char のコンテナとも u8 のコンテナとも言えて曖昧ではありますが、用途に合わせてコンテナ型に対する解釈を定めれば一通りになります。文字の列ともバイトの列とも言えるかもしれませんが、文字ともバイトとも言えるものの列ではないですよね。

trait GetFirst<Item> {
    fn first(&self) -> Option<Item>;
}

問題 1 : 型推論が効かなくなるとメソッド記法が使えなくなる

ではこのトレイトを仮に String と Vec<u8> と (i32, i32) に実装してみましょう。

// String を char のコンテナと見て一文字目を返す。
// 返す型は char
impl GetFirst<char> for String {
    fn first(&self) -> Option<char> {
        self.chars().next()
    }
}

// Vec<u8> は言わずもがな u8 のコンテナで、一つ目の要素を返す。
// 返す型は u8
impl GetFirst<u8> for Vec<u8> {
    fn first(&self) -> Option<u8> {
        self.iter().cloned().next()
    }
}

// (i32, i32) を二要素の i32 のコンテナと見て左側を返す。
// 返す型は i32
impl GetFirst<i32> for (i32, i32) {
    fn first(&self) -> Option<i32> {
        Some(self.0)
    }
}

使ってみます:

fn main() {
    let s = String::from("hello");
    println!("{:?}", s.first()); // => Some('h')

    let v = vec![0u8, 1u8, 2u8];
    println!("{:?}", v.first()); // => Some(0)

    let t = (1i32, 2i32);
    println!("{:?}", t.first()); // => Some(1)
}

問題なく実行できますね。しかし、ここにうっかり次のような実装を追加してしまうと問題が見えます。

// String をバイト列のコンテナと見て一バイト目を返す。
// 返す型は u8
impl GetFirst<u8> for String {
    fn first(&self) -> Option<u8> {
        self.bytes().next()
    }
}

うっかりこのような実装を追加してしまうと、 使用箇所で エラーになってしまいます。

error[E0282]: type annotations needed
  --> junk01-19-09.rs:39:24
   |
39 |     println!("{:?}", s.first()); // => Some('h')
   |                        ^^^^^ cannot infer type for `Item`

error: aborting due to previous error

For more information about this error, try `rustc --explain E0282`.

コンパイラが言っていることは至極当然で、 String には GetFirst<char> と GetFirst<u8> の両方が実装されているため、型変数 Item の型を推論できないと言っています。これらを呼びわけるためには戻り値型から推論させるか、メソッド記法を諦めて書き下すしかありません。

println!("{:?}", GetFirst::<char>::first(&s)); // => Some('h')
println!("{:?}", GetFirst::<u8>::first(&s)); // => Some(104)

先ほど s.first() だけで正しくコンパイルできたのは、型 String に対して GetFirst は GetItem<char> しか実装されていなかったために、自動的に Item = char であると 型推論されたから なのです。あくまでも推論に依存しているので、このように複数の候補がある場合など推論できない状況に陥るとエラーになってしまいます。

今回の例では、コンテナが「持つ」とされる要素の型は本来ただ一つであるはずなのに String が char を持つとも u8 を持つともしてしまったためにエラーが起きました。問題はこれが 使用時にエラーになった ということで、型に両方を実装しただけではエラーになりません。それはジェネリクスを使うのが適正なことだってあるから当然です。しかし今回のような場合はそれでは困るので、型引数 Item が異なる GetFirst<Item> を同じ型に対して実装しないように「気をつける」ことでしか対応できません。

また、 GetFirst<Item> がライブラリで定義されているトレイトだったりすると、その用途を誤解したライブラリのユーザーが、同じ型に複数の GetFirst<Item> を実装した上でそれをライブラリとして公開するかもしれません。そうなると本来 GetFirst<Item> が実現したかった意図と実際の使われ方がかけはなれていくこともありえます。

もし Item が関連型になっていれば、この Item の定義は GetFirst を何か型に実装するときになされることとなります。 GetFirst はジェネリクスではありませんから真に単一のトレイトです。すると GetFirst を String に実装できる機会は一度だけですから、 Item も必ず一通りにしかなりません。この型は型により一意に定まるものだという意図も明確にできます。

問題 2 : 他のジェネリクスで制約を設定したいときに型変数が増える

これは実質面倒なだけではありますが、 GetFirst を実装した型を関数で受け取りたいときに余計な型変数が増えます。それはもちろんそうで、ジェネリクスのシステム的には GetFirst<u8> と GetFirst<char> の両方があるかもしれないので、どちらに対しても呼び出せるよう、ジェネリクスにする必要があります。

fn get_first_of<Item, U: GetFirst<Item>>(x: &U) -> Option<Item> {
    x.first()
}

もし Item が関連型になっていれば、 U: GetFirst のみですみます。 U に GetFirst を実装した時点で Item の定義がなされており、必ず一つに定まっているからです。ジェネリクスはトレイトごと (GetFirst<u8> と GetFirst<char> は別のトレイトです) に一つの型を、関連型はそのトレイトを実装する型に一つの型を結び付けるものだと考えてもいいかもしれません。

この程度ならば面倒なくらいですむかもしれませんが、これが増えてくると厄介です。意味のない例ですが、例えば次のようにしなければなりません。

use std::ops::Add;

trait Foo<T, U>
where
    T: Copy + Eq + Ord,
    U: Copy + Eq + Ord + Add<T, Output = U>,
{
    fn foo(x: T, y: U) -> U;
}

struct X;

impl Foo<i32, i32> for X {
    fn foo(_: i32, _: i32) -> i32 {
        42
    }
}

fn bar<T, U, V>(_: V)
where
    T: Copy + Eq + Ord,
    U: Copy + Eq + Ord + Add<T, Output = U>,
    V: Foo<T, U>,
{
}

fn main() {
    bar(X);
}

特に bar() に注目してください。このように、とくにジェネリクスの型変数に制約がある場合などは関数ごとに一々制約ごと書き直さなくてはなりません。ジェネリクスを使うべき場合はもちろん制約が必要となるので仕方がないですが、関連型を使うべき場合、つまり型に対して型変数が一通りに定まる場合は、トレイトの実装時に型が定まっているわけなので、関数を呼び出すごとに確認しなくても、そこできちんと制約に則っていることが分かれば本来それでよいはずです。実際、関連型を使えば

use std::ops::Add;

trait Foo {
    type T: Copy + Eq + Ord;
    type U: Copy + Eq + Ord + Add<Self::T, Output = Self::U>;

    fn foo(x: Self::T, y: Self::U) -> Self::U;
}

struct X;

impl Foo for X {
    type T = i32;
    type U = i32;

    fn foo(_: i32, _: i32) -> i32 {
        42
    }
}

fn bar<V: Foo>(_: V) {}

fn main() {
    bar(X);
}

とかけます。特に bar() は非常にすっきりしたと思います。

参考

Rust の関連型の使いどころ | κeen の Happy Hacκing Blog も参考になるかと思われます。 ↩

Rust の関連型はジェネリクスではだめなのか？