2011年8月15日月曜日

stl::vectorのパフォーマンス

いつも適当に書いてしまうので、ちょっとまとめておく。
  • 大きさを指定せずに push_back し続ける。
  • コンストラクトするときに大きさを指定して添字で代入する。
  • reserveで大きさを指定して、push_backする。
のバトル。

#include <iostream>
#include <vector>
#include <algorithm>
#include <boost/timer.hpp>

struct E {
    unsigned int id;
    unsigned char value[1024];
};

struct NonOptimize {
    NonOptimize(const size_t num) : n(num) { }

    inline void operator()() const {
        std::vector<E> v;
        for (size_t i = 0; i < n; ++i) {
            E e = {i};
            v.push_back(e);
        }
    }

    const size_t n;
};

struct ConstructWithSize {
    ConstructWithSize(const size_t num) : n(num) { }

    inline void operator()() const {
        std::vector<E> v(n);
        for (size_t i = 0; i < n; ++i) {
            E e = {i};
            v[i] = e;
        }
    }

    const size_t n;
};

struct Reserved {
    Reserved(const size_t num) : n(num) { }

    inline void operator()() const {
        std::vector<E> v;
        v.reserve(n);
        for (size_t i = 0; i < n; ++i) {
            E e = {i};
            v.push_back(e);
        }
    }

    const size_t n;
};

template <typename F>
inline std::vector<double>& mesure(F& func, std::vector<double>* elapsed) {
    typedef std::vector<double> Results;
    boost::timer timer;
    
    for (Results::iterator i(elapsed->begin()), end(elapsed->end()); i != end; ++i) {
        timer.restart();
        func();
        *i = timer.elapsed();
    }
    return *elapsed;
}

std::ostream& operator<<(std::ostream& os, const std::vector<double>& elapsed) {
    typedef std::vector<double> Results;
    Results::const_iterator max = std::max_element(elapsed.begin(), elapsed.end());
    Results::const_iterator min = std::min_element(elapsed.begin(), elapsed.end());
    double sum(0);;
    for (Results::const_iterator i(elapsed.begin()), end(elapsed.end()); i != end; ++i) {
        if (i != max && i != min) {
            sum += *i;
        }
    }
    os << "MAX: " << *max << ", MIN:" << *min << ", AVG:" << (sum / (elapsed.size() - 2));
    return os;
}

int main(int argc, char **argv) {
    static const size_t NUM(50000);
    boost::timer timer;

    NonOptimize f1(NUM);
    ConstructWithSize f2(NUM);
    Reserved f3(NUM);

    std::cout << argv[0] << std::endl;
    std::vector<double> elapsed(10);
    std::cout << mesure(f1, &elapsed) << std::endl;
    std::cout << mesure(f2, &elapsed) << std::endl;
    std::cout << mesure(f3, &elapsed) << std::endl;

    return 0;
}
で、ビルド。ついでだから llvm でもお試し。
all: main_gnu main_llvm_gnu

main_gnu: main.cc
	g++ $(CXXFLAGS) $< -o $@

main_llvm_gnu: main.cc
	llvm-g++ $(CXXFLAGS) $< -o $@

.PHONY: clean
clean:
	@rm -fv main_gnu main_llvm_gnu

したら、実行。
$ make; ./main_gnu; ./main_llvm_gnu
g++ -O3 -Wall main.cc -o main_gnu
llvm-g++ -O3 -Wall main.cc -o main_llvm_gnu
./main_gnu
MAX: 0.29, MIN:0.26, AVG:0.27875
MAX: 0.18, MIN:0.14, AVG:0.15125
MAX: 0.13, MIN:0.11, AVG:0.1175
./main_llvm_gnu
MAX: 0.25, MIN:0.24, AVG:0.2425
MAX: 0.15, MIN:0.13, AVG:0.13875
MAX: 0.11, MIN:0.1, AVG:0.105

  • 大きさを指定せずに push_back し続ける。
  • コンストラクトするときに大きさを指定して添字で代入する。
  • reserveで大きさを指定して、push_backする。
コンストラクタで大きさを指定した場合、アロケーションしてから、初期値を代入してるんだろうな。
任意値で埋めたいときは、reserveしたほうが吉っぽい。