Super Crunchers の解説サイトを発見!

邦訳は山形浩生の超 訳?でかつリズム感のある文章だが、Super Crunchers がなんで絶対計算者なの?という素朴な疑問は多くの読者が抱えるだろう。それにばっちり応えるサイトを発見!増田 耕一 (MASUDA Kooiti)さんのサイト
「2007年12月、本屋の店頭で日本語版を見た。主題はわたしの仕事とかなり重なりがありそうだ。しかし、日本語版では「絶対計算」という用語がしきりにくりかえされているが、これは回帰(regression)などの統計的推測をさしているらしい。この用語には納得がいかないので、英語版を読むことにした。……「絶対計算」「絶対計算者」の原語は、Super Crunching, Super Cruncherである。ここでSuperは、処理するデータの量が常識はずれに大きいことをさす。 2007年現在のめやすは1テラバイト(1兆バイト)以上である。ただしデータ量は1〜2年ごとに倍になる。「crunching」はここではnumber crunchingの略であり、数値データを計算処理することをさしている。……「number crunching」を日本語に訳すのは確かにむずかしい。「number」はここでは数値データをさすのだが、日常語では「数字」と言いそうなところだ。「crunch」は「すりつぶす」とか「か[噛]む」とかいう意味だが、「...つぶし」では違った意味になってしまうし、「...かみ」では一瞬かみつくだけのようにも思われる。もちつきあるいは鍛冶[かじ]屋にたとえられるかとも思ったが、「数字つき」とか「数字鍛冶」と言っても説明しないとわからない。仮に、継続性をくりかえしで表現して、「数字かみかみ」としておこう。 Super Cruncherは「超大型数字かみかみ屋」とでもしておこう。……データのかみかたにもいろいろあるが、著者が重視する方法はまず回帰である。これが非常に強力だというのが著者がいちばん主張したいことのようだが、比較の相手は個人の経験と主観による方法だ。……自然科学者から見ると、回帰は経験的方法の典型であって、個人の主観による方法と比べれば客観的にはちがいないが、とても「絶対」などというものではない。(これが最初に述べた日本語訳への不満だ。) 「絶対」という表現がふさわしいのは、論理あるいは基本的物理法則にもとづく方法だ。 (いつも「絶対的」方法だけで問題が解決されるわけではないので、次善の策として「経験的」な方法もよく使うのだが。)……回帰のほかに、実験計画法(設定をランダム化すること)も重視されている。また、ベイズの定理とニューラルネットが紹介されている。 (著者がベイズ流と頻度確率論の区別をよく理解しているかどうか疑問だ。わたしもよく理解していないが。)……回帰を重視する背景にもなっていると思うが、著者は多くのものごとが正規分布に従うと思っている。指数関数など理解していないだろう子どもに「数量の95%は平均値±2×標準偏差におさまる」という知識を教えてしまうほどだ。これは、多くのものごとは正規分布でなくべき乗則(分布関数としては「指数分布」というべきか)に従うと主張するTALEB (2007)とは対照的だ。注目する変数が違うからだろうが、両方とも我田引水ではないだろうか? (ただし、確率微分方程式などによる時間発展の予測を勧めない点では両者の議論は似ているかもしれない。)」(出典:)。