今更だけどサーバリソース余裕だったから計算させてきた

全maruデータ 9,550,906行(除追加分)
うち、sed正規表現での抜き出しに失敗した行 15858+α行

ヒット板数 847
実スレ総数 413,591

みみずんログの1板/434スレ分で生130MB/圧縮30MBらしいから、単純計算で全部で28.6GBか
maruの内容全部切り分けてDBに放り込むとかしてないし、処理サイズかなりでかいから、
処理法の都合で±1%位の誤差はあるだろうけど勘弁