今更だけどサーバリソース余裕だったから計算させてきた
全maruデータ 9,550,906行(除追加分)
うち、sed正規表現での抜き出しに失敗した行 15858+α行
ヒット板数 847
実スレ総数 413,591
みみずんログの1板/434スレ分で生130MB/圧縮30MBらしいから、単純計算で全部で28.6GBか
maruの内容全部切り分けてDBに放り込むとかしてないし、処理サイズかなりでかいから、
処理法の都合で±1%位の誤差はあるだろうけど勘弁
【2chデータTor流出関係】情報集約スレッド●98
■ このスレッドは過去ログ倉庫に格納されています
2013/09/04(水) 06:48:36.15ID:Rj5KwSDE0
■ このスレッドは過去ログ倉庫に格納されています