2ちゃんねるの全発言の統計を取ろうに挑戦
bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。
まずは現在空いている oyster138(旧game5)ではじめてみよう計画
【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
04/05/03 04:30ID:???243FOX ★
04/05/05 04:43ID:???04/05/05 05:08ID:opmkPnWR
そのうち専ブラで見れるようになったらいいなぁ。
245動け動けウゴウゴ2ちゃんねる
04/05/05 05:13ID:AVSjUnie04/05/05 05:55ID:VRkKWxVe
555のせいで分速が実況並になってる
247FOX ★
04/05/05 06:17ID:??? >>167
どんな風に表現する?
どんな風に表現する?
248FOX ★
04/05/05 06:39ID:???249FOX ★
04/05/05 06:41ID:??? $xxx =~ s/(\d)(\d\d\d)(\d\d\d)(?!\d)/$1,$2,$3/g;
こうか?
こうか?
250※ ◆baila6uPTo
04/05/05 06:51ID:e0CkQtMj04/05/05 07:07ID:r05C2KS5
すごい。いつか本当にこれができそう。
http://qb3.2ch.net/test/read.cgi/operate/1077427399/260
http://qb3.2ch.net/test/read.cgi/operate/1077427399/260
252▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 10:39ID:Fbu5SeHY 乙です。
確認事項ですが、>>163だとwiki中の、
「発言時unixtimeとバイト数を掛け合わせた数値.発言バイト数.〜」
じゃなくて
「発言時unixtime.発言処理プロセスID.発言バイト数.〜」
じゃないんでしょうか。
確認事項ですが、>>163だとwiki中の、
「発言時unixtimeとバイト数を掛け合わせた数値.発言バイト数.〜」
じゃなくて
「発言時unixtime.発言処理プロセスID.発言バイト数.〜」
じゃないんでしょうか。
253ヾ●ノ゛ ◆NATTOSpTC2
04/05/05 10:43ID:JFU+GiAA 仮想都市「にちゃんねる」とかそんなのが出来るのかな…
ワクワク
ワクワク
255サザン ★
04/05/05 11:48ID:??? >>248-249
おいらがずっと前に作った、コンマつけるサブルーチン
sub Comma{
$input = $_[0];
return $input if ($input < 1000);
$input = reverse($input);
$input =~ s/(\d\d\d)/$1,/g;
$input = reverse($input);
return $input;
}
おいらがずっと前に作った、コンマつけるサブルーチン
sub Comma{
$input = $_[0];
return $input if ($input < 1000);
$input = reverse($input);
$input =~ s/(\d\d\d)/$1,/g;
$input = reverse($input);
return $input;
}
04/05/05 12:09ID:SMCdAKZQ
記念マキコ
257▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 12:10ID:Fbu5SeHY04/05/05 12:43ID:QheWwOaA
つばめの「その他」だけベスト20か30まで表示して欲しいと言ってみる
板数多いのに特定の板の雑談スレや狼のスレがいくつも常に10以内に入ってるから
板数多いのに特定の板の雑談スレや狼のスレがいくつも常に10以内に入ってるから
259▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 12:50ID:Fbu5SeHY >FOX 師
たびたびlookup仕様変更になってスマソですが、
●でのカキコフラグもいれられませんかね?
どの板でどれくらい●利用者のカキコがあるかってのもおもしろいかと。
たびたびlookup仕様変更になってスマソですが、
●でのカキコフラグもいれられませんかね?
どの板でどれくらい●利用者のカキコがあるかってのもおもしろいかと。
04/05/05 14:08ID:qKcTJOH+
>>259
それおもろそう。
それおもろそう。
04/05/05 15:20ID:WfoZKfCr
(●´ー`●)板は不要やね
04/05/05 15:23ID:QJ42uJM9
たぶん●板より●の書き込み回数の多い板とかあるんだろうなあ
263▲ 某ソレ511
04/05/05 15:24ID:gcRkPq+m 此の板もそうっぽいね
04/05/05 15:44ID:WfoZKfCr
携帯カキコフラグとかもおもろいかもね。オフ板と携帯板は半数以上だったりして。
docomo.ne.jp、ezweb.ne.jp、jp-*.ne.jp、P*.ppp.prin.ne.jp
docomo.ne.jp、ezweb.ne.jp、jp-*.ne.jp、P*.ppp.prin.ne.jp
04/05/05 16:09ID:RLyQeFyQ
できれば隠し板はカウントに入れて欲しくないと思ってみる今日この頃
266▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 17:03ID:Fbu5SeHY 各種フラグをいれるとしてこんなところですか。
・●使用の有無
・携帯からかどうか
・UAフラグ(IE6/IE5/Mozilla(with NN)/safari/opera/その他)
・●使用の有無
・携帯からかどうか
・UAフラグ(IE6/IE5/Mozilla(with NN)/safari/opera/その他)
04/05/05 17:04ID:yMqcfq0l
別に良いじゃないかと思って見る今日この頃
04/05/05 17:06ID:dFuPLh4F
>>266
monazillaはその他大勢ですか
monazillaはその他大勢ですか
269▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 17:10ID:Fbu5SeHY2702chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/05 17:52ID:pJ9vT2PY271▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:12ID:Fbu5SeHY >>270
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html
<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html
<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
04/05/05 18:14ID:dDde0FIw
個人的にはだけど、あの手の情報公開用文書に「デザイン」は要らないと思う。
273▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:14ID:Fbu5SeHY <携帯>(ホスト名判別を入れる?)
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
274▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:23ID:Fbu5SeHY monazillaについてですが、結論から言うと、ブラウザ別に分離するのは仕様上無理っぽいです。
なんでmonazillaはmonazillaということで・・・。
なんでmonazillaはmonazillaということで・・・。
04/05/05 18:27ID:/Tguwlaj
UA って必要ですか?
UA が判ると何が嬉しい?
UA が判ると何が嬉しい?
04/05/05 18:37ID:dFuPLh4F
携帯や2chブラウザかだけ判れば充分だと思う。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。
利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。
利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
277▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:39ID:Fbu5SeHY あとはロボット検索系ですか。
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html
google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)
netscapeは判別可能っぽいです、スマソ。
netscape Netscape
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html
google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)
netscapeは判別可能っぽいです、スマソ。
netscape Netscape
278▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:45ID:Fbu5SeHY 2chの場合、意外とロボット検索の割合があるはずなので
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。
判定はFOX師次第ですが。
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。
判定はFOX師次第ですが。
04/05/05 19:06ID:/Tguwlaj
ロボットは、bbs.cgi を叩かないと思う。
04/05/05 20:13ID:PKmYwlM0
携帯:monazilla:その他
の比率だけで十分な予感。
の比率だけで十分な予感。
04/05/05 22:25ID:1bcwnQSQ
ゴミ箱はカウントしないようにしてください。
282FOX ★
04/05/05 22:27ID:???04/05/05 22:39ID:yMqcfq0l
男と女のひりt;y=ー(゚д゚)・∵. ターン
04/05/06 00:09ID:9o2cBzO1
書き込み内容から空白を取り除いた物のMD5値なんてぇのはどうでしょうか?
コスト高いかな?
定型文爆撃の統計に使えそうですけど。
コスト高いかな?
定型文爆撃の統計に使えそうですけど。
04/05/06 01:44ID:uWNdeQGD
04/05/06 02:29ID:F0AGR43X
板別のスレたて人のホスト統計とか
とれるようになったら、うれしいのです。
なんとなく。
とれるようになったら、うれしいのです。
なんとなく。
287FOX ★
04/05/06 03:03ID:??? >>174 なんですが。。。
某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに
呼んで欲しいですー
わたし、cronとか良く知らないのでお願いしますー
>root★さん
某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに
呼んで欲しいですー
わたし、cronとか良く知らないのでお願いしますー
>root★さん
288root ★
04/05/06 03:59ID:??? これからやります。
-dは、JSTですよね。
-dは、JSTですよね。
289FOX ★
04/05/06 04:00ID:??? はいー
JST ですー
すんませんです。
お手数かけて
JST ですー
すんませんです。
お手数かけて
290root ★
04/05/06 04:09ID:??? うーむ、PDT/PSTな環境で夏も冬もちゃんと0:01に動かすのって、どうやるんだろ。
今はとりあえずPDTで0:01にしておこう。
で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
今はとりあえずPDTで0:01にしておこう。
で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
291FOX ★
04/05/06 04:13ID:??? あっ
テスト用に print したんだった。
すてちゃっていいですー
今後も print する予定なので < testするとき
テスト用に print したんだった。
すてちゃっていいですー
今後も print する予定なので < testするとき
293FOX ★
04/05/06 04:16ID:??? どもですー
294FOX ★
04/05/06 14:23ID:??? >>281-282
どういうことかと言うと
1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
正しくカウントしてなきゃ意味無いじゃん
だと思うのだが、
どういうことかと言うと
1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
正しくカウントしてなきゃ意味無いじゃん
だと思うのだが、
295▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/06 14:24ID:2c6hsSsM ●書き込み統計は不採用ですか・・・・残念。
296動け動けウゴウゴ2ちゃんねる
04/05/06 21:21ID:ZyCM2I0Z04/05/06 21:26ID:jI4fXdTr
298FOX ★
04/05/06 21:31ID:??? pie に移しますか、
あした手配します。
あした手配します。
299FOX ★
04/05/06 21:32ID:??? まずは bbs.cgi から呼ぶの止めます
300FOX ★
04/05/06 21:43ID:??? ということで bbs.2ch.net は急遽 pie に banana を用意します
メール送りますー > root★さん
メール送りますー > root★さん
3012chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/06 21:49ID:+hfFt++i bananaで大丈夫なの?>memory
302root ★
04/05/06 22:36ID:???303FOX ★
04/05/06 22:46ID:???04/05/06 22:48ID:pSKXJTGU
スレごとの投稿バイトの平均とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも
あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも
あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
305root ★
04/05/06 22:48ID:??? >>303
メール受け取りました。これから中身確認します。
今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。
儀式内容はあっちのスレでいきます。
メール受け取りました。これから中身確認します。
今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。
儀式内容はあっちのスレでいきます。
306FOX ★
04/05/06 22:49ID:??? qb2 も含めて呼び出しは全てのサーバで停止しました。
04/05/06 22:53ID:donbUruI
>304
おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし
だから、レスアンカーを数えてもあまり参考にならないかと・・・・
おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし
だから、レスアンカーを数えてもあまり参考にならないかと・・・・
04/05/06 22:57ID:pSKXJTGU
うんまあその程度しか期待してないけど
310動け2ちゃんねる
04/05/06 23:53ID:V9WCEG22 過去のデータは見られるようになるのか?
04/05/07 00:08ID:ZEwc/ihl
datから起こせるようになるんでは?
物凄い負荷になるかも知れんけど
物凄い負荷になるかも知れんけど
314root ★
04/05/07 15:15ID:??? ということで、PIEにて再開。
さきほどpekoサーバのbbs.cgiを更新。
さきほどpekoサーバのbbs.cgiを更新。
315root ★
04/05/07 16:16ID:??? 移行して約1時間半。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
316FOX ★
04/05/07 16:28ID:??? 今日観察したいのは
昨日まで起こっていた問題が解決されたかどうか、
昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。
取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)
期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
昨日まで起こっていた問題が解決されたかどうか、
昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。
取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)
期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
04/05/07 18:16ID:LaK4k1ip
今朝分のカキコ数が累積されてなかったのは
再開前の投稿が反映されてなかっただけね
再開前の投稿が反映されてなかっただけね
319root ★
04/05/08 01:56ID:???320FOX ★
04/05/08 01:58ID:??? ええと
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
04/05/08 02:18ID:yUbs4oTT
323未承諾広告※ ◆TWARamEjuA
04/05/08 02:25ID:zB87dtMl 個人的にはやっぱり生textが欲しかったり(苦笑)
♪tonbi をグラフにしてみようかしらん。
♪tonbi をグラフにしてみようかしらん。
04/05/08 02:26ID:n72bHeAS
そろそろread.cgi/r.i/p.iのも見たいな、と言ってみるてすつ。
04/05/08 02:33ID:yUbs4oTT
04/05/08 02:42ID:yUbs4oTT
>>324
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。
内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。
内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
327FOX ★
04/05/08 03:19ID:???04/05/08 03:32ID:n72bHeAS
>>327
それぞれの色はどういう意味ですか?
それぞれの色はどういう意味ですか?
329▲ 某ソレ511
04/05/08 03:34ID:Uu8N52Jz おいらでいいなら、
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
04/05/08 03:34ID:Ow75dG29
04/05/08 03:37ID:n72bHeAS
d。
332▲ 某ソレ511
04/05/08 03:45ID:Uu8N52Jz そういえばpc5だけbananaで白文字だけど、
バックアップ強化とかなんか特殊事情あったっけ、
バックアップ強化とかなんか特殊事情あったっけ、
333FOX ★
04/05/08 03:52ID:??? 単に忘れているだけだったりして
334FOX ★
04/05/08 04:31ID:??? kawasemi さんたちは呼ばれていますか? > root★さん
336FOX ★
04/05/08 04:38ID:??? はいー
動いていましたー
動いていましたー
04/05/08 04:48ID:LG/h073Q
緑色がumaっすかね。
338FOX ★
04/05/08 05:00ID:??? http://stats.2ch.net/kawasemi-m/
http://stats.2ch.net/kawasemi-m/0total-20040508.txt
毎分更新
23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
http://stats.2ch.net/kawasemi-m/0total-20040508.txt
毎分更新
23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
340FOX ★
04/05/08 05:22ID:??? >>339
こまいところは、ちとあとまわし、、、
こまいところは、ちとあとまわし、、、
341未承諾広告※ ◆TWARamEjuA
04/05/08 05:22ID:zB87dtMl あっと、23:59-24:00 の分。って意味ですね。
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
342未承諾広告※ ◆TWARamEjuA
04/05/08 05:28ID:zB87dtMl 手前味噌でスマソですけれども、鯖名もくっつけると鯖毎の集計も楽になるかと。
参照: http://sv2ch.baila6.jp/board/
でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
参照: http://sv2ch.baila6.jp/board/
でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
■ このスレッドは過去ログ倉庫に格納されています