X


【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1

■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
垢版 |
04/05/03 04:30ID:???
2ちゃんねるの全発言の統計を取ろうに挑戦

bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。

まずは現在空いている oyster138(旧game5)ではじめてみよう計画
04/05/05 04:39ID:88wp+AAg
進化してますねー。
つばめにスレタイも欲しいけど……厳しいだろうしなぁ……。
243FOX ★
垢版 |
04/05/05 04:43ID:???
>>242

その辺は 形が固まってからかと
今は、あるデータをどの様に加工したら便利かを模索中。。。

ってことで
04/05/05 05:08ID:opmkPnWR
そのうち専ブラで見れるようになったらいいなぁ。
245動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 05:13ID:AVSjUnie
>>244
うん、うん。。
BBYのように、見れたらいいねぇ・・
04/05/05 05:55ID:VRkKWxVe
555のせいで分速が実況並になってる
247FOX ★
垢版 |
04/05/05 06:17ID:???
>>167
どんな風に表現する?
248FOX ★
垢版 |
04/05/05 06:39ID:???
>>212
$xxx =~ s/(\d)(\d\d\d)(?!\d)/$1,$2/g;

というのをぐぐって見つけて使っているデ酢
百万のところもカンマつけるにはどうしたらいいの?
249FOX ★
垢版 |
04/05/05 06:41ID:???
$xxx =~ s/(\d)(\d\d\d)(\d\d\d)(?!\d)/$1,$2,$3/g;

こうか?
04/05/05 06:51ID:e0CkQtMj
>>249
http://www.din.or.jp/~ohzaki/perl.htm#NumberWithComma
このあたりですー
04/05/05 07:07ID:r05C2KS5
すごい。いつか本当にこれができそう。
http://qb3.2ch.net/test/read.cgi/operate/1077427399/260
04/05/05 10:39ID:Fbu5SeHY
乙です。

確認事項ですが、>>163だとwiki中の、

「発言時unixtimeとバイト数を掛け合わせた数値.発言バイト数.〜」

じゃなくて

「発言時unixtime.発言処理プロセスID.発言バイト数.〜」

じゃないんでしょうか。
04/05/05 10:43ID:JFU+GiAA
仮想都市「にちゃんねる」とかそんなのが出来るのかな…
ワクワク
04/05/05 10:55ID:7bPYdRO1
>>252
おぉ そうですね
更新しておきました。
04/05/05 11:48ID:???
>>248-249
おいらがずっと前に作った、コンマつけるサブルーチン

sub Comma{
$input = $_[0];
return $input if ($input < 1000);

$input = reverse($input);
$input =~ s/(\d\d\d)/$1,/g;
$input = reverse($input);

return $input;
}
04/05/05 12:09ID:SMCdAKZQ
記念マキコ
04/05/05 12:10ID:Fbu5SeHY
>>254
どうもです。

あと、ちょろっと「現状」の体裁を整えておきました。
04/05/05 12:43ID:QheWwOaA
つばめの「その他」だけベスト20か30まで表示して欲しいと言ってみる
板数多いのに特定の板の雑談スレや狼のスレがいくつも常に10以内に入ってるから
04/05/05 12:50ID:Fbu5SeHY
>FOX 師

たびたびlookup仕様変更になってスマソですが、
●でのカキコフラグもいれられませんかね?

どの板でどれくらい●利用者のカキコがあるかってのもおもしろいかと。
04/05/05 14:08ID:qKcTJOH+
>>259
それおもろそう。
04/05/05 15:20ID:WfoZKfCr
(●´ー`●)板は不要やね
04/05/05 15:23ID:QJ42uJM9
たぶん●板より●の書き込み回数の多い板とかあるんだろうなあ
04/05/05 15:24ID:gcRkPq+m
此の板もそうっぽいね
04/05/05 15:44ID:WfoZKfCr
携帯カキコフラグとかもおもろいかもね。オフ板と携帯板は半数以上だったりして。

docomo.ne.jp、ezweb.ne.jp、jp-*.ne.jp、P*.ppp.prin.ne.jp
04/05/05 16:09ID:RLyQeFyQ
できれば隠し板はカウントに入れて欲しくないと思ってみる今日この頃
04/05/05 17:03ID:Fbu5SeHY
各種フラグをいれるとしてこんなところですか。

・●使用の有無
・携帯からかどうか

・UAフラグ(IE6/IE5/Mozilla(with NN)/safari/opera/その他)

04/05/05 17:04ID:yMqcfq0l
別に良いじゃないかと思って見る今日この頃
04/05/05 17:06ID:dFuPLh4F
>>266
monazillaはその他大勢ですか
04/05/05 17:10ID:Fbu5SeHY
>>268
とりあえず通常ブラウザだけあげてみただけです、スマソ。

で、monazillaはどうしますかね。

・一緒にmonazillaとする
・個々のブラウザごとにわける
04/05/05 17:52ID:pJ9vT2PY
デザイン作てもいいのかなぁ?

>>247
合計 xxxxxx Bytes

書きこみバイト数が多い板TOP50

みたいな。

>>269
ブラウザごとにわけたほうがいいかと。
04/05/05 18:12ID:Fbu5SeHY
>>270
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html

<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
04/05/05 18:14ID:dDde0FIw
個人的にはだけど、あの手の情報公開用文書に「デザイン」は要らないと思う。
04/05/05 18:14ID:Fbu5SeHY
<携帯>(ホスト名判別を入れる?)
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
04/05/05 18:23ID:Fbu5SeHY
monazillaについてですが、結論から言うと、ブラウザ別に分離するのは仕様上無理っぽいです。
なんでmonazillaはmonazillaということで・・・。
04/05/05 18:27ID:/Tguwlaj
UA って必要ですか?
UA が判ると何が嬉しい?
04/05/05 18:37ID:dFuPLh4F
携帯や2chブラウザかだけ判れば充分だと思う。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。

利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
04/05/05 18:39ID:Fbu5SeHY
あとはロボット検索系ですか。
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html

google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)

netscapeは判別可能っぽいです、スマソ。

netscape Netscape
04/05/05 18:45ID:Fbu5SeHY
2chの場合、意外とロボット検索の割合があるはずなので
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。

判定はFOX師次第ですが。
04/05/05 19:06ID:/Tguwlaj
ロボットは、bbs.cgi を叩かないと思う。
04/05/05 20:13ID:PKmYwlM0
携帯:monazilla:その他
の比率だけで十分な予感。
04/05/05 22:25ID:1bcwnQSQ
ゴミ箱はカウントしないようにしてください。
282FOX ★
垢版 |
04/05/05 22:27ID:???
>>281
そういう話か?
なんか違うような、
04/05/05 22:39ID:yMqcfq0l
男と女のひりt;y=ー(゚д゚)・∵. ターン
04/05/06 00:09ID:9o2cBzO1
書き込み内容から空白を取り除いた物のMD5値なんてぇのはどうでしょうか?
コスト高いかな?

定型文爆撃の統計に使えそうですけど。
04/05/06 01:44ID:uWNdeQGD
http://stats.2ch.net/tubame.cgi

pieとidolの板は、bbspink.comにして欲しいです。
(pie.2ch.net、idol.2ch.netになってるです。)
04/05/06 02:29ID:F0AGR43X
板別のスレたて人のホスト統計とか
とれるようになったら、うれしいのです。

なんとなく。
287FOX ★
垢版 |
04/05/06 03:03ID:???
>>174 なんですが。。。

某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに

呼んで欲しいですー

わたし、cronとか良く知らないのでお願いしますー

>root★さん
288root ★
垢版 |
04/05/06 03:59ID:???
これからやります。
-dは、JSTですよね。
289FOX ★
垢版 |
04/05/06 04:00ID:???
はいー
JST ですー

すんませんです。
お手数かけて
290root ★
垢版 |
04/05/06 04:09ID:???
うーむ、PDT/PSTな環境で夏も冬もちゃんと0:01に動かすのって、どうやるんだろ。
今はとりあえずPDTで0:01にしておこう。

で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
291FOX ★
垢版 |
04/05/06 04:13ID:???
あっ
テスト用に print したんだった。
すてちゃっていいですー

今後も print する予定なので < testするとき
292root ★
垢版 |
04/05/06 04:15ID:???
stdout/stderrをでぶぬるに捨てるようにしました。>>291
293FOX ★
垢版 |
04/05/06 04:16ID:???
どもですー
294FOX ★
垢版 |
04/05/06 14:23ID:???
>>281-282

どういうことかと言うと

1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
  正しくカウントしてなきゃ意味無いじゃん

だと思うのだが、
04/05/06 14:24ID:2c6hsSsM
●書き込み統計は不採用ですか・・・・残念。
296動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/06 21:21ID:ZyCM2I0Z
http://stats.2ch.net/karasu.cgi
http://stats.2ch.net/suzume.cgi

繋がらない。
04/05/06 21:26ID:jI4fXdTr
>>296
鯖落ちしてるみたいっすね。
pingかからないです
298FOX ★
垢版 |
04/05/06 21:31ID:???
pie に移しますか、
あした手配します。
299FOX ★
垢版 |
04/05/06 21:32ID:???
まずは bbs.cgi から呼ぶの止めます
300FOX ★
垢版 |
04/05/06 21:43ID:???
ということで bbs.2ch.net は急遽 pie に banana を用意します
メール送りますー > root★さん
04/05/06 21:49ID:+hfFt++i
bananaで大丈夫なの?>memory
302root ★
垢版 |
04/05/06 22:36ID:???
了解です。>>300

で、pekoサーバのbbs.cgiを更新しました。
live8負荷かかってんなぁと思ったら某今井氏出演中か。2ブレーメンぐらいかな。

bbs.2ch.netの用途だけなら、なんとかなるんじゃかなと。>>301
もし足りないようなら、そのときはまた考慮いただくということで。
303FOX ★
垢版 |
04/05/06 22:46ID:???
>>302
メール発射しましたー
DNS の設定はどのように変更すればいいですか?
04/05/06 22:48ID:pSKXJTGU
スレごとの投稿バイトの平均とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも

あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
305root ★
垢版 |
04/05/06 22:48ID:???
>>303
メール受け取りました。これから中身確認します。

今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。

儀式内容はあっちのスレでいきます。
306FOX ★
垢版 |
04/05/06 22:49ID:???
qb2 も含めて呼び出しは全てのサーバで停止しました。
307root ★
垢版 |
04/05/06 22:51ID:???
>>306
了解です。
まずは中身確認させてくださいです。

ごそごそして、準備ができ次第儀式へと。
04/05/06 22:53ID:donbUruI
>304

おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし

だから、レスアンカーを数えてもあまり参考にならないかと・・・・
04/05/06 22:57ID:pSKXJTGU
うんまあその程度しか期待してないけど
04/05/06 23:53ID:V9WCEG22
過去のデータは見られるようになるのか?
04/05/07 00:08ID:ZEwc/ihl
datから起こせるようになるんでは?
物凄い負荷になるかも知れんけど
04/05/07 00:36ID:CUklDSTK
>>310
うしろには振り向かない仕様なので無理です。
04/05/07 00:39ID:3AqajSl0
>>174 >>287 を見る限り予定はあると思うけど、
314root ★
垢版 |
04/05/07 15:15ID:???
ということで、PIEにて再開。

さきほどpekoサーバのbbs.cgiを更新。
315root ★
垢版 |
04/05/07 16:16ID:???
移行して約1時間半。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
316FOX ★
垢版 |
04/05/07 16:28ID:???
今日観察したいのは
昨日まで起こっていた問題が解決されたかどうか、

昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。

取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)

期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
04/05/07 18:16ID:LaK4k1ip
今朝分のカキコ数が累積されてなかったのは
再開前の投稿が反映されてなかっただけね
04/05/07 18:18ID:3AqajSl0
heからPIEに移ってネットワークの詰まりがなくなるため
>>226-227の問題も解決できてると、期待してみよう、
319root ★
垢版 |
04/05/08 01:56ID:???
http://ch2.ath.cx/load/live8.html

やるな。ここのCGIからデータとってるすね。これ。
320FOX ★
垢版 |
04/05/08 01:58ID:???
ええと
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
321root ★
垢版 |
04/05/08 02:01ID:???
もとより>>319の中の人はそのつもりでしょう。

で、>>316、いいかんじすね。ピークでも詰まる様子はみられないし。
04/05/08 02:18ID:yUbs4oTT
>>319
ですです。

>>320
んー、2ちゃんの歴史そのものかなぁ。(笑)<どんどん仕様変更
直ぐに元に戻したりも出来るので、その点は大丈夫です。
04/05/08 02:25ID:zB87dtMl
個人的にはやっぱり生textが欲しかったり(苦笑)

♪tonbi をグラフにしてみようかしらん。
04/05/08 02:26ID:n72bHeAS
そろそろread.cgi/r.i/p.iのも見たいな、と言ってみるてすつ。
04/05/08 02:33ID:yUbs4oTT
>>323
ワクワク。
私の方では、板別には手が出ないです。(´・ω・`)
04/05/08 02:42ID:yUbs4oTT
>>324
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。

内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
327FOX ★
垢版 |
04/05/08 03:19ID:???
移転考察用に

http://stats.2ch.net/karasu2.cgi
04/05/08 03:32ID:n72bHeAS
>>327
それぞれの色はどういう意味ですか?
04/05/08 03:34ID:Uu8N52Jz
おいらでいいなら、
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
04/05/08 03:34ID:Ow75dG29
>>328
青:peko
黄:banana

かと
04/05/08 03:37ID:n72bHeAS
d。
04/05/08 03:45ID:Uu8N52Jz
そういえばpc5だけbananaで白文字だけど、
バックアップ強化とかなんか特殊事情あったっけ、
333FOX ★
垢版 |
04/05/08 03:52ID:???
単に忘れているだけだったりして
334FOX ★
垢版 |
04/05/08 04:31ID:???
kawasemi さんたちは呼ばれていますか? > root★さん
335root ★
垢版 |
04/05/08 04:37ID:???
>>334
>>314 の時点で既にcron仕込んでありますです。
336FOX ★
垢版 |
04/05/08 04:38ID:???
はいー

動いていましたー
04/05/08 04:48ID:LG/h073Q
緑色がumaっすかね。
338FOX ★
垢版 |
04/05/08 05:00ID:???
http://stats.2ch.net/kawasemi-m/
http://stats.2ch.net/kawasemi-m/0total-20040508.txt

毎分更新

23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
04/05/08 05:16ID:zB87dtMl
>>338
おー!
24:00 = 00:00 ではダメなのかな?
340FOX ★
垢版 |
04/05/08 05:22ID:???
>>339
こまいところは、ちとあとまわし、、、
04/05/08 05:22ID:zB87dtMl
あっと、23:59-24:00 の分。って意味ですね。
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
04/05/08 05:28ID:zB87dtMl
手前味噌でスマソですけれども、鯖名もくっつけると鯖毎の集計も楽になるかと。
参照: http://sv2ch.baila6.jp/board/

でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。