X



トップページ運用情報
1001コメント239KB
【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
0001FOX ★
垢版 |
04/05/03 04:30ID:???
2ちゃんねるの全発言の統計を取ろうに挑戦

bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。

まずは現在空いている oyster138(旧game5)ではじめてみよう計画
0201FOX ★
垢版 |
04/05/04 21:30ID:???
>>186
ふむふむ
ということは、今一番書き込まれているスレッドのランキング等は
どうせ使い捨てだからオンメモリーでやっちゃえばいいのか、

20 位くらいまであればいいですよね?
live あり版となし版くらいにわけて
0202root ★
垢版 |
04/05/04 21:30ID:???
落ち着いたら、サーバ別あたりをグラフにとってみようかなと。
うまくできるようなら、bbs.cgi起動数は各サーバでとる必要がなくなるということで。
0204▲ 某ソレ511
垢版 |
04/05/04 21:38ID:/glRN505
>>200
最近過疎板のさらなる過疎化(レス数の減少)が進んでるっぽいんですよね、
あと、レス数が少ない板としては、規制情報を別にすれば
ダントツにグッズリスト板が少ないですねぇ。
他の板は1週間に少なくとも100レスはついてるのにグッズリスト板は
1週間に20〜30レス前後という、、
0205動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 21:42ID:xaPinMdF
>204
そういう過疎板なんですけど板のしての役目は終わったんじゃないかと思います。
PIEへ本格引っ越し前に板の見直し等やった方がいいんじゃないかと思われ
0206▲ 某ソレ511
垢版 |
04/05/04 21:52ID:/glRN505
>>205
2ちゃんねるガイドからして「人が少ないから」という理由での閉鎖は却下ですから。
住人からの要請があった場合は別かもしれないけどそこには手をつけないほうがいいかと。
>>203
HTMLデザインを作って送ってみるとか(素
0211動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 22:12ID:3l40ql6A
特化係数を出してくれないか?
ランキングだけ見せられてもようわからん。

特化係数=((短期間のある板の書き込み数)/(短期間の全体の書き込み数))/((長期間のある板の書き込み数)/(長期間の全体の書き込み数))

これをやるとどこで特徴的に書き込み数多いかわかるはず。
わり算を使っているから過疎板だと過敏に反応しそうだけど。
0212名無しお兄ちゃん……大好きv ◆XB8eKarenE
垢版 |
04/05/04 22:26ID:h5o54svo
すずめの本日の発言数、
百万のところのカンマが抜けてますー

>>210
450位でようやく100%……大きすぎでは?
というか、今でも800x600でウェブ見てる人も居るんで見放さないでくだちい。。。

>>211
何の特化係数ですか?
短期間=5分くらい & 長期間=1週間 くらいにすると、
祭りがどこで起きてるのかの判定には使えそうですけど……。
0215動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 23:43ID:AZIx/j9H
また、便秘になったみたい・・・
0218動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 00:27ID:0bDz/uTo
>>217
すばらしいぃ・・・
0219ぼるじょあ ◆yBEncckFOU
垢版 |
04/05/05 00:31ID:+m9Rxeay
ページを表示できません

検索中のページは現在、利用できません。Web サイトに技術的な問題が発
生しているか、ブラウザの設定を調整する必要があります。
0226▲ 某ソレ511
垢版 |
04/05/05 00:45ID:gcRkPq+m
stats.2ch.netはPIEじゃなくてheにあるgame5の再利用ですよ。
っていってるうちに直ったようですね。
しかし、なんかこの止まって直った直後に、すずめとかの値が
ちょっと増えすぎてるような気がするんだけど、、
例えば、止まる前は32000レス@18分くらいだったのに急に240000@43分になったり。
1750レス/分→5600レス/分なんだよなぁ、どっかで処理がループしてるんじゃ、、
0227root ★
垢版 |
04/05/05 00:52ID:???
うーむ、、、。データのはけが悪いために、DNSがリトライしているとかか。

正直ここまでデータのはけが悪いと、かなりつらいかも。
ここでMRTGとかRTG入れてグラフ表示しようかなとか思ってたんですが、
この状況ではとても無理な予感。
0228FOX ★
垢版 |
04/05/05 01:24ID:???
ティーショットが飛ばないと

クラブが悪いとか、
いっしょに回っているメンバーが悪いとか

野球の監督でチームが負けたら

選手が悪いとか
フロントが悪いとか

ないものねだりは無意味かと、
どうせ望むものは手に入りません。
狭い空き地でも、みんなで遊んでいるのが面白いンであって
0233動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 03:03ID:AVSjUnie
>>232
ニュー速は『その他』なんですねぇ・・・
まぁ、雑談カテですしねぇ・・・(w
0235FOX ★
垢版 |
04/05/05 03:28ID:???
入れますか、
0236動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 03:34ID:AVSjUnie
>>234
ご指摘ありがとうございます・・・
ニュースカテに戻っていたのですねぇ・・・
0237ぼるじょあ ◆yBEncckFOU
垢版 |
04/05/05 03:36ID:+m9Rxeay
おおおっ
ツバメいつの間にかスレに飛べるようになってるのねン☆

余は満足じゃ
0238動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 03:39ID:AVSjUnie
>>235
早速の変更、お疲れさまです・・・
ニュー速が『NEWS』に入ると、目立ちますねぇ・・・
『その他』に、いろんな板がはいって、
興味深いですねぇ・・・
0240FOX ★
垢版 |
04/05/05 03:47ID:???
右の数字が過去一分間に付いたレスの数です

つまり分速です
0243FOX ★
垢版 |
04/05/05 04:43ID:???
>>242

その辺は 形が固まってからかと
今は、あるデータをどの様に加工したら便利かを模索中。。。

ってことで
0245動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 05:13ID:AVSjUnie
>>244
うん、うん。。
BBYのように、見れたらいいねぇ・・
0247FOX ★
垢版 |
04/05/05 06:17ID:???
>>167
どんな風に表現する?
0248FOX ★
垢版 |
04/05/05 06:39ID:???
>>212
$xxx =~ s/(\d)(\d\d\d)(?!\d)/$1,$2/g;

というのをぐぐって見つけて使っているデ酢
百万のところもカンマつけるにはどうしたらいいの?
0249FOX ★
垢版 |
04/05/05 06:41ID:???
$xxx =~ s/(\d)(\d\d\d)(\d\d\d)(?!\d)/$1,$2,$3/g;

こうか?
0252▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 10:39ID:Fbu5SeHY
乙です。

確認事項ですが、>>163だとwiki中の、

「発言時unixtimeとバイト数を掛け合わせた数値.発言バイト数.〜」

じゃなくて

「発言時unixtime.発言処理プロセスID.発言バイト数.〜」

じゃないんでしょうか。
0255サザン ★
垢版 |
04/05/05 11:48ID:???
>>248-249
おいらがずっと前に作った、コンマつけるサブルーチン

sub Comma{
$input = $_[0];
return $input if ($input < 1000);

$input = reverse($input);
$input =~ s/(\d\d\d)/$1,/g;
$input = reverse($input);

return $input;
}
0258動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 12:43ID:QheWwOaA
つばめの「その他」だけベスト20か30まで表示して欲しいと言ってみる
板数多いのに特定の板の雑談スレや狼のスレがいくつも常に10以内に入ってるから
0259▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 12:50ID:Fbu5SeHY
>FOX 師

たびたびlookup仕様変更になってスマソですが、
●でのカキコフラグもいれられませんかね?

どの板でどれくらい●利用者のカキコがあるかってのもおもしろいかと。
0264動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 15:44ID:WfoZKfCr
携帯カキコフラグとかもおもろいかもね。オフ板と携帯板は半数以上だったりして。

docomo.ne.jp、ezweb.ne.jp、jp-*.ne.jp、P*.ppp.prin.ne.jp
0266▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 17:03ID:Fbu5SeHY
各種フラグをいれるとしてこんなところですか。

・●使用の有無
・携帯からかどうか

・UAフラグ(IE6/IE5/Mozilla(with NN)/safari/opera/その他)

0269▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 17:10ID:Fbu5SeHY
>>268
とりあえず通常ブラウザだけあげてみただけです、スマソ。

で、monazillaはどうしますかね。

・一緒にmonazillaとする
・個々のブラウザごとにわける
0271▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 18:12ID:Fbu5SeHY
>>270
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html

<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
0274▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 18:23ID:Fbu5SeHY
monazillaについてですが、結論から言うと、ブラウザ別に分離するのは仕様上無理っぽいです。
なんでmonazillaはmonazillaということで・・・。
0276動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/05 18:37ID:dFuPLh4F
携帯や2chブラウザかだけ判れば充分だと思う。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。

利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
0277▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 18:39ID:Fbu5SeHY
あとはロボット検索系ですか。
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html

google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)

netscapeは判別可能っぽいです、スマソ。

netscape Netscape
0278▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
垢版 |
04/05/05 18:45ID:Fbu5SeHY
2chの場合、意外とロボット検索の割合があるはずなので
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。

判定はFOX師次第ですが。
0282FOX ★
垢版 |
04/05/05 22:27ID:???
>>281
そういう話か?
なんか違うような、
0284動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/06 00:09ID:9o2cBzO1
書き込み内容から空白を取り除いた物のMD5値なんてぇのはどうでしょうか?
コスト高いかな?

定型文爆撃の統計に使えそうですけど。
0287FOX ★
垢版 |
04/05/06 03:03ID:???
>>174 なんですが。。。

某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに

呼んで欲しいですー

わたし、cronとか良く知らないのでお願いしますー

>root★さん
0288root ★
垢版 |
04/05/06 03:59ID:???
これからやります。
-dは、JSTですよね。
0289FOX ★
垢版 |
04/05/06 04:00ID:???
はいー
JST ですー

すんませんです。
お手数かけて
0290root ★
垢版 |
04/05/06 04:09ID:???
うーむ、PDT/PSTな環境で夏も冬もちゃんと0:01に動かすのって、どうやるんだろ。
今はとりあえずPDTで0:01にしておこう。

で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
0291FOX ★
垢版 |
04/05/06 04:13ID:???
あっ
テスト用に print したんだった。
すてちゃっていいですー

今後も print する予定なので < testするとき
0292root ★
垢版 |
04/05/06 04:15ID:???
stdout/stderrをでぶぬるに捨てるようにしました。>>291
0293FOX ★
垢版 |
04/05/06 04:16ID:???
どもですー
0294FOX ★
垢版 |
04/05/06 14:23ID:???
>>281-282

どういうことかと言うと

1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
  正しくカウントしてなきゃ意味無いじゃん

だと思うのだが、
0298FOX ★
垢版 |
04/05/06 21:31ID:???
pie に移しますか、
あした手配します。
0299FOX ★
垢版 |
04/05/06 21:32ID:???
まずは bbs.cgi から呼ぶの止めます
0300FOX ★
垢版 |
04/05/06 21:43ID:???
ということで bbs.2ch.net は急遽 pie に banana を用意します
メール送りますー > root★さん
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況