【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
2ちゃんねるの全発言の統計を取ろうに挑戦 bbs.cgi に一個DNS問い合わせの処理を追加 発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up この方法でやるとかなり低コストで出来る予感。 まずは現在空いている oyster138(旧game5)ではじめてみよう計画 >>169 とんびを見ると、 プロ野球板baseで実況しているのが、 わかるねぇ・・・ ところで、バイト数や鯖名がたまに紛れ込んでますが、 これはすぐになおるかな、 >>172 いやあの、デーゲームだった試合も3試合ほどありますよ、、 とは言っても確かに実況してそうなスレはありますがね、 データを蓄積していく上で必要なのは 毎日 0:01 に呼ばれる処理 (一日の集計 & お掃除) 毎時 N:01 に呼ばれる処理 N分毎に呼ばれる処理 この三つかしら、(これらはPerlで書くか、) どのくらいの時間の集計なんだろ?>とんび baseは実況かな? >>173 何度か見てみると実況してるのがよく分かる。 >>173 データ形式を変更したので・・・ お掃除しました 4649 575 801 のデータもしっかり消えてしまった。 >>176 いや、してるって分かるけどね、審判スレとか劇場スレとか。 >169 とんびのこの時間って、過去何分ですか? それとは別に、要望としては過去10分の投稿数+投稿IP数キボン。 というわけでフォーマットが変わったので、 Wikiのほうを更新いただけると。 @40000000409781ca359406bc 26729091:3c1e:db37 + 0001 1083670976.63248.21.1083670501.livebase.live12.2ch.net.bbs.bbs.2ch.net @40000000409781ca382279cc d8dad9b3:e038:b61a + 0001 1083670975.754.62.1081403915.siki.hobby3.2ch.net.bbs.bbs.2ch.net @40000000409781ca38a8824c 26729091:77ae:3372 + 0001 1083670976.63238.76.1083670763.livebase.live12.2ch.net.bbs.bbs.2ch.net @40000000409781ca3aeab9bc 267289eb:50df:8729 + 0001 1083670976.56043.129.1083670787.liveanb.live8.2ch.net.bbs.bbs.2ch.net @40000000409781cb002bcce4 267289e9:468b:e816 + 0001 1083670976.45872.38.1083668481.livecx.live10.2ch.net.bbs.bbs.2ch.net @40000000409781cb01b0e25c d8dad9b3:2020:f4fe + 0001 1083670976.20567.16.1083196120.football.sports4.2ch.net.bbs.bbs.2ch.net この時間の発言数 95,709 (2004/05/04 20:59:40 現在) この時間の発言数 0 (2004/05/04 21:00:08 現在) この時間の発言数 0 (2004/05/04 21:02:08 現在) クリアされて2分、発言0。ありえない〜 毎回時間取得しなきゃだめなのかー つまり毎回呼ばれるんじゃなく ずーと常駐していると、 なおしてきますー >>185 bbyと違って毎回呼び出すようにするとコストがとても高くなるので (何せ全サーバのbbs.cgi起動数分)、 パイプ型でずっと常駐するように設定してますです。 >>186 了解ですー 毎回時刻とるように改造したつもり クリアされてからすぐの時間だと、 伸びっぷりがよーくわかってほそろしいですねぇ。 >>190 しょっちゅうネットワーク詰まるです。昨日も詰まりました。 例のHE問題と思われ。 上がったかな。マシンは落ちてないすね。 %uptime 5:15AM up 15:44, 2 users, load averages: 0.05, 0.06, 0.06 この数値の跳ね上がりは 誰かがどこかの段階で自動的にリトライかけるからですかねぇ 書き込む人もリトライするし・・・ 10分くらいリロードしないと、総発言数が万単位で増えているのが、怖いよなぁ。 GWのゴールデンタイムだから? ついでに、baseの増え方みていると、とも子入れられないか、よけいな心配してみたり。 この時間は秒速25レスくらい(1分で1500レス相当)ついてるね。 >>186 ふむふむ ということは、今一番書き込まれているスレッドのランキング等は どうせ使い捨てだからオンメモリーでやっちゃえばいいのか、 20 位くらいまであればいいですよね? live あり版となし版くらいにわけて 落ち着いたら、サーバ別あたりをグラフにとってみようかなと。 うまくできるようなら、bbs.cgi起動数は各サーバでとる必要がなくなるということで。 どでもいいけど、総バイト数は何処へ・・・。 あと、HTMLデザインももにょもにょ・・・。 >>200 最近過疎板のさらなる過疎化(レス数の減少)が進んでるっぽいんですよね、 あと、レス数が少ない板としては、規制情報を別にすれば ダントツにグッズリスト板が少ないですねぇ。 他の板は1週間に少なくとも100レスはついてるのにグッズリスト板は 1週間に20〜30レス前後という、、 >204 そういう過疎板なんですけど板のしての役目は終わったんじゃないかと思います。 PIEへ本格引っ越し前に板の見直し等やった方がいいんじゃないかと思われ >>205 2ちゃんねるガイドからして「人が少ないから」という理由での閉鎖は却下ですから。 住人からの要請があった場合は別かもしれないけどそこには手をつけないほうがいいかと。 >>203 HTMLデザインを作って送ってみるとか(素 newsplusの他にnews5ってありますね。 ゴミ箱かなにか? >>208 おおぉ、そうだったのかー。ありがとうございます(テレ また落ちてる? >206 うーん、font−size:250−順位÷3(端数切り捨て)% 特化係数を出してくれないか? ランキングだけ見せられてもようわからん。 特化係数=((短期間のある板の書き込み数)/(短期間の全体の書き込み数))/((長期間のある板の書き込み数)/(長期間の全体の書き込み数)) これをやるとどこで特徴的に書き込み数多いかわかるはず。 わり算を使っているから過疎板だと過敏に反応しそうだけど。 すずめの本日の発言数、 百万のところのカンマが抜けてますー >>210 450位でようやく100%……大きすぎでは? というか、今でも800x600でウェブ見てる人も居るんで見放さないでくだちい。。。 >>211 何の特化係数ですか? 短期間=5分くらい & 長期間=1週間 くらいにすると、 祭りがどこで起きてるのかの判定には使えそうですけど……。 おー やっぱのべ100万いくのかぁ 一割はアレだけどne 1分間で約1700の発言。 今の時間にそれ以上の人がPCに向かって2chやってるわけだ ページを表示できません 検索中のページは現在、利用できません。Web サイトに技術的な問題が発 生しているか、ブラウザの設定を調整する必要があります。 >>217 見れませぬ。 てゆうか野鳥全部見れない stats.2ch.netはPIEじゃなくてheにあるgame5の再利用ですよ。 っていってるうちに直ったようですね。 しかし、なんかこの止まって直った直後に、すずめとかの値が ちょっと増えすぎてるような気がするんだけど、、 例えば、止まる前は32000レス@18分くらいだったのに急に240000@43分になったり。 1750レス/分→5600レス/分なんだよなぁ、どっかで処理がループしてるんじゃ、、 うーむ、、、。データのはけが悪いために、DNSがリトライしているとかか。 正直ここまでデータのはけが悪いと、かなりつらいかも。 ここでMRTGとかRTG入れてグラフ表示しようかなとか思ってたんですが、 この状況ではとても無理な予感。 ティーショットが飛ばないと クラブが悪いとか、 いっしょに回っているメンバーが悪いとか 野球の監督でチームが負けたら 選手が悪いとか フロントが悪いとか ないものねだりは無意味かと、 どうせ望むものは手に入りません。 狭い空き地でも、みんなで遊んでいるのが面白いンであって >>228 おっ。めづらしい。 どでもいいけどHTMLデザインつくってイイデスカ >>232 ニュー速は『その他』なんですねぇ・・・ まぁ、雑談カテですしねぇ・・・(w >>233 N即は今でもニュースカテゴリだよ。 鯖がex4だけど。 >>234 ご指摘ありがとうございます・・・ ニュースカテに戻っていたのですねぇ・・・ おおおっ ツバメいつの間にかスレに飛べるようになってるのねン☆ 余は満足じゃ >>235 早速の変更、お疲れさまです・・・ ニュー速が『NEWS』に入ると、目立ちますねぇ・・・ 『その他』に、いろんな板がはいって、 興味深いですねぇ・・・ ツバメよ stats鯖から 教えてよ スレの速度を〜♪ 右の数字が過去一分間に付いたレスの数です つまり分速です 進化してますねー。 つばめにスレタイも欲しいけど……厳しいだろうしなぁ……。 >>242 その辺は 形が固まってからかと 今は、あるデータをどの様に加工したら便利かを模索中。。。 ってことで >>244 うん、うん。。 BBYのように、見れたらいいねぇ・・ >>212 $xxx =~ s/(\d)(\d\d\d)(?!\d)/$1,$2/g; というのをぐぐって見つけて使っているデ酢 百万のところもカンマつけるにはどうしたらいいの? $xxx =~ s/(\d)(\d\d\d)(\d\d\d)(?!\d)/$1,$2,$3/g; こうか? >>249 http://www.din.or.jp/ ~ohzaki/perl.htm#NumberWithComma このあたりですー 乙です。 確認事項ですが、>>163 だとwiki中の、 「発言時unixtimeとバイト数を掛け合わせた数値.発言バイト数.〜」 じゃなくて 「発言時unixtime.発言処理プロセスID.発言バイト数.〜」 じゃないんでしょうか。 仮想都市「にちゃんねる」とかそんなのが出来るのかな… ワクワク >>252 おぉ そうですね 更新しておきました。 >>248-249 おいらがずっと前に作った、コンマつけるサブルーチン sub Comma{ $input = $_[0]; return $input if ($input < 1000); $input = reverse($input); $input =~ s/(\d\d\d)/$1,/g; $input = reverse($input); return $input; } >>254 どうもです。 あと、ちょろっと「現状」の体裁を整えておきました。 つばめの「その他」だけベスト20か30まで表示して欲しいと言ってみる 板数多いのに特定の板の雑談スレや狼のスレがいくつも常に10以内に入ってるから >FOX 師 たびたびlookup仕様変更になってスマソですが、 ●でのカキコフラグもいれられませんかね? どの板でどれくらい●利用者のカキコがあるかってのもおもしろいかと。 たぶん●板より●の書き込み回数の多い板とかあるんだろうなあ 携帯カキコフラグとかもおもろいかもね。オフ板と携帯板は半数以上だったりして。 docomo.ne.jp、ezweb.ne.jp、jp-*.ne.jp、P*.ppp.prin.ne.jp できれば隠し板はカウントに入れて欲しくないと思ってみる今日この頃 各種フラグをいれるとしてこんなところですか。 ・●使用の有無 ・携帯からかどうか ・UAフラグ(IE6/IE5/Mozilla(with NN)/safari/opera/その他) >>268 とりあえず通常ブラウザだけあげてみただけです、スマソ。 で、monazillaはどうしますかね。 ・一緒にmonazillaとする ・個々のブラウザごとにわける デザイン作てもいいのかなぁ? >>247 合計 xxxxxx Bytes 書きこみバイト数が多い板TOP50 みたいな。 >>269 ブラウザごとにわけたほうがいいかと。 >>270 ならのっけるストリングを検討。 参考:ttp://www.bayashi.net/st/pdmemo/ua.html <PCwebブラウザ> msie6 IE6 msie5 IE5 safari Safari mozilla Mozilla/Netscape(判別が困難なため一緒にする) opera Opera lite Lite icab iCab omni OmniWeb hotjava HotJava lynx Lynx w3m w3m 個人的にはだけど、あの手の情報公開用文書に「デザイン」は要らないと思う。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる