X


【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1

■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
垢版 |
04/05/03 04:30ID:???
2ちゃんねるの全発言の統計を取ろうに挑戦

bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。

まずは現在空いている oyster138(旧game5)ではじめてみよう計画
04/05/05 17:04ID:yMqcfq0l
別に良いじゃないかと思って見る今日この頃
04/05/05 17:06ID:dFuPLh4F
>>266
monazillaはその他大勢ですか
04/05/05 17:10ID:Fbu5SeHY
>>268
とりあえず通常ブラウザだけあげてみただけです、スマソ。

で、monazillaはどうしますかね。

・一緒にmonazillaとする
・個々のブラウザごとにわける
04/05/05 17:52ID:pJ9vT2PY
デザイン作てもいいのかなぁ?

>>247
合計 xxxxxx Bytes

書きこみバイト数が多い板TOP50

みたいな。

>>269
ブラウザごとにわけたほうがいいかと。
04/05/05 18:12ID:Fbu5SeHY
>>270
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html

<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
04/05/05 18:14ID:dDde0FIw
個人的にはだけど、あの手の情報公開用文書に「デザイン」は要らないと思う。
04/05/05 18:14ID:Fbu5SeHY
<携帯>(ホスト名判別を入れる?)
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
04/05/05 18:23ID:Fbu5SeHY
monazillaについてですが、結論から言うと、ブラウザ別に分離するのは仕様上無理っぽいです。
なんでmonazillaはmonazillaということで・・・。
04/05/05 18:27ID:/Tguwlaj
UA って必要ですか?
UA が判ると何が嬉しい?
04/05/05 18:37ID:dFuPLh4F
携帯や2chブラウザかだけ判れば充分だと思う。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。

利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
04/05/05 18:39ID:Fbu5SeHY
あとはロボット検索系ですか。
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html

google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)

netscapeは判別可能っぽいです、スマソ。

netscape Netscape
04/05/05 18:45ID:Fbu5SeHY
2chの場合、意外とロボット検索の割合があるはずなので
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。

判定はFOX師次第ですが。
04/05/05 19:06ID:/Tguwlaj
ロボットは、bbs.cgi を叩かないと思う。
04/05/05 20:13ID:PKmYwlM0
携帯:monazilla:その他
の比率だけで十分な予感。
04/05/05 22:25ID:1bcwnQSQ
ゴミ箱はカウントしないようにしてください。
282FOX ★
垢版 |
04/05/05 22:27ID:???
>>281
そういう話か?
なんか違うような、
04/05/05 22:39ID:yMqcfq0l
男と女のひりt;y=ー(゚д゚)・∵. ターン
04/05/06 00:09ID:9o2cBzO1
書き込み内容から空白を取り除いた物のMD5値なんてぇのはどうでしょうか?
コスト高いかな?

定型文爆撃の統計に使えそうですけど。
04/05/06 01:44ID:uWNdeQGD
http://stats.2ch.net/tubame.cgi

pieとidolの板は、bbspink.comにして欲しいです。
(pie.2ch.net、idol.2ch.netになってるです。)
04/05/06 02:29ID:F0AGR43X
板別のスレたて人のホスト統計とか
とれるようになったら、うれしいのです。

なんとなく。
287FOX ★
垢版 |
04/05/06 03:03ID:???
>>174 なんですが。。。

某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに

呼んで欲しいですー

わたし、cronとか良く知らないのでお願いしますー

>root★さん
288root ★
垢版 |
04/05/06 03:59ID:???
これからやります。
-dは、JSTですよね。
289FOX ★
垢版 |
04/05/06 04:00ID:???
はいー
JST ですー

すんませんです。
お手数かけて
290root ★
垢版 |
04/05/06 04:09ID:???
うーむ、PDT/PSTな環境で夏も冬もちゃんと0:01に動かすのって、どうやるんだろ。
今はとりあえずPDTで0:01にしておこう。

で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
291FOX ★
垢版 |
04/05/06 04:13ID:???
あっ
テスト用に print したんだった。
すてちゃっていいですー

今後も print する予定なので < testするとき
292root ★
垢版 |
04/05/06 04:15ID:???
stdout/stderrをでぶぬるに捨てるようにしました。>>291
293FOX ★
垢版 |
04/05/06 04:16ID:???
どもですー
294FOX ★
垢版 |
04/05/06 14:23ID:???
>>281-282

どういうことかと言うと

1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
  正しくカウントしてなきゃ意味無いじゃん

だと思うのだが、
04/05/06 14:24ID:2c6hsSsM
●書き込み統計は不採用ですか・・・・残念。
296動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/06 21:21ID:ZyCM2I0Z
http://stats.2ch.net/karasu.cgi
http://stats.2ch.net/suzume.cgi

繋がらない。
04/05/06 21:26ID:jI4fXdTr
>>296
鯖落ちしてるみたいっすね。
pingかからないです
298FOX ★
垢版 |
04/05/06 21:31ID:???
pie に移しますか、
あした手配します。
299FOX ★
垢版 |
04/05/06 21:32ID:???
まずは bbs.cgi から呼ぶの止めます
300FOX ★
垢版 |
04/05/06 21:43ID:???
ということで bbs.2ch.net は急遽 pie に banana を用意します
メール送りますー > root★さん
04/05/06 21:49ID:+hfFt++i
bananaで大丈夫なの?>memory
302root ★
垢版 |
04/05/06 22:36ID:???
了解です。>>300

で、pekoサーバのbbs.cgiを更新しました。
live8負荷かかってんなぁと思ったら某今井氏出演中か。2ブレーメンぐらいかな。

bbs.2ch.netの用途だけなら、なんとかなるんじゃかなと。>>301
もし足りないようなら、そのときはまた考慮いただくということで。
303FOX ★
垢版 |
04/05/06 22:46ID:???
>>302
メール発射しましたー
DNS の設定はどのように変更すればいいですか?
04/05/06 22:48ID:pSKXJTGU
スレごとの投稿バイトの平均とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも

あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
305root ★
垢版 |
04/05/06 22:48ID:???
>>303
メール受け取りました。これから中身確認します。

今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。

儀式内容はあっちのスレでいきます。
306FOX ★
垢版 |
04/05/06 22:49ID:???
qb2 も含めて呼び出しは全てのサーバで停止しました。
307root ★
垢版 |
04/05/06 22:51ID:???
>>306
了解です。
まずは中身確認させてくださいです。

ごそごそして、準備ができ次第儀式へと。
04/05/06 22:53ID:donbUruI
>304

おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし

だから、レスアンカーを数えてもあまり参考にならないかと・・・・
04/05/06 22:57ID:pSKXJTGU
うんまあその程度しか期待してないけど
04/05/06 23:53ID:V9WCEG22
過去のデータは見られるようになるのか?
04/05/07 00:08ID:ZEwc/ihl
datから起こせるようになるんでは?
物凄い負荷になるかも知れんけど
04/05/07 00:36ID:CUklDSTK
>>310
うしろには振り向かない仕様なので無理です。
04/05/07 00:39ID:3AqajSl0
>>174 >>287 を見る限り予定はあると思うけど、
314root ★
垢版 |
04/05/07 15:15ID:???
ということで、PIEにて再開。

さきほどpekoサーバのbbs.cgiを更新。
315root ★
垢版 |
04/05/07 16:16ID:???
移行して約1時間半。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
316FOX ★
垢版 |
04/05/07 16:28ID:???
今日観察したいのは
昨日まで起こっていた問題が解決されたかどうか、

昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。

取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)

期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
04/05/07 18:16ID:LaK4k1ip
今朝分のカキコ数が累積されてなかったのは
再開前の投稿が反映されてなかっただけね
04/05/07 18:18ID:3AqajSl0
heからPIEに移ってネットワークの詰まりがなくなるため
>>226-227の問題も解決できてると、期待してみよう、
319root ★
垢版 |
04/05/08 01:56ID:???
http://ch2.ath.cx/load/live8.html

やるな。ここのCGIからデータとってるすね。これ。
320FOX ★
垢版 |
04/05/08 01:58ID:???
ええと
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
321root ★
垢版 |
04/05/08 02:01ID:???
もとより>>319の中の人はそのつもりでしょう。

で、>>316、いいかんじすね。ピークでも詰まる様子はみられないし。
04/05/08 02:18ID:yUbs4oTT
>>319
ですです。

>>320
んー、2ちゃんの歴史そのものかなぁ。(笑)<どんどん仕様変更
直ぐに元に戻したりも出来るので、その点は大丈夫です。
04/05/08 02:25ID:zB87dtMl
個人的にはやっぱり生textが欲しかったり(苦笑)

♪tonbi をグラフにしてみようかしらん。
04/05/08 02:26ID:n72bHeAS
そろそろread.cgi/r.i/p.iのも見たいな、と言ってみるてすつ。
04/05/08 02:33ID:yUbs4oTT
>>323
ワクワク。
私の方では、板別には手が出ないです。(´・ω・`)
04/05/08 02:42ID:yUbs4oTT
>>324
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。

内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
327FOX ★
垢版 |
04/05/08 03:19ID:???
移転考察用に

http://stats.2ch.net/karasu2.cgi
04/05/08 03:32ID:n72bHeAS
>>327
それぞれの色はどういう意味ですか?
04/05/08 03:34ID:Uu8N52Jz
おいらでいいなら、
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
04/05/08 03:34ID:Ow75dG29
>>328
青:peko
黄:banana

かと
04/05/08 03:37ID:n72bHeAS
d。
04/05/08 03:45ID:Uu8N52Jz
そういえばpc5だけbananaで白文字だけど、
バックアップ強化とかなんか特殊事情あったっけ、
333FOX ★
垢版 |
04/05/08 03:52ID:???
単に忘れているだけだったりして
334FOX ★
垢版 |
04/05/08 04:31ID:???
kawasemi さんたちは呼ばれていますか? > root★さん
335root ★
垢版 |
04/05/08 04:37ID:???
>>334
>>314 の時点で既にcron仕込んでありますです。
336FOX ★
垢版 |
04/05/08 04:38ID:???
はいー

動いていましたー
04/05/08 04:48ID:LG/h073Q
緑色がumaっすかね。
338FOX ★
垢版 |
04/05/08 05:00ID:???
http://stats.2ch.net/kawasemi-m/
http://stats.2ch.net/kawasemi-m/0total-20040508.txt

毎分更新

23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
04/05/08 05:16ID:zB87dtMl
>>338
おー!
24:00 = 00:00 ではダメなのかな?
340FOX ★
垢版 |
04/05/08 05:22ID:???
>>339
こまいところは、ちとあとまわし、、、
04/05/08 05:22ID:zB87dtMl
あっと、23:59-24:00 の分。って意味ですね。
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
04/05/08 05:28ID:zB87dtMl
手前味噌でスマソですけれども、鯖名もくっつけると鯖毎の集計も楽になるかと。
参照: http://sv2ch.baila6.jp/board/

でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
343FOX ★
垢版 |
04/05/08 05:34ID:???
なるなる、

サーバ名は、、、
別に 板 - サーバのファイルを一日に一回くらい作るかな

まとめたファイルですか。。。
ちと考えます

http://stats.2ch.net/kawasemi-h/0total-2004050805.txt
http://stats.2ch.net/kawasemi-h/
これも日にち境界がどうなるか。。。
すでに晩酌モード頭働かないので、またあとで考えよう。
344FOX ★
垢版 |
04/05/08 05:35ID:???
保持数は・・・

四日程度を考えていますー
04/05/08 05:39ID:zB87dtMl
>>343-344
おつですおつですー(^o^)
346FOX ★
垢版 |
04/05/08 05:41ID:???
ファイル名失敗

http://stats.2ch.net/kawasemi-h/0total-20040508.txt
こうですね、

>>345
大枠はこんな感じでしょうかねぇ
細かいところはこれからということで、
04/05/08 05:50ID:TrTJvMo4
スレ立てを分けてカウントしてみません?
348FOX ★
垢版 |
04/05/08 05:53ID:???
>>347
そっすねー

>>342
全部1ファイルというと、こうかな?
http://stats.2ch.net/kawasemi-m/0all-20040508.txt
04/05/08 05:59ID:zB87dtMl
>>348
をーすばーらすぃっ!(嬉)

しかし朝珈琲ってばなんなんでしょうね。。。
と宣いつつ朝珈琲飲用中(嬉)
350FOX ★
垢版 |
04/05/08 07:02ID:???
なんとなく上手く行っている気配
http://stats.2ch.net/kawasemi-h/morningcoffee-20040508.txt

日にち境界もこっちは上手く行くはずなんだけど、、、
結果がでるのは 24:01 過ぎですなぁ
04/05/08 12:24ID:g7ImWCVB
実況板のログと番組表を組み合わせてみると面白そう
XMLTVとか使えばいいかな
http://linux.paken.org/index.php?XMLTV%C6%FC%CB%DC%C2%D0%B1%FE%C8%C7
04/05/08 19:38ID:Ow75dG29
今ってどんなIP返してるのかな?
res/minとかのっけてみるとか。
04/05/09 05:48ID:AtpUTGip
とも子がスレストする時に BBS に何か投げて
「とも子作動検知器」って作れないかな?
04/05/09 18:35ID:gi/LMh3d
とも子の日記帳
04/05/09 21:52ID:E1jy2wjV
板名はmorningcoffeeとかよりもモ娘(狼)とかいてあった方がわかりやすいと思います
356FOX ★
垢版 |
04/05/09 22:57ID:???
http://stats.2ch.net/kawasemi-d/2ch.txt

ここに毎日の投稿数の合計が貯められていく予定
04/05/09 23:07ID:isr/eun3
えー 私は逆の方がわかりやすいけど>>355
04/05/09 23:13ID:Ck1B8ZRl
こんな板に入り浸ってる人くらいじゃない?フォルダ名から板名が分かるのって
04/05/09 23:15ID:UR2UtJpd
>>355,357
どういう形式で表示するかは後で誰かがなんとかしてくれるさ
04/05/09 23:18ID:0iH8W+nj
じゃ、間をとって
ハロプロ@2ch掲示板で。
04/05/09 23:22ID:NiC2juA1
野鳥の会だから鳥の名前なんだ(逆?
04/05/10 00:56ID:CtJPKB5Q
http://stats.2ch.net/karasu2.cgi
どんどん黄色くなっていく。
04/05/10 04:18ID:piZUp38e
>>356
> 200405090
> 200405091533082
> 200405091658017

なんで全部0509なの?
364FOX ★
垢版 |
04/05/10 04:27ID:???
>>363
全部 五月九日のデータだからでーす
04/05/10 05:01ID:piZUp38e
ほよ、、、どう違うの?
366FOX ★
垢版 |
04/05/10 05:03ID:???
200405091533082 = 2004/05/09 15:33:08 かな?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。