2ちゃんねるの全発言の統計を取ろうに挑戦
bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。
まずは現在空いている oyster138(旧game5)ではじめてみよう計画
【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
04/05/03 04:30ID:???04/05/05 17:04ID:yMqcfq0l
別に良いじゃないかと思って見る今日この頃
04/05/05 17:06ID:dFuPLh4F
>>266
monazillaはその他大勢ですか
monazillaはその他大勢ですか
269▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 17:10ID:Fbu5SeHY2702chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/05 17:52ID:pJ9vT2PY271▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:12ID:Fbu5SeHY >>270
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html
<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
ならのっけるストリングを検討。
参考:ttp://www.bayashi.net/st/pdmemo/ua.html
<PCwebブラウザ>
msie6 IE6
msie5 IE5
safari Safari
mozilla Mozilla/Netscape(判別が困難なため一緒にする)
opera Opera
lite Lite
icab iCab
omni OmniWeb
hotjava HotJava
lynx Lynx
w3m w3m
04/05/05 18:14ID:dDde0FIw
個人的にはだけど、あの手の情報公開用文書に「デザイン」は要らないと思う。
273▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:14ID:Fbu5SeHY <携帯>(ホスト名判別を入れる?)
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
imode i-mode
foma FOMA
voda J-Phone/Vodafone
ezweb AU
ddip H"
astel ASTEL
274▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:23ID:Fbu5SeHY monazillaについてですが、結論から言うと、ブラウザ別に分離するのは仕様上無理っぽいです。
なんでmonazillaはmonazillaということで・・・。
なんでmonazillaはmonazillaということで・・・。
04/05/05 18:27ID:/Tguwlaj
UA って必要ですか?
UA が判ると何が嬉しい?
UA が判ると何が嬉しい?
04/05/05 18:37ID:dFuPLh4F
携帯や2chブラウザかだけ判れば充分だと思う。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。
利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
一般ブラウザはどうせほとんどIEだろうし、
UAが判った所で2ちゃんねるにとっては
何の参考にもならなさそう。
利用価値云々ではなくて、とにかくいろんな統計を
片っ端から取りたいって言うなら別だけどね。
277▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:39ID:Fbu5SeHY あとはロボット検索系ですか。
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html
google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)
netscapeは判別可能っぽいです、スマソ。
netscape Netscape
ttp://f3.aaacafe.ne.jp/~zwgxodue/url.html
google Google系
naver Naver系
fast AllTheWeb
inktomi inktomi系(gooとかも)
netscapeは判別可能っぽいです、スマソ。
netscape Netscape
278▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/05 18:45ID:Fbu5SeHY 2chの場合、意外とロボット検索の割合があるはずなので
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。
判定はFOX師次第ですが。
一概にUAがIEでほとんど、は言い切れません。
マカーのSafari度も結構あるはずですし。
判定はFOX師次第ですが。
04/05/05 19:06ID:/Tguwlaj
ロボットは、bbs.cgi を叩かないと思う。
04/05/05 20:13ID:PKmYwlM0
携帯:monazilla:その他
の比率だけで十分な予感。
の比率だけで十分な予感。
04/05/05 22:25ID:1bcwnQSQ
ゴミ箱はカウントしないようにしてください。
282FOX ★
04/05/05 22:27ID:???04/05/05 22:39ID:yMqcfq0l
男と女のひりt;y=ー(゚д゚)・∵. ターン
04/05/06 00:09ID:9o2cBzO1
書き込み内容から空白を取り除いた物のMD5値なんてぇのはどうでしょうか?
コスト高いかな?
定型文爆撃の統計に使えそうですけど。
コスト高いかな?
定型文爆撃の統計に使えそうですけど。
04/05/06 01:44ID:uWNdeQGD
04/05/06 02:29ID:F0AGR43X
板別のスレたて人のホスト統計とか
とれるようになったら、うれしいのです。
なんとなく。
とれるようになったら、うれしいのです。
なんとなく。
287FOX ★
04/05/06 03:03ID:??? >>174 なんですが。。。
某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに
呼んで欲しいですー
わたし、cronとか良く知らないのでお願いしますー
>root★さん
某BBS directry にある
kawasemi-d.cgi を毎日 00:01に
kawasemi-h.cgi を毎時 01min に
kawasemi-m.cgi を一日中 1 min おきに
呼んで欲しいですー
わたし、cronとか良く知らないのでお願いしますー
>root★さん
288root ★
04/05/06 03:59ID:??? これからやります。
-dは、JSTですよね。
-dは、JSTですよね。
289FOX ★
04/05/06 04:00ID:??? はいー
JST ですー
すんませんです。
お手数かけて
JST ですー
すんませんです。
お手数かけて
290root ★
04/05/06 04:09ID:??? うーむ、PDT/PSTな環境で夏も冬もちゃんと0:01に動かすのって、どうやるんだろ。
今はとりあえずPDTで0:01にしておこう。
で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
今はとりあえずPDTで0:01にしておこう。
で、このコマンド何か出力しているらしくがんがんメールがでているわけですが、
出力をログに残すようにしておく?
それとも、捨てちゃっていいですか?
291FOX ★
04/05/06 04:13ID:??? あっ
テスト用に print したんだった。
すてちゃっていいですー
今後も print する予定なので < testするとき
テスト用に print したんだった。
すてちゃっていいですー
今後も print する予定なので < testするとき
293FOX ★
04/05/06 04:16ID:??? どもですー
294FOX ★
04/05/06 14:23ID:??? >>281-282
どういうことかと言うと
1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
正しくカウントしてなきゃ意味無いじゃん
だと思うのだが、
どういうことかと言うと
1) うわっ ゴミ箱にかけるんで無いの? -> ゴミ箱を書けなくしなきゃ
2) げっ 書いていないのにカウントされるって事?
正しくカウントしてなきゃ意味無いじゃん
だと思うのだが、
295▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/06 14:24ID:2c6hsSsM ●書き込み統計は不採用ですか・・・・残念。
296動け動けウゴウゴ2ちゃんねる
04/05/06 21:21ID:ZyCM2I0Z04/05/06 21:26ID:jI4fXdTr
298FOX ★
04/05/06 21:31ID:??? pie に移しますか、
あした手配します。
あした手配します。
299FOX ★
04/05/06 21:32ID:??? まずは bbs.cgi から呼ぶの止めます
300FOX ★
04/05/06 21:43ID:??? ということで bbs.2ch.net は急遽 pie に banana を用意します
メール送りますー > root★さん
メール送りますー > root★さん
3012chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/06 21:49ID:+hfFt++i bananaで大丈夫なの?>memory
302root ★
04/05/06 22:36ID:???303FOX ★
04/05/06 22:46ID:???04/05/06 22:48ID:pSKXJTGU
スレごとの投稿バイトの平均とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも
あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
スレごとの投稿間隔の平均とかが見られると
レス数が異なるスレ同士の比較に使えるかも
あとレスアンカーの使われたレス数で住人同士の会話度とか
URLリンク数で情報度とか
2ちゃんねるスレリンク数で連携度とか
305root ★
04/05/06 22:48ID:??? >>303
メール受け取りました。これから中身確認します。
今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。
儀式内容はあっちのスレでいきます。
メール受け取りました。これから中身確認します。
今bbs.cgiから参照されてないんであれば、単純に今のものを引き継いでいただければOKです。
つまりIPアドレスの変更のみで可かなと。
儀式内容はあっちのスレでいきます。
306FOX ★
04/05/06 22:49ID:??? qb2 も含めて呼び出しは全てのサーバで停止しました。
04/05/06 22:53ID:donbUruI
>304
おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし
だから、レスアンカーを数えてもあまり参考にならないかと・・・・
おいらは某板で>>このアンカーはスレの容量を増やすので
嫌われると仕込まれて以来、>一個でレスするのを原則にしてる
専用ブラウザは大抵ポップアップしてくれるし
だから、レスアンカーを数えてもあまり参考にならないかと・・・・
04/05/06 22:57ID:pSKXJTGU
うんまあその程度しか期待してないけど
310動け2ちゃんねる
04/05/06 23:53ID:V9WCEG22 過去のデータは見られるようになるのか?
04/05/07 00:08ID:ZEwc/ihl
datから起こせるようになるんでは?
物凄い負荷になるかも知れんけど
物凄い負荷になるかも知れんけど
314root ★
04/05/07 15:15ID:??? ということで、PIEにて再開。
さきほどpekoサーバのbbs.cgiを更新。
さきほどpekoサーバのbbs.cgiを更新。
315root ★
04/05/07 16:16ID:??? 移行して約1時間半。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
メモリ不足やI/Oがめいっぱいになることもなく、今のところ問題なく動いている模様。
316FOX ★
04/05/07 16:28ID:??? 今日観察したいのは
昨日まで起こっていた問題が解決されたかどうか、
昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。
取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)
期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
昨日まで起こっていた問題が解決されたかどうか、
昨日までの問題点
各サーバのbbs.cgiを bbs.2ch.net がブロックしてしまうので
書き込み時に時間がかかり、処理が溜まり各サーバが
にっちもさっちも行かなくなった。
取った行動
bbs.2ch.net の設置してあるサーバが良くないと決め付け
別のサーバにした。ロケーションすら変えた (he->pie)
期待値
bbs.2ch.net の動作が各サーバのbbs.cgiをブロックすることなく
ピーク時も順調に良好な掲示板動作が・・・
04/05/07 18:16ID:LaK4k1ip
今朝分のカキコ数が累積されてなかったのは
再開前の投稿が反映されてなかっただけね
再開前の投稿が反映されてなかっただけね
319root ★
04/05/08 01:56ID:???320FOX ★
04/05/08 01:58ID:??? ええと
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
あくまでも仮の形式・仮のアドレスなので
どんどん仕様変更は覚悟しておいてくださいー
04/05/08 02:18ID:yUbs4oTT
323未承諾広告※ ◆TWARamEjuA
04/05/08 02:25ID:zB87dtMl 個人的にはやっぱり生textが欲しかったり(苦笑)
♪tonbi をグラフにしてみようかしらん。
♪tonbi をグラフにしてみようかしらん。
04/05/08 02:26ID:n72bHeAS
そろそろread.cgi/r.i/p.iのも見たいな、と言ってみるてすつ。
04/05/08 02:33ID:yUbs4oTT
04/05/08 02:42ID:yUbs4oTT
>>324
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。
内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
さすがにread.cgiのアクセス数を外部で拾うのは無理のような。
内部で記録する場合でも、httpd.confを触って1アクセスで1バイトの
ログを吐くようにしてファイルサイズ=アクセス数というような工夫を
しないと苦しいかも。
327FOX ★
04/05/08 03:19ID:???04/05/08 03:32ID:n72bHeAS
>>327
それぞれの色はどういう意味ですか?
それぞれの色はどういう意味ですか?
329▲ 某ソレ511
04/05/08 03:34ID:Uu8N52Jz おいらでいいなら、
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
水色=peko(cobra)サーバ
黄色=bananaサーバ
白色=その他
04/05/08 03:34ID:Ow75dG29
04/05/08 03:37ID:n72bHeAS
d。
332▲ 某ソレ511
04/05/08 03:45ID:Uu8N52Jz そういえばpc5だけbananaで白文字だけど、
バックアップ強化とかなんか特殊事情あったっけ、
バックアップ強化とかなんか特殊事情あったっけ、
333FOX ★
04/05/08 03:52ID:??? 単に忘れているだけだったりして
334FOX ★
04/05/08 04:31ID:??? kawasemi さんたちは呼ばれていますか? > root★さん
336FOX ★
04/05/08 04:38ID:??? はいー
動いていましたー
動いていましたー
04/05/08 04:48ID:LG/h073Q
緑色がumaっすかね。
338FOX ★
04/05/08 05:00ID:??? http://stats.2ch.net/kawasemi-m/
http://stats.2ch.net/kawasemi-m/0total-20040508.txt
毎分更新
23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
http://stats.2ch.net/kawasemi-m/0total-20040508.txt
毎分更新
23:59 は正しく取れるけど
24:00 は取れなくて
00:00 が・・・
340FOX ★
04/05/08 05:22ID:??? >>339
こまいところは、ちとあとまわし、、、
こまいところは、ちとあとまわし、、、
341未承諾広告※ ◆TWARamEjuA
04/05/08 05:22ID:zB87dtMl あっと、23:59-24:00 の分。って意味ですね。
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
それならそのまま翌日 00:00 でも OK かと(ソートしてもキレイに並ぶから)
あと、何日分保持させるのかな?
1440行/日ですよね?
342未承諾広告※ ◆TWARamEjuA
04/05/08 05:28ID:zB87dtMl 手前味噌でスマソですけれども、鯖名もくっつけると鯖毎の集計も楽になるかと。
参照: http://sv2ch.baila6.jp/board/
でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
参照: http://sv2ch.baila6.jp/board/
でもって、1 板ずつ採取となると 500 近いアクセスが必要となってくるので、みんなまとめたファイルもあるとよいかもです。
(こちらの場合は「最新値/その日の累計値」だけを 1 板 1 行にしておくとか)
参照: http://sv2ch.baila6.jp/boardlist.txt
343FOX ★
04/05/08 05:34ID:??? なるなる、
サーバ名は、、、
別に 板 - サーバのファイルを一日に一回くらい作るかな
まとめたファイルですか。。。
ちと考えます
http://stats.2ch.net/kawasemi-h/0total-2004050805.txt
http://stats.2ch.net/kawasemi-h/
これも日にち境界がどうなるか。。。
すでに晩酌モード頭働かないので、またあとで考えよう。
サーバ名は、、、
別に 板 - サーバのファイルを一日に一回くらい作るかな
まとめたファイルですか。。。
ちと考えます
http://stats.2ch.net/kawasemi-h/0total-2004050805.txt
http://stats.2ch.net/kawasemi-h/
これも日にち境界がどうなるか。。。
すでに晩酌モード頭働かないので、またあとで考えよう。
344FOX ★
04/05/08 05:35ID:??? 保持数は・・・
四日程度を考えていますー
四日程度を考えていますー
346FOX ★
04/05/08 05:41ID:??? ファイル名失敗
http://stats.2ch.net/kawasemi-h/0total-20040508.txt
こうですね、
>>345
大枠はこんな感じでしょうかねぇ
細かいところはこれからということで、
http://stats.2ch.net/kawasemi-h/0total-20040508.txt
こうですね、
>>345
大枠はこんな感じでしょうかねぇ
細かいところはこれからということで、
04/05/08 05:50ID:TrTJvMo4
スレ立てを分けてカウントしてみません?
348FOX ★
04/05/08 05:53ID:???349未承諾広告※ ◆TWARamEjuA
04/05/08 05:59ID:zB87dtMl350FOX ★
04/05/08 07:02ID:??? なんとなく上手く行っている気配
http://stats.2ch.net/kawasemi-h/morningcoffee-20040508.txt
日にち境界もこっちは上手く行くはずなんだけど、、、
結果がでるのは 24:01 過ぎですなぁ
http://stats.2ch.net/kawasemi-h/morningcoffee-20040508.txt
日にち境界もこっちは上手く行くはずなんだけど、、、
結果がでるのは 24:01 過ぎですなぁ
04/05/08 12:24ID:g7ImWCVB
実況板のログと番組表を組み合わせてみると面白そう
XMLTVとか使えばいいかな
http://linux.paken.org/index.php?XMLTV%C6%FC%CB%DC%C2%D0%B1%FE%C8%C7
XMLTVとか使えばいいかな
http://linux.paken.org/index.php?XMLTV%C6%FC%CB%DC%C2%D0%B1%FE%C8%C7
04/05/08 19:38ID:Ow75dG29
今ってどんなIP返してるのかな?
res/minとかのっけてみるとか。
res/minとかのっけてみるとか。
04/05/09 05:48ID:AtpUTGip
とも子がスレストする時に BBS に何か投げて
「とも子作動検知器」って作れないかな?
「とも子作動検知器」って作れないかな?
04/05/09 18:35ID:gi/LMh3d
とも子の日記帳
04/05/09 21:52ID:E1jy2wjV
板名はmorningcoffeeとかよりもモ娘(狼)とかいてあった方がわかりやすいと思います
356FOX ★
04/05/09 22:57ID:???04/05/09 23:07ID:isr/eun3
えー 私は逆の方がわかりやすいけど>>355
358▲ 某ソレ511
04/05/09 23:13ID:Ck1B8ZRl こんな板に入り浸ってる人くらいじゃない?フォルダ名から板名が分かるのって
04/05/10 00:56ID:CtJPKB5Q
http://stats.2ch.net/karasu2.cgi
どんどん黄色くなっていく。
どんどん黄色くなっていく。
04/05/10 04:18ID:piZUp38e
364FOX ★
04/05/10 04:27ID:??? >>363
全部 五月九日のデータだからでーす
全部 五月九日のデータだからでーす
04/05/10 05:01ID:piZUp38e
ほよ、、、どう違うの?
366FOX ★
04/05/10 05:03ID:??? 200405091533082 = 2004/05/09 15:33:08 かな?
■ このスレッドは過去ログ倉庫に格納されています