2ちゃんねるの全発言の統計を取ろうに挑戦
bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。
まずは現在空いている oyster138(旧game5)ではじめてみよう計画
【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
04/05/03 04:30ID:???04/05/03 14:16ID:mzD8zE5G
前から期待してた機能だ
↑ |
ス . | ,ヘ
レ . | / |
数 | / |
|__,,,,,,,,,,r-''~ \
. ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
レス頻度→
これが板ごとに見られれば板全体の稼動スレの占有度とか
個々のスレの板におけるレスの早さの程度とかがわかる
はじめて行く板でもレスが特定のスレに集中しているのかどうかも見当がつく
↑ |
ス . | ,ヘ
レ . | / |
数 | / |
|__,,,,,,,,,,r-''~ \
. ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
レス頻度→
これが板ごとに見られれば板全体の稼動スレの占有度とか
個々のスレの板におけるレスの早さの程度とかがわかる
はじめて行く板でもレスが特定のスレに集中しているのかどうかも見当がつく
43FOX ★
04/05/03 18:06ID:??? stats.2ch.net 内に原型のプログラム書いたので
都度呼んでくださいー > root★さん
詳しくは、メールしましたー
BBYと同じと仮定して作ってあります(単にコピーしただけですけど)
都度呼んでくださいー > root★さん
詳しくは、メールしましたー
BBYと同じと仮定して作ってあります(単にコピーしただけですけど)
44サザン ★
04/05/03 18:49ID:??? むぅ
どうやって読むのかと思った、、
どうやって読むのかと思った、、
46FOX ★
04/05/04 01:41ID:??? 質問でーす
ひばり君をコンパイルして更新しても
変わった様子がないんですが、
コンパイル後に何かしなきゃならないんでしょうか?
ひばり君をコンパイルして更新しても
変わった様子がないんですが、
コンパイル後に何かしなきゃならないんでしょうか?
47root ★
04/05/04 01:50ID:??? >>46
あ、メールしたとおり今回のは「パイプ」として起動されてますので、
コンパイルしたら、1回今いるやつをkillしないとだめです。
killを簡単に実行するshell sciptを作って置いておきます。
あ、メールしたとおり今回のは「パイプ」として起動されてますので、
コンパイルしたら、1回今いるやつをkillしないとだめです。
killを簡単に実行するshell sciptを作って置いておきます。
48FOX ★
04/05/04 01:52ID:??? むちむちなもんで
よろしくお願いいたします
よろしくお願いいたします
49root ★
04/05/04 01:58ID:??? 該当ディレクトリに .sh で終わるファイルを入れて置きました。
./なんちゃら.sh
というかんじで実行すればだいじょうぶなはず。
./なんちゃら.sh
というかんじで実行すればだいじょうぶなはず。
50FOX ★
04/05/04 01:59ID:??? どもですー
やってみますー
やってみますー
04/05/04 01:59ID:bkw4fOLy
予想としては一日30万カキコくらいかなぁ?
現行スレの数は500板*400スレ=20万スレくらいあるよね。多分。
それに平均500レスあるとしたら・・・ 1億レス?
一生かかっても見れねぇな・・・
あぁ、この瞬間にも俺が一生見ることが無いであろう書き込みが行われている・・・!
現行スレの数は500板*400スレ=20万スレくらいあるよね。多分。
それに平均500レスあるとしたら・・・ 1億レス?
一生かかっても見れねぇな・・・
あぁ、この瞬間にも俺が一生見ることが無いであろう書き込みが行われている・・・!
04/05/04 02:02ID:/glRN505
04/05/04 02:08ID:bkw4fOLy
>>52
('A`)多すぎ
('A`)多すぎ
54FOX ★
04/05/04 02:09ID:???04/05/04 02:18ID:P3CR8iTu
スレッドランキングまだなおらんのか
04/05/04 02:48ID:t1viavpl
>>51
実際常時動いてるスレはもっと少ないかもかも
実際常時動いてるスレはもっと少ないかもかも
04/05/04 02:53ID:/glRN505
それは「常時動いてる」というのがどのラインなのかによると思うなぁ、、
10分に1レス?1時間に1レス?1日に1レス?とか水掛け論かこれは、、
10分に1レス?1時間に1レス?1日に1レス?とか水掛け論かこれは、、
58ヾ●ノ゛ ◆NATTOSpTC2
04/05/04 02:58ID:b0MI3gJD04/05/04 03:08ID:AdOlsIdV
どこまで進んだの〜?
60FOX ★
04/05/04 03:23ID:???04/05/04 03:27ID:Bm2cXfAJ
62FOX ★
04/05/04 03:29ID:???04/05/04 03:31ID:AdOlsIdV
うほっ!
……狼は桁が違いますな。
……狼は桁が違いますな。
64ホームズ© ◆SHERLOCK7U
04/05/04 03:31ID:Si4r74/7 すごー。新しいおもちゃだ、、
04/05/04 03:34ID:K1WK5TN9
上に行く程文字が大きくなってるんだな。
662chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/04 03:40ID:SlhusVJW どうでもいいけどアングラな感じムンムン・・・・。。。
04/05/04 03:40ID:AdOlsIdV
次はスレッド別ランキングで「トンビ」かな?
04/05/04 03:42ID:Bm2cXfAJ
とりあえず今日0時からの統計かな。
明日のいまごろとかどうなってるんだろう。
すずめの板名にBBS MENUのものと鯖名まであれば、
見比べやすくて面白いと思うけど。面倒だろうか。
明日のいまごろとかどうなってるんだろう。
すずめの板名にBBS MENUのものと鯖名まであれば、
見比べやすくて面白いと思うけど。面倒だろうか。
69ヾ●ノ゛ ◆NATTOSpTC2
04/05/04 03:43ID:b0MI3gJD 次は 「めじろ」の予感
04/05/04 03:43ID:t1viavpl
なんか抜けてる板ない?隠し以外で
712chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/04 03:44ID:SlhusVJW bbyみたいにテキストデータもほしい、、、
72FOX ★
04/05/04 03:46ID:??? 突貫工事で酒飲みながら作ったから
今日の昨日きここまで
ご要望はこのスレに書いておいてね
本格的に飲む !!
今日の昨日きここまで
ご要望はこのスレに書いておいてね
本格的に飲む !!
04/05/04 03:46ID:AdOlsIdV
>>70
単に有効時間内に書き込みがないだけじゃない?
単に有効時間内に書き込みがないだけじゃない?
04/05/04 03:51ID:t1viavpl
>>73-74
honobonoがない
honobonoがない
04/05/04 03:52ID:AdOlsIdV
あれ? sec2chd@qb2に書き込んだのに反映されない……。
反映されるのにどれくらいかかるの?
反映されるのにどれくらいかかるの?
04/05/04 03:54ID:AdOlsIdV
×sec2chd
○saku2chd
○saku2chd
78FOX ★
04/05/04 03:54ID:??? 今はほとんどリアルタイムと思うが
パイプがどうのこうの言っていたので
その辺の遅延に関しては root★さんの解説が必要と思われ、
パイプがどうのこうの言っていたので
その辺の遅延に関しては root★さんの解説が必要と思われ、
04/05/04 03:56ID:Bm2cXfAJ
80※ ◆baila6uPTo
04/05/04 03:57ID:2DOEwHTG log/main/current へのシンボリックを、httpd で参照できるところに置いておくとか、
毎分自動更新 HTML 吐き出しの方が良さそうな?
もうねるぽ。
毎分自動更新 HTML 吐き出しの方が良さそうな?
もうねるぽ。
04/05/04 04:10ID:6UwOg8SN
・時間別で分けると住民の生活の流れが分かって面白いかも。
特定板は日曜休みの人がアクセスする割合が多い…とか出来るとマーケティングにも使えるかも知れない。
・テレビ覧とシンクロ参照機能とか付けるとテレビ局から視聴率データとして●ノが出来るかも知れない。
歌番組でなっち登場シーンでカキコが倍増現象とか関連付けられたとしたら…
・板の中のスレッド別回覧、発言ランキング
特定の話題の(板)の特に何に興味が集まっているか、一目で参照出来るとマーケ(ry
・祭り抽出
機能の進化が進めば、株のアナリストみたいな奴が出てきて、情報に意味を持たせ物語を作る奴が出てくる予感。
と、実装する技術知らないので適当に言うだけ言ってみるテスト。
特定板は日曜休みの人がアクセスする割合が多い…とか出来るとマーケティングにも使えるかも知れない。
・テレビ覧とシンクロ参照機能とか付けるとテレビ局から視聴率データとして●ノが出来るかも知れない。
歌番組でなっち登場シーンでカキコが倍増現象とか関連付けられたとしたら…
・板の中のスレッド別回覧、発言ランキング
特定の話題の(板)の特に何に興味が集まっているか、一目で参照出来るとマーケ(ry
・祭り抽出
機能の進化が進めば、株のアナリストみたいな奴が出てきて、情報に意味を持たせ物語を作る奴が出てくる予感。
と、実装する技術知らないので適当に言うだけ言ってみるテスト。
04/05/04 04:16ID:AdOlsIdV
うーん、qb2は対象外なのかな?
84ぼるじょあ ◆yBEncckFOU
04/05/04 04:24ID:muKXYdZS おっ
いいねぇー
いいねぇー
85FOX ★
04/05/04 04:29ID:???04/05/04 04:31ID:AdOlsIdV
>>85
たしかに……。
たしかに……。
04/05/04 04:32ID:oedb2deq
72 名前:FOX ★[] 投稿日:04/05/04(火) 03:46 ID:???
突貫工事で酒飲みながら作ったから
今日の昨日きここまで
ご要望はこのスレに書いておいてね
本格的に飲む !!
↑
ここらへんが危険
突貫工事で酒飲みながら作ったから
今日の昨日きここまで
ご要望はこのスレに書いておいてね
本格的に飲む !!
↑
ここらへんが危険
88FOX ★
04/05/04 04:32ID:???04/05/04 04:34ID:t1viavpl
>>88
ここです
ここです
90FOX ★
04/05/04 04:35ID:???04/05/04 04:36ID:t1viavpl
>>90
はい、human4ですね
はい、human4ですね
04/05/04 04:37ID:t1viavpl
http://www.domo2.net/system/ver.html
20040414みたいです
20040414みたいです
93FOX ★
04/05/04 04:38ID:??? あららっ
更新するようにした
更新するようにした
94FOX ★
04/05/04 04:40ID:??? qb2 は こっそり手動で入れてこよう
952chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/04 04:44ID:SlhusVJW すこしだけスクリプトいじってみたいと思うのはやはり・・・中毒?
というのはどうでもいいのでおいといて、、、もう5万すか、、、
というのはどうでもいいのでおいといて、、、もう5万すか、、、
96ぼるじょあ ◆yBEncckFOU
04/05/04 04:45ID:muKXYdZS スゲースゲー
98FOX ★
04/05/04 04:46ID:???99FOX ★
04/05/04 04:46ID:??? >>97
鴨です
鴨です
1002chtubo愛用者〜ヘ(゚д゚ヘ))))))〜61 ◆2CHTUBOC5A
04/05/04 04:49ID:SlhusVJW >>98
>至福゜のひとときってやつです。
↑
一瞬これが気になった。まさか本当にかな入力(ry
板名表示のほうがいいなー。>suzume
>至福゜のひとときってやつです。
↑
一瞬これが気になった。まさか本当にかな入力(ry
板名表示のほうがいいなー。>suzume
102ぼるじょあ ◆yBEncckFOU
04/05/04 05:00ID:muKXYdZS ホントだー
103FOX ★
04/05/04 05:06ID:???104root ★
04/05/04 05:06ID:??? >>80
log/main/currentの出力を、ほぼそのままFOXさんのプログラムにくべています。
某bbsgather.plみたいなかんじ。
# 呼び出し部分を作る際に、あのコードを参考にさせていただきました。どもです。
log/main/currentの出力を、ほぼそのままFOXさんのプログラムにくべています。
某bbsgather.plみたいなかんじ。
# 呼び出し部分を作る際に、あのコードを参考にさせていただきました。どもです。
105FOX ★
04/05/04 05:11ID:??? >>104
質問です
各サーバからのlook up時、時刻データは載せていませんが
(つまり ひばり君が受け取った時刻を基準に全部動作している)
日付境界での挙動は・・・
1) かにりずれるので look up 時日付もデータとして載せたほうが良い
2) たいして気にする必要は無い
どんなもんでしょ?
質問です
各サーバからのlook up時、時刻データは載せていませんが
(つまり ひばり君が受け取った時刻を基準に全部動作している)
日付境界での挙動は・・・
1) かにりずれるので look up 時日付もデータとして載せたほうが良い
2) たいして気にする必要は無い
どんなもんでしょ?
107root ★
04/05/04 05:16ID:??? 1秒も、というのは「ぜんぜん」いう意味ではなくて、
遅延は多く見ても1秒未満だ、という意味です。
遅延は多く見ても1秒未満だ、という意味です。
108FOX ★
04/05/04 05:17ID:??? ほほーい
んじゃ 2) で
んじゃ 2) で
109root ★
04/05/04 05:18ID:??? もちろん日付を乗せても無害だとは思います。
で、このプログラムは日付境界と関係なく動き続けるようになっていて、
ログローテートとかの影響を受けることはありませんです。
で、このプログラムは日付境界と関係なく動き続けるようになっていて、
ログローテートとかの影響を受けることはありませんです。
110動け動けウゴウゴ2ちゃんねる
04/05/04 05:18ID:A5sVUGfg すみません関係ない質問ですが削除依頼はどこにだせばいいですか?
111root ★
04/05/04 05:19ID:??? もうねなきゃ。
しかし、暴論を承知で言うと、
2ちゃんねるの全体の1割がmorningcoffeeでできているのか、、、。
しかし、暴論を承知で言うと、
2ちゃんねるの全体の1割がmorningcoffeeでできているのか、、、。
112 ◆BFzK/mtqM2
04/05/04 05:22ID:Pj7f0UXH >>111
たしかに。。。。
たしかに。。。。
04/05/04 05:23ID:fWBrq4PN
114FOX ★
04/05/04 05:54ID:??? まずは一定間隔おきにデータ取りの感じでやってみますか
04/05/04 05:58ID:oedb2deq
04/05/04 05:59ID:5SNTe4Hr
いやそれどころじゃないし(;´∀`)・・
04/05/04 06:02ID:Bm2cXfAJ
んじゃ「実験中毒」で。
118▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/04 07:47ID:yvoV0Ae2119▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/04 07:51ID:yvoV0Ae2 連投スマソです。
>>111
もしそうならば、●による書き込み規制を
morningcoffeeにいれるだけで以下の可能性が予想できますなw
・書き込みたいがゆえに●が馬鹿売れ
・該当板の書き込みが減少
・該当板が廃れる
・その他の事象が発生
>>111
もしそうならば、●による書き込み規制を
morningcoffeeにいれるだけで以下の可能性が予想できますなw
・書き込みたいがゆえに●が馬鹿売れ
・該当板の書き込みが減少
・該当板が廃れる
・その他の事象が発生
04/05/04 08:05ID:T5hskl3S
>119
・その他の事象が発生
に
(´・ω・´)ノ〓 100オレオ
・その他の事象が発生
に
(´・ω・´)ノ〓 100オレオ
04/05/04 11:18ID:RHBmNt0H
わーい、新しいおもちゃだー
04/05/04 11:20ID:fXiwlTKb
04/05/04 11:25ID:/glRN505
>>60から集計し始めたからじゃないかな?
つまり0時〜3時まではすずめではカウントされてないとか
つまり0時〜3時まではすずめではカウントされてないとか
04/05/04 11:31ID:fXiwlTKb
お、なるほど。
本日稼動開始だったのか(w
さすが、▲持ちですねー。
本日稼動開始だったのか(w
さすが、▲持ちですねー。
04/05/04 11:50ID:njNboplL
IPアドレスをデータに含めると、板別人口ランキングが分かる。
IPアドレスは繋ぎ変え等で変わるが、統計的に見れば人口とほぼ比例するはず。
板の常駐率みたいなのも分かるかも。
常駐率=発言数/IPアドレス数 のように求める。
IPアドレスは繋ぎ変え等で変わるが、統計的に見れば人口とほぼ比例するはず。
板の常駐率みたいなのも分かるかも。
常駐率=発言数/IPアドレス数 のように求める。
126▲ 某ソレ511
04/05/04 13:00ID:/glRN505 あとすずめに出てこないのはsports2上の5板と
2ch規制情報[sec2ch]なので漏れはなさそうですね。
>>125
いちおうsamba24でクリアされた時間ごとのIPアドレスの数っていうデータはあるけどねぇ、
カウントされるのがどういう基準なのかよく分からないからなぁ
http://etc.2ch.net/_service/IPnum-2004-5-4.txt
2ch規制情報[sec2ch]なので漏れはなさそうですね。
>>125
いちおうsamba24でクリアされた時間ごとのIPアドレスの数っていうデータはあるけどねぇ、
カウントされるのがどういう基準なのかよく分からないからなぁ
http://etc.2ch.net/_service/IPnum-2004-5-4.txt
127動け動けウゴウゴ2ちゃんねる
04/05/04 13:30ID:HiEE2Dve 引きこもりランキングだなあ
128動け動けウゴウゴ2ちゃんねる
04/05/04 14:25ID:18i/pJOV 板が23あるgame6より板が1つのtv5が多いっつうのも
04/05/04 14:47ID:r6qwSjJs
morningcoffee>game6全部>>(越えられない壁)>>その他
04/05/04 14:51ID:Hrfq64Ek
実況板の書き込み数がたいしたことないなと思ったが、
あそこはゴールデンタイムにならないと上がってこないか
つーか、モー板には時間は関係ないのねw
あそこはゴールデンタイムにならないと上がってこないか
つーか、モー板には時間は関係ないのねw
131_
04/05/04 15:34ID:5POVpaVr04/05/04 17:14ID:njn3ef4n
> 58 www.hobby4 1
> 59 www.that2 1
これってなんですか?
> 59 www.that2 1
これってなんですか?
04/05/04 17:35ID:M8x5z933
http://www.hobby4.2ch.net/
とかで書き込んでる人が居るんじゃないですけー
とかで書き込んでる人が居るんじゃないですけー
134▲ 某ソレ511
04/05/04 18:08ID:/glRN505 なんかlive系の板だけ、書き込み数が3分の1くらいになってる気がする。。
(スレッドランキングの「過去6時間の投稿数」より少ないのはどうかと
http://www6.big.or.jp/~beyond/bbsnews/bbs-post-6h.html)
あと、フジテレビ板を見てきたら朝の10時から本スレを少なくとも10本は使ってるっぽいのに
すずめで見れるレス数が5000程度だったりするしなぁ、
(スレッドランキングの「過去6時間の投稿数」より少ないのはどうかと
http://www6.big.or.jp/~beyond/bbsnews/bbs-post-6h.html)
あと、フジテレビ板を見てきたら朝の10時から本スレを少なくとも10本は使ってるっぽいのに
すずめで見れるレス数が5000程度だったりするしなぁ、
04/05/04 18:11ID:XEms+XWz
136FOX ★
04/05/04 18:12ID:??? 処理の入り口部分で www. を取らなきゃね
137root ★
04/05/04 18:29ID:??? >>134
ネガティブキャッシュが動いてしまっているのかも。
一応ネガティブキャッシュが効かないようにはしてあるつもりだけど(SOA TTL=0)
うまくいってないのかな。
キャッシュが効いてしまうと、全く同じ問い合わせだとDNSに聞きに来てくれないんで。
避けるためには、何かランダムな文字列を一つ付与するようにしてもらえるとうれしいかも。
つまり、
> 発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
を、
毎回変わるランダム文字列.発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net
とかにするということです。
ネガティブキャッシュが動いてしまっているのかも。
一応ネガティブキャッシュが効かないようにはしてあるつもりだけど(SOA TTL=0)
うまくいってないのかな。
キャッシュが効いてしまうと、全く同じ問い合わせだとDNSに聞きに来てくれないんで。
避けるためには、何かランダムな文字列を一つ付与するようにしてもらえるとうれしいかも。
つまり、
> 発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
を、
毎回変わるランダム文字列.発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net
とかにするということです。
138root ★
04/05/04 18:33ID:???04/05/04 18:33ID:G5wEnZAp
投稿者のIP.発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net
140▲:/usr/local/bin/ch2 -o i686 ◆P8fXJj6wwo
04/05/04 18:34ID:yvoV0Ae2■ このスレッドは過去ログ倉庫に格納されています