X

【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1

■ このスレッドは過去ログ倉庫に格納されています
1FOX ★
垢版 |
04/05/03 04:30ID:???
2ちゃんねるの全発言の統計を取ろうに挑戦

bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。

まずは現在空いている oyster138(旧game5)ではじめてみよう計画
04/05/04 03:52ID:AdOlsIdV
あれ? sec2chd@qb2に書き込んだのに反映されない……。

反映されるのにどれくらいかかるの?
04/05/04 03:54ID:AdOlsIdV
×sec2chd
○saku2chd
78FOX ★
垢版 |
04/05/04 03:54ID:???
今はほとんどリアルタイムと思うが
パイプがどうのこうの言っていたので
その辺の遅延に関しては root★さんの解説が必要と思われ、
04/05/04 03:56ID:Bm2cXfAJ
2ch運用情報 operate@qb3
すずめの表示をこんな感じにキボンヌ。
検索しやすくなると思うので。

>>72
あんた、遊びなはれ。酒も飲みなはれ。
ていうか乙カレー。
04/05/04 03:57ID:2DOEwHTG
log/main/current へのシンボリックを、httpd で参照できるところに置いておくとか、
毎分自動更新 HTML 吐き出しの方が良さそうな?

もうねるぽ。
81FOX ★
垢版 |
04/05/04 04:00ID:???
>>71 >>80

まずは全部隠蔽して作ってみた。
ぼつぼつかと
04/05/04 04:10ID:6UwOg8SN
・時間別で分けると住民の生活の流れが分かって面白いかも。
特定板は日曜休みの人がアクセスする割合が多い…とか出来るとマーケティングにも使えるかも知れない。

・テレビ覧とシンクロ参照機能とか付けるとテレビ局から視聴率データとして●ノが出来るかも知れない。
歌番組でなっち登場シーンでカキコが倍増現象とか関連付けられたとしたら…

・板の中のスレッド別回覧、発言ランキング
特定の話題の(板)の特に何に興味が集まっているか、一目で参照出来るとマーケ(ry

・祭り抽出



機能の進化が進めば、株のアナリストみたいな奴が出てきて、情報に意味を持たせ物語を作る奴が出てくる予感。


と、実装する技術知らないので適当に言うだけ言ってみるテスト。
04/05/04 04:16ID:AdOlsIdV
うーん、qb2は対象外なのかな?
04/05/04 04:24ID:muKXYdZS
おっ 
いいねぇー
85FOX ★
垢版 |
04/05/04 04:29ID:???
>>83
どうなんだろう。。。

qb2 の bbs.cgi 上書きしてもいいならすぐ出来るんだけど、、、
ちょっと危険な匂いが ぷんぷん
04/05/04 04:31ID:AdOlsIdV
>>85
たしかに……。
04/05/04 04:32ID:oedb2deq
72 名前:FOX ★[] 投稿日:04/05/04(火) 03:46 ID:???
突貫工事で酒飲みながら作ったから
今日の昨日きここまで

ご要望はこのスレに書いておいてね

本格的に飲む !!
   ↑
ここらへんが危険
88FOX ★
垢版 |
04/05/04 04:32ID:???
>>75
確かに、、、

honobono ってサーバどこだろ?
04/05/04 04:34ID:t1viavpl
>>88
ここです
90FOX ★
垢版 |
04/05/04 04:35ID:???
>>89
human4 でしたっけ?

もしかして human4 って、、、
bbs.cgi 更新されていないのか?
04/05/04 04:36ID:t1viavpl
>>90
はい、human4ですね
04/05/04 04:37ID:t1viavpl
http://www.domo2.net/system/ver.html
20040414みたいです
93FOX ★
垢版 |
04/05/04 04:38ID:???
あららっ

更新するようにした
94FOX ★
垢版 |
04/05/04 04:40ID:???
qb2 は こっそり手動で入れてこよう
04/05/04 04:44ID:SlhusVJW
すこしだけスクリプトいじってみたいと思うのはやはり・・・中毒?

というのはどうでもいいのでおいといて、、、もう5万すか、、、
04/05/04 04:45ID:muKXYdZS
スゲースゲー
97root ★
垢版 |
04/05/04 04:45ID:???
おぉ、進んでいる、、、。

>>78
バッファを1行ごとにフラッシュしてあげれば、ほぼ完全にリアルタイムになるのかしら。
98FOX ★
垢版 |
04/05/04 04:46ID:???
>>95
至福゜のひとときってやつです。
99FOX ★
垢版 |
04/05/04 04:46ID:???
>>97
鴨です
04/05/04 04:49ID:SlhusVJW
>>98
>至福゜のひとときってやつです。
    ↑
一瞬これが気になった。まさか本当にかな入力(ry


板名表示のほうがいいなー。>suzume
101root ★
垢版 |
04/05/04 04:58ID:???
>>99
呼び出し側でバッファフラッシュのコードを入れてみた。
これでほぼリアルタイムになったはず。

# 今日はもうねます。
04/05/04 05:00ID:muKXYdZS
ホントだー
103FOX ★
垢版 |
04/05/04 05:06ID:???
>>101
おっ

うまく行っているようです
104root ★
垢版 |
04/05/04 05:06ID:???
>>80
log/main/currentの出力を、ほぼそのままFOXさんのプログラムにくべています。
某bbsgather.plみたいなかんじ。

# 呼び出し部分を作る際に、あのコードを参考にさせていただきました。どもです。
105FOX ★
垢版 |
04/05/04 05:11ID:???
>>104
質問です

各サーバからのlook up時、時刻データは載せていませんが
(つまり ひばり君が受け取った時刻を基準に全部動作している)

日付境界での挙動は・・・

1) かにりずれるので look up 時日付もデータとして載せたほうが良い
2) たいして気にする必要は無い

どんなもんでしょ?
106root ★
垢版 |
04/05/04 05:15ID:???
>>105
2)でいいと思います。たぶん、1秒もずれてないでしょう。
107root ★
垢版 |
04/05/04 05:16ID:???
1秒も、というのは「ぜんぜん」いう意味ではなくて、
遅延は多く見ても1秒未満だ、という意味です。
108FOX ★
垢版 |
04/05/04 05:17ID:???
ほほーい
んじゃ 2) で
109root ★
垢版 |
04/05/04 05:18ID:???
もちろん日付を乗せても無害だとは思います。

で、このプログラムは日付境界と関係なく動き続けるようになっていて、
ログローテートとかの影響を受けることはありませんです。
110動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 05:18ID:A5sVUGfg
すみません関係ない質問ですが削除依頼はどこにだせばいいですか?
111root ★
垢版 |
04/05/04 05:19ID:???
もうねなきゃ。

しかし、暴論を承知で言うと、
2ちゃんねるの全体の1割がmorningcoffeeでできているのか、、、。
112 ◆BFzK/mtqM2
垢版 |
04/05/04 05:22ID:Pj7f0UXH
>>111
たしかに。。。。
04/05/04 05:23ID:fWBrq4PN
>>110
削除整理
http://qb2.2ch.net/saku/
114FOX ★
垢版 |
04/05/04 05:54ID:???
まずは一定間隔おきにデータ取りの感じでやってみますか
04/05/04 05:58ID:oedb2deq
http://stats.2ch.net/

なんか切なくなって、夜中に泣き叫びそうになるので、
「実験中」とか書いてやって下さい・・・
04/05/04 05:59ID:5SNTe4Hr
いやそれどころじゃないし(;´∀`)・・
04/05/04 06:02ID:Bm2cXfAJ
んじゃ「実験中毒」で。
04/05/04 07:47ID:yvoV0Ae2
>>60,62の情報を反映しました。
http://info.2ch.net/wiki/pukiwiki.php?%C1%B4%C8%AF%B8%C0%C5%FD%B7%D7%BC%E8%C6%C0%BA%EE%C0%EF
04/05/04 07:51ID:yvoV0Ae2
連投スマソです。

>>111
もしそうならば、●による書き込み規制を
morningcoffeeにいれるだけで以下の可能性が予想できますなw

・書き込みたいがゆえに●が馬鹿売れ
・該当板の書き込みが減少
・該当板が廃れる
・その他の事象が発生
04/05/04 08:05ID:T5hskl3S
>119
 ・その他の事象が発生

(´・ω・´)ノ〓 100オレオ
04/05/04 11:18ID:RHBmNt0H
わーい、新しいおもちゃだー
04/05/04 11:20ID:fXiwlTKb
http://dra.zive.net/gao/

何でか差が大きい。(gao:6000超え 雀:2000超え)
うちのバグかな。。。
04/05/04 11:25ID:/glRN505
>>60から集計し始めたからじゃないかな?
つまり0時〜3時まではすずめではカウントされてないとか
04/05/04 11:31ID:fXiwlTKb
お、なるほど。
本日稼動開始だったのか(w

さすが、▲持ちですねー。
04/05/04 11:50ID:njNboplL
IPアドレスをデータに含めると、板別人口ランキングが分かる。
IPアドレスは繋ぎ変え等で変わるが、統計的に見れば人口とほぼ比例するはず。

板の常駐率みたいなのも分かるかも。
常駐率=発言数/IPアドレス数 のように求める。
04/05/04 13:00ID:/glRN505
あとすずめに出てこないのはsports2上の5板と
2ch規制情報[sec2ch]なので漏れはなさそうですね。

>>125
いちおうsamba24でクリアされた時間ごとのIPアドレスの数っていうデータはあるけどねぇ、
カウントされるのがどういう基準なのかよく分からないからなぁ
http://etc.2ch.net/_service/IPnum-2004-5-4.txt
127動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 13:30ID:HiEE2Dve
引きこもりランキングだなあ
128動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 14:25ID:18i/pJOV
板が23あるgame6より板が1つのtv5が多いっつうのも
04/05/04 14:47ID:r6qwSjJs
morningcoffee>game6全部>>(越えられない壁)>>その他
04/05/04 14:51ID:Hrfq64Ek
実況板の書き込み数がたいしたことないなと思ったが、
あそこはゴールデンタイムにならないと上がってこないか

つーか、モー板には時間は関係ないのねw
131_
垢版 |
04/05/04 15:34ID:5POVpaVr
要望:

ちゃっかりカウンター(http://count.2ch.net/?operate)のように、
昨日のデータを保存するようにして下さい
04/05/04 17:14ID:njn3ef4n
> 58 www.hobby4 1
> 59 www.that2 1

これってなんですか?
04/05/04 17:35ID:M8x5z933
http://www.hobby4.2ch.net/
とかで書き込んでる人が居るんじゃないですけー
04/05/04 18:08ID:/glRN505
なんかlive系の板だけ、書き込み数が3分の1くらいになってる気がする。。
(スレッドランキングの「過去6時間の投稿数」より少ないのはどうかと
http://www6.big.or.jp/~beyond/bbsnews/bbs-post-6h.html)
あと、フジテレビ板を見てきたら朝の10時から本スレを少なくとも10本は使ってるっぽいのに
すずめで見れるレス数が5000程度だったりするしなぁ、
04/05/04 18:11ID:XEms+XWz
>132
http://鯖名.2ch.net/板名/ と http://www.鯖名.2ch.net/板名/ は同一だったような。
136FOX ★
垢版 |
04/05/04 18:12ID:???
処理の入り口部分で www. を取らなきゃね
137root ★
垢版 |
04/05/04 18:29ID:???
>>134
ネガティブキャッシュが動いてしまっているのかも。

一応ネガティブキャッシュが効かないようにはしてあるつもりだけど(SOA TTL=0)
うまくいってないのかな。

キャッシュが効いてしまうと、全く同じ問い合わせだとDNSに聞きに来てくれないんで。

避けるためには、何かランダムな文字列を一つ付与するようにしてもらえるとうれしいかも。
つまり、

> 発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up

を、

毎回変わるランダム文字列.発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net

とかにするということです。
138root ★
垢版 |
04/05/04 18:33ID:???
今自宅で試しました。ううむ、どうも>>137みたいだなぁ。

つまり、全く同じバイト数で全く同じスレッドに発言すると、とられないことになる。

ランダム文字列じゃなくて、>>105みたいに時間でとってもいいかも。
ただし秒単位ではたぶんだめで、もっと細かいやつ。
04/05/04 18:33ID:G5wEnZAp
投稿者のIP.発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net
04/05/04 18:34ID:yvoV0Ae2
>>137

unixtime.bytes.theadkey.boardname.servername.cginame.BBS.2ch.net

でどうでしょう。
141root ★
垢版 |
04/05/04 18:35ID:???
>>140
というわけで、秒より細かいのを入れないと。
Perlだとどうやってとるんでしたっけ。
04/05/04 18:35ID:2DOEwHTG
「発言番号」ってのはうまくいくのかな?
04/05/04 18:36ID:2DOEwHTG
>>141
use Time:HiRes;
標準では入っていないかもです(泪)
04/05/04 18:37ID:yvoV0Ae2
>>140
あうすれ違いですた、スマソ。

たしかに秒単位じゃあliveあたりはきついですね。
unixtime@$RAND.〜などとしてみますか?

$RAND=4文字程度のランダム文字
04/05/04 18:38ID:/glRN505
なるほど、、どーりで他の板も微妙に少ない気がしたんだよなぁ、
って、この処理っておそらくcgiの一番最後でやってるんですよね?
だったら>>142でもいい気がする
04/05/04 18:39ID:2DOEwHTG
あ、$$(プロセスIDを格納しているスカラー変数)だと被りにくいかもですね(^-^)
147root ★
垢版 |
04/05/04 18:40ID:???
これでいいのかな。

$uniqid = time . "." . $$;
04/05/04 18:40ID:yvoV0Ae2
>>146
GAの予感。

unixtime$$.bytes.theadkey.boardname.servername.cginame.BBS.2ch.net
04/05/04 18:42ID:yvoV0Ae2
また名前入れ忘れた上に、GAじゃなくてGIだったし orz

逝ってきます。
04/05/04 18:42ID:2DOEwHTG
>>147
個人的には、
$uniqid = sprintf qq|%d.%d|, time, $$;
(^-^;)
151root ★
垢版 |
04/05/04 18:43ID:???
>>150
なるほどです。
私はPerl初心者なんで。
152root ★
垢版 |
04/05/04 18:45ID:???
で、live系がなぜ特に少なくなったかというと、みんなで同じバイト数の発言を同じスレでしてるからか。
04/05/04 18:47ID:yvoV0Ae2
逝ってきました。

>>152

キタ━━━!!

とかのオンパレードですからねえ。
04/05/04 18:47ID:2DOEwHTG
>>150
でもって無精だから、、、
gethostbyname sprintf qq|%d.%d.%d.%d.%s.%s.%s.bbs.2ch.net|,
 time, # epoctime
 $$, # PID
 length $FORM{message}, # 長さ
 $FORM{key}, # datナンバ
 $FORM{bbs}, # bbs名
 $ENV{HTTP_HOST}, # 鯖名
 $ENV{SCRIPT_URI}; # cgi名
(^ー^;;;)
04/05/04 18:48ID:giuYQHul
すれ違いしまそ

319 名前: 動け動けウゴウゴ2ちゃんねる [sage] 投稿日: 04/05/04 18:46 ID:vM82bvmg
oyster244落ちました。

2ch鯖監視所
http://users72.psychedance.com/

なので、よろしくお願いします
04/05/04 18:57ID:muKXYdZS
>>152
(*・3・) エェー そういう仕組みなのか・・・・
157FOX ★
垢版 |
04/05/04 19:11ID:???
>>141

C で書いてたりして、
Perl よくわかんないし
04/05/04 19:31ID:SlhusVJW
PHPはよくわかるけど、
Perl よくわからないってところは同じだな。
159FOX ★
垢版 |
04/05/04 19:34ID:???
なにぼけたこと言ってるんだ >>157

bba.cgi は Perl でしょ
160動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 19:37ID:oQRaYUcD
>>157
>>159
FOX ★の中の人が入れ替わった━━━━ヽ(゚∀゚ )ノ━━━━!!!!
04/05/04 19:38ID:18i/pJOV
bba.cgi
04/05/04 19:42ID:K1WK5TN9
む、新型か。
163FOX ★
垢版 |
04/05/04 19:42ID:???
time.$$.bytes. -----

にした。

peko サーバコンパイルお願いしますー
04/05/04 19:56ID:Pj7f0UXH
>>157
>>159
誰も突っ込まなかったんで、自分で突っ込みを入れたのかな?
04/05/04 19:58ID:w+IqmgNm
★の自作自演が見られるスレはここですか?
166FOX ★
垢版 |
04/05/04 20:04ID:???
この時間ってのも作ってみるか、

今はまだ試行錯誤の段階ですので

あら捜し、アイデア出しって事で
04/05/04 20:06ID:SlhusVJW
投稿バイト数の合計まだー?
04/05/04 20:13ID:AfF+geJh
基本の部分が完成されてしまえばアウトプットの形はいろんな人がそれぞれ作ってくれるのではないかと
169FOX ★
垢版 |
04/05/04 20:14ID:???
http://stats.2ch.net/tonbi.cgi
04/05/04 20:16ID:xaPinMdF
おおっ、時間単位の発言数だ
まぁ、トップは今お祭り騒ぎだからなぁっと言っても野球すら超えてるとはw
04/05/04 20:22ID:Pj7f0UXH
>>166
この時間とは、どの時間?
172動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 20:22ID:AZIx/j9H
>>169
とんびを見ると、
プロ野球板baseで実況しているのが、
わかるねぇ・・・
04/05/04 20:24ID:/glRN505
ところで、バイト数や鯖名がたまに紛れ込んでますが、
これはすぐになおるかな、

>>172
いやあの、デーゲームだった試合も3試合ほどありますよ、、
とは言っても確かに実況してそうなスレはありますがね、
174FOX ★
垢版 |
04/05/04 20:24ID:???
データを蓄積していく上で必要なのは

毎日 0:01 に呼ばれる処理 (一日の集計 & お掃除)
毎時 N:01 に呼ばれる処理
N分毎に呼ばれる処理

この三つかしら、(これらはPerlで書くか、)
04/05/04 20:25ID:RHBmNt0H
どのくらいの時間の集計なんだろ?>とんび
baseは実況かな?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況