X



トップページ運用情報
1001コメント239KB
【野鳥の会】 BBS.2ch.net 全発言統計の巻 part1
■ このスレッドは過去ログ倉庫に格納されています
0001FOX ★
垢版 |
04/05/03 04:30ID:???
2ちゃんねるの全発言の統計を取ろうに挑戦

bbs.cgi に一個DNS問い合わせの処理を追加
発言バイト数.スレッドkey.板.サーバ.CGI名.BBS.2ch.net をlook up
この方法でやるとかなり低コストで出来る予感。

まずは現在空いている oyster138(旧game5)ではじめてみよう計画
0002root ★
垢版 |
04/05/03 04:32ID:???
もうすぐ生誕の儀式します。
儀式はあっちのスレで。儀式後はこちらで。
0003FOX ★
垢版 |
04/05/03 04:33ID:???
ほほーい
0010FOX ★
垢版 |
04/05/03 05:57ID:???
stats.2ch.net の中でいろいろ作ればいいのかな?
0011root ★
垢版 |
04/05/03 06:00ID:???
さて、DNS側の基本作業は終わりました。
これからアカウント情報をFOXさんにメールします。

統計情報処理プログラムを作るときは、BBX/Rock54と同じようなフィルタリングが必要ですね。
つまり、PIEやHEのDNSキャッシュサーバか、あるいはuma/pekoサーバからの
DNSリクエストだけ受けるようにしないと、ノイズが乗ってしまうんで。

このへんはシステム側でできると思います。
つまり、FOXさんの処理プログラムにデータが行く時は、既にフィルタリングは済んでいると
想定してもらっていい、という仕様でいこううかと。

# どういうシステムデザインでいこうかいろいろ試行錯誤と脳内計画をしていたのが、
# 生誕の儀式が遅れた原因でした。スマソ。
0012root ★
垢版 |
04/05/03 06:01ID:???
>>10
ですね。statsはoyster138上に作成しています。
0013FOX ★
垢版 |
04/05/03 06:03ID:???
まずは 呼ぶほうから作りますか、

もえ引いてもいいですか?
0015root ★
垢版 |
04/05/03 06:06ID:???
>>13
はい、準備OKです。
0017root ★
垢版 |
04/05/03 06:09ID:???
>>16
対応はやっ。
Wikiが必要かなぁ、って書いてから寝ようと思っていた矢先に、、、。

ありがとうございます。
0018FOX ★
垢版 |
04/05/03 06:10ID:???
こんなコードを書いていきなり tv5 に入れてみる

{
my $BYTES = length($FORM{'MESSAGE'});
my $BHOST = "$BYTES.$FORM{'key'}.$FORM{'bbs'}.$ENV{'SERVER_NAME'}.bbs.bbs.2ch.net";
my $YACHO = gethostbyname($BHOST);
}
0019root ★
垢版 |
04/05/03 06:14ID:???
こんなのがどんどん来はじめた。
@400000004095649e3b09e634 d8dad9b3:ffa9:b4d8 + 0001 70.1083531769.morningcoffee.tv5.2ch.net.bbs.bbs.2ch.net
0020FOX ★
垢版 |
04/05/03 06:15ID:???
qb4 に入れて特にエラーも出さないようなので、

全サーバに配ってみる

ただしaaa.bbb.ccc.ddd.bbs.2ch.net の部分は
どんどん変わる予定
0021root ★
垢版 |
04/05/03 06:16ID:???
CGI名が一番上位に来るというのは、いいセンスですね。
将来read.cgiとかで何かしても、サブドメインを分ければ、サーバ側を分けられるので。
0022root ★
垢版 |
04/05/03 06:16ID:???
>>20
配り終わったらpekoサーバでperlccしますので、お伝えください。
0023FOX ★
垢版 |
04/05/03 06:18ID:???
>>22
配りましたー
0024root ★
垢版 |
04/05/03 06:18ID:???
他のサーバからもどんどん来始めた。

@40000000409565b01efa986c d8dad9b3:6b39:f011 + 0001 73.1083146689.entrance.ex2.2ch.net.bbs.bbs.2ch.net
@40000000409565b02c41a894 267289e9:b519:8f38 + 0001 134.1083529195.livecx.live10.2ch.net.bbs.bbs.2ch.net
@40000000409565b02d762154 4113977a:4f0a:afc0 + 0001 90.1080893802.mj.gamble2.2ch.net.bbs.bbs.2ch.net
@40000000409565b100e80c4c d8dad9b3:b487:c7ea + 0001 68.1083508251.news.ex4.2ch.net.bbs.bbs.2ch.net
@40000000409565b1193a55fc d8dad9b3:2e95:9788 + 0001 117.1083531849.motenai.love2.2ch.net.bbs.bbs.2ch.net
@40000000409565b12103e1a4 d8dad9b3:2c87:5494 + 0001 26.1078758110.intro.etc.2ch.net.bbs.bbs.2ch.net
@40000000409565b12a11c874 d8dad9b3:e962:b596 + 0001 163.1083523761.base.sports5.2ch.net.bbs.bbs.2ch.net
0026FOX ★
垢版 |
04/05/03 06:21ID:???
my $BYTES = length($FORM{'MESSAGE'});

現在この部分は、投稿時のバイト数ではなく
bbs.cgi が >>1 なんかを置き換えたあとの実際に
dat に書き込まれるバイト数でーす
0027FOX ★
垢版 |
04/05/03 06:24ID:???
>>25

bbs.2ch.net look up 個数の微分値、積分値は
MRTG or RTG 等を用いて root★さんの方でやりますか?

私は、サーバ別とか板別とか中身をみての処理をやろうと思いますが、
0029動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/03 06:35ID:e7+mElU+
>>28
時間ごと日にちごとの、板別スレッド別発言数ランキングとか。
http://www6.big.or.jp/~beyond/bbsnews/bbs-post-1h.html

read.cgiにも組み込むと、どのスレがどれだけ呼ばれているか統計が取れる。
で、IPアドレスも呼び出しに含めると、>>9に加えて、どのホストが
どの板のどのスレをROMしたり書いてるか、完全追跡できる。
0030FOX ★
垢版 |
04/05/03 06:37ID:???
>>28

第一目標は
http://www6.big.or.jp/~beyond/bbsnews/bbs-post-1.html
これを超低コストでより正確によりリアルタイムに実現。
0031root ★
垢版 |
04/05/03 06:41ID:???
perlccしました。

>>27
そうですね。そんなかんじがいいかなと。
サーバ別とか板別の投稿数の推移とか、これならコストかけずに簡単にとれますね。

read.cgiに応用すれば、そっちも取れるのかも。
0032root ★
垢版 |
04/05/03 06:45ID:???
今のところDNS側には異常なし。

本日はそろそろ、おやすみなさい。
いろいろいじるのは、明日以降ということで。
0034ヾ●ノ゛ ◆NATTOSpTC2
垢版 |
04/05/03 06:58ID:ll71U536
>>29
荒らしの追跡ができて便利になるのかなー?
すると野菜舞台の人が楽になったりするのかも?
0035 ◆BARONWRR1M
垢版 |
04/05/03 07:13ID:I5A2iZiq
生命の神秘の追求には役立つのかしら?
0041動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/03 14:16ID:mzD8zE5G
前から期待してた機能だ

↑ |
ス . |             ,ヘ
レ . |          / |
数 |         /  |
   |__,,,,,,,,,,r-''~    \
   . ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
    レス頻度→

これが板ごとに見られれば板全体の稼動スレの占有度とか
個々のスレの板におけるレスの早さの程度とかがわかる

はじめて行く板でもレスが特定のスレに集中しているのかどうかも見当がつく
0042 [―{}@{}@{}-]
垢版 |
04/05/03 14:55ID:Vxhp5w2g
これと●でスレ立てられなくなたのと何か関係が・・・?
0043FOX ★
垢版 |
04/05/03 18:06ID:???
stats.2ch.net 内に原型のプログラム書いたので
都度呼んでくださいー > root★さん

詳しくは、メールしましたー
BBYと同じと仮定して作ってあります(単にコピーしただけですけど)
0044サザン ★
垢版 |
04/05/03 18:49ID:???
むぅ

どうやって読むのかと思った、、
0045root ★
垢版 |
04/05/03 19:15ID:???
>>43
ほい、ぼちぼちやります。
0046FOX ★
垢版 |
04/05/04 01:41ID:???
質問でーす

ひばり君をコンパイルして更新しても
変わった様子がないんですが、

コンパイル後に何かしなきゃならないんでしょうか?
0047root ★
垢版 |
04/05/04 01:50ID:???
>>46
あ、メールしたとおり今回のは「パイプ」として起動されてますので、
コンパイルしたら、1回今いるやつをkillしないとだめです。

killを簡単に実行するshell sciptを作って置いておきます。
0048FOX ★
垢版 |
04/05/04 01:52ID:???
むちむちなもんで

よろしくお願いいたします
0049root ★
垢版 |
04/05/04 01:58ID:???
該当ディレクトリに .sh で終わるファイルを入れて置きました。

./なんちゃら.sh

というかんじで実行すればだいじょうぶなはず。
0050FOX ★
垢版 |
04/05/04 01:59ID:???
どもですー
やってみますー
0051動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 01:59ID:bkw4fOLy
予想としては一日30万カキコくらいかなぁ?

現行スレの数は500板*400スレ=20万スレくらいあるよね。多分。
それに平均500レスあるとしたら・・・ 1億レス?
一生かかっても見れねぇな・・・

あぁ、この瞬間にも俺が一生見ることが無いであろう書き込みが行われている・・・!
0054FOX ★
垢版 |
04/05/04 02:09ID:???
>>49
うまく行っているようです。
どもでした。
0057▲ 某ソレ511@ちょっと酔ってるみたい
垢版 |
04/05/04 02:53ID:/glRN505
それは「常時動いてる」というのがどのラインなのかによると思うなぁ、、
10分に1レス?1時間に1レス?1日に1レス?とか水掛け論かこれは、、
0058ヾ●ノ゛ ◆NATTOSpTC2
垢版 |
04/05/04 02:58ID:b0MI3gJD
>>57
脳内定義↓
最近24時間でレスがあれば動いている。
例えば過疎板なんかでは動いてるスレが50以下なんてこともあったり…
0068動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 03:42ID:Bm2cXfAJ
とりあえず今日0時からの統計かな。
明日のいまごろとかどうなってるんだろう。
すずめの板名にBBS MENUのものと鯖名まであれば、
見比べやすくて面白いと思うけど。面倒だろうか。
0072FOX ★
垢版 |
04/05/04 03:46ID:???
突貫工事で酒飲みながら作ったから
今日の昨日きここまで

ご要望はこのスレに書いておいてね

本格的に飲む !!
0074FOX ★
垢版 |
04/05/04 03:47ID:???
>>70 >>73
書いてくるといいかも
0078FOX ★
垢版 |
04/05/04 03:54ID:???
今はほとんどリアルタイムと思うが
パイプがどうのこうの言っていたので
その辺の遅延に関しては root★さんの解説が必要と思われ、
0079動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 03:56ID:Bm2cXfAJ
2ch運用情報 operate@qb3
すずめの表示をこんな感じにキボンヌ。
検索しやすくなると思うので。

>>72
あんた、遊びなはれ。酒も飲みなはれ。
ていうか乙カレー。
0080◆baila6uPTo
垢版 |
04/05/04 03:57ID:2DOEwHTG
log/main/current へのシンボリックを、httpd で参照できるところに置いておくとか、
毎分自動更新 HTML 吐き出しの方が良さそうな?

もうねるぽ。
0081FOX ★
垢版 |
04/05/04 04:00ID:???
>>71 >>80

まずは全部隠蔽して作ってみた。
ぼつぼつかと
0082動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 04:10ID:6UwOg8SN
・時間別で分けると住民の生活の流れが分かって面白いかも。
特定板は日曜休みの人がアクセスする割合が多い…とか出来るとマーケティングにも使えるかも知れない。

・テレビ覧とシンクロ参照機能とか付けるとテレビ局から視聴率データとして●ノが出来るかも知れない。
歌番組でなっち登場シーンでカキコが倍増現象とか関連付けられたとしたら…

・板の中のスレッド別回覧、発言ランキング
特定の話題の(板)の特に何に興味が集まっているか、一目で参照出来るとマーケ(ry

・祭り抽出



機能の進化が進めば、株のアナリストみたいな奴が出てきて、情報に意味を持たせ物語を作る奴が出てくる予感。


と、実装する技術知らないので適当に言うだけ言ってみるテスト。
0085FOX ★
垢版 |
04/05/04 04:29ID:???
>>83
どうなんだろう。。。

qb2 の bbs.cgi 上書きしてもいいならすぐ出来るんだけど、、、
ちょっと危険な匂いが ぷんぷん
0087動け動けウゴウゴ2ちゃんねる
垢版 |
04/05/04 04:32ID:oedb2deq
72 名前:FOX ★[] 投稿日:04/05/04(火) 03:46 ID:???
突貫工事で酒飲みながら作ったから
今日の昨日きここまで

ご要望はこのスレに書いておいてね

本格的に飲む !!
   ↑
ここらへんが危険
0088FOX ★
垢版 |
04/05/04 04:32ID:???
>>75
確かに、、、

honobono ってサーバどこだろ?
0090FOX ★
垢版 |
04/05/04 04:35ID:???
>>89
human4 でしたっけ?

もしかして human4 って、、、
bbs.cgi 更新されていないのか?
0093FOX ★
垢版 |
04/05/04 04:38ID:???
あららっ

更新するようにした
0094FOX ★
垢版 |
04/05/04 04:40ID:???
qb2 は こっそり手動で入れてこよう
0097root ★
垢版 |
04/05/04 04:45ID:???
おぉ、進んでいる、、、。

>>78
バッファを1行ごとにフラッシュしてあげれば、ほぼ完全にリアルタイムになるのかしら。
0098FOX ★
垢版 |
04/05/04 04:46ID:???
>>95
至福゜のひとときってやつです。
0099FOX ★
垢版 |
04/05/04 04:46ID:???
>>97
鴨です
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況