bby -- スレッド情報一元管理システム構築スレ
■ このスレッドは過去ログ倉庫に格納されています
2chにある全スレッドの情報を一元で管理するシステム(通称bby)について議論したり構築したり
雑談したりするスレッドです。
関連スレ
bbs.cgi再開発プロジェクト2
http://qb3.2ch.net/test/read.cgi/operate/1069144193/l50
【広告】新機能 Rock54【自動排除】 2
http://qb3.2ch.net/test/read.cgi/operate/1067770666/l50 となるとやっぱりerimoを保存するのが良ですね。
後、datが残っていると本板でスレッド削除された時に問題ですけど、、、 DNSでbbyに突撃じゃぁぁぁぁぁぁ!→erimo「うぉおおおおおおおおおおおおおお!」→bbynews(dat)をはきだす&erimoの各ファイル吐き出す
→datの数が最高数に達した→archive0.2ch.netにFTP接続→/bby/dat/にコピーし、bby側のdatは削除→FTP Close→OKyo. でもerimoはリアルタイムに更新されてる・・・・(^_^;)
スレが一定量立つとバックアップを作成?(^_^;)なんかエレガントじゃない気がする >>377
1スレ毎にsocket、socketしてたらtugaruのりんごが重くてバタン… >>378
そこで>>346 タイプでlog保存ですよ。 >>374
んじゃsubject.txtと平行して新型のsubject2.txtでも作るとか。
スレキー.dat<>スレタイ<>鯖<>フォルダ
な感じで。 >381
おいらもそれ考えた(^_^;)
たたき台としてはdatを結合した1ファイルみたいなやつ。
不要な情報はけずっちゃえばいい・・・・とか >>378
日別のtxtを用意して、news.txt等と同時に開き、
news.txtから落ちたスレッド情報は、日別txtにどんどん追記。 とりあえず、かつて2chになかった永続的な横断検索(スレタイ&スレッドの1だけだけどね(^_^;))
の可能性を鑑みるに、なんらかの手段を残しておく方向は捨てたくないなぁ・・・・ >>381
うーん、erimoのレス1の情報がなくなっちゃうのが惜しいと言えば惜しい >>383
鯖<>フォルダ<>スレキー<>投稿者<>メール<>日付とID<>本文<>スレタイ
な感じ? >>387
それだったらerimoで保存してあるtxtの形式が
日付 時間 スレのアドレス 投稿者<>メール<>日付とID<>本文<>スレタイ\n
だからそっちとたいして変わらない罠。 >387
鯖<>フォルダ<>スレキー
の部分は
http://qb3.2ch.net/test/read.cgi/operate/1073058944/
↑のままでええかと(^_^;)そしたら専用ツールの方で解釈できるし
あ(^_^;)おいらがちょっと概要を勘違いしてるのね
/bbynewsも/erimoもerimoが吐いてるデータで、見え方がhtmlなのか生なのかの違いなのね(^_^;) >>391
かつerimo自体は、subject.txtとdatを結合したデータを保持してます。 うわー
thread.txtがいつもならありえないほどでかくなってた。。。 erimoだとかnotoだとかturugaだかtugaruだか
いろいろありますね。 >391
あいあい(^_^;)出遅れをとり戻そうと斜め読みしてたんで
やっと追いつきました って、
おおおおおーーーーーーー
保存してあるじゃないですか!! >>395 って事故レスしてるし(^_^;)>392ね
>399
なるほどー(^_^;)ってなんか部分集合が色々作られてるわけだ・・・・ ほうほう、、ただ、1の内容が入ってないのね。
まあ、入れたら膨大なログに、、ならないか。
1ファイル1MByteくらいになるけど。 >>405
最初に作ったのが noto だったので入っていないのだ
入れるのは簡単 うっそーん
新thread.txtを設置して5分で1M突破かよーw つことはあれだね(^_^;)
BBYサーバには
1 2chで立ったスレッドの、>1のdatにまつわるデータが集まる
2 そのデータを加工して閲覧可能な状態にできる
まずこれが基本で
どのように加工することで、どのような機能にデータを提供できるか
あるいは、どのような機能を想定して、どのようなデータを作り、残すべきか
って話になるわけだ(^_^;) 1ファイル1MB、、、
検索するのにあちこちから1MBを引っ張ると転送量がすごそうですね 現在のbby.php(非公式の奴ね)状況
thread.txt(保存用テキスト)
530 KB(543308 Byte)
LineCount:505
(;´Д`)ハァハァ 現状は
1 IE向けのhtmlヘッドライン(erimoディレクトリ)
2 erimoの保持するtxt(用途不明)
3 専用ブラウザ向けdatおよびsubject.txt
4 noto(用途不明)
が出力っつーことで(^_^;) 大量アクセスでphpが逝っちゃった。。。(あーあ
THREAD.TXT容量:1034 KB(1059238 Byte) LineCount:10104
そんなにねーよー。=>LineCount ありゃ、実際にあった>10104
やばいやばい、容量が、、あたふたあたふた。 >>416
あっ、
2004/02/04 02:16:07
から確認できました
ありがとうございます 最終的には pull だけじゃなく push まで考えていたりして
>>371 順にレスしていこうかなと。
>>320
負荷は、今のところOKかな。
http://bbq.2ch.net/_service/20040204.txt
ただ、こいつはumaサーバで唯一Ultra160でディスクが動いているので
(SCSIはUltra320仕様だけど、ディスクが対応してない)、ちょっと、不利かな。
でも、まだまだ余裕ですよ。
こりゃ、bbqもまじめにアクセス数を観察しないとまずそうなだなぁ。
ということで、こちらを。そのうちグラフ出るでしょう。
http://mumumu.mu/mrtg/mrtg-rrd.cgi/access/bbqaccess.html >419
専用ブラウザに対して?(^_^;)>push >>421
まだそこまでの具体的な方法は考えていないのだ、
エレガントに数百万人にpush できたら大成功 pushするにはpushする相手を知ってないといけない気がするわけだが(^_^;)
専用ブラウザからBBY pusherにログインしてリアルタイムに受信とか・・・・
って数百万ですか(^_^;)うーんうーん >>339
今、1日に5000ぐらいかな。< スレ。
だったら、datが1000個超えないように、6時間に1回掃除ぐらいでいいのかなと。
>>347
>>1が犯罪予告だったり、とってもプライバシーだったりした時のことは、
考えたほうがいいかもしれないと思うです。
つまり、何らかのI/Fで削除人さんのあぼーんと同期とか。
ということで、今の段階で全板やっちゃうのは、やや危険かも。かも。
>>419
pushですか。やるなぁ。
おじさんがでまかせでカキコするのいろんなアイディアのための道具を用意するのが、
当面の私の役割ってことかな。ことかな。 >>424
いやー
これもumaが稼動し始めて
時間が出来たおかげです
いろいろ思いついちゃう。
どうも どうもです >424
あー、そういう問題ありますね>削除同期
かなり面倒な処理(処理自体は軽くても)になりそう・・・・(^_^;)
苦労人だ(^_^;)>役目 新スレは、多かったときで、凡そ8000/dぐらいありましたけど・・・ >>429
その辺の指導検出、迎撃もやれば出来る気がするんですよねぇ http://ex.2ch.net/entrance/
なんかむしろ懐かしい風景だったり(^_^;)消したなぁ・・・・ notoさんをとりあえずニュース系だけにして、
ある程度過去のdatを保存しておくようにすると、記者さん大喜びのよかーん。
>1の記事があれば、検索時の重複がかなりふせげるような。ような。 >>429でスレ乱立してる人のライブカメラ。怖い。(汗)
ttp://www.geocities.co.jp/HiTeens-Rabbit/1203/licam.jpg
(ttp://www.geocities.co.jp/Milano-Cat/6084から引用) >436
壷でこのスレッドリロードすると、どんどん変化して怖い(^_^;) >>437
壷な人にはきつかったですね・・・すんません・・・。
・・・_| ̄|○・・・はうぅ・・・ どんどんスレ削除しても、ここには記録が残るわけですねぇ。
なんて便利な・・・ニヤリ ちょっと質問です
異なる鯖で、同じスレキーのスレがたった場合、
http://bbq.2ch.net/bbynews/dat/ のスレキーってどうなります?
後から BBY を呼び出した方が、1インクリメントされてたりするのかな。 >>444
ひとつだけ同じkeyのやつがあったけど、
やっぱり上書きされてた。 、、と思ったけど、これは調子が悪くて
二重に登録されてただけだった。 うむ。確かに地震だった。
ってなに書いてるんだよーヽ(`Д´)ノ 2004/02/04 04:14:06 地震キキキキタタタタ━━━((゚(゚∀゚)゚))━━━!!!!PART26 M7.74
2004/02/04 04:12:10 じしん 番組の途中ですが名無しです
2004/02/04 04:11:55 地震です 番組の途中ですが名無しです
2004/02/04 04:11:44 地震 番組の途中ですが名無しです
2004/02/04 04:11:42 地震 番組の途中ですが名無しです
2004/02/04 04:08:18 陸自先遣隊・サマワ福祉局にヒツジ20頭贈る 宿営地は工期が遅れ始める(2/4) auau...φ ★
2004/02/04 04:07:18 パキスタンなど感染国に160万ドル支援 鳥インフルエンザでFAO(2/4) auau...φ ★
2004/02/04 04:06:55 コネティカットで不審な粉 共和党全国委員宛の封筒に 米当局者(2/4) auau...φ ★
2004/02/04 04:06:35 露南部・北オセチヤで車爆発、通行中の女性死亡 チェチェンに隣接(2/4) auau...φ ★
http://bbq.2ch.net/bby/erimo/news.html
ニュー速最高 >>451
おお、ここにも地震計が設置されたということで。 >451
地震スレッドが4つ連続出たったら地震を関知するシステムが作れそうだ(^_^;) >>444
まぁ そのうちなんとかするという事で、 ひろゆきキタ━━━━━━(゚∀゚)━━━━━━!! (´-`).。oO(ひろゆきさんってこの時間もう寝てるのかと思った) >461
わかりにくいけど、今も寝てます(^_^;)>459は寝言 >>463
起きてますか〜( ゚д゚)σ)´Д`)プニプニ ●は剥奪(返金だけど)
でそのカードは多分点数下がるよ。
それを繰り返していると使えなくなるよどこ行っても、
もちろんもう●は永久に買えません(NTTecのリストにのる)
__、,____
/::::::::::,,:::::::::::::::::::::ヽ
/:::::::::::,,,::::::::::::::::::::::::::::::ヽ
/::::::::::::::,,,,:::::::::::::::::::::::::::::::::::ヽ、
|::::::/⌒ ^ ⌒ \:::::::::::::::::::::::::ヽ.
|:::::| /ヽ::::::::::::::::::::::| ひろゆき様の参上だ!
|:::::|\ / ヽ::::::::::::::::::::|
ヽ:::|<(| こ(> \|ヽ:::::::::| .
ヽ| h J:::::::::| .
\ L ヽ::::::/ . >>1>>1000 嘘を嘘だと見抜ける人で無いと(掲示板を使うのは)難しい
\ー―┘ |:::/
__\__/ /V_____
/;;;;;;;;;/ く / ∧;;;;;;;;;;;;;;;;;; >>462
(´-`).。oO(マァブさんもそろそろ寝ないとやばいかと・・・)
☆ チン 〃 ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄
ヽ ___\(\・∀・)<ひろゆきはやくー
\_/⊂ ⊂_)_ \_______
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄/|
|  ̄  ̄ ̄ ̄ ̄ ̄ ̄:| :|
| .|/ ロックな生き方してるな。中浦和は。おもしろかったぞ ■ このスレッドは過去ログ倉庫に格納されています