X



bbs.cgi再開発プロジェクト Part8

レス数が900を超えています。1000を超えると表示できなくなるよ。
1root▲ ★
垢版 |
NGNG
bbs.cgiの開発作業をすすめていくためのスレッドです。

FOXさんの努力によりSpeedyCGIへの対応が行われ、
パフォーマンスの向上が図られたbbs.cgi。

・さらなるカスタマイズ
・パフォーマンスの向上
・微妙な虫取り
・残された秘境エリアの開拓

あたりをターゲットに。

前スレ:
bbs.cgi再開発プロジェクト7
http://qb5.2ch.net/test/read.cgi/operate/1130918407/
2007/02/14(水) 21:29:29ID:IUQlVW7b0
復帰呪文側でスレを立てる
2007/02/14(水) 21:36:34ID:VJPVdIvT0
>>807 変数の初期化とかいろいろあるので,今のままでは別スクリプトから
呼ぶってのはちょっと難しいかもですね.

>>808 ゴミスレが立ってもいいなら,それもありかも?
2007/02/14(水) 22:22:29ID:Uc7IlgTe0
■移転ですー
に対抗して
■復帰ですー
で立てる。
811動け動けウゴウゴ2ちゃんねる
垢版 |
2007/02/14(水) 22:30:44ID:Qtmb/rzV0
復帰するたんびにスレ立ててたらスレ立て荒らしになっちゃうよ
2007/02/14(水) 22:35:08ID:BdEREMKO0
既に立ってたらもう立てなくていいじゃん?
既存のスレにレスするだけとか
813動け動けウゴウゴ2ちゃんねる
垢版 |
2007/02/14(水) 23:37:21ID:+vqZDfnm0
例の特殊datか
2007/02/14(水) 23:43:57ID:VJPVdIvT0
あ......SpeedyCGI だから,船の出港時だけは生成するっていうのもありかな?
2007/02/14(水) 23:46:33ID:jsn575PK0?PLT(23461)
>>814
なるほど。

出航時を判別すればいいのか。
起動回数でも $FOX の中に持たせてみるとか。
2007/02/14(水) 23:47:58ID:jsn575PK0?PLT(23461)
…ただ、同時に起動した時におもたくなるリスクは、あるのかもかも?
そのへんは、大福食ってみないと、なのかしら。
2007/02/14(水) 23:48:54ID:VJPVdIvT0
>>815 回数のカウントでなくても,単に初回かどうかのフラグでもいいかと.
2007/02/14(水) 23:50:00ID:jsn575PK0?PLT(23461)
>>817
なるほど、そですね。
2007/02/14(水) 23:52:25ID:VJPVdIvT0
>>816 起動時に必ず生成ではなく,まず存在確認してから生成ならいいかも?
2007/02/14(水) 23:54:53ID:jsn575PK0?PLT(23461)
なるほど。
そうすれば、stat() するのは初回だけで済むと。
821動け動けウゴウゴ2ちゃんねる
垢版 |
2007/02/15(木) 00:12:49ID:yY6LrhsA0
今度は何?
2007/02/15(木) 01:41:19ID:gXwQFdVg0
>>814-820 やりますた.単に bbs.cgi が初回かどうかじゃなく,板別に判定ってことで.
2007/02/15(木) 09:04:09ID:JSo1tbfI0
次bananaの件が一段落して、次なる興味深い内容を見つけたわけですが、
bbs.cgi の現状も saborin もわかならいのでしばらくROMってみます。
断片でも状況がわかるならにちゃんねるWikiにまとめてもいいんですけど
2007/02/15(木) 18:02:34ID:m3Btua9c0?PLT(23500)
>>823
ようこそです。

ネタはいろいろありますんで、まずはじっくりと。
2007/02/15(木) 18:03:02ID:m3Btua9c0?PLT(23500)
>>824
△ いろいろ
○ きっといろいろ
2007/02/15(木) 20:11:33ID:JSo1tbfI0
私が営業してるときの定型句
「ネットワークやシステムで面倒な作業、困ってること、手間になってることありませんか?」

削除人の仕事を楽にするためのベイズフィルタ用いたスパム(板違い、駄スレ、LR違反)判定する
スクリプトとか需要あったりするのかな?
2007/02/15(木) 20:27:50ID:w2Gva9Ua0
うーん、、削除が遅れ気味なのって、
実際に判定する人自体が足りてない?からなんじゃないですかねぇ。
人手である程度絞り込んで報告されるようなシステムである
削除整理板のやつですらもてあまし気味だから、、

削除整理板とかに報告されたのが実際にスパムであるかどうか
判定するスクリプトなら有用な可能性もあるかもしれないけど、
やっぱそういうのもトラブル起きそうな、、
自動的に削除しちゃうようなのはちょっとやばいですよね

管理人はちょっとは面白がりそうな気はしないでもないけど、、
主力で使えるかどうかは、、
2007/02/15(木) 20:29:23ID:CV42PsqZ0
★070214 医者・病院板 必殺連投沈め人報告
http://qb5.2ch.net/test/read.cgi/sec2chd/1171450708/33
より

必殺連投沈め人<>sage<>2007/02/13(火) 13:24:22 RDYXJnwt0<>まあ、こんな糞スレが200まで続・><>ntkyto051210.kyto.nt.adsl.ppp.infoweb.ne.jp<>220.147.189.210<><>Monazilla/1.00 MAKA/1.0b

なぜ<>が・>になっているのだろう?
2007/02/15(木) 20:35:45ID:w2Gva9Ua0
>>828
<>で区切られている領域で、本文の最初30バイトを表示しているみたいだけど、
ちょうど区切りのところが2バイト文字の上位1バイトの
ところで区切られちゃって、0x82になってる、と。
それで直後の < とくっついて0x823c になる。
でも、そのような文字はないのでそこの部分が・で表示されてるのかと。
(当てはまるのがないのは・ってなってるから)

こういうのがまずく当てはまると変な漢字が表示されたりするかも。
2007/02/15(木) 20:42:24ID:JSo1tbfI0
>>827
最終的な判断は人間がしないといけないわけですが、
新しく立ったスレを取得、スレタイと>>1の内容を解析して
危険度なりの数値化を行い(メールのスパムフィルタはこの
段階でしきい値を超えたものを削除している)、一覧に色付け
などするして、削除人が判断しやすいようにするサポートする
という形が現実的な解かと思います。
2007/02/15(木) 20:46:22ID:5rlZMeA00
スレッド削除に限って言えば、スレ立て規制値をあげればある程度の効果は期待できます。
現実的じゃないけど。
2007/02/15(木) 20:48:03ID:HJL8rp+v0
>>830
試してみたいならν側でどうぞ
どうせ阿鼻叫喚地獄絵図だし実験場だし
2007/02/15(木) 20:51:03ID:x+ebRFvV0
>>827
こんなの持ってくるなよーっつうのが多いです。個人的には。
2007/02/15(木) 20:53:39ID:m3Btua9c0?PLT(23500)
削除系はどきがむねむねするです。
財宝はきっとたくさんあるはずなので、
じっくりゆっくりあせらずにってかんじが、いいのかもかも。
2007/02/15(木) 20:54:30ID:w2Gva9Ua0
まぁ、削除依頼されたスレやらなにやらの
スパム度を判断するとか、どのような内容かなどの
自動推定とかだったらちょっとは面白いかもとは思いますねぇ、
ぼくはほとんどSVMばっかでやってたけど

まぁ、現状削除の処理が滞っていることへの
解決になるとはちょっと考えにくいけど、
2007/02/15(木) 20:57:28ID:5rlZMeA00
削除されても同じスレを繰り返し立てる人もいるから、その辺からなんかアプローチできる部分がなくもないかもしれないとは思う。
2007/02/15(木) 21:00:30ID:HJL8rp+v0
そして規制報告へ〜って流れならワクテカ
2007/02/15(木) 21:06:34ID:JSo1tbfI0
削除人の作業コストが高いのが問題なのか、削除したことによるさらなる苦情なり板が荒れるのが問題なのか、
削除人がそもそも人手不足なのが問題なのか、といったような状況がそれぞれ板によって違うのが現状と思います。
処理が滞ってる原因の全ては無理だと思いますが、少しでも有効に機能するシステムを提案できるだけでも、
メリットはあると思います。失敗しても、それはそれでノウハウにはなりますし。

こんな感じで削除サポートでなくても、今問題となってそうなものがあれば、何か提案できそうな気はしてます。
2007/02/15(木) 22:08:05ID:Gs6bbfnP0
レスに自動的に嵐or広告フラグを付けるっていいね。
削除人がやりやすくなりそう。

2chのレスにベイジリアンフィルタがどれだけ効果があるか興味がある。
学習効果を外部に公開して、2chブラウザでも使えるようになればかなり便利になるかも。
2007/02/15(木) 22:14:23ID:MEvd0Lu50
取り敢えず、電番が書き込まれたら、削除。
2007/02/15(木) 22:17:01ID:gXwQFdVg0
>>828-829 芋掘りログに記録する際に,単純にバイト数で切ってるからですね.
技術的にはそういうのが起こらないようにすることは可能なんですが,
先日 <br> タグの空白パディングを一律にやらず文字コード見てから
やるようにしたら芋掘りに影響出ちゃって結局元に戻したぐらいなんで,
いじるのはちょっとコワいような......
2007/02/15(木) 22:17:04ID:0bcM0s4Y0?2BP(6811)
Rockに引っかかったら印が付く。
って云うのはすぐに出来そうですね♪
2007/02/15(木) 22:18:51ID:jUwHitHq0
むむむさんの危惧はわかります。下手な実装はパンドラの箱を開けかねませんし。

そこで、実際に影響はしない実験の提案。

特定の板における「削除したもの」と「削除しなかったもの」の
適切に変換したテキストデータファイル1万件程度の山を2つつくって、
それをもとにbogofilterのデータベースを作ってみて、削除人たちに実験してもらうのはどうでしょうか。
なお、もっといい方法があればそれでもかまいません。
実際に実験に加わるのは運営ボランティアの方々ですし。
2007/02/15(木) 22:23:20ID:JSo1tbfI0
専用ブラウザを考慮したら、bbs.cgi でできる事って限定されてしまうことに気付く。
スレ立て時に何か追加で処理を追加するのは、また別の案を考えて、関連キーワードスレに
遊びにいってみます。


現状の ex17,ex21 の投稿数をみると、軽量化は不要で高機能化に充分余裕がありますね。
規制関連や鯖落ちから復帰した時の処理に何かネタがありそうな気はしますね。
2007/02/16(金) 02:49:33ID:5gMuPpJn0
表示スタイルの切り替えは一番上に「表示」させたほうがいいよ
(または、もうちょっと多少なりとも目立たせる)
じゃないと
知らない人は永久に気が付かないかも

ここに来る前は、てっきり白紙撤回されたと思ってたよ
2007/02/16(金) 02:51:22ID:5gMuPpJn0
つけたし
基本的に一番下のほうのスレはたいていの人は
無視して捨ててると思うから
2007/02/16(金) 16:38:22ID:5gMuPpJn0
反応してくれて、ありがとう
でも
色のセンス最悪ですw

かんべんしてください、この色合いは
2007/02/16(金) 16:56:26ID:5gMuPpJn0
でも、まあ
目立つっちゃ、目立つかな

他の人の反応がないとなんとも
2007/02/16(金) 17:37:32ID:hgReDhGI0
ペパーミントグリーンはあんまり好きではないな。
2007/02/16(金) 20:29:19ID:s3BXWkgp0
2chにデザイン的センスが無いのは
デフォを超えて今や伝統だと思う。
2007/02/16(金) 21:08:27ID:5uZ2dIcq0
>838
実際に作って公開すれば、いろいろ反響がでるのではないかなと。
852動け動けウゴウゴ2ちゃんねる
垢版 |
2007/02/16(金) 22:29:35ID:oYif/tQ70
>>827
判定が楽なLRにするとかは
http://qb5.2ch.net/test/read.cgi/sakukb/1100604538/l50
2007/02/17(土) 00:02:46ID:tFdnFmdq0
>>847-850 まぁ,あくまでコードを書く人間であってデザイナーじゃないんで.
いい色見本とかあれば示してもらえれば.
2007/02/18(日) 01:53:52ID:W3NlNiwz0
イチバン上に持ってくるというのは無しなのかな
告知っぽい期間だけでも
2007/02/21(水) 08:33:02ID:z6zY2ZIR0
見付けた人だけが使える機能がひっそりとたたずんでるってのも悪くないかなぁ,と......
(あと,上に置くとそれはそれでウザいって人も出てきそうな気も)


それはともかく,亀ですが
>>357-362 bbsd では BBS_BG_PICTURE が空なら url("") を出力しないようにしますた.
# bbs.cgi はとりあえず従来通り.
2007/02/21(水) 14:16:42ID:???0?PLT(23500)
SSL_X_ っていうのは、どういうあれなんでしたっけか。 > SunOSさん
2007/02/21(水) 15:38:56ID:z6zY2ZIR0
>>856 suExec 有効だと arbitrary な環境変数を渡せないゆえの苦肉の策ですね.
SSL_* という環境変数は suExec 有効でも渡されますが,これは元々
mod_ssl によって SSL を使ってる場合だけにしか設定されませんし,
また SSL を使ってても SSL_X_* という名前にしておけばぶつからないってことで.
http://httpd.apache.org/docs/2.2/mod/mod_ssl.html

あと,SSL_X_BBSCGI_FUNCTIONS ってのは,CentiSec や Saborin 等を一時的に有効にしたい場合に

SetEnv SSL_X_BBSCGI_FUNCTIONS CentiSec,Saborin

とか .htaccess に入れればいいようにってことで.
2007/02/21(水) 16:16:54ID:???0?PLT(23500)
なるほど、とても納得できました。>>857
2007/02/23(金) 11:26:05ID:???0?PLT(23532)
そんなわけで。

subback.html とかを作っているところとかは、こんなことしているです。
@{$GB->{NEWSUB} に、subject.txt が行単位で配列に入っていると。

# subbackの中身部分
my $i = 0;
foreach(@{$GB->{NEWSUB}})
{
chomp($_);
++$i;
/^(\w+)\.dat<>(.*)/;
my ($key, $value) = ($1, $2);
&Put1Line(*HED, "<a href=\"$key/l50\">$i: $value</a>\n");
}
2007/02/23(金) 11:53:51ID:2Oxo44Dd0
subject.txt の処理だけなら単一文字列のまま扱うのもいいかなと思うんですが,
他の場所での再利用を考えると,結局配列やハッシュで扱った方がいいのかなとも思ったり.

# まぁ,Perl CGI の枠内でやってる限り限界はあるかな,とも思いますが.
2007/02/23(金) 11:56:05ID:???0?PLT(23532)
ふむむ。>>860

ただ、今のsubject.txtの処理がグロテスク((c)SunOSさん)というのも
事実だとは思うので、これを機に以下略したいところではあるかも。
2007/02/23(金) 12:17:27ID:AbpaAoA10
指摘もらった内容で flock 使わないダミーファイル&rename方式で作り直してみました。
http://choco.tank.jp/trac/wiki/subjectTxtFunc (説明)
http://choco.tank.jp/trac/browser/trunk/perlre/SUBJECT_TXT/func2.pl (ソース)

今回は subject.txt の更新だけなので、index.html subback.html の話は別に
2007/02/23(金) 12:34:07ID:AbpaAoA10
http://qb5.2ch.net/test/read.cgi/operate/1171963749/906
にあるアトミックとは、ファイル更新時のデータの一時的な乱れや
http://ex20.2ch.net/test/read.cgi/nanmin/1170905254/732-740
で雑談で出たファイルの不整合のことだと思いますが、

私の認識では、プロセスの排他制御を行い同一リソースに対する
デッドロックさせない、同時に書き換えさせずに不整合を生まない
という意味での掲示板全体のアトミックを考えてました。

>>862の説明ページにも書いてありますが、プロセス間の排他制御を行わない
ダミーファイル方式の場合、bbs.cgi のプロセス切り替えが発生した場合、
実際の dat レス数と subject.txt の不整合が生じます。
(これも書いてありますが、同じスレで発言があれば治ります)
また、age 書き込みしたのにあがらない(saborin ではない)ことも発生します。
この程度は利用上の致命的問題とならないので現状でもOKなんだと思います。

このあたりの考え方は技術者的思考&嗜好ですみません
2007/02/23(金) 12:39:38ID:ezCNONMk0
datの破損
http://wwwww.2ch.net/test/read.cgi/news4vip/1172149686/738-739
(●持ってない人用) http://asnxload.dip.jp/files/ppfx00370.txt

738のレスを書き込み中に739の書き込みが割り込んだように見える
2007/02/23(金) 12:40:37ID:AbpaAoA10
>>860
再利用となる index.html や subback.html 作成用の subject.txt データに関しては、
bbs.cgi で subject.txt を更新(func.pl の UpdateSubjectDat())した後に

open(SUBJECT, $subjectTxtPath)
  binmode(SUBJECT);
flock(SUBJECT, 1);
@subjectTxt = <SUBJECT>;
close(SUBJECT);
chomp(@subjectTxt);

で改めて読み込んで処理すればいいかと。
@subjectTxt = <SUBJECT>; な読み込みは Perl 内部で特に最適化されてる部分なので
二重の読み込み処理に見えますが、そんなにコストは高くないです。
2007/02/23(金) 12:43:42ID:AbpaAoA10
>>864
>>863の内容と同じですけど、書き込み時刻が3秒ズレているんでなぜ発生してるのか少々不可解ではあります。
2007/02/23(金) 12:44:29ID:AbpaAoA10
>>865 訂正
flock いらないですね
2007/02/23(金) 12:46:58ID:AbpaAoA10
>>859
いろいろと制約事項(subject.txtの内容が破損してないなど)はありますが

# subback.html
$tmpl = qq[<a href="%s/l50">%d: %s</a>\n];
$cnt = 0;
for (@subjectTxt) {
  printf($tmpl, substr($_, 0, 10), ++$cnt, substr($_, 15));
}

でよいかと
2007/02/23(金) 12:52:57ID:AbpaAoA10
ついでに index.html 書き出し部分も

# index.html
$boradName = 'news4vip';
# 1..10
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d:</a> <a href="#%d">%s</a> ];
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
  $_ = $subjectTxt[$cnt-1];
  printf($tmpl, substr($_, 0, 10), $cnt, $cnt, substr($_, 15));
}

# 11..100
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d: %s</a> ];
$cntLast = (@subjectTxt > 100) ? 100 : scalar(@subjectTxt) ;
for $cnt (11 .. $cntLast)
{
  $_ = $subjectTxt[$cnt-1];
  printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
}

# 上位10スレの l10 のhtml化
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
# threadId 取得
  $threadId = ($subjectTxt[$cnt-1], 0, 10)

  # dat を読む (ここでもIOを減らす方法はいくつかある)
  open(DAT, "${boardPath}/${threadId}.dat");

  # 書く ( 1 と l10 部分)

}
2007/02/23(金) 13:14:00ID:2Oxo44Dd0
>>863
>(ryにあるアトミックとは、ファイル更新時のデータの一時的な乱れや
>(ryで雑談で出たファイルの不整合のことだと思いますが、

まぁそうですね.

>私の認識では、(ry掲示板全体のアトミックを考えてました。

一般論としてはそれも重要なことだとは思いますが,
2ch の特性を踏まえると普通のファイルロックの使い方では
先に述べたような不都合も出てくる,と.

# まぁ,そのあたりも乗り越えようと考えたのが bbsd なんですけどね.

>>864 デカいカキコのため,write() が複数になってその間に割り込んだ可能性もありますね.

>>865 なるほど......

>>868 少数とはいえ,まだ9桁スレキーも残ってるところあるかも?

>>869 html 部分は,別途こんなのを作ってます -> http://qb5.2ch.net/operate/html/
これを読み込んでつなげてる,と.
2007/02/23(金) 13:16:50ID:???0?PLT(23532)
>>865 >>867
ふむふむ、改めて読めばよいと。

>>868 >>869
そんなかんじですか。
# Perl はほぼ素人だったり。
2007/02/23(金) 13:17:45ID:???0?PLT(23532)
確かに、9桁のキーはまだ結構ありますね。
2007/02/23(金) 13:30:42ID:AbpaAoA10
10桁決め打ちでやってますが、9桁対応させるなら10桁目が数字かそうでないかで
条件分岐を追加すればいいだけですね。正規表現でやれば \d{9,10} ですみますけど
Perlの正規表現は他の実装に比べて早いですが、index や substr などの文字列処理に
比べたら馬鹿にならないほどコスト大(数十倍)だったりします。
2007/02/23(金) 13:31:53ID:???0?PLT(23532)
>>873
せっかくやるなら、あんまり正規表現は使いたくないかも。
んで、どうするのがいんだべか。
2007/02/23(金) 13:36:17ID:AbpaAoA10
http://qb5.2ch.net/operate/html/ のアイデアはあるかなと思ってましたが、
ディスクをどの程度使用するかにも寄りますが、l10 だけでなく全てのレスを
HTML化しておけば、read.cgi でも使えますし、より効果的な負荷低減になると
思います。
バイナリの埋め込みになりますが、各レスのオフセット(seek の引数)も一緒に
インデクス化していれておけば、現実的可能な最速処理もできるかと
2007/02/23(金) 13:38:05ID:AbpaAoA10
>>874 9桁対応版
{
  substr($_, 9, 1) eq '.'
    ? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
    : printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14));
}
2007/02/23(金) 13:42:39ID:2Oxo44Dd0
>>875
>全てのレスをHTML化しておけば、read.cgi でも使えますし

これは昔 dat2html 使ってやろうとしてたことあったような記憶もおぼろげながら......
まぁ,read.cgi 出力に mod_cache かますとかやった方が手っ取り早いと思いますけど.
2007/02/23(金) 13:42:57ID:AbpaAoA10
>>876 修正
  substr($_, 9, 1) eq '.' # 10文字目がピリオドなら9桁
    : printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14))
    ? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
2007/02/23(金) 13:53:53ID:AbpaAoA10
>>877
今の read.cgi って対象の .dat を読み込んで、1,300 や 1-20 や l50 なんかの指定に従って
対象の行を取り出して整形して出力する処理ではないかと思ってるのですが、この dat の行を
html に変換するコストが無駄になってるのでは?と思ってます。

あと、mod_cache をかませても l50 や指定なしのものだけをキャッシュさせて、それ以外の
特殊な条件指定したもの(300-400)はキャッシュの意味は少ないと思いますし、そちらのコストも
考えると、全レスhtml化の恩恵は大きいと思います。こちらも時間があれば仕様案まとめてみます
2007/02/23(金) 14:09:03ID:???0?PLT(23532)
そんなわけで、プロファイリングしてみた。

1行目を
#!/usr/local/bin/perl -d:DProf
に変えて、できたtmon.outを処理。

レスはこれ。
http://dso.2ch.net/test/read.cgi/myanmar/1153850369/530
html/ の下がないと作り直すので、2つ目のレスで計測。

トリップあり、sage、●なし、BEなし。

%Time ExclSec CumulS #Calls sec/call Csec/c Name
14.4 0.077 0.095 1 0.0775 0.0948 main::MakeIndex4PC
13.1 0.070 0.070 1 0.0703 0.0703 main::IsKoukoku
8.82 0.047 0.266 1 0.0468 0.2661 main::bbs_entryXXX
5.63 0.030 0.233 30 0.0010 0.0078 main::BEGIN
5.63 0.030 0.026 1 0.0304 0.0262 main::initFOX
4.32 0.023 0.045 10 0.0023 0.0045 Net::DNS::Resolver::Base::BEGIN
4.32 0.023 0.052 22 0.0010 0.0024 Jcode::BEGIN
3.00 0.016 0.016 1 0.0156 0.0156 main::mumumuGetNowTime
3.00 0.016 0.016 11 0.0014 0.0014 DynaLoader::dl_load_file
2.82 0.015 0.030 10 0.0015 0.0030 LWP::UserAgent::BEGIN
2.82 0.015 0.023 73 0.0002 0.0003 Exporter::import
1.50 0.008 0.008 1 0.0078 0.0078 jcode::init
1.50 0.008 0.008 1 0.0078 0.0078 main::checkDenyList
1.50 0.008 0.008 1 0.0078 0.0078 main::foxReadSettings
1.50 0.008 0.008 1 0.0078 0.0078 Net::DNS::RR::_get_subclass
2007/02/23(金) 14:11:31ID:???0?PLT(23532)
最初のは、index.html を作る処理ですね。
次のが広告かどうかのチェック。
3番目は各種初期化。
2007/02/23(金) 14:17:21ID:2Oxo44Dd0
>>879 基本的に,mod_cache に任せておけば大局的には読み出しの多いレス番指定が
ヒット率が高くなるでしょうし,読み出しの多いものが重点的にキャッシュされ,
一方少ないものは on the fly に生成するという形に収斂していくかと.

全レスを HTML 化したものもスタティックファイルとして保持させると,
あぼーん用スクリプトとか dat 落ちスクリプトとかにも対応する処理を
入れることになって,手間と効果のバランスからどうかなぁ,とも.
2007/02/23(金) 14:25:01ID:AbpaAoA10
>>880,881
speedy でのキャッシュされた実行ではなさそうなので、BEGIN や Exporter::Import などのコストも入ってますね。
となると上ふたつのコストが、ファイル読み込み処理と、正規表現の文字列処理なので、この部分が一番わかりやすい
大きなコストになってるような感じですね。
他の部分は、上二つに比べたらまだ気を使うほどのところでもなさそうです。
2007/02/23(金) 14:30:15ID:???0?PLT(23532)
で、われわれがSaborinと呼んでいるのは、
MakeIndex4PC(とUpdateSubback)を呼ぶのをまばらにする、
というものですね。
2007/02/23(金) 14:35:09ID:AbpaAoA10
私が今後どのような形で(&飽きずにいつまでw)お手伝いすることになるかわかりませんが、
FreeBSD の -stable と -current みたいに、現状の改善と安定を目指すものと、年末くらいに
完全にいちから再設計して作り直した(現状では雪だるまがそっち系なのかな?)システムという
形で現状ですべきこと、長期的に考えることを分けて考えてもいいような気がします。

現状では、>>880 のようなものとにらめっこして、LAを減らすことかな?
あるいは現状の利用者数、投稿数で年末まで持つと仮定して、新バージョンの開発かな?w
なんてことを考えるのははたから茶々いれるだけの技術者的の私個人としては楽しいのですが、
運営側としてはどうなんでしょ?
2007/02/23(金) 14:43:27ID:???0?PLT(23532)
きっと、、、「運営側」っていう言葉について、
「それって何だろう」って素で思うようになると、
なんとなくいいかんじになる、んじゃないのかなと。

ここって「あっち側」とか「こっち側」とかじゃなくて、
管理人を除いてみんな同じところにいる、
っていうあたりから、はじまっているような気がするんで。

なんというか、このへんにいる人たちは
みんなたんなる「お手伝い」に過ぎなくて、
単にそれぞれ、出来ることが違うだけというか。なんとゆうか。
2007/02/23(金) 14:46:09ID:2Oxo44Dd0
>>885 一から再設計ということでは,しばらく前に VIP の有志の人たちが
レスデータをファイルでなく MySQL に入れるとかいうのを作ってたような.
雪だるまというか bbsd は,すでに稼働してる鯖もある (live23, live24)
ので長期的というほど先の話でもないと個人的に考えてはいますが,
呪文対応等の未実装部分をこれからぼちぼちやっていこう,ということで.

# むしろ,削除人や復帰人の人たちのことを考えれば,未実装部分は
# 早くなくした方がいいのかも,とも.

## 「運営側」に関しては >>886 に同意で.
2007/02/23(金) 14:48:55ID:???0?PLT(23532)
で、>>886 みたいなものって、昔のインターネットには割とたくさんあったんですが、
今のインターネットには、もうなんか少なくなったというか、
ほとんど見当たらないようになりましたね。

「それいいっすね。いっちょやりますかぁ」「ごにょごにょ…」
「おい変だぞ、どうしたんだゴルァ」
「あちゃー、ごめんなさいー、戻しますー」みたいな、
アドホックというか、とりあえず試してみるというか。

そんなわけで私は2ちゃんねるに「昔からある、もともとのインターネットの姿」を、
ほんのちょっぴり、垣間見ていたりなんかして。

すれ違いすんませんです。
2007/02/23(金) 14:52:05ID:2Oxo44Dd0
>>888 まぁそうですね,これだけデカいサイトで挑戦的なことをできるところって
他にないでしょうしね.「普通の」大手サイトでは,▲が増えるどころじゃ済まないでしょうしw
2007/02/23(金) 14:57:04ID:AbpaAoA10
>>888,889
そういう土壌はこの一週間で充分堪能していますw
私も仕事で仕様ガチガチ安定して当然の世界でも生きてますし、
趣味のソフトウェア開発では、自由きままにやっています。
論文やレポート書いてどっかにポストするのも好きですし、
ちょうど今の新ばななは良い縁になったと思います。
顔色伺ってというのはあまり楽しくないので、自由気ままに
勝手にプロジェクト立ち上げて勝手に進めて、方針や意見が
合わなければ自然に影が薄くなっていくのかもしれないですね
2007/02/23(金) 15:01:40ID:???0?PLT(23532)
そっすね。>>890

勝手にという中にもたぶん需要があったり、
動機付けがあったり、空気嫁があったりするのかなと。

私の基本思想はこのへんにでも適当に。
サーバ修理中につき(そろそろ退院予定らしいです)、Googleキャッシュでごめんなさい。

http://72.14.235.104/search?q=cache:9LcMvz3YJbkJ:mumumu.mu/human-2ch.html+mumumu.mu/human-2ch.html&hl=ja&ct=clnk&cd=1
2007/02/23(金) 15:02:11ID:2Oxo44Dd0
>>890 まぁ,何を隠そう私自身,勝手にコード書いて「これどうよ?」って
勝手に提示するってのをこれまで繰り返しながら,2ch にずぶずぶはまってきてますからw
チョコさんも,そんな感じではまっていくことになるのかなぁ,とw
2007/02/23(金) 15:07:23ID:AbpaAoA10
>>891
私の活動ポリシーの元になってるPerlの三大美徳に似てますね
ttp://www.nishiohirokazu.org/archived_coreblog/55

>>892
実験的なコード書くのと、各種検証してレポート書くのと、試作品
(もうちょっとで商品になりそうなのにその手前で止まってる)を
日常的に作ってますから、モチベーションさえあれば色んなことを
していく可能性は大きい環境ではありますw
2007/02/23(金) 15:14:50ID:???0?PLT(23532)
>>893
それ、おもしろいですね。
mumumu.mu が復活したら、改変してみるかも。
2007/02/23(金) 15:15:35ID:AbpaAoA10
すぐ出来そうなことは実機のモニターになれるならということでこんな感じでw
ttp://yy28.60.kg/test/read.cgi/maido3/1170831265/85
スキルは今までにそれなりに蓄積してきて、必要があれば何でも作れるとは思うんだけど
モチベーションを持てる何かがないので日々興味の赴くままに(ここにいる理由がまさにw)
何かしております。先日までは amd64 や 128bitSSE で deflate 高速化出来ないか試行錯誤してたりw
2007/02/23(金) 15:29:38ID:AbpaAoA10
とりあえず、今私にクリティカルにできそうなこととしては‥‥‥
sub MakeIndex4PC
sub IsKoukoku
の部分の現状のコードをいただけるのであれば、リファクタリングさせてもらいますよ。
2007/02/23(金) 15:49:45ID:2Oxo44Dd0
MakeIndex4PC に関しては,いろいろ挿入するファイルがあったり
出力内容自体が複雑故って感じもしますね.

IsKoukoku の方は,チョコさんから見ていじりがいがあるかも?
確か,IsKoukoku の中核部分は以前から公開されていて,
クローズドではないと思うので貼ってみます.

    foreach my $NG_word_ref (@FOX_Ro54)
    {
        my $NG_word = $NG_word_ref->[0]; # リファレンスから取り出し。
        if (my $matched = eval{ return $In_Strings =~ m<$NG_word> ? $& : undef }) {
            $NG_word_ref->[0] = $matched; return $NG_word_ref;
        } # 合致したらNGワード部分の摘出とリファレンスを返す。
        # 不正 NG ワードがあったり引っかからなければスキップ
    }
    return '';

ちなみに,@FOX_Ro54 は初期化段階でこんな感じで読み込まれます.

    open(ADFILE,"....../Rock54data");
    @FOX_Ro54 = map { [ (split /<>/)[5,6,7] ] } <ADFILE>;
    close(ADFILE)            ;
2007/02/23(金) 16:08:22ID:ZT6cIEXJ0
>>897
Rock54のファイルの場所は秘密なのでは?
899Kseniya ★
垢版 |
2007/02/23(金) 16:10:49ID:???0
つうか
そのフォルダが超機密だったのであった。

うひゃひゃひゃひや
2007/02/23(金) 16:13:39ID:PebZXv460
/(^o^)\
2007/02/23(金) 16:13:49ID:osWVCmNQ0
川 ;´・`;)イイハナシヤナー

認証ぐらいかけとけよ
2007/02/23(金) 16:13:57ID:Nv58QqDI0
どうもアレかなと思ったらやっぱり。。
2007/02/23(金) 16:14:07ID:z2462BoB0
なんてこった・・・。
2007/02/23(金) 16:15:12ID:8SBJJSul0
GJ!
2007/02/23(金) 16:15:45ID:tP51+qgU0
2007/02/23(金) 16:18:07ID:AbpaAoA10
>>897
このレスあぼ〜ん しておくか、変更する必要があるかも(汗
私のトリップに @hotmail.com が使えますから、そちらに
可能な部分だけ改めて送ってもらえれれば確認できます。

ここのコードはあまり手を加えられるところはないですね。
一応先日 Rock54 がらみで試作してみたコードはこちら
http://choco.tank.jp/trac/wiki/Rock54re
2007/02/23(金) 16:22:36ID:2Oxo44Dd0
あまりにひどいミスで......すいませんm(_ _)m
レス数が900を超えています。1000を超えると表示できなくなるよ。