bbs.cgiの開発作業をすすめていくためのスレッドです。
FOXさんの努力によりSpeedyCGIへの対応が行われ、
パフォーマンスの向上が図られたbbs.cgi。
・さらなるカスタマイズ
・パフォーマンスの向上
・微妙な虫取り
・残された秘境エリアの開拓
あたりをターゲットに。
前スレ:
bbs.cgi再開発プロジェクト7
http://qb5.2ch.net/test/read.cgi/operate/1130918407/
探検
bbs.cgi再開発プロジェクト Part8
レス数が900を超えています。1000を超えると表示できなくなるよ。
1root▲ ★
NGNG2007/02/15(木) 20:46:22ID:5rlZMeA00
スレッド削除に限って言えば、スレ立て規制値をあげればある程度の効果は期待できます。
現実的じゃないけど。
現実的じゃないけど。
2007/02/15(木) 20:48:03ID:HJL8rp+v0
2007/02/15(木) 20:51:03ID:x+ebRFvV0
>>827
こんなの持ってくるなよーっつうのが多いです。個人的には。
こんなの持ってくるなよーっつうのが多いです。個人的には。
削除系はどきがむねむねするです。
財宝はきっとたくさんあるはずなので、
じっくりゆっくりあせらずにってかんじが、いいのかもかも。
財宝はきっとたくさんあるはずなので、
じっくりゆっくりあせらずにってかんじが、いいのかもかも。
835どくどくさぼてん
2007/02/15(木) 20:54:30ID:w2Gva9Ua0 まぁ、削除依頼されたスレやらなにやらの
スパム度を判断するとか、どのような内容かなどの
自動推定とかだったらちょっとは面白いかもとは思いますねぇ、
ぼくはほとんどSVMばっかでやってたけど
まぁ、現状削除の処理が滞っていることへの
解決になるとはちょっと考えにくいけど、
スパム度を判断するとか、どのような内容かなどの
自動推定とかだったらちょっとは面白いかもとは思いますねぇ、
ぼくはほとんどSVMばっかでやってたけど
まぁ、現状削除の処理が滞っていることへの
解決になるとはちょっと考えにくいけど、
2007/02/15(木) 20:57:28ID:5rlZMeA00
削除されても同じスレを繰り返し立てる人もいるから、その辺からなんかアプローチできる部分がなくもないかもしれないとは思う。
2007/02/15(木) 21:00:30ID:HJL8rp+v0
そして規制報告へ〜って流れならワクテカ
削除人の作業コストが高いのが問題なのか、削除したことによるさらなる苦情なり板が荒れるのが問題なのか、
削除人がそもそも人手不足なのが問題なのか、といったような状況がそれぞれ板によって違うのが現状と思います。
処理が滞ってる原因の全ては無理だと思いますが、少しでも有効に機能するシステムを提案できるだけでも、
メリットはあると思います。失敗しても、それはそれでノウハウにはなりますし。
こんな感じで削除サポートでなくても、今問題となってそうなものがあれば、何か提案できそうな気はしてます。
削除人がそもそも人手不足なのが問題なのか、といったような状況がそれぞれ板によって違うのが現状と思います。
処理が滞ってる原因の全ては無理だと思いますが、少しでも有効に機能するシステムを提案できるだけでも、
メリットはあると思います。失敗しても、それはそれでノウハウにはなりますし。
こんな感じで削除サポートでなくても、今問題となってそうなものがあれば、何か提案できそうな気はしてます。
2007/02/15(木) 22:08:05ID:Gs6bbfnP0
レスに自動的に嵐or広告フラグを付けるっていいね。
削除人がやりやすくなりそう。
2chのレスにベイジリアンフィルタがどれだけ効果があるか興味がある。
学習効果を外部に公開して、2chブラウザでも使えるようになればかなり便利になるかも。
削除人がやりやすくなりそう。
2chのレスにベイジリアンフィルタがどれだけ効果があるか興味がある。
学習効果を外部に公開して、2chブラウザでも使えるようになればかなり便利になるかも。
2007/02/15(木) 22:14:23ID:MEvd0Lu50
取り敢えず、電番が書き込まれたら、削除。
>>828-829 芋掘りログに記録する際に,単純にバイト数で切ってるからですね.
技術的にはそういうのが起こらないようにすることは可能なんですが,
先日 <br> タグの空白パディングを一律にやらず文字コード見てから
やるようにしたら芋掘りに影響出ちゃって結局元に戻したぐらいなんで,
いじるのはちょっとコワいような......
技術的にはそういうのが起こらないようにすることは可能なんですが,
先日 <br> タグの空白パディングを一律にやらず文字コード見てから
やるようにしたら芋掘りに影響出ちゃって結局元に戻したぐらいなんで,
いじるのはちょっとコワいような......
Rockに引っかかったら印が付く。
って云うのはすぐに出来そうですね♪
って云うのはすぐに出来そうですね♪
2007/02/15(木) 22:18:51ID:jUwHitHq0
むむむさんの危惧はわかります。下手な実装はパンドラの箱を開けかねませんし。
そこで、実際に影響はしない実験の提案。
特定の板における「削除したもの」と「削除しなかったもの」の
適切に変換したテキストデータファイル1万件程度の山を2つつくって、
それをもとにbogofilterのデータベースを作ってみて、削除人たちに実験してもらうのはどうでしょうか。
なお、もっといい方法があればそれでもかまいません。
実際に実験に加わるのは運営ボランティアの方々ですし。
そこで、実際に影響はしない実験の提案。
特定の板における「削除したもの」と「削除しなかったもの」の
適切に変換したテキストデータファイル1万件程度の山を2つつくって、
それをもとにbogofilterのデータベースを作ってみて、削除人たちに実験してもらうのはどうでしょうか。
なお、もっといい方法があればそれでもかまいません。
実際に実験に加わるのは運営ボランティアの方々ですし。
専用ブラウザを考慮したら、bbs.cgi でできる事って限定されてしまうことに気付く。
スレ立て時に何か追加で処理を追加するのは、また別の案を考えて、関連キーワードスレに
遊びにいってみます。
現状の ex17,ex21 の投稿数をみると、軽量化は不要で高機能化に充分余裕がありますね。
規制関連や鯖落ちから復帰した時の処理に何かネタがありそうな気はしますね。
スレ立て時に何か追加で処理を追加するのは、また別の案を考えて、関連キーワードスレに
遊びにいってみます。
現状の ex17,ex21 の投稿数をみると、軽量化は不要で高機能化に充分余裕がありますね。
規制関連や鯖落ちから復帰した時の処理に何かネタがありそうな気はしますね。
2007/02/16(金) 02:49:33ID:5gMuPpJn0
表示スタイルの切り替えは一番上に「表示」させたほうがいいよ
(または、もうちょっと多少なりとも目立たせる)
じゃないと
知らない人は永久に気が付かないかも
ここに来る前は、てっきり白紙撤回されたと思ってたよ
(または、もうちょっと多少なりとも目立たせる)
じゃないと
知らない人は永久に気が付かないかも
ここに来る前は、てっきり白紙撤回されたと思ってたよ
2007/02/16(金) 02:51:22ID:5gMuPpJn0
つけたし
基本的に一番下のほうのスレはたいていの人は
無視して捨ててると思うから
基本的に一番下のほうのスレはたいていの人は
無視して捨ててると思うから
2007/02/16(金) 16:38:22ID:5gMuPpJn0
反応してくれて、ありがとう
でも
色のセンス最悪ですw
かんべんしてください、この色合いは
でも
色のセンス最悪ですw
かんべんしてください、この色合いは
2007/02/16(金) 16:56:26ID:5gMuPpJn0
でも、まあ
目立つっちゃ、目立つかな
他の人の反応がないとなんとも
目立つっちゃ、目立つかな
他の人の反応がないとなんとも
2007/02/16(金) 17:37:32ID:hgReDhGI0
ペパーミントグリーンはあんまり好きではないな。
2007/02/16(金) 20:29:19ID:s3BXWkgp0
2chにデザイン的センスが無いのは
デフォを超えて今や伝統だと思う。
デフォを超えて今や伝統だと思う。
852動け動けウゴウゴ2ちゃんねる
2007/02/16(金) 22:29:35ID:oYif/tQ70 >>847-850 まぁ,あくまでコードを書く人間であってデザイナーじゃないんで.
いい色見本とかあれば示してもらえれば.
いい色見本とかあれば示してもらえれば.
2007/02/18(日) 01:53:52ID:W3NlNiwz0
イチバン上に持ってくるというのは無しなのかな
告知っぽい期間だけでも
告知っぽい期間だけでも
見付けた人だけが使える機能がひっそりとたたずんでるってのも悪くないかなぁ,と......
(あと,上に置くとそれはそれでウザいって人も出てきそうな気も)
それはともかく,亀ですが
>>357-362 bbsd では BBS_BG_PICTURE が空なら url("") を出力しないようにしますた.
# bbs.cgi はとりあえず従来通り.
(あと,上に置くとそれはそれでウザいって人も出てきそうな気も)
それはともかく,亀ですが
>>357-362 bbsd では BBS_BG_PICTURE が空なら url("") を出力しないようにしますた.
# bbs.cgi はとりあえず従来通り.
SSL_X_ っていうのは、どういうあれなんでしたっけか。 > SunOSさん
>>856 suExec 有効だと arbitrary な環境変数を渡せないゆえの苦肉の策ですね.
SSL_* という環境変数は suExec 有効でも渡されますが,これは元々
mod_ssl によって SSL を使ってる場合だけにしか設定されませんし,
また SSL を使ってても SSL_X_* という名前にしておけばぶつからないってことで.
http://httpd.apache.org/docs/2.2/mod/mod_ssl.html
あと,SSL_X_BBSCGI_FUNCTIONS ってのは,CentiSec や Saborin 等を一時的に有効にしたい場合に
SetEnv SSL_X_BBSCGI_FUNCTIONS CentiSec,Saborin
とか .htaccess に入れればいいようにってことで.
SSL_* という環境変数は suExec 有効でも渡されますが,これは元々
mod_ssl によって SSL を使ってる場合だけにしか設定されませんし,
また SSL を使ってても SSL_X_* という名前にしておけばぶつからないってことで.
http://httpd.apache.org/docs/2.2/mod/mod_ssl.html
あと,SSL_X_BBSCGI_FUNCTIONS ってのは,CentiSec や Saborin 等を一時的に有効にしたい場合に
SetEnv SSL_X_BBSCGI_FUNCTIONS CentiSec,Saborin
とか .htaccess に入れればいいようにってことで.
なるほど、とても納得できました。>>857
そんなわけで。
subback.html とかを作っているところとかは、こんなことしているです。
@{$GB->{NEWSUB} に、subject.txt が行単位で配列に入っていると。
# subbackの中身部分
my $i = 0;
foreach(@{$GB->{NEWSUB}})
{
chomp($_);
++$i;
/^(\w+)\.dat<>(.*)/;
my ($key, $value) = ($1, $2);
&Put1Line(*HED, "<a href=\"$key/l50\">$i: $value</a>\n");
}
subback.html とかを作っているところとかは、こんなことしているです。
@{$GB->{NEWSUB} に、subject.txt が行単位で配列に入っていると。
# subbackの中身部分
my $i = 0;
foreach(@{$GB->{NEWSUB}})
{
chomp($_);
++$i;
/^(\w+)\.dat<>(.*)/;
my ($key, $value) = ($1, $2);
&Put1Line(*HED, "<a href=\"$key/l50\">$i: $value</a>\n");
}
subject.txt の処理だけなら単一文字列のまま扱うのもいいかなと思うんですが,
他の場所での再利用を考えると,結局配列やハッシュで扱った方がいいのかなとも思ったり.
# まぁ,Perl CGI の枠内でやってる限り限界はあるかな,とも思いますが.
他の場所での再利用を考えると,結局配列やハッシュで扱った方がいいのかなとも思ったり.
# まぁ,Perl CGI の枠内でやってる限り限界はあるかな,とも思いますが.
指摘もらった内容で flock 使わないダミーファイル&rename方式で作り直してみました。
http://choco.tank.jp/trac/wiki/subjectTxtFunc (説明)
http://choco.tank.jp/trac/browser/trunk/perlre/SUBJECT_TXT/func2.pl (ソース)
今回は subject.txt の更新だけなので、index.html subback.html の話は別に
http://choco.tank.jp/trac/wiki/subjectTxtFunc (説明)
http://choco.tank.jp/trac/browser/trunk/perlre/SUBJECT_TXT/func2.pl (ソース)
今回は subject.txt の更新だけなので、index.html subback.html の話は別に
http://qb5.2ch.net/test/read.cgi/operate/1171963749/906
にあるアトミックとは、ファイル更新時のデータの一時的な乱れや
http://ex20.2ch.net/test/read.cgi/nanmin/1170905254/732-740
で雑談で出たファイルの不整合のことだと思いますが、
私の認識では、プロセスの排他制御を行い同一リソースに対する
デッドロックさせない、同時に書き換えさせずに不整合を生まない
という意味での掲示板全体のアトミックを考えてました。
>>862の説明ページにも書いてありますが、プロセス間の排他制御を行わない
ダミーファイル方式の場合、bbs.cgi のプロセス切り替えが発生した場合、
実際の dat レス数と subject.txt の不整合が生じます。
(これも書いてありますが、同じスレで発言があれば治ります)
また、age 書き込みしたのにあがらない(saborin ではない)ことも発生します。
この程度は利用上の致命的問題とならないので現状でもOKなんだと思います。
このあたりの考え方は技術者的思考&嗜好ですみません
にあるアトミックとは、ファイル更新時のデータの一時的な乱れや
http://ex20.2ch.net/test/read.cgi/nanmin/1170905254/732-740
で雑談で出たファイルの不整合のことだと思いますが、
私の認識では、プロセスの排他制御を行い同一リソースに対する
デッドロックさせない、同時に書き換えさせずに不整合を生まない
という意味での掲示板全体のアトミックを考えてました。
>>862の説明ページにも書いてありますが、プロセス間の排他制御を行わない
ダミーファイル方式の場合、bbs.cgi のプロセス切り替えが発生した場合、
実際の dat レス数と subject.txt の不整合が生じます。
(これも書いてありますが、同じスレで発言があれば治ります)
また、age 書き込みしたのにあがらない(saborin ではない)ことも発生します。
この程度は利用上の致命的問題とならないので現状でもOKなんだと思います。
このあたりの考え方は技術者的思考&嗜好ですみません
864stream ◆PNstream2s
2007/02/23(金) 12:39:38ID:ezCNONMk0 datの破損
http://wwwww.2ch.net/test/read.cgi/news4vip/1172149686/738-739
(●持ってない人用) http://asnxload.dip.jp/files/ppfx00370.txt
738のレスを書き込み中に739の書き込みが割り込んだように見える
http://wwwww.2ch.net/test/read.cgi/news4vip/1172149686/738-739
(●持ってない人用) http://asnxload.dip.jp/files/ppfx00370.txt
738のレスを書き込み中に739の書き込みが割り込んだように見える
>>860
再利用となる index.html や subback.html 作成用の subject.txt データに関しては、
bbs.cgi で subject.txt を更新(func.pl の UpdateSubjectDat())した後に
open(SUBJECT, $subjectTxtPath)
binmode(SUBJECT);
flock(SUBJECT, 1);
@subjectTxt = <SUBJECT>;
close(SUBJECT);
chomp(@subjectTxt);
で改めて読み込んで処理すればいいかと。
@subjectTxt = <SUBJECT>; な読み込みは Perl 内部で特に最適化されてる部分なので
二重の読み込み処理に見えますが、そんなにコストは高くないです。
再利用となる index.html や subback.html 作成用の subject.txt データに関しては、
bbs.cgi で subject.txt を更新(func.pl の UpdateSubjectDat())した後に
open(SUBJECT, $subjectTxtPath)
binmode(SUBJECT);
flock(SUBJECT, 1);
@subjectTxt = <SUBJECT>;
close(SUBJECT);
chomp(@subjectTxt);
で改めて読み込んで処理すればいいかと。
@subjectTxt = <SUBJECT>; な読み込みは Perl 内部で特に最適化されてる部分なので
二重の読み込み処理に見えますが、そんなにコストは高くないです。
>>865 訂正
flock いらないですね
flock いらないですね
>>859
いろいろと制約事項(subject.txtの内容が破損してないなど)はありますが
# subback.html
$tmpl = qq[<a href="%s/l50">%d: %s</a>\n];
$cnt = 0;
for (@subjectTxt) {
printf($tmpl, substr($_, 0, 10), ++$cnt, substr($_, 15));
}
でよいかと
いろいろと制約事項(subject.txtの内容が破損してないなど)はありますが
# subback.html
$tmpl = qq[<a href="%s/l50">%d: %s</a>\n];
$cnt = 0;
for (@subjectTxt) {
printf($tmpl, substr($_, 0, 10), ++$cnt, substr($_, 15));
}
でよいかと
ついでに index.html 書き出し部分も
# index.html
$boradName = 'news4vip';
# 1..10
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d:</a> <a href="#%d">%s</a> ];
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
$_ = $subjectTxt[$cnt-1];
printf($tmpl, substr($_, 0, 10), $cnt, $cnt, substr($_, 15));
}
# 11..100
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d: %s</a> ];
$cntLast = (@subjectTxt > 100) ? 100 : scalar(@subjectTxt) ;
for $cnt (11 .. $cntLast)
{
$_ = $subjectTxt[$cnt-1];
printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
}
# 上位10スレの l10 のhtml化
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
# threadId 取得
$threadId = ($subjectTxt[$cnt-1], 0, 10)
# dat を読む (ここでもIOを減らす方法はいくつかある)
open(DAT, "${boardPath}/${threadId}.dat");
# 書く ( 1 と l10 部分)
}
# index.html
$boradName = 'news4vip';
# 1..10
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d:</a> <a href="#%d">%s</a> ];
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
$_ = $subjectTxt[$cnt-1];
printf($tmpl, substr($_, 0, 10), $cnt, $cnt, substr($_, 15));
}
# 11..100
$tmpl = qq[<a href="../test/read.cgi/${boardName}/%s/l50" target="body">%d: %s</a> ];
$cntLast = (@subjectTxt > 100) ? 100 : scalar(@subjectTxt) ;
for $cnt (11 .. $cntLast)
{
$_ = $subjectTxt[$cnt-1];
printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
}
# 上位10スレの l10 のhtml化
$cntLast = (@subjectTxt > 10) ? 10 : scalar(@subjectTxt) ;
for $cnt (1 .. $cntLast)
{
# threadId 取得
$threadId = ($subjectTxt[$cnt-1], 0, 10)
# dat を読む (ここでもIOを減らす方法はいくつかある)
open(DAT, "${boardPath}/${threadId}.dat");
# 書く ( 1 と l10 部分)
}
>>863
>(ryにあるアトミックとは、ファイル更新時のデータの一時的な乱れや
>(ryで雑談で出たファイルの不整合のことだと思いますが、
まぁそうですね.
>私の認識では、(ry掲示板全体のアトミックを考えてました。
一般論としてはそれも重要なことだとは思いますが,
2ch の特性を踏まえると普通のファイルロックの使い方では
先に述べたような不都合も出てくる,と.
# まぁ,そのあたりも乗り越えようと考えたのが bbsd なんですけどね.
>>864 デカいカキコのため,write() が複数になってその間に割り込んだ可能性もありますね.
>>865 なるほど......
>>868 少数とはいえ,まだ9桁スレキーも残ってるところあるかも?
>>869 html 部分は,別途こんなのを作ってます -> http://qb5.2ch.net/operate/html/
これを読み込んでつなげてる,と.
>(ryにあるアトミックとは、ファイル更新時のデータの一時的な乱れや
>(ryで雑談で出たファイルの不整合のことだと思いますが、
まぁそうですね.
>私の認識では、(ry掲示板全体のアトミックを考えてました。
一般論としてはそれも重要なことだとは思いますが,
2ch の特性を踏まえると普通のファイルロックの使い方では
先に述べたような不都合も出てくる,と.
# まぁ,そのあたりも乗り越えようと考えたのが bbsd なんですけどね.
>>864 デカいカキコのため,write() が複数になってその間に割り込んだ可能性もありますね.
>>865 なるほど......
>>868 少数とはいえ,まだ9桁スレキーも残ってるところあるかも?
>>869 html 部分は,別途こんなのを作ってます -> http://qb5.2ch.net/operate/html/
これを読み込んでつなげてる,と.
確かに、9桁のキーはまだ結構ありますね。
10桁決め打ちでやってますが、9桁対応させるなら10桁目が数字かそうでないかで
条件分岐を追加すればいいだけですね。正規表現でやれば \d{9,10} ですみますけど
Perlの正規表現は他の実装に比べて早いですが、index や substr などの文字列処理に
比べたら馬鹿にならないほどコスト大(数十倍)だったりします。
条件分岐を追加すればいいだけですね。正規表現でやれば \d{9,10} ですみますけど
Perlの正規表現は他の実装に比べて早いですが、index や substr などの文字列処理に
比べたら馬鹿にならないほどコスト大(数十倍)だったりします。
http://qb5.2ch.net/operate/html/ のアイデアはあるかなと思ってましたが、
ディスクをどの程度使用するかにも寄りますが、l10 だけでなく全てのレスを
HTML化しておけば、read.cgi でも使えますし、より効果的な負荷低減になると
思います。
バイナリの埋め込みになりますが、各レスのオフセット(seek の引数)も一緒に
インデクス化していれておけば、現実的可能な最速処理もできるかと
ディスクをどの程度使用するかにも寄りますが、l10 だけでなく全てのレスを
HTML化しておけば、read.cgi でも使えますし、より効果的な負荷低減になると
思います。
バイナリの埋め込みになりますが、各レスのオフセット(seek の引数)も一緒に
インデクス化していれておけば、現実的可能な最速処理もできるかと
>>874 9桁対応版
{
substr($_, 9, 1) eq '.'
? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
: printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14));
}
{
substr($_, 9, 1) eq '.'
? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
: printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14));
}
>>875
>全てのレスをHTML化しておけば、read.cgi でも使えますし
これは昔 dat2html 使ってやろうとしてたことあったような記憶もおぼろげながら......
まぁ,read.cgi 出力に mod_cache かますとかやった方が手っ取り早いと思いますけど.
>全てのレスをHTML化しておけば、read.cgi でも使えますし
これは昔 dat2html 使ってやろうとしてたことあったような記憶もおぼろげながら......
まぁ,read.cgi 出力に mod_cache かますとかやった方が手っ取り早いと思いますけど.
>>876 修正
substr($_, 9, 1) eq '.' # 10文字目がピリオドなら9桁
: printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14))
? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
substr($_, 9, 1) eq '.' # 10文字目がピリオドなら9桁
: printf($tmpl, substr($_, 0, 9), $cnt, substr($_, 14))
? printf($tmpl, substr($_, 0, 10), $cnt, substr($_, 15));
>>877
今の read.cgi って対象の .dat を読み込んで、1,300 や 1-20 や l50 なんかの指定に従って
対象の行を取り出して整形して出力する処理ではないかと思ってるのですが、この dat の行を
html に変換するコストが無駄になってるのでは?と思ってます。
あと、mod_cache をかませても l50 や指定なしのものだけをキャッシュさせて、それ以外の
特殊な条件指定したもの(300-400)はキャッシュの意味は少ないと思いますし、そちらのコストも
考えると、全レスhtml化の恩恵は大きいと思います。こちらも時間があれば仕様案まとめてみます
今の read.cgi って対象の .dat を読み込んで、1,300 や 1-20 や l50 なんかの指定に従って
対象の行を取り出して整形して出力する処理ではないかと思ってるのですが、この dat の行を
html に変換するコストが無駄になってるのでは?と思ってます。
あと、mod_cache をかませても l50 や指定なしのものだけをキャッシュさせて、それ以外の
特殊な条件指定したもの(300-400)はキャッシュの意味は少ないと思いますし、そちらのコストも
考えると、全レスhtml化の恩恵は大きいと思います。こちらも時間があれば仕様案まとめてみます
そんなわけで、プロファイリングしてみた。
1行目を
#!/usr/local/bin/perl -d:DProf
に変えて、できたtmon.outを処理。
レスはこれ。
http://dso.2ch.net/test/read.cgi/myanmar/1153850369/530
html/ の下がないと作り直すので、2つ目のレスで計測。
トリップあり、sage、●なし、BEなし。
%Time ExclSec CumulS #Calls sec/call Csec/c Name
14.4 0.077 0.095 1 0.0775 0.0948 main::MakeIndex4PC
13.1 0.070 0.070 1 0.0703 0.0703 main::IsKoukoku
8.82 0.047 0.266 1 0.0468 0.2661 main::bbs_entryXXX
5.63 0.030 0.233 30 0.0010 0.0078 main::BEGIN
5.63 0.030 0.026 1 0.0304 0.0262 main::initFOX
4.32 0.023 0.045 10 0.0023 0.0045 Net::DNS::Resolver::Base::BEGIN
4.32 0.023 0.052 22 0.0010 0.0024 Jcode::BEGIN
3.00 0.016 0.016 1 0.0156 0.0156 main::mumumuGetNowTime
3.00 0.016 0.016 11 0.0014 0.0014 DynaLoader::dl_load_file
2.82 0.015 0.030 10 0.0015 0.0030 LWP::UserAgent::BEGIN
2.82 0.015 0.023 73 0.0002 0.0003 Exporter::import
1.50 0.008 0.008 1 0.0078 0.0078 jcode::init
1.50 0.008 0.008 1 0.0078 0.0078 main::checkDenyList
1.50 0.008 0.008 1 0.0078 0.0078 main::foxReadSettings
1.50 0.008 0.008 1 0.0078 0.0078 Net::DNS::RR::_get_subclass
1行目を
#!/usr/local/bin/perl -d:DProf
に変えて、できたtmon.outを処理。
レスはこれ。
http://dso.2ch.net/test/read.cgi/myanmar/1153850369/530
html/ の下がないと作り直すので、2つ目のレスで計測。
トリップあり、sage、●なし、BEなし。
%Time ExclSec CumulS #Calls sec/call Csec/c Name
14.4 0.077 0.095 1 0.0775 0.0948 main::MakeIndex4PC
13.1 0.070 0.070 1 0.0703 0.0703 main::IsKoukoku
8.82 0.047 0.266 1 0.0468 0.2661 main::bbs_entryXXX
5.63 0.030 0.233 30 0.0010 0.0078 main::BEGIN
5.63 0.030 0.026 1 0.0304 0.0262 main::initFOX
4.32 0.023 0.045 10 0.0023 0.0045 Net::DNS::Resolver::Base::BEGIN
4.32 0.023 0.052 22 0.0010 0.0024 Jcode::BEGIN
3.00 0.016 0.016 1 0.0156 0.0156 main::mumumuGetNowTime
3.00 0.016 0.016 11 0.0014 0.0014 DynaLoader::dl_load_file
2.82 0.015 0.030 10 0.0015 0.0030 LWP::UserAgent::BEGIN
2.82 0.015 0.023 73 0.0002 0.0003 Exporter::import
1.50 0.008 0.008 1 0.0078 0.0078 jcode::init
1.50 0.008 0.008 1 0.0078 0.0078 main::checkDenyList
1.50 0.008 0.008 1 0.0078 0.0078 main::foxReadSettings
1.50 0.008 0.008 1 0.0078 0.0078 Net::DNS::RR::_get_subclass
最初のは、index.html を作る処理ですね。
次のが広告かどうかのチェック。
3番目は各種初期化。
次のが広告かどうかのチェック。
3番目は各種初期化。
>>879 基本的に,mod_cache に任せておけば大局的には読み出しの多いレス番指定が
ヒット率が高くなるでしょうし,読み出しの多いものが重点的にキャッシュされ,
一方少ないものは on the fly に生成するという形に収斂していくかと.
全レスを HTML 化したものもスタティックファイルとして保持させると,
あぼーん用スクリプトとか dat 落ちスクリプトとかにも対応する処理を
入れることになって,手間と効果のバランスからどうかなぁ,とも.
ヒット率が高くなるでしょうし,読み出しの多いものが重点的にキャッシュされ,
一方少ないものは on the fly に生成するという形に収斂していくかと.
全レスを HTML 化したものもスタティックファイルとして保持させると,
あぼーん用スクリプトとか dat 落ちスクリプトとかにも対応する処理を
入れることになって,手間と効果のバランスからどうかなぁ,とも.
>>880,881
speedy でのキャッシュされた実行ではなさそうなので、BEGIN や Exporter::Import などのコストも入ってますね。
となると上ふたつのコストが、ファイル読み込み処理と、正規表現の文字列処理なので、この部分が一番わかりやすい
大きなコストになってるような感じですね。
他の部分は、上二つに比べたらまだ気を使うほどのところでもなさそうです。
speedy でのキャッシュされた実行ではなさそうなので、BEGIN や Exporter::Import などのコストも入ってますね。
となると上ふたつのコストが、ファイル読み込み処理と、正規表現の文字列処理なので、この部分が一番わかりやすい
大きなコストになってるような感じですね。
他の部分は、上二つに比べたらまだ気を使うほどのところでもなさそうです。
で、われわれがSaborinと呼んでいるのは、
MakeIndex4PC(とUpdateSubback)を呼ぶのをまばらにする、
というものですね。
MakeIndex4PC(とUpdateSubback)を呼ぶのをまばらにする、
というものですね。
私が今後どのような形で(&飽きずにいつまでw)お手伝いすることになるかわかりませんが、
FreeBSD の -stable と -current みたいに、現状の改善と安定を目指すものと、年末くらいに
完全にいちから再設計して作り直した(現状では雪だるまがそっち系なのかな?)システムという
形で現状ですべきこと、長期的に考えることを分けて考えてもいいような気がします。
現状では、>>880 のようなものとにらめっこして、LAを減らすことかな?
あるいは現状の利用者数、投稿数で年末まで持つと仮定して、新バージョンの開発かな?w
なんてことを考えるのははたから茶々いれるだけの技術者的の私個人としては楽しいのですが、
運営側としてはどうなんでしょ?
FreeBSD の -stable と -current みたいに、現状の改善と安定を目指すものと、年末くらいに
完全にいちから再設計して作り直した(現状では雪だるまがそっち系なのかな?)システムという
形で現状ですべきこと、長期的に考えることを分けて考えてもいいような気がします。
現状では、>>880 のようなものとにらめっこして、LAを減らすことかな?
あるいは現状の利用者数、投稿数で年末まで持つと仮定して、新バージョンの開発かな?w
なんてことを考えるのははたから茶々いれるだけの技術者的の私個人としては楽しいのですが、
運営側としてはどうなんでしょ?
きっと、、、「運営側」っていう言葉について、
「それって何だろう」って素で思うようになると、
なんとなくいいかんじになる、んじゃないのかなと。
ここって「あっち側」とか「こっち側」とかじゃなくて、
管理人を除いてみんな同じところにいる、
っていうあたりから、はじまっているような気がするんで。
なんというか、このへんにいる人たちは
みんなたんなる「お手伝い」に過ぎなくて、
単にそれぞれ、出来ることが違うだけというか。なんとゆうか。
「それって何だろう」って素で思うようになると、
なんとなくいいかんじになる、んじゃないのかなと。
ここって「あっち側」とか「こっち側」とかじゃなくて、
管理人を除いてみんな同じところにいる、
っていうあたりから、はじまっているような気がするんで。
なんというか、このへんにいる人たちは
みんなたんなる「お手伝い」に過ぎなくて、
単にそれぞれ、出来ることが違うだけというか。なんとゆうか。
で、>>886 みたいなものって、昔のインターネットには割とたくさんあったんですが、
今のインターネットには、もうなんか少なくなったというか、
ほとんど見当たらないようになりましたね。
「それいいっすね。いっちょやりますかぁ」「ごにょごにょ…」
「おい変だぞ、どうしたんだゴルァ」
「あちゃー、ごめんなさいー、戻しますー」みたいな、
アドホックというか、とりあえず試してみるというか。
そんなわけで私は2ちゃんねるに「昔からある、もともとのインターネットの姿」を、
ほんのちょっぴり、垣間見ていたりなんかして。
すれ違いすんませんです。
今のインターネットには、もうなんか少なくなったというか、
ほとんど見当たらないようになりましたね。
「それいいっすね。いっちょやりますかぁ」「ごにょごにょ…」
「おい変だぞ、どうしたんだゴルァ」
「あちゃー、ごめんなさいー、戻しますー」みたいな、
アドホックというか、とりあえず試してみるというか。
そんなわけで私は2ちゃんねるに「昔からある、もともとのインターネットの姿」を、
ほんのちょっぴり、垣間見ていたりなんかして。
すれ違いすんませんです。
>>888 まぁそうですね,これだけデカいサイトで挑戦的なことをできるところって
他にないでしょうしね.「普通の」大手サイトでは,▲が増えるどころじゃ済まないでしょうしw
他にないでしょうしね.「普通の」大手サイトでは,▲が増えるどころじゃ済まないでしょうしw
>>888,889
そういう土壌はこの一週間で充分堪能していますw
私も仕事で仕様ガチガチ安定して当然の世界でも生きてますし、
趣味のソフトウェア開発では、自由きままにやっています。
論文やレポート書いてどっかにポストするのも好きですし、
ちょうど今の新ばななは良い縁になったと思います。
顔色伺ってというのはあまり楽しくないので、自由気ままに
勝手にプロジェクト立ち上げて勝手に進めて、方針や意見が
合わなければ自然に影が薄くなっていくのかもしれないですね
そういう土壌はこの一週間で充分堪能していますw
私も仕事で仕様ガチガチ安定して当然の世界でも生きてますし、
趣味のソフトウェア開発では、自由きままにやっています。
論文やレポート書いてどっかにポストするのも好きですし、
ちょうど今の新ばななは良い縁になったと思います。
顔色伺ってというのはあまり楽しくないので、自由気ままに
勝手にプロジェクト立ち上げて勝手に進めて、方針や意見が
合わなければ自然に影が薄くなっていくのかもしれないですね
そっすね。>>890
勝手にという中にもたぶん需要があったり、
動機付けがあったり、空気嫁があったりするのかなと。
私の基本思想はこのへんにでも適当に。
サーバ修理中につき(そろそろ退院予定らしいです)、Googleキャッシュでごめんなさい。
http://72.14.235.104/search?q=cache:9LcMvz3YJbkJ:mumumu.mu/human-2ch.html+mumumu.mu/human-2ch.html&hl=ja&ct=clnk&cd=1
勝手にという中にもたぶん需要があったり、
動機付けがあったり、空気嫁があったりするのかなと。
私の基本思想はこのへんにでも適当に。
サーバ修理中につき(そろそろ退院予定らしいです)、Googleキャッシュでごめんなさい。
http://72.14.235.104/search?q=cache:9LcMvz3YJbkJ:mumumu.mu/human-2ch.html+mumumu.mu/human-2ch.html&hl=ja&ct=clnk&cd=1
>>890 まぁ,何を隠そう私自身,勝手にコード書いて「これどうよ?」って
勝手に提示するってのをこれまで繰り返しながら,2ch にずぶずぶはまってきてますからw
チョコさんも,そんな感じではまっていくことになるのかなぁ,とw
勝手に提示するってのをこれまで繰り返しながら,2ch にずぶずぶはまってきてますからw
チョコさんも,そんな感じではまっていくことになるのかなぁ,とw
すぐ出来そうなことは実機のモニターになれるならということでこんな感じでw
ttp://yy28.60.kg/test/read.cgi/maido3/1170831265/85
スキルは今までにそれなりに蓄積してきて、必要があれば何でも作れるとは思うんだけど
モチベーションを持てる何かがないので日々興味の赴くままに(ここにいる理由がまさにw)
何かしております。先日までは amd64 や 128bitSSE で deflate 高速化出来ないか試行錯誤してたりw
ttp://yy28.60.kg/test/read.cgi/maido3/1170831265/85
スキルは今までにそれなりに蓄積してきて、必要があれば何でも作れるとは思うんだけど
モチベーションを持てる何かがないので日々興味の赴くままに(ここにいる理由がまさにw)
何かしております。先日までは amd64 や 128bitSSE で deflate 高速化出来ないか試行錯誤してたりw
とりあえず、今私にクリティカルにできそうなこととしては‥‥‥
sub MakeIndex4PC
sub IsKoukoku
の部分の現状のコードをいただけるのであれば、リファクタリングさせてもらいますよ。
sub MakeIndex4PC
sub IsKoukoku
の部分の現状のコードをいただけるのであれば、リファクタリングさせてもらいますよ。
MakeIndex4PC に関しては,いろいろ挿入するファイルがあったり
出力内容自体が複雑故って感じもしますね.
IsKoukoku の方は,チョコさんから見ていじりがいがあるかも?
確か,IsKoukoku の中核部分は以前から公開されていて,
クローズドではないと思うので貼ってみます.
foreach my $NG_word_ref (@FOX_Ro54)
{
my $NG_word = $NG_word_ref->[0]; # リファレンスから取り出し。
if (my $matched = eval{ return $In_Strings =~ m<$NG_word> ? $& : undef }) {
$NG_word_ref->[0] = $matched; return $NG_word_ref;
} # 合致したらNGワード部分の摘出とリファレンスを返す。
# 不正 NG ワードがあったり引っかからなければスキップ
}
return '';
ちなみに,@FOX_Ro54 は初期化段階でこんな感じで読み込まれます.
open(ADFILE,"....../Rock54data");
@FOX_Ro54 = map { [ (split /<>/)[5,6,7] ] } <ADFILE>;
close(ADFILE) ;
出力内容自体が複雑故って感じもしますね.
IsKoukoku の方は,チョコさんから見ていじりがいがあるかも?
確か,IsKoukoku の中核部分は以前から公開されていて,
クローズドではないと思うので貼ってみます.
foreach my $NG_word_ref (@FOX_Ro54)
{
my $NG_word = $NG_word_ref->[0]; # リファレンスから取り出し。
if (my $matched = eval{ return $In_Strings =~ m<$NG_word> ? $& : undef }) {
$NG_word_ref->[0] = $matched; return $NG_word_ref;
} # 合致したらNGワード部分の摘出とリファレンスを返す。
# 不正 NG ワードがあったり引っかからなければスキップ
}
return '';
ちなみに,@FOX_Ro54 は初期化段階でこんな感じで読み込まれます.
open(ADFILE,"....../Rock54data");
@FOX_Ro54 = map { [ (split /<>/)[5,6,7] ] } <ADFILE>;
close(ADFILE) ;
2007/02/23(金) 16:08:22ID:ZT6cIEXJ0
>>897
Rock54のファイルの場所は秘密なのでは?
Rock54のファイルの場所は秘密なのでは?
899Kseniya ★
2007/02/23(金) 16:10:49ID:???0 つうか
そのフォルダが超機密だったのであった。
うひゃひゃひゃひや
そのフォルダが超機密だったのであった。
うひゃひゃひゃひや
2007/02/23(金) 16:13:39ID:PebZXv460
/(^o^)\
901stream ◆PNstream2s
2007/02/23(金) 16:13:49ID:osWVCmNQ0 川 ;´・`;)イイハナシヤナー
認証ぐらいかけとけよ
認証ぐらいかけとけよ
2007/02/23(金) 16:13:57ID:Nv58QqDI0
どうもアレかなと思ったらやっぱり。。
2007/02/23(金) 16:14:07ID:z2462BoB0
なんてこった・・・。
2007/02/23(金) 16:15:12ID:8SBJJSul0
GJ!
2007/02/23(金) 16:15:45ID:tP51+qgU0
△
>>897
このレスあぼ〜ん しておくか、変更する必要があるかも(汗
私のトリップに @hotmail.com が使えますから、そちらに
可能な部分だけ改めて送ってもらえれれば確認できます。
ここのコードはあまり手を加えられるところはないですね。
一応先日 Rock54 がらみで試作してみたコードはこちら
http://choco.tank.jp/trac/wiki/Rock54re
このレスあぼ〜ん しておくか、変更する必要があるかも(汗
私のトリップに @hotmail.com が使えますから、そちらに
可能な部分だけ改めて送ってもらえれれば確認できます。
ここのコードはあまり手を加えられるところはないですね。
一応先日 Rock54 がらみで試作してみたコードはこちら
http://choco.tank.jp/trac/wiki/Rock54re
2007/02/23(金) 16:25:03ID:4XP+PmOt0
あっはっは。
2007/02/23(金) 16:25:33ID:Nv58QqDI0
これはもうキャップ支給ものだな
2007/02/23(金) 16:32:37ID:PebZXv460
( ゚∀゚)o彡°キャップ!キャップ!
911チョコバナナ ◆Choco52.ko
2007/02/23(金) 16:33:01ID:AbpaAoA10 >>907
Don't mind ♪
職を失うわけではないですし(私は仕事で契約破棄されたことありますけどw)
誰の命にかかわるわけではないので(総務省から警告うける内容でもないですし)
気にせず生きましょう
Don't mind ♪
職を失うわけではないですし(私は仕事で契約破棄されたことありますけどw)
誰の命にかかわるわけではないので(総務省から警告うける内容でもないですし)
気にせず生きましょう
2007/02/23(金) 16:34:21ID:8SBJJSul0
祝★強制支給!
SunOSさんが、本件を管理人に丁寧なメールで報告&ごめんなさいしました。
(私に Cc: されていました)
管理人からは、
> うひゃひゃ、たまにあることで。
というメールがすぐに返ってきました。
そんなわけで、私はどうしたらよかろうでしょうか。
やはり何か、★でも出しますかね。
でもそれもなんかびみょうかも。
(私に Cc: されていました)
管理人からは、
> うひゃひゃ、たまにあることで。
というメールがすぐに返ってきました。
そんなわけで、私はどうしたらよかろうでしょうか。
やはり何か、★でも出しますかね。
でもそれもなんかびみょうかも。
2007/02/23(金) 16:37:08ID:8SBJJSul0
▲ ★
2007/02/23(金) 16:37:46ID:Nv58QqDI0
白三角 標準装備で
2007/02/23(金) 16:39:04ID:9+ya++bV0
つサン▲▲ ★
2007/02/23(金) 16:45:29ID:1Luj9ZEH0
わろとけわろとけ
( ゚∀゚)アハハ八八ノヽノヽノヽノ \ / \ / \
このスレで最速1.000やろか?(素
( ゚∀゚)アハハ八八ノヽノヽノヽノ \ / \ / \
このスレで最速1.000やろか?(素
2007/02/23(金) 16:47:45ID:1Luj9ZEH0
今からこのスレはSunOSさんのキャップを考えるスレにします。
サンサンサン★は どう?
サンサンサン★は どう?
>>918
やるな
やるな
2007/02/23(金) 16:53:36ID:???0
ゥケケケケ
/ノ\∧_∧Ψ
/ノ\( ゚∀゚)|
⌒⌒ (∪ヌルポ⊃
←し―J|。+゚
/ノ\∧_∧Ψ
/ノ\( ゚∀゚)|
⌒⌒ (∪ヌルポ⊃
←し―J|。+゚
2007/02/23(金) 16:54:09ID:68M5N5it0
>>921
ガッ
ガッ
2007/02/23(金) 16:59:23ID:KDWDnaV20
祭りだと聞いて歩いてきました
いつもならファイルパスとか事前に気付いて伏せるんですが......
今回は注意力不足だったようで......
# ★ を頂くのは恐れ多いので,\u263C あたりで......
今回は注意力不足だったようで......
# ★ を頂くのは恐れ多いので,\u263C あたりで......
2007/02/23(金) 17:28:56ID:PQAQOmsq0
ん、なんかマソコとか呼ばれそうなアレだな
927チョコバナナ ◆Choco52.ko
2007/02/23(金) 17:32:05ID:AbpaAoA10 >>925
同じグループに他にも SUN があるようです。>>926 のご指摘もありますし、黒塗りにしたこちらはいかが?
http://www.fileformat.info/info/unicode/char/2600/index.htm 'BLACK SUN WITH RAYS'
同じグループに他にも SUN があるようです。>>926 のご指摘もありますし、黒塗りにしたこちらはいかが?
http://www.fileformat.info/info/unicode/char/2600/index.htm 'BLACK SUN WITH RAYS'
2007/02/23(金) 17:39:28ID:wWRGG5C/0
こりゃアナルだな
2007/02/23(金) 17:52:24ID:tP51+qgU0
閉鎖騒動になるぞ。
930動け動けウゴウゴ2ちゃんねる
2007/02/23(金) 17:53:56ID:83NNOvB00 rootたんって▲一つ増えた?
気づかなかったな
気づかなかったな
レス数が900を超えています。1000を超えると表示できなくなるよ。
ニュース
- 【文春】中居正広「9000万円女性トラブル」X子さんの訴えを握り潰した「フジテレビ幹部」★2 [Ailuropoda melanoleuca★]
- アサヒビール、吉沢亮とCM契約解除「容認できない」 [おっさん友の会★]
- 【野球】源田壮亮が妻・衛藤美彩に〝決別LINE〟送信か「あとは弁護士と話してほしい」★2 [ネギうどん★]
- 【立憲】野田代表、消費減税「将来世代にプラスにならない」「現実的な路線を取っていく」 ★2 [樽悶★]
- 【1000円の壁】「ラーメン店」倒産、前年比3割超の急増 過去最多を大幅更新 ラーメン店の3割が「赤字」経営、原材料コスト高が痛手 [シャチ★]
- 出生数が過去最低を更新 子どもはほしいのに金銭問題がネック 抜け出せない"少子化の罠" ★3 [首都圏の虎★]
- 【速報】中居正広の文春報道第2弾、とうとう出る [112948759]
- 有識者「死刑制度に賛成?じゃあ君が死刑執行ボタン押してね」 死刑賛成派「あ...ぁ...」 [237216734]
- アサヒビール、吉沢亮とCM契約解除 [256556981]
- 【速報】石破総理「東京一極集中をやめます。まず私たちから省庁を地方移転、大企業も地方移転させます」百合子大発狂へw [732289945]
- 【速報】石破総理「東京一極集中をやめる。まずは省庁と大企業を地方移転させる」
- 【朗報】RTX50xxシリーズ発表される [752644586]