【.htaccess】読みこみできない【規制作戦】
■ このスレッドは過去ログ倉庫に格納されています
http://qb3.2ch.net/test/read.cgi/operate/1082125059/864-865n 864 :動け動けウゴウゴ2ちゃんねる :04/04/26 16:31 ID:XBHI6262 全datさらうのを勧めるのもどうかと 865 :留守番 ★ :04/04/26 16:42 ID:??? >>864 最近増えてきているんですよねぇ .htaccess で deny の規制が復活の予感。 http://qb3.2ch.net/test/read.cgi/operate/1082125059/867-868n 867 :root ★ :04/04/26 16:47 ID:??? datかっさらいもさることながら、read.cgi経由も目につくような気が。 868 :留守番 ★ :04/04/26 16:49 ID:??? >>867 ですねぇ 思い立ったが吉日ってことで スレ立ててやりましょ どうせなら.htaccessでリダイレクト先を広告でいっぱい埋め尽くせば良いのに(素 これで、みみずんタンやにくちゃんねるさんが規制されることはないんですよね? 懐かしいスレが復活しましたねぇ。 出張先から記念パピコ。 一定時間毎にsubback.htmlを読んで、新スレのみをいただくというのも 所謂「かっさらい」に該当するのでしょうか…? ようは、こういうことなのですが。 http://www.dqnplus.net/ >>8 subback.htmlよりsubject.txt取得の方が効率良いですし、おすすめです。 datかっさらいは・・・どうなんでしょう 以前newsplus.jpはそれで規制くらいましたね。 程度問題だとは思いますけど。 ありがとうございます。 たしかにsubback.txtを読んだ方が軽いですね。 変更することにします。 当面はこのスレの流れを読みつつ対応していきます。 鯖に負担をかけない程度にやさしくやる分にはいいんじゃないかなぁ。 コストの面からいうと、 ・>>1 を取るためだけの目的でread.cgiを呼ぶのはコストが高いので、避けてほしい ・datをとる場合、できるだけ前に取ったものの増分で入手してほしい といったところかなと。 あとは、read.cgi経由で統計情報のグラフに影響が出るぐらい、 がばちょと読んでいる方がたまにいるみたいということかなと。 なお、みみずんさんとかは、負荷のかからない時刻にやさしくスキャンいただいている模様であると、 その筋の方からうかがっておりますです。 「read.cgiでがばちょ」の対象になっていそうなのは、見ている範囲だと、 ・memories(の各バーチャルホスト) ・news5 ・news6 ・pc5 ・science2 あたりか。 あとは私が統計情報見ていないところでも、別途あるかも。 私のサイトでは、datから必要な情報は、 ・スレ立て人 ・>>1 なので、一度datをいただいてDBに入れたスレには二度とアクセスしていません。 もちろん、read.cgiは通していません。 ただ、subback.htmlを5分毎に読んでいるのですが、いかがなものでしょうか? こんな感じにした方が言いかと。 dat取得は1個ごとに10secのwaitをいれる newsplus.jpから入手した情報ですけどw × 作った ○ 使った 頭がつかれてるっぽい。。。 >>16 BBYのdatはどれ位の間保持されてますか? わかりました。 改良していきます。 ありがとうございました。 >>20 1時間ごとにclearだったかな?。一応100個までらしいです。 >>20 >>22 subject.txtから消えるだけで、bbynews/bbyliveのdatそのものは3日前のものまで残っています。 ただし元記事がスレッド削除された場合、最大30分の遅延でこちらのdatも消えます。 >>24 なるほど… どうもありがとうございます。 .htaccess で弾くとすると...... deny リストの数が多くなってきたら, 前作った mod_authz_iplist が効果的かも. >>28 そこは2chではないので2ch2.netの方に言ってくださいな >>29 そこも、newsplusやbizplus、dqnplusの subject.txtなんかを総ざらいしているはずですが。 鯖とか回線に余裕がある時間帯にGETすればいいですか? 何曜の何時ころ余裕あります? >>32 ども。 4時〜6時くらいが底みたいすね。 嗚呼、思い出すは去年の夏、、、 そしてマーリンルージュ、、、 記念ぱぴこ 別スレでレスした際にむむむさんのページ見てた際に気がついたんですけど たんですけどmemoriesで今日の4〜5時までの間にread.cgiブン回してぶっこ 抜きやってた痕跡がありますね。。 read.cgiのアクセス記録で見ればわかりますけど明らかに怪しい動きしています。 ttp://mumumu.mu/mrtg/mrtg-rrd.cgi/read/memoriesread.html う〜ん まじで何とかしなきぉだぞー 簡単にどのIPががんがん持っていっているかをアパッチのろぐから 一発で表示してくれる cgi きぼー 1) ログは巨大である(停止しているサーバでも 100M/day) 2) read.cgi だけ抽出して 呼び元の多い順に表示 出力例) read.cgi (← ここは .dat とか、bbs.cgi とか .html .txt に変わる) 1. 111.112.113.114 8,360 回 2. 222.112.113.114 4,230 回 3. 333.112.113.114 2,560 回 だれか作ってくれー pc4.2ch.net サーバ 371318 read.cgi 呼び出し回数 = 159230 64.68.92.14(6804) 64.68.92.9(6780) 64.68.92.18(6568) 64.68.92.11(6519) 64.68.92.10(6311) 64.68.92.17(6158) 64.68.92.19(6132) 64.68.92.4(6039) 64.68.92.5(5883) 64.68.92.6(5863) bubble.2ch.net サーバ read.cgi 呼び出し回数 = 64.68.92.14(4882) 64.68.92.9(4545) 64.68.92.18(4449) 64.68.92.10(4434) 64.68.92.11(4314) 64.68.92.17(4306) 64.68.92.19(4236) 64.68.92.6(4140) 64.68.92.5(4101) 64.68.92.4(4040) 64.68.92.16(2665) >40 それだけ見る限りでは、64.68.92.0/24(*****回)みたいな感じで纏めたほうが便利かも。 order allow,deny allow from all deny from 64.68.92. を入れてみる 64.68.92.* googlebot.com……グーグルか! なるほど(w pc4.2ch.net サーバ .dat 呼び出し回数 = 139021 219.106.23.235(11074) 219.167.59.210(4425) 218.228.216.29(2456) 220.210.180.206(1793) 218.228.216.14(1407) 218.228.185.40(1306) 202.225.240.125(1261) 61.201.230.16(1086) 218.228.216.129(980) 221.184.158.51(821) 143.90.87.123(615) googleが相手ならrobots.txtを置いておくというのでは駄目なのでしょうか? bubble.2ch.net サーバ .dat 呼び出し回数 = 30589 218.228.216.29(1967) 218.228.216.14(1137) bubble.2ch.net サーバ .txt 呼び出し回数 = 7075 210.138.60.135(1981) pc4.2ch.net サーバ .txt 呼び出し回数 = 46430 210.138.60.135(1991) 218.223.194.216(1092) 219.106.243.202(872) 210.147.179.31(834) 61.121.247.58(653) 210.170.129.199(540) 219.111.57.38(504) 210.173.38.6(451) 219.126.175.153(397) 202.213.149.85(392) 129.250.170.69(384) pc4 bubble に入れた order allow,deny allow from all deny from 64.68.92. deny from 219.106.23.235 deny from 219.167.59.210 deny from 210.138.60.135 deny from 218.223.194.216 どうしますかねぇ google とかのはいつでも止められるということで良いんですが、 固定IPのところもはじけばいいんですが、 その他のねぇ、、、 規制情報板経由ですかねぇ。 219.106.23.235 ntt1-ppp489.utunomiya.sannet.ne.jp 219.167.59.210 o059210.ap.plala.or.jp 210.138.60.135 135.60.138.210.bn.2iij.net 218.223.194.216 goa.self-core.org self-core.orgってなに? >53 whoisによると、ケーブルテレビで固定IPの個人ユーザーっぽい。 >52 個人でのぶっこ抜き行為ですけど明らかに2ちゃんの鯖に過剰に負担をかける 行為ですので通報は可能だと思います。 規制情報板へログを添付して掲載して頂ければ該当プロパへ通報します。 User-agent: * Disallow: /test で行儀のいいロボットにはお帰りいただけます。 もちろんGoogleも。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる