クローラー&過剰リロード対策スレ
■ このスレッドは過去ログ倉庫に格納されています
最近、頻発しているクローラーや過剰リロード対策スレッドです。
★FAQ
■クローラーや過剰リロードとは?
・ツール等を使って板のスレッドを根こそぎDLする行為をクロール行為と
いいます。
クローラーとはクロール行為をする人の事です。
・過剰リロードとは文字通り過剰にリロードをしてsubject.txt等を取得
する行為です。
■どうして迷惑なの?
クロール行為や過剰リロードは鯖に過剰な負担をかけるため、最悪、鯖落ち
する危険があります。
■やったらどうなるの?
発見されて悪質な場合は規制情報板に掲載の上、該当プロバイダに通報
されます。
もしも先方が対応しなかったり、再発するような場合は .htaccessで
denyする場合もあります。
■.htaccessでdenyされるとどうなるの?
.htaccessでdenyされると書き込みはおろか閲覧すら出来なくなります。 >>414
↓
>>359
>>368
>>407
かちゅ〜しゃでお気に入りスレの巡回を一度しただけですけれど。。。
●にログインしていると結構早く巡回するからそれが逆に駄目だったのかしら。。
新着レスお知らせ機能とかの特殊なのは一切使ってないです。ノーマル機能の「巡回」のみ。
全ての板を含めて500スレちょい。ニュース速報プラス板で巡回したのは50スレくらい。
これで引っかかるのは如何なものかと。。。 >>440
1) どのサーバで引っかかったですか?
2) どれくらいの時間内にどれくらいのファイルにアクセスしたですか?
つまりスピード、
>>436
どうもそこら辺の田代砲を先ほどの設定で30秒位回した程度ではやはり引っかからない模様。 IEで見ると各スレ毎に経過秒数が表示されるのは何? 家電板に田代砲を0.1秒間隔で100連射してもひっかからない
0.25秒間隔で200斉射しても全然大丈夫だった >>442
1
news19(ニュース速報プラス板)
2
かちゅ〜しゃの巡回機能で一度きり。
正確な速度はわからないっぽ。
●ログインで巡回すると目視では2秒に3スレくらい巡回している雰囲気。
新規取得レス数が多かったり少なかったりでかなりばらつきがある。
数量的にはnews19サーバ限定だと50くらい。2ちゃんねる全体で500ちょっと。
しかもこれかちゅ〜しゃのお気に入りに入れた順番に巡回しているわけだからnews19サーバのスレのみを
連続して取得したわけじゃない。
news19に限れば飛び飛びで取得している感じだから数秒〜数十秒に一度程度のアクセスだろう。
俺様のレスは不確定すぎて何の参考にもならないと思う。
ただ言えるのは「何でこれで引っかかるのかよ?!( ゚д゚)m6」ということのみ。
>>444
それで引っかからないのに何故俺様は。。。
>>446-447
ほぉー。
専ブラしか使わんから分からんかった。
らりあとー >>51 からの未読を読みました。
だいたい、予想通りの展開すね。
newsplus.jp も、ばっちりひっかかりで。
archplus.newsplus.jp とか stick.newsplus.jp とかは、dat読んでいます。
更新チェックあり、ディレイありでも、今みたいにすべての+が2台のサーバにおさまっていると、
全datの更新チェックを入れるだけで、すぐにアクセス数は2000ぐらいいって、ばっちりと。
で、別にnewsplus.jpがしくっても2ちゃんねる的には何の影響もないので、
そっちはあとで、ってことにして、
これから、上から順にレスを入れていきます。 >>448
メール受け取りました。
レス入れてから、仕込みやります。
でも、全サーバcronしこむの、ちとめんどいかも、かも。
f(りゃ からけりいれるほうが、らくかもとおもた。 >>345-356辺りの掛け合いを思い出して3回/secで回してみた。
400回越えた辺りではやはりバーボン行きにはならない模様。
プニルで家電板を10枚ぐらい開いて同時にリロードかけたけどバーボンでねー あひゃひゃひゃあ。。。
削除が出来ないですよぅ。
削除画面がバーボンだぁw
かちゅで巡回してるせいかぁ。。 かちゅでは読めてるから、バーボンになってるの気が付かなかった。。 まずは〜>>207まで。
>>63
ポイント制というか、加算率ってのは、面白い考えかもですね。
F C ノーマルY 正規割引 格安 = 150 125 100 70 50 みたいなイメージですか。
>>207
これだと、jigブラウザとかscopeとか、いわゆる携帯にダウンロードアプリで動く形式のやつは、
そのままでは概ねだめですね。
携帯のiアプリからは、そのiアプリのサーバ1箇所しか、通信できないのです。(そういう仕様です)
つまり、普通に作ると、*絶対に*中間サーバ方式になると。 >>457
その辺は悩みどころ
結構負荷高い(メモリ食う、時間かかる)ので
そっちから入れるとタイムアウト頻発かも
んで全サーバまわりきらないうちに次の巡回がはじまったり、、、
要検討っすね、
今のところくろーりんく゜が頻繁にくるところと
接続数の足りないところに入れればいいのかも >>461
今回の仕組みでバーボンに引っかかったらかちゅ〜しゃからも読めないと思う。
Error:このスレッドは見つかりませんでした
のエラーが出る。
つかあれか。この仕組みに引っかかったら引っかかった当該板だけではなく
運営板以外は全て読み書き不能になるのかよ。。。
>>460
ダヨ(ο・д・)(・д・`ο)ネー
携帯関係はBlackGoatを増やしてで対応が当初のプランかと、
つまり bbs 用サーバのキャパシティを増大させるために携帯を分離した
ということです。 >>464
とある鯖のスレッド数えてみたら、150程ありました。。
qb5です。。
まあ、150も見てればそら引っかかるかぁ。。
かちゅで巡回してたら駄目って事ね。。これからは。 >>465
>>323 より前ですか? あとですか? >>467
>まあ、150も見てればそら引っかかるかぁ
工エエェェ(´д`)ェェエエ工
何だと?
俺様は以前の2ちゃんねる専用デスクトップ「俺様壱号」の時には普通に2ちゃんねる全体で2万スレとかの巡回をしてましたが。。
>>468
後ですね。 >>472
全体では、やっぱ500スレくらい見てるんですよ。
けど、それらは結構分散してるから。
削除系の板の巡回が多いんで、結局そのくらいに
なってしまってるもんで。。 ボラ活動のために未取得のスレを巡回して取得していったら、
これにひっかかるのかな。。。
今までそういうやり方でボラ活動してきたので、
ひっかかってしまうと、厳しいものがあるですね。。
負荷をかけてまでやろうとは思わないですが。。。 かちゅの巡回はdatをどんどん読んじゃうタイプなのか。 一番負荷かけてるのは誰? って話しです。
50万人のうちの上位100人は引っかかることを覚悟してください 前のやつみたいに上位100人を規制したい
自動で、って事か。 って言うか>>332で一旦リセットしているみたいだから後に決まっているような予感が。。。
28 BBON.news19 218.218.14.139 (EATcf-320p139.ppp15.odn.ne.jp) 89
この
>BBON.news19
というのはnews19サーバでの読み込み過多によりバーボン入りしましたという事よね?
それとも2ちゃんねる全体で引っかかった中で読み込み数が一番多かったサーバ?
あと、末尾の数字(89)ってなぁに?
最初は1だったのがどんどん増えてきた。 qb5の削除依頼系は普通に見えてたから、削除スクリプト
動かすまで、まじで気が付かなかった。。
やっぱJaneに切り替えた方がいいのかなぁ。。
>>476
多分、●も使ってるから、スピードが速いのかもしれない。
うーん、、削除系だけ外してもらうか、自分で手間かけて
Janeに巡回先を移行させるか。。
(で、後者をやれと言われそうな予感) 〜>>267まで
>>245
blackgoat3/4は現在のところ、プライベート側にしかサービスを提供していません。
もちろん、パブリック側に提供することも、技術的には可能です。
>>248
live系はスルーにする(現在のバーボンのように)とかの細かなチューニングは、
これから詰めていけばいいかなと。
個人的には、live系と場合によってはex系はスルーか、大幅にゆるくしてもよいかなとは思っています。
そのかわり過負荷で落ちたとしても、文句言わせないってことになるんでしょう、きっと。
>>255
live系は、遅延するぐらいならサーバが重くなったり落ちたりしたほうがいいという、
一般のサーバとはだいぶ違う人たちな気がするですね。つまり、いわゆる「コスト高」な人たち。
ということでIMO、上記の意見で。 >>482
かちゅの方で、スピードをコントロールする手段がないんで、
やっぱこれを使う限りは駄目って事ですねぇ。。
いちいちログアウトして巡回しても手間なだけだし。。
ふむふむ。。 削除整理板だと1000超えるスレがあるけれど、
活動のためにほとんどのスレを巡回対象にしているボラさんって
そこそこいる予感しますよね。 >>483
kageの中の人に要望するしか無いですね多分。。。
>>483
subject.txtを1回取得で更新されてるものだけ一つ一つ見て回る、じゃダメなん? >>484
運営カテゴリは除外、で良いような。
このカテゴリの板は商売としてクロールしてログを取得する意味もうまみも無いような気がしますし。
サーバー負荷に対してそんなに必死になるほど
2ちゃんねる運営ってのはキツキツで頑張ってんのか〜?
サーバー関連のことはやったことないから分かんないんだけども。 >>489
上位0.01%くらいで30%くらいの資源を使っていると見た >>487
お気に入りのスレは複数の板にまたがっているでしょうからねぇ。。
各板ごとにそれをやるようじゃ専用ブラウザの利便性が著しく損なわれるような。
>>484
整理板のスレもそこそこあるんですけど、削除議論とか
ここの規制系のいくつかのスレとか、運営系のスレとか、
規制議論とか、巡回してるところは、かなりあるんです。。
「巡回するな」は、活動するなと同義なんで、なんか方法
変えるしかないんかなぁと。。
>>485
まあ、なんか考えるのかもだけどね、、作者さんも。
>>486
かちゅにキャップ設定するとこなんてないですよw
>>483
Jane Viewは、そういう巡回できるですよ。けどね、巡回先が
大量にあると、一気にスレを開くとタブで埋まっちゃうのね。。
(で、画面が見えないという弊害が)
そんなわけで、かちゅでの巡回続けてるのです。。 >>493
View使ってますけど一度に開くスレ数は設定で決められますよ
15スレずつ開いて読んで閉じてって感じに >>488
活動方法にもよるのでしょうけれど、
クロールしてどこの板が未処理なのか調べているので、
それが駄目となってしまうと、今後はどうすればいいのかなあと。
いい方法があるなら、そちらに移行しますが。 |
〆⌒ヽ
―{}@{}@{}-]
( 皿 )
ロボットに見える件 >>493
>かちゅにキャップ設定するとこなんてないですよ
ダヨ(ο・д・)(・д・`ο)ネー
って言うか「書き込み規制を回避」なら兎も角。そもそも読み込みすら出来ないんだから。
それに、キャップでの回避が実現できるなら●をスルーする仕組みにしてくれと。 >>492>>493
Live2chなんかは1回の動作で取得スレのあるsubject.txt全部取得できるよ。
更新してるスレを開くのは手動だけど。 >>497
いや、除外ってこのバーボンの設定を、ですね。2ちゃんねるの中の人が。
>>501
何だと?
とても便利そうな機能じゃないかよ?!( ゚д゚)m6
〜>>380 まで
>>288
これから、ぼちぼち調整かなと。
おじさんは常に「極端」から始めるので、時に(生)暖かな心構えが必要です。
>>323
現在の閾値は例によって極秘なわけですが、なかなかな値すね。
設定値を見た感想: 一般的な板におけるスレの自動全取得は絶対にだめ、だめったらだめ。
掲示板ってそういうもんじゃないでしょ。
>>329
headlineかな。
>>363
仮に耐えられないとしたら、何か策を考えるんだろうなと。
>>367
今の状況だと、携帯側のプライベートネットワークが既に100Mbpsの頭打ちですね。
つまり、別のところで詰まっている状態です。
サーバ自体の能力は、まだ使い切っていないと思います。
ただ、限界ぎりぎりまで使うテストをしていないので、
blackgoat3/4の限界値(どのくらいまでの処理が可能なのか)は、正直なところ未知数です。 >>502
datじゃなくsubject.txtをちょっと触るだけなので許して欲しい
datを読むのは手動なので >>504
JaneViewでも同じですよ。
お気に入りのある板のsubject.txtを読みに行ってるです。
で、1鯖にそんなに大量に板が入ってるところも無いから、
そんなに負荷ではないと思う(多分私は50板前後。。) >>502
>>504
ただ、それをやるのは全取得スレッドを対象にして更新チェックするから、
ログ大量に保管してる人はあまりやらないと思う。(全取得スレッドのフォルダ開くだけで物凄くメモリ食う) ちなみに、JaneViewは、数分間は連続巡回できない
ようにもなってるし。。 >>509
それは基本じゃねすか?
かちゅ〜しゃも5分間隔をあけないと再巡回できない。 ん?
qb5ってバーボン除外(引っかかるけど、denyはされない)ですよ? いま、MacMoeJiroで削除整理板のスレを新規に200スレ巡回させたけど、
引っかからなかったよ・・・ >>511
えーとですね。。
qb5はみられても、各鯖の削除スクリプトはバーボンになるですよ。。 おや、etc4とgame10で急激なread.cgiアクセス数上昇が見られます。
新バーボンに引っかからない何て何やっているんだろう? 風呂入ってる間に1万回以上回し続けててみたもののやはりバーボン入りはせず。 まだ私がたまにぷちぷち手動で動かしているだけですよ? なにこれ
ttp://ch2.ath.cx/load/c-au1.html 〜>>406
>>381
今は、
cフロント1←blackgoat←掲示板サーバ
cフロント2←
cフロント3←
・・・
のうちの、のうちのcフロントに行くところが、100Mに達してしまっています。
つまり、blackgoatから出て行くところの管がめいっぱいになっていると。
blackgoatのネットワークI/Fそのものは1G対応なので、スイッチをいいものにアップグレードする方向で
解決を図ろうとしているわけです。
もし外からのアクセスが相当数見込まれるなら、それ用のblackgoatを入れる手はありえます。
cフロントの替わりに、各種クライアントやらクローラやらがつながると。
>>389 >>395 >>401
現在のblackgoatの遅延は1分です。ここしばらくずっと変えていません。
なっているとしたら、おかしいですね。
再度見直してみましたが、3/4とも1分になっていました。
>>406
その段階ですか。スイッチ? サーバ? それともその両方?
どのぐらいのスイッチを入れるかにもよるですね。
全ポート1Gのしっかりしたスイッチだと、それなりに値段します。
単に1Gでそれなりに動けばいいなら、いまやそれほどでもないかと。 >>511
>引っかかるけど
の時点でだめぽだと言うことでしょう。
削除作業の為に整理板や要請板を巡回しただけで引っかかってしまっては。。。
巡回せずに手動で取得しろと。
>>516
その辺が謎ねぇ。。
田代砲とかではなくスレ取得を連続で行うと引っかかるのかしら。
>>517
それじゃ削除作業が出来ないでしょうよと。
だから運営カテゴリは除外してくれないかしらと。除外ってdenyされない、では無くて。この仕組み自体動かさないでくれと。
運営カテゴリなんてボランティア以外にはそうそう巡回などしないでしょう。 大量に削除依頼スレッドを取得してから、いざ現場へいくと
削除が出来ない、っつーことですね。
削除人の方も取得の方法考えろってことでFA?>お狐さん >>521
>その段階ですか。スイッチ? サーバ? それともその両方?
両方です
>どのぐらいのスイッチを入れるかにもよるですね。
>全ポート1Gのしっかりしたスイッチだと、それなりに値段します。
>単に1Gでそれなりに動けばいいなら、いまやそれほどでもないかと。
全ポート1Gのしっかりしたスイッチだと聞いています 仕組みがよくわからんからあれだけれどさ。
削除スクリプト経由では規制を受けないようにするとか。
>>523
>>522
>巡回せずに手動で取得しろと。
巡回が駄目じゃなく
その方法が駄目なんだと思うぞ、
つまり引っかかる人は、世界で一番2ちゃんねるに負荷かけている人
方法変えてください、
難しいかなぁ、何て言えばいいんだろ、
まだどこにも導入されていないけどサ 個人的には、削除人のリモホが出ちゃってるのが
怖いなぁとか。
固定IPだったりもするし。
どういう基準でdenyされるか判るまでは
削除作業自体、やめた方が良さそうですね。 ってか、削除作業するならまず大量にスレ巡回する前に長期未処理1スレ取得して
そこに上がってるところから巡回始めてほしいもんだなぁ・・・
と、チラシの裏に愚痴っぽく 騒音、排ガス垂れ流しの車はもう使うなと言ってます。
ドライブは勿論出来ます。 FOXタン、中国からの書き込みっぽいのがあるんだけど、規制できる? パトカーや救急車も排ガス規制はクリアしてもらうと。 要は串をランダムに変えてアクセスすれば引っかからないとwwwwwww >>535
既に、自動切り替えソフトに100個ほどぶち込みました 末尾の数字は、ばーぼんになって何分経過したかの数字なのだ、という結論に至った俺 ■ このスレッドは過去ログ倉庫に格納されています