【芋】芋ほり用正規表現リスト係2
■ このスレッドは過去ログ倉庫に格納されています
芋ほりまとめで使用する正規表現リストの管理・保守を行うためのスレッドです。 規制議論板・荒らし報告スレで番犬さんの芋ほりログのまとめを行う際に利用されるちょっと大切なリストです。 現在の正規表現リストは http://imo.70.kg/list.html で確認できます。 まだまだ不完全なもので、リストの追加作業を一緒にやってくれる人を募集しています。 *応募資格* Perl互換の正規表現を扱える方。 連絡の付くメールアドレスを利用されていること。 参加希望の方は 1)変更者の欄に表示される名前 2)パスワード をご記入のうえ、 brigittaあっとimo.70.kg まで、メールを送ってください。 前スレ 【芋】芋ほり用正規表現リスト係 http://qb5.2ch.net/test/read.cgi/sec2chd/1243686067/ <拠点> 幸せサーバープロジェクト 「アイデア・技術のある人募集中」★3 http://qb5.2ch.net/test/read.cgi/operate/1241361889/ <参加者> 【専ブラで】p2proxy Part7【p2で書き込み】 http://pc12.2ch.net/test/read.cgi/software/1241931703/ 落ちたらいらなかったということで。。。 報告人ではないので。。。 himaさん、jpにあるbz.commufaについてですがここに入れるべきものではないと思います。 入れた理由をお聞かせ願えますか? ここに立てたいだけかのぅ いじれるサーバについでにつくっちゃえばいいのに 【ihou系】(薬物・取引・出会い)宣伝・マルチ継続行為対策スレ 2 http://qb5.2ch.net/test/read.cgi/sec2chd/1243912444/221 を見てて、「r-157-41.bz.commufa.jp 1res」がありました。 ##othersの58番 \.((g|h)\d+).commufa.jp に追加できばよかったのですが、gもhもbzも対応する表記が分かりませんでした。 test2の正規表現テストプログラムで試した所、##jpの91番のリストに追加でも求めた置換後の結果を吐き出したので追加しました。 報告が事後報告になり申し訳ありません。 > ([a-z0-9\-]+).az.commufa.jp bzがこれに類するのか調べてからでも 出たらすぐ突っ込まなくても 【 正規表現リストに見つからなかったホスト(要調査) 】 e-coo-can.ensnet.jp<221.186.117.234> 10res ★090607 goki 「野良猫に愛の手を」コピペ/改行+短文連投荒らし報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1244302149/129 Pアドレス 221.186.117.234 ホスト名 e-coo-can.ensnet.jp IPアドレス割当国 日本 ( jp ) Network Information: [ネットワーク情報] a. [IPネットワークアドレス] 221.186.117.232/29 b. [ネットワーク名] ENSNET f. [組織名] エス・ディー・アイ有限会社 g. [Organization] SDI Inc. m. [管理者連絡窓口] TY5475JP n. [技術連絡担当者] TY5475JP p. [ネームサーバ] [割当年月日] 2004/06/28 [返却年月日] [最終更新] 2004/06/28 09:52:01(JST) 【 漏れ串 】 串 SKNfa-02p8-185.ppp11.odn.ad.jp<210.197.175.185> 1res ( うち接続先 debian.lenny<> //正規表現リストに見つからなかったホスト(要調査) 1res ) 【 正規表現リストに見つからなかったホスト(要調査) 】 ip1036.matsumoto.ne.jp<202.248.55.22> 8res adh034.mco.ne.jp<211.16.117.34> 2res ★090614 複数板 「ID:BRbULYcm0がたてろって言ったから」スレ乱立報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1244905492/89 ♪ ◆QS1LouL6pUですが、酉割れしちゃったのでこれで行きます。 登録 >>9 \.ensnet.jp 登録 >>10 debian.lenny debian.lennyは登録しなくていいでしょ、さすがに >>12 いっぱいになって邪魔になったら考える人間です。 一度使われた以上近いうちにまた来る可能性はありますから。 しばらくしたら削除すればいいのだし。 【 正規表現リストに見つからなかったホスト(要調査) 】 218-45-223-65.enterbrain.ne.jp<218.45.223.65> 1res ★090614 複数板「岡野しね!」連投埋め立て荒らし報告スレ http://qb5.2ch.net/test/read.cgi/sec2chd/1244951387/72 >>7 >>8 さんの言うとおりだと思います。 固定か動的か微妙な線ですし、もう少し慎重に追加しても良かったかと。 >>14 対応します >>14 whoisの結果、企業のものであるようだったので、そのように対応しました。 変更方法に迷ったら相談するって方にした方がいいんですかね。 BBQにusr.wakwak.ne.jpを追加しました 【 正規表現リストに見つからなかったホスト(要調査) 】 foma003003.mobile.ppp.infoweb.ne.jp<202.219.14.227> 1res foma003027.mobile.ppp.infoweb.ne.jp<202.219.14.251> 1res foma003011.mobile.ppp.infoweb.ne.jp<202.219.14.235> 1res foma003029.mobile.ppp.infoweb.ne.jp<202.219.14.253> 1res ★090618 newsplus 通称「ばぐ太☆φスクリプト」マルチポスト報告(再々発) http://qb5.2ch.net/test/read.cgi/sec2chd/1245313454/28 【 正規表現リストに見つからなかったホスト(要調査) 】 fw.jta14.roonets.jp<219.127.169.130> 1res 【ihou系】(薬物・取引・出会い)宣伝・マルチ継続行為対策スレ 2 http://qb5.2ch.net/test/read.cgi/sec2chd/1243912444/341 >>21-22 終わりました 後、トリップ変えてみます。 s30.a048.ap.plala.or.jpをBBQに追加します こっちの http://qb5.2ch.net/test/read.cgi/sec2chd/1245412237/107 > # \.kgsm.nt.adsl.ppp.infoweb.ne.jp 1res ( anime3 1res ) でも同症状 わかった \.(\w+).nt.(isdn\d?|adsl\d?|ftth2?|ftth4|ngn\d?).ppp.infoweb.ne.jp ↓ \.$1.nt.$3.ppp.infoweb.ne.jp ^^ だから、$2 もともとは > \.(\w+).(f?nt).(isdn\d?|adsl\d?|ftth2?|ftth4|ngn\d?).ppp.infoweb.ne.jp で運用していたから$3でちゃんと表示されるんだけれども 今は > \.(\w+).nt.(isdn\d?|adsl\d?|ftth2?|ftth4|ngn\d?).ppp.infoweb.ne.jp になっているからチェック見落としていたのかも値 bbiqはdynamicと入れ替わるようだから面倒ですね。 絞り込みたい人は、yournet機能を使って絞り込んでください。 【 正規表現リストに見つからなかったホスト(要調査) 】 dhcp-202-58-156-63.voip.canet.ne.jp<202.58.156.63> 1res ★090619 news 「勃起した」2get荒らし報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1245340031/49 【 正規表現リストに見つからなかったホスト(要調査) 】 249.58.accsnet.ne.jp<210.235.58.249> 65res 160.252.69.6[r39t89sYu3..2r5n]<160.252.69.6> 3res c-179-60.tv-naruto.ne.jp<202.52.179.60> 2res ★090620 newsplus ms 京教大準強姦容疑者リストマルチポスト荒らし http://qb5.2ch.net/test/read.cgi/sec2chd/1245486482/46 160.252.69.6[r39t89sYu3..2r5n]<160.252.69.6> 3res これは不具合ではないですかね? その他については対応しました。 >>36-37 そうですね、それは多分不具合だと思います。 乙でしたー お疲れ様ですー 160.252.69.6は逆引き不可です。 なのでホスト名ではなく、IPアドレスが表示されていますので不具合ではないです。 a. [IPネットワークアドレス] 160.252.0.0/16 b. [ネットワーク名] SINSHU-UNIV f. [組織名] 信州大学 あーそうかごめんなさい。 不具合ですね。 ちょっと見てきます。。。 random さん。 83 \.dynamic\.tiki.ne.jp 84 (?<!dynamic)\.tiki.ne.jp 84がエラー起こしているので削除しちゃいます。 >>42 の件。 83番があるのでとりあえず削除しちゃいましたが もし、何かあるようだったら再登録してください。 >>42 否定後読みが使えないようなので、別のやり方で登録してみました。 ちょっと、これではあれなので、また変えてみました。 203.138.155.0/24 203.138.139.0/24 210.252.32.0/21の範囲を全てDNSで引いてみたのですが ざっと見た感じでは203.138.155.0/24・203.138.139.0/24がdynamicで 210.252.32.0/21が非dynamicというホストで返ってくるようです。 どういう違いなのかは、ISPそのものに問い合わせないと分からないですね。 なんと 考えることは同じですね(笑) http://www14.ocn.ne.jp/ ~brigitta/test6_001.txt http://www14.ocn.ne.jp/ ~brigitta/test6_002.txt http://www14.ocn.ne.jp/ ~brigitta/test6_003.txt dynamicと非dynamicが入れ替わることはあるのか?が大事なんでしょうけど 変化する事が証明されるまでは、このままで。 ★090623 既婚女性板 VIP突撃荒らし報告スレ(6回目) http://qb5.2ch.net/test/read.cgi/sec2chd/1245686662/130 【 正規表現リストに見つからなかったホスト(要調査) 】 107.217.8.202.bb.banban.jp<202.8.217.107> 1res 対応します 【ihou系】(薬物・取引・出会い)宣伝・マルチ継続行為対策スレ 2 http://qb5.2ch.net/test/read.cgi/sec2chd/1245459667/149 【 日本以外のISP、串等、逆引き不可 】 125-6-81-54.lw.livedoor.net <125.6.81.54> 3res 恐らく、http://provider.livedoor.com/ でしょうね。 ★090623 既婚女性板 VIP突撃荒らし報告スレ(6回目) http://qb5.2ch.net/test/read.cgi/sec2chd/1245686662/170,181 でbbiq.jpの範囲についてもうちょっと考えた方がよさげかなと思いました。 \.(hakata05|dynamic).bbiq.jp、みたいな形式はできませんでしょうか。 絞りたい人は、yornet機能を絞り込んでください。 bbiqユーザーなら、bbiqにdynamicの扱いについて問い合わせてください。 いや・・・たとえばhakata05がkitakyushu01になることは過去の規制歴から例がなく、 bbiq.jpを一律で規制するのは適切でないため、 \.(hakata05|dynamic).bbiq.jpの形式にしたほがいいのではないかと言いたかったのですが・・・ まだすべてじゃないけど、ある程度逆引きしてわかったこと。 \.bbiq.jp のリモホ形式は3つ。 1) ppp\d+\.[a-z]+\d+\.bbiq.jp 例) ppp0509.kitakyushu02.bbiq.jp 2) \d+-\d+-\d+-\d+\.ppp.bbiq.jp 例) 110-54-0-1.ppp.bbiq.jp 3) \d+-\d+-\d+-\d+\.dynamic.bbiq.jp 例) 110-54-20-51.dynamic.bbiq.jp (1)のppp\d+\.[a-z]+\d+\.bbiq.jp の形式ではdynamic に変わることはないように見える。 このアドレスレンジには.dynamic.bbiq.jp を *いまのところ* 確認できていない。 で、(2)の形式を有しているアドレスレンジはところどころに(3)の形式を含んだアドレスが存在している。 また、(1) のアドレスレンジと (2)(3) のアドレスレンジは重複しない。 なので、 \.([a-z]+\d+)\.bbiq.jp[TAB]\.$1.bbiq.jp \d+-\d+-\d+-\d+\.(ppp|dynamic).bbiq.jp の2種類でいけるんじゃないかなぁと。 どうでしょうか。。。 http://qb5.2ch.net/test/read.cgi/sec2chd/1245101640/35 35 名前:名無しの報告[sage] 投稿日:2009/06/17(水) 15:38:02 ID:R8f9s8lT0 《報告》 >>3-16 《ログ》 >>21-34 《集計》 ppp1878.ohashi10.bbiq.jp 18res 110-54-35-22.dynamic.bbiq.jp 16res ppp0448.ohashi10.bbiq.jp 15res ppp4389.ohashi10.bbiq.jp 15res 110-54-35-145.dynamic.bbiq.jp 13res ppp1738.ohashi10.bbiq.jp 12res ppp0729.ohashi10.bbiq.jp 10res ppp24032.ohashi10.bbiq.jp 8res ppp0459.ohashi10.bbiq.jp 6res ppp4629.ohashi10.bbiq.jp 5res 110-54-35-242.dynamic.bbiq.jp 5res ppp1445.ohashi10.bbiq.jp 4res 110-54-35-102.dynamic.bbiq.jp 4res ppp5145.ohashi10.bbiq.jp 2res この例では入れ替わっているように見受けられるのですが。 まさか、二人の荒らしが同じISPで同じような荒らしをするなんてまずないでしょうし。 そりゃまぁレンジごとで振ってるかどうか見ただけじゃわからんものね それに、私はppp.bbiq.jpなんてホストを見たことが無いんですよね。 検索しても引っかからないですし。 実際に使われているホストでは無いと思います…… bbiqのスレを見ていましたが、普通に入れ替わるみたいですね。 と、なるとdynamicの場合は\.bbiq.jp dynamicとその他のホストを含む場合は(例:>>58 ) \.([a-z]+\d+).bbiq.jp[TAB]\.($1|dynamic) という風に出力出来ればいいのですが。 >>61 取り消します。 dynamicもしくはpppの場合は\.bbiq.jp dynamicもしくはpppとその他のホストを含む場合は \.([a-z]+\d+).bbiq.jp[TAB]\.($1|dynamic|ppp) という風に出力出来ればよさそうです。 うーん、出てくるなぁ 【 正規表現リストに見つからなかったホスト(要調査) 】 pl278.mas1102.iidabashi.nttpc.ne.jp<219.102.246.22> 3res ↓ pl\d+\.mas11..\.iidabashi.nttpc.ne.jp で? >>63 調べてみますね。 マンションかホームかという違いだと思いますが。 というか、mas11が変動しないなんてソースありませんよね? 適当にやるなんてどうなんでしょうか? 不確かなら未対応のまま張ればいいと思うのですが。 でも逆引きして調べてみたところ(まだ90%程ですが) 11の部分は、変動しないようです。 >>67 その表記でもマッチしますから、撤回はしなくてもいいのですが…… >>63-64 \.mas110\d.iidabashi.nttpc.ne.jpで登録しました。 zakoツールの正規表現リストには pl\d+\.nas9..\.([a-z-]+).nttpc.ne.jp pl\d+\.nas9..\.$1.nttpc.ne.jp がある 多分 pl\d+\.mas11..\.([a-z-]+).nttpc.ne.jp pl\d+\.mas11..\.$1.nttpc.ne.jp じゃない? ★090625 複数「これ拡散させろよ J3gKBBYxXyo」マルチポスト報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1245921372/98,100 > 98 名前: 名無しの報告 [sage] 投稿日: 2009/06/26(金) 04:58:42 ID:UYtQDtte0 > 【 正規表現リストに見つからなかったホスト(要調査) 】 > pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res > ppp4873.kitakyushu01.bbiq.jp<58.3.124.47> 2res > fla01-244.wind.ne.jp<218.45.51.244> 2res > ppp22253.hakata06.bbiq.jp<203.114.203.253> 1res > > > # とりあえずそのまま貼り > 100 名前: 名無しの報告 [sage] 投稿日: 2009/06/26(金) 05:23:08 ID:8a4VkQXi0 > ppp4873.kitakyushu01.bbiq.jp<58.3.124.47> 2res > ↓ > \.kitakyushu01.bbiq.jp > > ppp22253.hakata06.bbiq.jp<203.114.203.253> 1res > ↓ > \.hakata06.bbiq.jp > 上の2つは正規表現リストを更新したら問題ない > > > pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res > ↓ > pac\d+-ppp\d+.packet1.sannet.ne.jp > 他のsannetから推測した この形は初めて > > fla01-244.wind.ne.jp<218.45.51.244> 2res > ↓ > \.wind.ne.jp > これは前例皆無 http://qb5.2ch.net/test/read.cgi/sec2chd/1245921372/100 の下2つを更新お願いします。 sannetの形がよく分かりませんが(100は自分のレスです)。 私がDNSを全て引いた結果です。 同じ規則が当てはまるとも限らないわけで、公開串登録所のテンプレにもmasは存在していなかったので。 AirH"っぽいですが。 横入りしますが、2年前ほど前はAirH"をwakwakから使うときに専用アクセスポイントから繋ぐと 「pl2**.mas11**.iidabashi.nttpc.ne.jp」という形になってましたよ 他の例との違いで指摘は非常に的外れだと思いますがね。 >>72 > pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res これもすごーくAirH"臭いですね。 > \.wind.ne.jp 範囲が広すぎですね、ホスト見たらフレッツだと普通に分かると思うんですが。 >>74 ありがとうございます。 nttcからAirH"を利用するとiidabashiになるようですね。 うぅ・・久しぶりに規制に巻き込まれたぁ・・・ ------ >>58 を見る限り変動しているっぽいですね。 ところで、110-54-35-145.dynamic.bbiq.jp の正引きをするとどうなりますか? こちらでは正引きできず 110.54.35.145 と予測して逆引きすると 110-54-35-145.ppp.bbiq.jp という結果に。。。 なんか昨日は逆引きできたのに今日は出来なくなってたりしてます。 DNSが不安定な感じがするんですが、こっちの環境のせいかもーとも思えて・・・。 こちらでも正引き不可でした。 恐らくbbiqの方でDNSを変更しているのではないでしょうか? どうしてかはちょっとわからないですが。 >>62 のような感じで、範囲を出るようにして頂くといいのですけれど。 >>77 ネットワークメンテナンスがあったみたいですね。 それの影響かも。 > >>62 のような感じで、範囲を出るようにして頂くといいのですけれど。 私のほうで対応するとなるとソースコードに直書きになるかもですが。。。 それでもいいんですかね? オプションでオンオフではなくて、リスト上のデータからオンオフが出来ると良いですよねぇ たとえばリストの種別に新たな種類を用意する。 種別が特定の種類の場合は特殊処理をする。 なんらかの変更で特殊処理が不要になったら、元の種別に戻すとか。。。 >>78 yournet機能のようにした方がいいかもしれませんね。 種別云々で特殊処理をするというのは、所詮ハードコーディングなんですよね。 その切り替えがリスト依存なだけで。。。 出来ることならコード自体は汎用性を持たせたいですし、 依存させるべきはリストの構成であったほうがいいと思うんですよね。 どうしたらいいかなぁ。。。 >>79 ユーザに任せるってことですか? >>80 が可能ならユーザ依存の規制範囲は撤廃したいって言うのが本音です。 いい案が浮かばなかったのでyournet機能みたいな実装になった感じです。 リスト依存で範囲の縮小(yournet機能的なこと)をするのに抵抗はありますか? 以前のLogCounter1や2はどうわけてたんだよ。 持ってる人検証よろ。 >>81 リストには、\.bbiq.jpを登録しておいて、希望者はその特殊な機能を使って絞りこむという形で。 抵抗は特にないですし、正規表現で行うのは無理じゃないかなあと。 >>82 どうもならないでしょう。 つい最近入れ替わるようになったようですし。 logcounterはyornetのような入れ替わるホストを絞り込むような機能は作らなかったようですが。 ならISPからソースでてくるまで\.bbiq.jpでいいじゃん。 絞り込んで欲しい人はISPに問い合わせしてソース貰って来いということで。 hakata**.bbiq.jpやkitakyusyu**.bbiq.jpが入れ替わることは考えにくいので絞り込むかどうかやっているのですが。 規制人の意向もあるようなので絞り込んだほうがいいでしょう。 はぁ… >>83 あーいや、「yournet機能的なこと」をすることにではなく、 「yournet機能的なこと」と同等のことをユーザ依存ではなく、リスト依存で行うことに抵抗を感じるか?ってことです。 つまりリストのほうにそういう仕組みを作るってことです。 現状のリスト構成では難しいかもしれませんが、場合によっては再構成も視野に入れて。。。 >>84 私の理想としては出来る限り巻き添えはなくしたい方向です。 とはいえ闇雲に範囲を縮小することを望んでいるわけでもないです。 だからこそISPからの返答や、規制人の意向などを考慮に入れて範囲を作って行きたいなと。 yournetの件はISPから部分的に範囲の絞込みが可能な言質を得られました。 bbiqの件は規制人の判断で範囲を絞り込まれました。 なので、これらについては絞込みを行っても問題ではないと思います。 一番の問題は旧Verとの互換性ですね。 リストをいじると互換性がなくなって正常な動作をしなくなる。。。 自動更新プログラム組んでないからなぁ>< とりあえずリストによる方法はあとで考えるとしてハードコーディングで対応させますか。 将来のリスト拡張のためのデータ構造を作っておきたいし。 リスト構造のメタ情報をヘッダに含ませるっていうのはどうだろうか。。。 bbiqはハードコーディングするとしてyournetはどうしようかなぁ。。。 >>88 互換性は…先頭に#を付けることで旧バージョンには無視させるという感じでは駄目ですか? >>91 ちょっと迷っていたりする感じ。 実際のところ、うまく纏められなかったらツールVer更新するでしょ。 それにツールの特性上、常に最新Verであることが望ましいわけで。 だとすれば、過去Verとの互換性というのを考慮する必要もないかなと。 必要があることと言えば、このツール以外にリストを参照するサービスがあった場合かな。 この場合にはリスト構造に過去との互換性を持たせないとまずい。 でも、まだいないと思うんだけどね・・・ で、話を纏めると「自動更新プログラムをさっさと組め」になります>< 幸せスレでお試しオンライン集計ページさらしたときは、リストを鯖に保存させていたなぁ ttp://imo.70.kg/list.txtって、常時更新されているんでしたっけ? どもです まあ、使いそうなのはNAO★IMO位な気も ★090623 既婚女性板 VIP突撃荒らし報告スレ(6回目) http://qb5.2ch.net/test/read.cgi/sec2chd/1245686662/ 【 正規表現リストに見つからなかったホスト(要調査) 】 km.city.kami.kochi.jp<220.110.206.179> 1res やっぱり、各都道府県ドメインのリストは作った方がいいのかしら。 【 正規表現リストに見つからなかったホスト(要調査) 】 tvtcl-70038.tvt.ne.jp<202.52.23.38> 1res ★090627 複数「みんなのエロゲ!」エログロ画像リンクマルチポスト報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1246034718/42 【 正規表現リストに見つからなかったホスト(要調査) 】 ppps0873.hakata.bbiq.jp<203.135.193.238> 83res ★090627 複数板 「アイドルマスター関連スレ」レス転載マルチポスト報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1246069901/53 【 正規表現リストに見つからなかったホスト(要調査) 】 ppps0873.hakata.bbiq.jp<203.135.193.238> 83res ★090627 複数板 「アイドルマスター関連スレ」レス転載マルチポスト報告 http://qb5.2ch.net/test/read.cgi/sec2chd/1246069901/53 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる