【芋】芋ほり用正規表現リスト係2
■ このスレッドは過去ログ倉庫に格納されています
芋ほりまとめで使用する正規表現リストの管理・保守を行うためのスレッドです。
規制議論板・荒らし報告スレで番犬さんの芋ほりログのまとめを行う際に利用されるちょっと大切なリストです。
現在の正規表現リストは http://imo.70.kg/list.html で確認できます。
まだまだ不完全なもので、リストの追加作業を一緒にやってくれる人を募集しています。
*応募資格*
Perl互換の正規表現を扱える方。
連絡の付くメールアドレスを利用されていること。
参加希望の方は
1)変更者の欄に表示される名前
2)パスワード
をご記入のうえ、 brigittaあっとimo.70.kg まで、メールを送ってください。
前スレ
【芋】芋ほり用正規表現リスト係
http://qb5.2ch.net/test/read.cgi/sec2chd/1243686067/
<拠点>
幸せサーバープロジェクト 「アイデア・技術のある人募集中」★3
http://qb5.2ch.net/test/read.cgi/operate/1241361889/
<参加者>
【専ブラで】p2proxy Part7【p2で書き込み】
http://pc12.2ch.net/test/read.cgi/software/1241931703/
まだすべてじゃないけど、ある程度逆引きしてわかったこと。
\.bbiq.jp のリモホ形式は3つ。
1) ppp\d+\.[a-z]+\d+\.bbiq.jp 例) ppp0509.kitakyushu02.bbiq.jp
2) \d+-\d+-\d+-\d+\.ppp.bbiq.jp 例) 110-54-0-1.ppp.bbiq.jp
3) \d+-\d+-\d+-\d+\.dynamic.bbiq.jp 例) 110-54-20-51.dynamic.bbiq.jp
(1)のppp\d+\.[a-z]+\d+\.bbiq.jp の形式ではdynamic に変わることはないように見える。
このアドレスレンジには.dynamic.bbiq.jp を *いまのところ* 確認できていない。
で、(2)の形式を有しているアドレスレンジはところどころに(3)の形式を含んだアドレスが存在している。
また、(1) のアドレスレンジと (2)(3) のアドレスレンジは重複しない。
なので、
\.([a-z]+\d+)\.bbiq.jp[TAB]\.$1.bbiq.jp
\d+-\d+-\d+-\d+\.(ppp|dynamic).bbiq.jp
の2種類でいけるんじゃないかなぁと。
どうでしょうか。。。 http://qb5.2ch.net/test/read.cgi/sec2chd/1245101640/35
35 名前:名無しの報告[sage] 投稿日:2009/06/17(水) 15:38:02 ID:R8f9s8lT0
《報告》
>>3-16
《ログ》
>>21-34
《集計》
ppp1878.ohashi10.bbiq.jp 18res
110-54-35-22.dynamic.bbiq.jp 16res
ppp0448.ohashi10.bbiq.jp 15res
ppp4389.ohashi10.bbiq.jp 15res
110-54-35-145.dynamic.bbiq.jp 13res
ppp1738.ohashi10.bbiq.jp 12res
ppp0729.ohashi10.bbiq.jp 10res
ppp24032.ohashi10.bbiq.jp 8res
ppp0459.ohashi10.bbiq.jp 6res
ppp4629.ohashi10.bbiq.jp 5res
110-54-35-242.dynamic.bbiq.jp 5res
ppp1445.ohashi10.bbiq.jp 4res
110-54-35-102.dynamic.bbiq.jp 4res
ppp5145.ohashi10.bbiq.jp 2res
この例では入れ替わっているように見受けられるのですが。
まさか、二人の荒らしが同じISPで同じような荒らしをするなんてまずないでしょうし。 そりゃまぁレンジごとで振ってるかどうか見ただけじゃわからんものね それに、私はppp.bbiq.jpなんてホストを見たことが無いんですよね。
検索しても引っかからないですし。
実際に使われているホストでは無いと思います…… bbiqのスレを見ていましたが、普通に入れ替わるみたいですね。
と、なるとdynamicの場合は\.bbiq.jp
dynamicとその他のホストを含む場合は(例:>>58)
\.([a-z]+\d+).bbiq.jp[TAB]\.($1|dynamic)
という風に出力出来ればいいのですが。 >>61取り消します。
dynamicもしくはpppの場合は\.bbiq.jp
dynamicもしくはpppとその他のホストを含む場合は
\.([a-z]+\d+).bbiq.jp[TAB]\.($1|dynamic|ppp)
という風に出力出来ればよさそうです。 うーん、出てくるなぁ
【 正規表現リストに見つからなかったホスト(要調査) 】
pl278.mas1102.iidabashi.nttpc.ne.jp<219.102.246.22> 3res
↓
pl\d+\.mas11..\.iidabashi.nttpc.ne.jp
で? >>63
調べてみますね。
マンションかホームかという違いだと思いますが。 というか、mas11が変動しないなんてソースありませんよね?
適当にやるなんてどうなんでしょうか?
不確かなら未対応のまま張ればいいと思うのですが。 でも逆引きして調べてみたところ(まだ90%程ですが)
11の部分は、変動しないようです。 >>67
その表記でもマッチしますから、撤回はしなくてもいいのですが…… >>63-64
\.mas110\d.iidabashi.nttpc.ne.jpで登録しました。 zakoツールの正規表現リストには
pl\d+\.nas9..\.([a-z-]+).nttpc.ne.jp pl\d+\.nas9..\.$1.nttpc.ne.jp
がある
多分
pl\d+\.mas11..\.([a-z-]+).nttpc.ne.jp pl\d+\.mas11..\.$1.nttpc.ne.jp
じゃない? ★090625 複数「これ拡散させろよ J3gKBBYxXyo」マルチポスト報告
http://qb5.2ch.net/test/read.cgi/sec2chd/1245921372/98,100
> 98 名前: 名無しの報告 [sage] 投稿日: 2009/06/26(金) 04:58:42 ID:UYtQDtte0
> 【 正規表現リストに見つからなかったホスト(要調査) 】
> pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res
> ppp4873.kitakyushu01.bbiq.jp<58.3.124.47> 2res
> fla01-244.wind.ne.jp<218.45.51.244> 2res
> ppp22253.hakata06.bbiq.jp<203.114.203.253> 1res
>
>
> # とりあえずそのまま貼り
> 100 名前: 名無しの報告 [sage] 投稿日: 2009/06/26(金) 05:23:08 ID:8a4VkQXi0
> ppp4873.kitakyushu01.bbiq.jp<58.3.124.47> 2res
> ↓
> \.kitakyushu01.bbiq.jp
>
> ppp22253.hakata06.bbiq.jp<203.114.203.253> 1res
> ↓
> \.hakata06.bbiq.jp
> 上の2つは正規表現リストを更新したら問題ない
>
>
> pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res
> ↓
> pac\d+-ppp\d+.packet1.sannet.ne.jp
> 他のsannetから推測した この形は初めて
>
> fla01-244.wind.ne.jp<218.45.51.244> 2res
> ↓
> \.wind.ne.jp
> これは前例皆無
http://qb5.2ch.net/test/read.cgi/sec2chd/1245921372/100の下2つを更新お願いします。
sannetの形がよく分かりませんが(100は自分のレスです)。 私がDNSを全て引いた結果です。
同じ規則が当てはまるとも限らないわけで、公開串登録所のテンプレにもmasは存在していなかったので。
AirH"っぽいですが。 横入りしますが、2年前ほど前はAirH"をwakwakから使うときに専用アクセスポイントから繋ぐと
「pl2**.mas11**.iidabashi.nttpc.ne.jp」という形になってましたよ 他の例との違いで指摘は非常に的外れだと思いますがね。
>>72
> pac1-ppp5.packet1.sannet.ne.jp<210.157.195.132> 3res
これもすごーくAirH"臭いですね。
> \.wind.ne.jp
範囲が広すぎですね、ホスト見たらフレッツだと普通に分かると思うんですが。
>>74
ありがとうございます。
nttcからAirH"を利用するとiidabashiになるようですね。 うぅ・・久しぶりに規制に巻き込まれたぁ・・・
------
>>58を見る限り変動しているっぽいですね。
ところで、110-54-35-145.dynamic.bbiq.jp の正引きをするとどうなりますか?
こちらでは正引きできず 110.54.35.145 と予測して逆引きすると 110-54-35-145.ppp.bbiq.jp という結果に。。。
なんか昨日は逆引きできたのに今日は出来なくなってたりしてます。
DNSが不安定な感じがするんですが、こっちの環境のせいかもーとも思えて・・・。 こちらでも正引き不可でした。
恐らくbbiqの方でDNSを変更しているのではないでしょうか?
どうしてかはちょっとわからないですが。
>>62のような感じで、範囲を出るようにして頂くといいのですけれど。 >>77
ネットワークメンテナンスがあったみたいですね。
それの影響かも。
> >>62のような感じで、範囲を出るようにして頂くといいのですけれど。
私のほうで対応するとなるとソースコードに直書きになるかもですが。。。
それでもいいんですかね?
オプションでオンオフではなくて、リスト上のデータからオンオフが出来ると良いですよねぇ
たとえばリストの種別に新たな種類を用意する。
種別が特定の種類の場合は特殊処理をする。
なんらかの変更で特殊処理が不要になったら、元の種別に戻すとか。。。 >>78
yournet機能のようにした方がいいかもしれませんね。 種別云々で特殊処理をするというのは、所詮ハードコーディングなんですよね。
その切り替えがリスト依存なだけで。。。
出来ることならコード自体は汎用性を持たせたいですし、
依存させるべきはリストの構成であったほうがいいと思うんですよね。
どうしたらいいかなぁ。。。 >>79
ユーザに任せるってことですか?
>>80が可能ならユーザ依存の規制範囲は撤廃したいって言うのが本音です。
いい案が浮かばなかったのでyournet機能みたいな実装になった感じです。
リスト依存で範囲の縮小(yournet機能的なこと)をするのに抵抗はありますか? 以前のLogCounter1や2はどうわけてたんだよ。
持ってる人検証よろ。 >>81
リストには、\.bbiq.jpを登録しておいて、希望者はその特殊な機能を使って絞りこむという形で。
抵抗は特にないですし、正規表現で行うのは無理じゃないかなあと。
>>82
どうもならないでしょう。
つい最近入れ替わるようになったようですし。
logcounterはyornetのような入れ替わるホストを絞り込むような機能は作らなかったようですが。 ならISPからソースでてくるまで\.bbiq.jpでいいじゃん。
絞り込んで欲しい人はISPに問い合わせしてソース貰って来いということで。 hakata**.bbiq.jpやkitakyusyu**.bbiq.jpが入れ替わることは考えにくいので絞り込むかどうかやっているのですが。
規制人の意向もあるようなので絞り込んだほうがいいでしょう。
はぁ… >>83
あーいや、「yournet機能的なこと」をすることにではなく、
「yournet機能的なこと」と同等のことをユーザ依存ではなく、リスト依存で行うことに抵抗を感じるか?ってことです。
つまりリストのほうにそういう仕組みを作るってことです。
現状のリスト構成では難しいかもしれませんが、場合によっては再構成も視野に入れて。。。 >>84
私の理想としては出来る限り巻き添えはなくしたい方向です。
とはいえ闇雲に範囲を縮小することを望んでいるわけでもないです。
だからこそISPからの返答や、規制人の意向などを考慮に入れて範囲を作って行きたいなと。
yournetの件はISPから部分的に範囲の絞込みが可能な言質を得られました。
bbiqの件は規制人の判断で範囲を絞り込まれました。
なので、これらについては絞込みを行っても問題ではないと思います。 一番の問題は旧Verとの互換性ですね。
リストをいじると互換性がなくなって正常な動作をしなくなる。。。
自動更新プログラム組んでないからなぁ>< とりあえずリストによる方法はあとで考えるとしてハードコーディングで対応させますか。
将来のリスト拡張のためのデータ構造を作っておきたいし。
リスト構造のメタ情報をヘッダに含ませるっていうのはどうだろうか。。。 bbiqはハードコーディングするとしてyournetはどうしようかなぁ。。。 >>88
互換性は…先頭に#を付けることで旧バージョンには無視させるという感じでは駄目ですか? >>91
ちょっと迷っていたりする感じ。
実際のところ、うまく纏められなかったらツールVer更新するでしょ。
それにツールの特性上、常に最新Verであることが望ましいわけで。
だとすれば、過去Verとの互換性というのを考慮する必要もないかなと。
必要があることと言えば、このツール以外にリストを参照するサービスがあった場合かな。
この場合にはリスト構造に過去との互換性を持たせないとまずい。
でも、まだいないと思うんだけどね・・・
で、話を纏めると「自動更新プログラムをさっさと組め」になります>< 幸せスレでお試しオンライン集計ページさらしたときは、リストを鯖に保存させていたなぁ
ttp://imo.70.kg/list.txtって、常時更新されているんでしたっけ? どもです
まあ、使いそうなのはNAO★IMO位な気も ★090623 既婚女性板 VIP突撃荒らし報告スレ(6回目)
http://qb5.2ch.net/test/read.cgi/sec2chd/1245686662/
【 正規表現リストに見つからなかったホスト(要調査) 】
km.city.kami.kochi.jp<220.110.206.179> 1res やっぱり、各都道府県ドメインのリストは作った方がいいのかしら。 【 正規表現リストに見つからなかったホスト(要調査) 】
tvtcl-70038.tvt.ne.jp<202.52.23.38> 1res
★090627 複数「みんなのエロゲ!」エログロ画像リンクマルチポスト報告
http://qb5.2ch.net/test/read.cgi/sec2chd/1246034718/42 【 正規表現リストに見つからなかったホスト(要調査) 】
ppps0873.hakata.bbiq.jp<203.135.193.238> 83res
★090627 複数板 「アイドルマスター関連スレ」レス転載マルチポスト報告
http://qb5.2ch.net/test/read.cgi/sec2chd/1246069901/53
【 正規表現リストに見つからなかったホスト(要調査) 】
ppps0873.hakata.bbiq.jp<203.135.193.238> 83res
★090627 複数板 「アイドルマスター関連スレ」レス転載マルチポスト報告
http://qb5.2ch.net/test/read.cgi/sec2chd/1246069901/53 ■ このスレッドは過去ログ倉庫に格納されています