datをUTF8にするのはどうだろうスレッド
■ このスレッドは過去ログ倉庫に格納されています
datをUTF8にするのはどうだろうスレッドです。
影響があるのは、AA周りすかねぇ。
ネタもあるから注意が必要だ
有名どころではハトとか 実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。 > 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
> ひろゆきは三度、専ブラを使え(で書き込め)なくした。
> それを受け、むむむさんは静かにqb5・6を停止した。
ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
嫌な予感がしてkakikomi.txt確認したら…>>1ネタをネタと(ry datの先頭あたりで判別できるようにすればいいんじゃないかな
Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>
ってみたいに
判別するだけだったら1文字か2文字でいいんじゃない? UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS 専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。 datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。 XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。 圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。 XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。 このスレの主旨?とはまったく異なる視点で…
・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する
ってのなら、まだ分からんでもないけど > dat?の XML 化
専ブラ開発者からみたら、メリットはないわな。 これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ > ・read.cgi が吐くものを XML で再定義する
read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。 >>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。
RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない? 書き込みがちょん切れたorz
RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。
専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。 うぁ… RFC の番号打ち間違えてたか、すまん orz
dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。
意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。 DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。 そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決
とか実も蓋もないことを書いてみる 金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし そのおっさんがどうだろうって言ってるわけでふりだしに戻る おっさんの気が変わった時に備えて議論しておこうとか sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい DBの容量食うけどutf8でよいよ。
???????がなくなるな。 utf8にしたらrockの方もutf8にする必要あるんじゃないの?
現在のshift-jisに無い文字はhtmlで使われてる&〜; で対応可能だけど
utf8になったら生を扱う事になって(ry SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。
専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361
切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15 >>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める
スレタイにSJIS範囲外の文字が入ると化けるけど dat + read.js
と
XML + XSLT
は、ブラウザはどっちが軽いんだろう。 専用ブラウザもIEのTridentエンジン使ってるんだから大した修正なしで出来ると思うんだが 全部の専ブラがTrident使ってるわけじゃないし まあまずは制限を1024KBに引き上げることだな
話はそれからだ
規制議論板から誘導されてきました。
この板を荒らした方が面白い反応が得られそうなので、これから数ヶ月間あの手この手で荒らし続けます。
これはほんの挨拶代わりのコピペマルチポポポです。
どうか面白い反応で楽しませてください。
以上、苦情は規制議論板まで。 ■ このスレッドは過去ログ倉庫に格納されています