X

datをUTF8にするのはどうだろうスレッド

■ このスレッドは過去ログ倉庫に格納されています
1ひろゆき@どうやら管理人 ★
垢版 |
2008/04/12(土) 13:13:09ID:???0?S★(1017889)
datをUTF8にするのはどうだろうスレッドです。

影響があるのは、AA周りすかねぇ。
2008/05/19(月) 22:00:30ID:X4v1z3oV0?2BP(7088)
うっとこはJST-9だよっ♪
2008/05/19(月) 22:56:52ID:ZQSwr6w90
>>413
全部実在するから始末に負えない
2008/05/19(月) 23:02:17ID:PaaKUwwi0
こんなにあるもんなのか

UTF-7
UTF-16 (後述)で表したUnicodeをBase64で変換して表す方式。
ただし、ASCIIのアルファベット範囲等については(ry

UTF-9
8ビット単位の可変長コード(1?5バイト)にエンコードする方式。
ISO-8859-1に対して一部互換である。
しかし、UTF-8が普及しつつあり、それと比べて欠(ry

UTF-18 (エイプリルフールネタだそうで)
Unicode符号位置を単一の18ビットによりエンコードする方式。
UTF-8に対するUTF-16のようなものだが、RFC公開時点のUnicodeで文字が定義されていた(ry
2008/05/19(月) 23:22:46ID:ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか
2008/05/19(月) 23:50:08ID:PaaKUwwi0
HTCPCP/1.0とかもなw
2008/05/20(火) 08:32:07ID:Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。
2008/05/20(火) 15:02:44ID:CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry
423動け動けウゴウゴ2ちゃんねる
垢版 |
2008/05/23(金) 20:07:51ID:7tXSpSoi0
よし、文字コード設計からやろう
2008/05/24(土) 01:23:43ID:m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに
2008/05/24(土) 02:10:03ID:zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?
2008/05/24(土) 02:32:35ID:m9uPvIcS0
できそうなところがないじゃない
2008/05/24(土) 08:52:12ID:oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS
2008/05/24(土) 12:23:35ID:d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない
2008/05/24(土) 12:46:32ID:oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?
2008/05/24(土) 12:49:22ID:PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。
2008/05/24(土) 15:28:00ID:jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。
2008/05/24(土) 15:43:50ID:9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。
2008/05/24(土) 15:50:33ID:jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。
2008/05/25(日) 09:38:23ID:nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。
2008/05/25(日) 13:45:49ID:U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。
2008/05/25(日) 14:07:56ID:rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ
2008/05/25(日) 15:57:25ID:nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。
438動け動けウゴウゴ2ちゃんねる
垢版 |
2008/05/25(日) 19:13:36ID:/yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?
2008/05/25(日) 19:23:33ID:foEE4xHPP
>>438
RFC 3629
2008/05/25(日) 19:43:12ID:nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。
2008/05/26(月) 16:51:29ID:ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。
2008/05/26(月) 18:51:20ID:xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。
2008/05/26(月) 23:05:42ID:4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる
2008/05/29(木) 00:47:21ID:ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし
2008/05/29(木) 01:58:12ID:PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る
2008/05/29(木) 11:44:06ID:0unnv0s00
いやもう結論でてるし
2008/05/29(木) 23:11:39ID:+LT7fBA+0
そうか
IDかっこいいな
2008/05/31(土) 11:35:12ID:m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか
449あぼーん
垢版 |
NGNG
あぼーん
2008/09/10(水) 19:41:26ID:3SVxHFXR0
てす
2008/09/10(水) 19:47:17ID:3SVxHFXR0
テステス
2008/09/12(金) 06:49:48ID:Yi4KG57V0
tes
2008/09/23(火) 16:11:48ID:YDhzyxaB0
>>312
俺も国際標準になるんだぜ?
454動け動けウゴウゴ2ちゃんねる
垢版 |
2008/09/25(木) 12:45:42ID:3T+dkcPm0
read.cgiをいじってみるよスレッド
http://qb5.2ch.net/test/read.cgi/operate/1222311594/
455動け動けウゴウゴ2ちゃんねる
垢版 |
2008/11/04(火) 19:47:09ID:TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?
2008/11/04(火) 20:58:01ID:FoqwzlC20
>>455
何周遅れだw
2008/11/05(水) 00:22:36ID:X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい
458動け動けウゴウゴ2ちゃんねる
垢版 |
2009/02/11(水) 21:18:57ID:qUTVryWc0?PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。
2009/04/11(土) 11:27:06ID:0wma4iid0
おっさんがまたその気にならないかなぁ
2009/05/25(月) 16:07:09ID:ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&〜; で対応可能だけど
utf8になったら生を扱う事になって(ry
2009/05/25(月) 20:47:18ID:L9EDgs7/0?BRZ(10072)
その方がごっつぅ都合良かったりします♪
2009/05/30(土) 17:31:30ID:WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15
2009/06/03(水) 13:22:42ID:64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど
2009/07/08(水) 08:20:48ID:/VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。
2009/08/16(日) 14:42:17ID:vfU/gAUo0
専用ブラウザもIEのTridentエンジン使ってるんだから大した修正なしで出来ると思うんだが
2009/08/16(日) 14:54:13ID:YZ6fRRAk0
全部の専ブラがTrident使ってるわけじゃないし
2009/08/21(金) 18:22:18ID:nM7Fld6I0
モノ知らんヤツはいいなあw
2009/09/13(日) 03:37:40ID:cr42RI7a0
まあまずは制限を1024KBに引き上げることだな
話はそれからだ
2009/11/24(火) 01:32:33ID:uSaRUPBN0


規制議論板から誘導されてきました。

この板を荒らした方が面白い反応が得られそうなので、これから数ヶ月間あの手この手で荒らし続けます。

これはほんの挨拶代わりのコピペマルチポポポです。

どうか面白い反応で楽しませてください。

以上、苦情は規制議論板まで。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況