datをUTF8にするのはどうだろうスレッド

■ このスレッドは過去ログ倉庫に格納されています
0001ひろゆき@どうやら管理人 ★2008/04/12(土) 13:13:09ID:???0?S★(1017889)
datをUTF8にするのはどうだろうスレッドです。

影響があるのは、AA周りすかねぇ。

0419動け動けウゴウゴ2ちゃんねる2008/05/19(月) 23:22:46ID:ACmPGLE70
ネタもあるから注意が必要だ
有名どころではハトとか

0420動け動けウゴウゴ2ちゃんねる2008/05/19(月) 23:50:08ID:PaaKUwwi0
HTCPCP/1.0とかもなw

0421動け動けウゴウゴ2ちゃんねる2008/05/20(火) 08:32:07ID:Yq4y55V5O
実用的なところでは洗濯バサミとかなw
家庭内やSOHOぐらいだと意外と使えるぞ。

0422動け動けウゴウゴ2ちゃんねる2008/05/20(火) 15:02:44ID:CxBd8N6S0
> 30 名前:止まない雨は名無しさん[sage] 投稿日:2008/04/11(金) 17:52:40 ID:3n18t16j0
> 狐は「もうずっと人大杉」にした。
>   ひろゆきは三度、専ブラを使え(で書き込め)なくした。
>     それを受け、むむむさんは静かにqb5・6を停止した。

ニュース実況++ / 2ちゃん人大杉拡大 行き場を失ったユーザーの荒らし行為が各地で続発★3
ttp://news24.2ch.net/test/read.cgi/liveplus/1207900534/30
 嫌な予感がしてkakikomi.txt確認したら…>‎>1ネタをネタと(ry

0423動け動けウゴウゴ2ちゃんねる2008/05/23(金) 20:07:51ID:7tXSpSoi0
よし、文字コード設計からやろう

0424動け動けウゴウゴ2ちゃんねる2008/05/24(土) 01:23:43ID:m9uPvIcS0
datの先頭あたりで判別できるようにすればいいんじゃないかな

Shift_JIS:[名無し]さん(bin+cue).rar<>sage<>
UTF-8:[名無し]さん(bin+cue).rar><sage<>

ってみたいに

0425動け動けウゴウゴ2ちゃんねる2008/05/24(土) 02:10:03ID:zjd3Cur70
判別するだけだったら1文字か2文字でいいんじゃない?

0426動け動けウゴウゴ2ちゃんねる2008/05/24(土) 02:32:35ID:m9uPvIcS0
できそうなところがないじゃない

0427動け動けウゴウゴ2ちゃんねる2008/05/24(土) 08:52:12ID:oBnQpL6S0
UTF-8なDATは、BOM付きUTF-8にすればいい
先頭を見てBOMならUTF-8、さもなくばSJIS

0428動け動けウゴウゴ2ちゃんねる2008/05/24(土) 12:23:35ID:d7IdQZ8a0
専ブラは差分取得するのでdatの先頭にBOMを付けても役に立たない

0429動け動けウゴウゴ2ちゃんねる2008/05/24(土) 12:46:32ID:oKxq3p9z0
ファイルの途中からUTF-8に変えるのかい?

0430動け動けウゴウゴ2ちゃんねる2008/05/24(土) 12:49:22ID:PCPcTJ5b0
いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
「使用を禁止すべき」扱いだし。ていうか、HTTP header の Content-Type の
charset で十分だべ。

0431動け動けウゴウゴ2ちゃんねる2008/05/24(土) 15:28:00ID:jwQb16jz0
datファイルは2ちゃんねる専用フォーマットだから自由に設計していいんじゃね?
もちろん標準バリバリでXML化でも良いけど、標準ってのも移り変わるもんだからねぇ。

0432動け動けウゴウゴ2ちゃんねる2008/05/24(土) 15:43:50ID:9dlsmaAP0
XMLは無駄にサイズ食うからなぁ。コードの見通しも悪いし。
賢明な選択肢とは思えん。

0433動け動けウゴウゴ2ちゃんねる2008/05/24(土) 15:50:33ID:jwQb16jz0
圧縮とセットならXMLもそれほど容量に影響しないと思う。
同じようなキーワードが並ぶのなら全部符号化されちまう。

0434動け動けウゴウゴ2ちゃんねる2008/05/25(日) 09:38:23ID:nr0ZnGPL0
XML化は利点が見えない。現状の1行1レコード、<>がフィールドセパレータ、で
困らないと思う。

0435動け動けウゴウゴ2ちゃんねる2008/05/25(日) 13:45:49ID:U0RJgIvu0
このスレの主旨?とはまったく異なる視点で…

・read.cgi が吐くものを XML で再定義する
・それに食わせる dat?も XML で再定義する

ってのなら、まだ分からんでもないけど > dat?の XML 化

専ブラ開発者からみたら、メリットはないわな。

0436動け動けウゴウゴ2ちゃんねる2008/05/25(日) 14:07:56ID:rNTH5CZP0
これ以上専用ブラウザ作者に迷惑をかけるのはやめてやれよ

0437動け動けウゴウゴ2ちゃんねる2008/05/25(日) 15:57:25ID:nr0ZnGPL0
> ・read.cgi が吐くものを XML で再定義する

read.cgiの吐くhtmlにスキーマを付けるのには全く独立した話として賛成。

0438動け動けウゴウゴ2ちゃんねる2008/05/25(日) 19:13:36ID:/yE7qfVJ0
>>430
> いわゆる BOM 付き UTF-8 は問題児なので反対。RFC 3626 でも基本的に
> 「使用を禁止すべき」扱いだし。

RFC 3626 Optimized Link State Routing Protocol (OLSR) って
Unicode 関係なくない?

0439動け動けウゴウゴ2ちゃんねる2008/05/25(日) 19:23:33ID:foEE4xHPP
>>438
RFC 3629

0440動け動けウゴウゴ2ちゃんねる2008/05/25(日) 19:43:12ID:nr0ZnGPL0
書き込みがちょん切れたorz

RFC3629的には、
datが、HTTPでやりとりされる物だと見るなら、HTTPのContent-Type
ヘッダがあるからBOMは禁止すべきということになるけど、
dat ファイル単体として見ると、エンコーディングを知る方法が
(なんらかの拡張をしない限り)ないから、BOMは禁止されるべきでない。

専ブラがローカルに持ってるdatについて、ファイル名を変えるとか、
専ブラ独自の形式にするとか、外部に情報ファイルを持つとか、
しなきゃいけなくなる。

0441動け動けウゴウゴ2ちゃんねる2008/05/26(月) 16:51:29ID:ZKBghHLV0
うぁ… RFC の番号打ち間違えてたか、すまん orz

dat 単体で見たときは云々、ってのはあくまでローカルな環境、ユーザエンドで
ファイル単体として扱うときの話なんで、それは環境・アプリ依存。
2ch の素の dat のファイルがどうあろうと、それをユーザ・アプリがどう扱おうと
好きにすればいい。

意味的には、したらばの EUC-JP な dat を Winodws な専ブラがローカルに
Shift_JIS(CP932) で保存するようなもの。

0442動け動けウゴウゴ2ちゃんねる2008/05/26(月) 18:51:20ID:xSM3vYZLO
DATをテキストだと考えるからややこしいんだ。
いっそoctet-streamとしてバイナリ扱いにでもすればいい。

0443動け動けウゴウゴ2ちゃんねる2008/05/26(月) 23:05:42ID:4dBEta1n0
そもそも人間が読めるようにしてるのは誰かってことを考えればなんてことないわけで
作り直すのに時間とお金がかかるのが問題なのかなあとか思ったり
ご飯食べないで生きられて時間が無限にあれば全部解決

とか実も蓋もないことを書いてみる

0444動け動けウゴウゴ2ちゃんねる2008/05/29(木) 00:47:21ID:ivI86OvK0
金も時間もあって2chの心臓部に触れられる人間というと一人しかいないな
飯のかわりにうまい棒で済むし

0445動け動けウゴウゴ2ちゃんねる2008/05/29(木) 01:58:12ID:PsXz3U600
そのおっさんがどうだろうって言ってるわけでふりだしに戻る

0446動け動けウゴウゴ2ちゃんねる2008/05/29(木) 11:44:06ID:0unnv0s00
いやもう結論でてるし

0447動け動けウゴウゴ2ちゃんねる2008/05/29(木) 23:11:39ID:+LT7fBA+0
そうか
IDかっこいいな

0448動け動けウゴウゴ2ちゃんねる2008/05/31(土) 11:35:12ID:m2txMOod0
おっさんの気が変わった時に備えて議論しておこうとか

0449あぼーんNGNG
あぼーん

0450kita159028.kitanet.ne.jp 2008/09/10(水) 19:41:26ID:3SVxHFXR0
てす

0451kita159028.kitanet.ne.jp テス2008/09/10(水) 19:47:17ID:3SVxHFXR0
テステス

0452動け動けウゴウゴ2ちゃんねる2008/09/12(金) 06:49:48ID:Yi4KG57V0
tes

0453,,・´∀`・,,)っ-○◎●2008/09/23(火) 16:11:48ID:YDhzyxaB0
>>312
俺も国際標準になるんだぜ?

0454動け動けウゴウゴ2ちゃんねる2008/09/25(木) 12:45:42ID:3T+dkcPm0
read.cgiをいじってみるよスレッド
http://qb5.2ch.net/test/read.cgi/operate/1222311594/

0455動け動けウゴウゴ2ちゃんねる2008/11/04(火) 19:47:09ID:TFZ/W06V0
sjisをブラウザでutf8に変換してread.js使えばおkじゃねの?

0456動け動けウゴウゴ2ちゃんねる2008/11/04(火) 20:58:01ID:FoqwzlC20
>>455
何周遅れだw

0457動け動けウゴウゴ2ちゃんねる2008/11/05(水) 00:22:36ID:X27+ADGy0
sjisをブラウザでutf8に変換とかある意味凄い発想ではある(わらい

0458動け動けウゴウゴ2ちゃんねる2009/02/11(水) 21:18:57ID:qUTVryWc0?PLT(18613)
DBの容量食うけどutf8でよいよ。
???????がなくなるな。

0459動け動けウゴウゴ2ちゃんねる2009/04/11(土) 11:27:06ID:0wma4iid0
おっさんがまたその気にならないかなぁ

0460動け動けウゴウゴ2ちゃんねる2009/05/25(月) 16:07:09ID:ZveJmHBs0
utf8にしたらrockの方もutf8にする必要あるんじゃないの?

現在のshift-jisに無い文字はhtmlで使われてる&〜; で対応可能だけど
utf8になったら生を扱う事になって(ry

0461未承諾広告※ ◆TWARamEjuA 2009/05/25(月) 20:47:18ID:L9EDgs7/0?BRZ(10072)
その方がごっつぅ都合良かったりします♪

0462動け動けウゴウゴ2ちゃんねる2009/05/30(土) 17:31:30ID:WUEb7YiBP
SJISはダメ文字がうざいな。
管理人の主眼はread.jsのようだが。

専ブラの対応は、文字コード処理なんてどの言語も
関数なりライブラリなりがあるから大した手間じゃないでしょ。
と、スクリプト程度しか作れない身で思ったら、
Delphiはめんどいのか>>361


切り替えは、ある時期に旧鯖は新スレ禁止、
utf鯖に全てスレを立て直して、keyの前後で区別すればいいよ。
鯖での区別はリスト保持がめんどい>>15

0463 [―{}@{}@{}-] 動け動けウゴウゴ2ちゃんねる2009/06/03(水) 13:22:42ID:64ScwrmkP
>>462
Delphiは2009からネイティブUnicode、
それ以前のでも表示させるのは可能だ
いまんとこJane系はNidaはUTF8も読める

スレタイにSJIS範囲外の文字が入ると化けるけど

0464動け動けウゴウゴ2ちゃんねる2009/07/08(水) 08:20:48ID:/VI8w+Vs0
dat + read.js

XML + XSLT
は、ブラウザはどっちが軽いんだろう。

0465動け動けウゴウゴ2ちゃんねる2009/08/16(日) 14:42:17ID:vfU/gAUo0
専用ブラウザもIEのTridentエンジン使ってるんだから大した修正なしで出来ると思うんだが

0466動け動けウゴウゴ2ちゃんねる2009/08/16(日) 14:54:13ID:YZ6fRRAk0
全部の専ブラがTrident使ってるわけじゃないし

0467動け動けウゴウゴ2ちゃんねる2009/08/21(金) 18:22:18ID:nM7Fld6I0
モノ知らんヤツはいいなあw

0468動け動けウゴウゴ2ちゃんねる2009/09/13(日) 03:37:40ID:cr42RI7a0
まあまずは制限を1024KBに引き上げることだな
話はそれからだ

0469 [―{}@{}@{}-] ぞうさん2009/11/24(火) 01:32:33ID:uSaRUPBN0


規制議論板から誘導されてきました。

この板を荒らした方が面白い反応が得られそうなので、これから数ヶ月間あの手この手で荒らし続けます。

これはほんの挨拶代わりのコピペマルチポポポです。

どうか面白い反応で楽しませてください。

以上、苦情は規制議論板まで。

■ このスレッドは過去ログ倉庫に格納されています