datをUTF8にするのはどうだろうスレッドです。
影響があるのは、AA周りすかねぇ。
探検
datをUTF8にするのはどうだろうスレッド
■ このスレッドは過去ログ倉庫に格納されています
2008/04/12(土) 13:15:03ID:UJKL7VVbP
↓ハゲスト
2008/04/12(土) 13:15:27ID:2lzvvu5k0
野
々
村
々
村
utf8にしちゃえば、read.jsが使えるので、
サーバリソースは軽くなるかなぁと。
サーバリソースは軽くなるかなぁと。
ぅぉたらこだ
2008/04/12(土) 13:22:59ID:YxILKQC60
転送量とDAT容量は増加するかね。
やるならBOMつきにしてほしいなぁ。
やるならBOMつきにしてほしいなぁ。
7c(・ω・c)))))) ◆....w.VIPQ
2008/04/12(土) 13:29:09ID:Q2BscwRD0 /⌒ヽ)
i三 ∪
○三 |
(/~∪
三三
三三
三三三
i三 ∪
○三 |
(/~∪
三三
三三
三三三
2008/04/12(土) 13:29:54ID:6duUvB8e0
今更変更かい
_r-._,-,_
r‐' __ ~t_
j'/"il li ~\〈
rf/l |_l_l| |l_l_ i゙ト'、
/"ハl U U |l゙i l
/ / li.ゝ γニ ヽノ | l | ふ〜ん
. l / il f:`l .l i_| | j l |
|/ ξ ゞ_`,-ィイ ξ l|
彡 /:::::::::::〇, ミ
ソ i::::::::::::::l_l:l リ
r‐' __ ~t_
j'/"il li ~\〈
rf/l |_l_l| |l_l_ i゙ト'、
/"ハl U U |l゙i l
/ / li.ゝ γニ ヽノ | l | ふ〜ん
. l / il f:`l .l i_| | j l |
|/ ξ ゞ_`,-ィイ ξ l|
彡 /:::::::::::〇, ミ
ソ i::::::::::::::l_l:l リ
今日はちとこれからおでかけにつき、記念カキコのみで。
何となく、いろんなところが影響ありな気がしますけど、
やる価値はあるかもですね。
ただ、これまでのSJISのdatを変換するのは実際的ではなさそうなので、
どうしても「混ざった」状態になると。
ということで大抵のスクリプト(削除など)は、
両方対応にしないと、だめなような。
何となく、いろんなところが影響ありな気がしますけど、
やる価値はあるかもですね。
ただ、これまでのSJISのdatを変換するのは実際的ではなさそうなので、
どうしても「混ざった」状態になると。
ということで大抵のスクリプト(削除など)は、
両方対応にしないと、だめなような。
2008/04/12(土) 13:34:42ID:brQJu+/UP
大変だ!キャップが割れたぞ!!
で、ライブなdatだけでも一斉に変換するかどうか、
というのも考えどころなのかな、と。
というのも考えどころなのかな、と。
2008/04/12(土) 13:37:15ID:dKHHUdt+0
UTF8なんてffftpの設定か
テラタームの初期設定くらいでしか見たことない
テラタームの初期設定くらいでしか見たことない
2008/04/12(土) 13:37:53ID:xAdVa0Bc0
そんなにサーバリソースが重かったのか
知らなかった
知らなかった
utf8のdatファイルを.dataとかにするか、
qb7みたいに新しいサーバ名の.datを全部utf8にするか、、、
管理周りは粛々と対応すればなんとかなると思うのですが、
アスキーアートみたいに、出来なくなることとか、
デメリットはどういうのがあるのかなぁ。。と。
qb7みたいに新しいサーバ名の.datを全部utf8にするか、、、
管理周りは粛々と対応すればなんとかなると思うのですが、
アスキーアートみたいに、出来なくなることとか、
デメリットはどういうのがあるのかなぁ。。と。
よくわからんけど
read.cgiをapacheモジュールにしたらいい
ついでにbbs.cgiも
mod_2ch
read.cgiをapacheモジュールにしたらいい
ついでにbbs.cgiも
mod_2ch
2008/04/12(土) 13:42:54ID:xDM6T07D0
>>15
そんなことよりbeをどうにかしろやコラ
そんなことよりbeをどうにかしろやコラ
2008/04/12(土) 13:44:45ID:rbaOIjlz0
デメリットや手間のわりにメリットは少ないかと・・・
大抵のソフトウェアはdatはSJISだと決めてハードコーディングしてるだろうかなぁ・・・
大抵のソフトウェアはdatはSJISだと決めてハードコーディングしてるだろうかなぁ・・・
19stream ◆PNstream2s
2008/04/12(土) 13:52:47ID:sMNaDZg+0 UTF-8でAAが影響受ける?なんで?
フォントなら、CSSでsans-serifつけりゃいいと思ってるけど
フォントなら、CSSでsans-serifつけりゃいいと思ってるけど
半角カナとか。
21stream ◆PNstream2s
2008/04/12(土) 13:55:15ID:sMNaDZg+022動け動けウゴウゴ2ちゃんねる
2008/04/12(土) 13:55:50ID:dKHHUdt+0 上のもんは下のもんの気持ちは汲んでも
顔色を伺ったらあかん
って仮面の兄ちゃんがいってた
顔色を伺ったらあかん
って仮面の兄ちゃんがいってた
23stream ◆PNstream2s
2008/04/12(土) 13:56:08ID:sMNaDZg+0 UTF-8の問題点は、サイズだな。
日本語の場合たいてい1文字で3バイト使うから、500KB制限を引き上げる必要があると思う。
日本語の場合たいてい1文字で3バイト使うから、500KB制限を引き上げる必要があると思う。
2008/04/12(土) 13:57:01ID:6duUvB8e0
ひろゆきがこんな事を思いつくとは思えない
ひろゆきにUTF-8を勧めた人間出て来い
ひろゆきにUTF-8を勧めた人間出て来い
>半角カタカナはUnicodeに存在して普通に使えるよ
まじすか。
まじすか。
26動け動けウゴウゴ2ちゃんねる
2008/04/12(土) 13:58:51ID:dKHHUdt+0 http://code.cside.com/3rdpage/jp/utf-8/Halfwidth_and_Fullwidth_Forms.html
これのことか
ユニコード上にある半角カタカナってーのは
これのことか
ユニコード上にある半角カタカナってーのは
2008/04/12(土) 13:59:50ID:YxILKQC60
半角カナはバイト数増えるけどつかえるよ。
2008/04/12(土) 14:01:05ID:nO2fnwtX0
UTF8でdatのサイズが大きくなったら、ますます重くなるのでは
サーバリソースも食う事になる
サーバリソースも食う事になる
なるほどなるほど
30stream ◆PNstream2s
2008/04/12(土) 14:04:35ID:sMNaDZg+0 サイズが問題ならUTF-16にする?w
ん...... UTF-8 にしないと read.js が使えない環境ってどんなのだろう?
少なくとも,IE6 での問題は anydat.so で対策されてますが......
少なくとも,IE6 での問題は anydat.so で対策されてますが......
anydat.soみたいなサーバ処理がいらないものだけで、
回せないかなと。
回せないかなと。
IE6 を無視すれば Content-Type で charset=Shift_JIS を追加するとかでいいんで
mod_headers で事足りるわけですが......
IE7 への強制アップデートもあったらしいですし,今後 IE6 の比率が下がれば
それでいいのかも,とも......
mod_headers で事足りるわけですが......
IE7 への強制アップデートもあったらしいですし,今後 IE6 の比率が下がれば
それでいいのかも,とも......
2008/04/12(土) 14:17:48ID:S6q0mxTHP
2ちゃんねるの中というか日本ではIE7アレルギーが異常だから
欧米とかに比べると普及は遅れていると思うよ>>33
欧米とかに比べると普及は遅れていると思うよ>>33
2008/04/12(土) 14:18:16ID:d8DDhQ/80
IE厨は腹を切って死ぬべきである
まぁ IE6 での問題は文字コードより,JavaScript が時々挙動不審になったり
ブラウザの動作が重くなったり,ということの方が大きいんですけどね.
# それで read.js をデフォルトにするのを断念した,という経緯も......
ブラウザの動作が重くなったり,ということの方が大きいんですけどね.
# それで read.js をデフォルトにするのを断念した,という経緯も......
2008/04/12(土) 14:22:37ID:nO2fnwtX0
>>30
UTF-16にすると、1バイトで表現できている英数文字が2バイトに
なるであってる?
UTF-8は漢字が2バイトから3バイト必要になる
どちらにしても、datサイズが増える事に変わりがないような
そうすると、オンメモリで処理可能なdatの総量が何割か減ったり、
通信容量の増大を招いたりでいい事がないような
UTF-16にすると、1バイトで表現できている英数文字が2バイトに
なるであってる?
UTF-8は漢字が2バイトから3バイト必要になる
どちらにしても、datサイズが増える事に変わりがないような
そうすると、オンメモリで処理可能なdatの総量が何割か減ったり、
通信容量の増大を招いたりでいい事がないような
38stream ◆PNstream2s
2008/04/12(土) 14:26:40ID:sMNaDZg+0 >>37
あってる
ただ、Shift_JISは日本語のコードにASCIIを含んでるから(つまり腐ってる)
UTF-8にすればShift_JISだったから必要な余計な処理が無くなって
負荷が減るとかコードの見通しが良くなるとかあるかもね。
Rock54まわりはいろいろ大変だったような。
あってる
ただ、Shift_JISは日本語のコードにASCIIを含んでるから(つまり腐ってる)
UTF-8にすればShift_JISだったから必要な余計な処理が無くなって
負荷が減るとかコードの見通しが良くなるとかあるかもね。
Rock54まわりはいろいろ大変だったような。
2008/04/12(土) 14:34:16ID:dKHHUdt+0
ほいほい文字コード変えられたら
内部設定をテキストファイルで読み込ませる組み込みは大変なことになる
多言語対応なんてやってられねーんだよ
どこのlinux脳だ
ということに
内部設定をテキストファイルで読み込ませる組み込みは大変なことになる
多言語対応なんてやってられねーんだよ
どこのlinux脳だ
ということに
まぁ read.js 以外のことを考えた場合,>>38 のような利点はありますけどね.
もっとも,その点に関しては EUC-JP でもいいんですけど.
もっとも,その点に関しては EUC-JP でもいいんですけど.
2008/04/12(土) 14:39:48ID:YxILKQC60
UTF8になったらしばらくは変える必要無さそうだけどね。
EUCはなぁ。ちょっと変える利点が。
EUCはなぁ。ちょっと変える利点が。
2008/04/12(土) 14:46:47ID:ddwKMOyI0
キャップの文字化けとか
目欄で「age」の直前に「鋭郭虐茎行市峻尽壮痴」でsageになってたとか
そんなの無くなる?
目欄で「age」の直前に「鋭郭虐茎行市峻尽壮痴」でsageになってたとか
そんなの無くなる?
2008/04/12(土) 14:49:14ID:YxILKQC60
なくなるね。
トリップはどうなるんだろう。
送られるデータが変わるわけだからやっぱり変わるよな。
トリップはどうなるんだろう。
送られるデータが変わるわけだからやっぱり変わるよな。
不正バイトシーケンスの問題は,どの文字コード使うにせよ
解決するならきちんとチェックするという以外ないような.
解決するならきちんとチェックするという以外ないような.
2008/04/12(土) 15:00:02ID:d8DDhQ/80
46stream ◆PNstream2s
2008/04/12(土) 15:21:54ID:V5lKbYlC0 持ってる運用情報のdatファイル1102個をiconvを使ってCP932からUTF-8に変換してみた。
正常に変換できたdatが1024個(偶然)。
CP932の場合 98.1MB (平均で98KB)
UTF-8の場合 121MB (平均で122KB) 1.24倍
意外と大きくなってない。
この程度の増加なら、全然許容範囲だと思った。
正常に変換できたdatが1024個(偶然)。
CP932の場合 98.1MB (平均で98KB)
UTF-8の場合 121MB (平均で122KB) 1.24倍
意外と大きくなってない。
この程度の増加なら、全然許容範囲だと思った。
2008/04/12(土) 15:37:44ID:YxILKQC60
>>46
出た異常についてkwsk
出た異常についてkwsk
48stream ◆PNstream2s
2008/04/12(土) 15:38:36ID:V5lKbYlC02008/04/12(土) 15:45:05ID:Kt287Ydo0
1.24倍の容量増をでかいと思うか、ちいさいと思うかは
メディアコストに対する認識の差だろうな
メディアコストに対する認識の差だろうな
2008/04/12(土) 16:26:54ID:nO2fnwtX0
サーバリソースを軽くするのが目的で、24%増になるのは本末転倒じゃないだろうか
2008/04/12(土) 16:33:17ID:i2IKMcHY0
容量が増えると花子が困るな
2008/04/12(土) 16:48:22ID:sjQIQGbL0
2ちゃん用の文字コード作ればいいよ
2008/04/12(土) 17:26:10ID:goAdvWs50
ザウルスとか旧Palmとか古い機種の専ブラは大丈夫なんだろうか?
2008/04/12(土) 17:56:53ID:rDg1K0sD0
>>50
処理量を優先するかストレージを優先するかの優先度の問題でしか無い。
処理量を優先するかストレージを優先するかの優先度の問題でしか無い。
2008/04/12(土) 18:12:22ID:GThHi3CAP
UTF-8にするんなら、いっそのことdatの仕様を思いっきり弄くり回すとか。
レイアウトとフォントはCSSにすればdat自体の容量は減る
互換性全くなしで、専ブラがひどいことになるがw
レイアウトとフォントはCSSにすればdat自体の容量は減る
互換性全くなしで、専ブラがひどいことになるがw
56動け動けウゴウゴ2ちゃんねる
2008/04/12(土) 18:19:15ID:Kt287Ydo0 「これが、私が考えた掲示板だ。使い勝手についていろいろ言う人もいるかもしれない。
それは対応する専用ブラウザを作るボランティアや利用者が、この仕様に合わせてもらうしかない」
この道ーはー
いつかーきたみーちー
それは対応する専用ブラウザを作るボランティアや利用者が、この仕様に合わせてもらうしかない」
この道ーはー
いつかーきたみーちー
2008/04/12(土) 18:35:33ID:H6XV6cuW0
最大の問題は過去のdatの扱い(一括変換するにしてもshift-jisのまま放置にしても)
2008/04/12(土) 18:42:56ID:mbw97Ct90
将来を見据えた時代の流れでいいんじゃね?
Shift-JISが許されるのは20世紀までだよね
Shift-JISが許されるのは20世紀までだよね
2008/04/12(土) 18:56:20ID:mbw97Ct90
とりあえず新板で試すのがベターだろうな
で、専ブラ作者には馴れてもらうと
その流れで文字コードの判別にセンシティブになってもらうと
変換とか引越しって、絶対にトラブるんだよな
で、専ブラ作者には馴れてもらうと
その流れで文字コードの判別にセンシティブになってもらうと
変換とか引越しって、絶対にトラブるんだよな
2008/04/12(土) 19:04:54ID:rbaOIjlz0
新板からとか、スレッド番号でスッパリ分けるとかするべきだろう。
あと、文字コード情報について正しくヘッダを送る。
既存のスレッド全部変換するのは、失敗のリスクとかが大きいと思う。
それから512KB制限も考え直すべきでしょう。
あと、文字コード情報について正しくヘッダを送る。
既存のスレッド全部変換するのは、失敗のリスクとかが大きいと思う。
それから512KB制限も考え直すべきでしょう。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- TBS『報道特集』 匿名の局アナが出演し告発! 民放女性アナ3人で「キャバ嬢並み接待」「アナウンサーで囲んでほしいと…」 [冬月記者★]
- 【八潮市道路陥没】運転手の救出活動を再開…作業用スロープが完成し重機でがれきの撤去始める ★3 [Ailuropoda melanoleuca★]
- フジテレビ女子アナ MC番組の欠席を報告「後輩が担当してくれます」 遅めの夏休みと [シコリアン★]
- 鷲見玲奈が体調不良で朝の生放送欠席 [ひかり★]
- 【八潮道路陥没】「前から糞のようなニオイが…」近隣住民らが感じていた“異変” アスファルトのヒビは予兆だったのか [Ailuropoda melanoleuca★]
- 【芸能】木村拓哉「みんな、たまってたんだな…」 事務所後輩が飲み会で抱き合って号泣 [シャチ★]
- ホロライブがある生活😊
- カナダ次期首相候補「じゃあこっちもテスラに関税100パーセント課すわ」 [782460143]
- なにここ🏡
- お🏡がある生活
- 兵庫県警、百条委員会の議員らを中傷した疑いでネットに書き込んだ斎藤支持者らの捜査を開始。日本始まったな🤩 [931948549]
- 「直美」が急増、社会問題に😨 [583597859]