X



datをUTF8にするのはどうだろうスレッド

■ このスレッドは過去ログ倉庫に格納されています
1ひろゆき@どうやら管理人 ★
垢版 |
2008/04/12(土) 13:13:09ID:???0?S★(1017889)
datをUTF8にするのはどうだろうスレッドです。

影響があるのは、AA周りすかねぇ。
2008/04/17(木) 19:50:50ID:x31S+u9S0
2ch DAT落ちスレ ミラー変換機の管理人さんが0chスクリプトを
UTF-8化したものを配布(http://mirror.s151.xrea.com/0ch_utf8/)していて、
サンプル(http://mirror.s151.xrea.com/2ch/0chu/utf8/)もあるので、
どんな感じになるのかはここで実験できるかもしれない。
2008/04/17(木) 20:26:07ID:l0VrTek40
>>315
違うに決まってんでしょ
2008/04/17(木) 21:11:03ID:0giwvNAd0
>>316
サンプルの惨状にワロス
2008/04/17(木) 21:21:30ID:chmztg1a0
多言語なんて荒れるんじゃない?
2008/04/17(木) 22:33:14ID:x31S+u9S0
>>318
荒れてるんじゃなくて、台湾版ニコニコ動画の掲示板のログを持ってきた
って管理人さんが書いてた。
考えてみたら、http://tw.bbs.nicovideo.jp/user/ の方を紹介すべきだったかな。
ニコニコ動画が運営しているUTF-8エンコードのサポート掲示板。
2008/04/18(金) 16:24:52ID:QnO5qrZL0
>>315
違うコードだけど、Windowsではどちらも¥に見える
2008/04/18(金) 18:28:59ID:PzY0ZFSE0
>>321
たぶんそれはアプリに問題が
2008/04/18(金) 19:33:59ID:sdKsYN1gO
暗黙の了解でバックスラッシュは特殊な仕様になってる。
詳しくは調べてね
2008/04/19(土) 00:04:03ID:hJxMwF/u0
マイクロソフトの変換法では、日本の円記号はUnicodeのバックスラッシュ(U+005C)に変換される。
そして、日本語用のフォントではバックスラッシュ(U+005C)を円記号として表示してしまうのである。
賛否両論の対応ではあったが、旧来のソフトウェアを捨て去ることなくUnicodeを利用できる現実的な方法として広く使われている。

なにこれー
2008/04/19(土) 04:37:18ID:PNa6uLXK0
Windows のフォントにパッチを当てて、円記号を無理やりバックスラッシュにしたり
してた人も居たはず…
2008/04/19(土) 09:40:01ID:E5leIjkHP
Beかなんかで、トリップの文字化けがあったよね。関係あるのかな。
ログだけじゃなく、全部ひっくるめて統一したい、とか?
2008/04/19(土) 10:47:11ID:i4TihsY/0
エンコーディングにSJISを使うかUTF-8を使うか、ということより
最終的にどんなフォントが使われるかということだな、問題は。
2008/04/19(土) 11:29:41ID:RC0Bf5GwP
フォントにな
2008/04/19(土) 12:05:13ID:WwihNvKZ0
すくなくともバックスラッシュを多用する板なんて限られてくるんだし(ム板とか)
そいつらがBSを表示できれば問題ない
2008/04/19(土) 12:18:26ID:BN4RLckC0
AA職人もバックスラッシュは欲しがるんじゃないか?
ってもMS標準のUnicodeフォントで統一されるなら支障無いと思うけど
2008/04/19(土) 12:25:16ID:Eb+X94MG0
バックスラッシュは是非欲しい
2008/04/19(土) 13:04:42ID:ZaXhrfEE0
\ ←?
2008/04/19(土) 13:42:54ID:WwihNvKZ0
>>332
\
2008/04/19(土) 13:43:17ID:boa9zPeZ0
>>328
2008/04/19(土) 14:29:20ID:PNa6uLXK0
以下スレチ
>>326
(旧 BE板と) BE プロフィール画面でのトリップ非互換問題は以下の通り。

・BE の内部処理が EUC-JP で、なおかつ本来トリップとしては不正な多バイトコード
 もしくはいわゆる半角カタカナを使用しているため。
・プロフィール画面の方では、各処理系で特殊用途として用いられる文字のエスケープ
 処理が板のトリップでの処理と違うため(「"、'、[、]、\」なんかが該当)。

すべての原因は何処かのスレで自身が発言してた、ひ(rが文字コード問題に弱いため。
2008/04/19(土) 14:33:40ID:AofXqpHw0
http://etc7.2ch.net/test/read.cgi/be/1184835944/225
5:トリップが化けないようにして

いまいち文字コード周りに弱いおいらです。。。
DBの文字コードを変えるとさらに文字化けを誘発しそうなんですよね。。
2008/04/19(土) 18:12:39ID:7NOZ3hUG0
>>328
2008/04/19(土) 21:00:50ID:pEn192nm0
UTF-8を理解していない人が
スレ参加とか。。アフォかと。。。
2008/04/19(土) 22:57:37ID:E5leIjkHP
もはや釣堀w
2008/04/20(日) 00:20:40ID:FJYFc2yt0
専ブラ作者には負担かけるわけだよねー
●で儲けさせてもらったくせにその仕打ちはどうかと
2008/04/20(日) 00:30:15ID:CZ8CMSVeP?PLT(13132)
>>340
、、、。
2008/04/20(日) 00:49:13ID:ioURv1tiP
\(^O^)/ドンマーイ
343動け動けウゴウゴ2ちゃんねる
垢版 |
2008/04/20(日) 02:52:04ID:6eEXFguv0
世界はUTF-8
344動け動けウゴウゴ2ちゃんねる
垢版 |
2008/04/20(日) 04:29:24ID:2uISEUW5O
俺のサイトもSjisからUTF8にしようと思ったけど面倒だからやめた。
PHP使ってるから初めからほうしとけば良かった。
2008/04/20(日) 10:42:00ID:E+evngot0
>>340
エンコ指定なんてふつう外出しにしてるだろ。大した手間じゃないよ。
2008/04/20(日) 10:46:48ID:ioURv1tiP
讃岐は●非対応、いや未対応。
完全ボラだからなー。
2008/04/20(日) 11:21:20ID:gBO4l9OF0
>>340
>>269
2008/04/20(日) 11:28:21ID:gBO4l9OF0
340じゃなくて345だった
2008/04/20(日) 12:56:44ID:E+evngot0
つまりJaneViewの設計が糞だってことか
2008/04/20(日) 13:03:17ID:6E0oOuN20
えんこーでぃんぐだけじゃなくてゆーあいにひょうじしたりあぼーんでのしょりがふくざつになるのに
お前はアホか。
2008/04/20(日) 14:07:13ID:75H7xodgP
ID:E+evngot0
ここはあなたみたいな無知な方が来る所じゃありませんよ、と
2008/04/20(日) 14:09:46ID:AQa/Gq8O0
内部処理がSjisの専ブラの方が多いだろ
2008/04/20(日) 16:11:58ID:sNEtEpdP0
WinアプリでWin95系をサポートしてるなら内部処理Unicodeにするのは困難
2008/04/20(日) 16:26:03ID:OWZ6WVMR0
いまさら95/98/MEを使っている奴なんて…いないだろう?
いないよね?いないと言ってくれよ!
2008/04/20(日) 16:41:03ID:16hsI3LLP
ここにいる!
2008/04/20(日) 16:42:43ID:E+evngot0
つまりエンコの変更に対応できないようなソフトを作っておいて
自前のコントロールじゃないからどうとか開発環境の内部処理が
どうとかOSがどうとか言い訳がましいことを言うなと
2008/04/20(日) 16:45:36ID:siTEX6bu0
>>353
でも不可能じゃ無いし、実際95でも使えるアプリでUnicode対応してるのも
ある。

ちょっと検索すれば判る程度の話だし。
2008/04/20(日) 17:05:38ID:6E0oOuN20
不可能じゃなければ簡単なわけじゃない。

>>356
やったことがなくてわからない事までろくに知りもせずに言及するな。
>>345のような発言する時点で実際にどんな問題が出てくるか全く把握してないだろ。
2008/04/20(日) 17:09:44ID:OWZ6WVMR0
ここは2chだし「まずやってみよう!」の精神でいいんじゃないかな?
問題が起きたら後から考えると。
2008/04/20(日) 17:12:52ID:iVEweGOHP
やるんならアフィ速とかVIPとか小規模に実験してから全板にいれてくれ
2008/04/20(日) 17:22:48ID:CuEhiLzy0
2chブラウザ製造機によく使われてるDelphiがUTF(Unicode)に標準で対応してないんだ。
かちゅ、ギコナビ、ホットゾヌ、Jane系は騙し騙しの対応になるか、対応を諦めるかのいずれかになるな。

そもそもひろゆきがUTF8に変更する積極的な理由がなくなったんだから
このままでいいんじゃないのかね。
2008/04/20(日) 17:47:46ID:E+evngot0
2ch鯖がSJISに特化した処理結果を返してるからといって
クライアントがSJISを前提にした設計にしちゃっていい理由には
ならんだろ?文字コードが変更されたとき、ユーザーの手間を
最小限に抑えて最低限の表示が出来るような設計にしておかなきゃ
糞だろ?
2008/04/20(日) 18:19:31ID:a/sg/Mv90
必レスのガイドラインスレに迷い込んだのかと思った。
2008/04/20(日) 18:41:36ID:nLYdFtzu0
専用ブラウザがどうのこうの言ってるけど
おいらのJDには関係ない
ついでにいうとNavi2chでも関係ない
つまりはどうでもいいってこった。
2008/04/20(日) 18:53:32ID:SICVUDUsO
>>362
フリーソフトにどんだけスケーラビリティ求めてんだ。ww
頭悪いの?それとも常識がないの?
2008/04/20(日) 19:58:54ID:OWZ6WVMR0
2chサーバ側の仕様なんて、これまでも結構変わっているわけで、
専ブラ作者もそれに追従してきている。
(gzip圧縮とか、EUCとか、バーボン回避のウエイト挿入とか)

今回の場合、暫定回避策を作るとすればliveb1.2ch.netみたいのを
ベースに変換Proxyを用意して、未対応の専ブラはそこを経由させる
ような対応もあるだろう。

もちろん「表示不能な文字が出る」「更新が遅延する」等の制限も
あるわけで、それを回避したい作者はUTF-8の本格対応をしてくる
だろう。

ま、実験サーバで様子見ながら進めるのが良いだろうね。
2008/04/20(日) 20:59:57ID:glaB1xWs0
ていうかそもそもUTF-8にするメリットってあんの?
専ブラとかトリップとかデメリットははっきりしてるけど
2008/04/20(日) 22:29:35ID:OWZ6WVMR0
UTF-8のメリットと言うよりも、SJISのデメリットの方が大きかったり。
SJISのままだとまともに検索処理できなかったりするしなあ。

findがEUCなのもこの辺が理由だろうし。
2008/04/20(日) 22:33:59ID:AfSvaIcn0
>>352
んなこたあない
2008/04/21(月) 03:35:19ID:L/X3LHo3O
>>368
そりゃ設計が甘いだけであって文字コードの問題じゃないだろ、jk。
2008/04/21(月) 08:34:06ID:B3naUrlS0
こんなことグダグダ言ってる体質だから、お前ら童貞なんだよ
2008/04/21(月) 10:30:04ID:SsWHcakdO
ティンコねえよばーか
2008/04/21(月) 20:25:58ID:aKzPBjG80
ほうほうwそれで?




・・・・えっ?
2008/04/21(月) 22:25:50ID:fSMi00ydO
同鯖なんだから、iframeでSJISのテキストひっぱってきて、
JSで整形すればいいジャマイカ
IE6どころかそれ以前でも問題ない

Ajaxにこる必要はないですよ、と。。。
2008/04/22(火) 01:51:28ID:ANEjSamR0
UTF8にすんの?ハングルとか中国語で蹂躙されそうでこわいんですけど
2008/04/22(火) 06:42:01ID:yL4lzVkx0
>>375
バカなんだから、黙ってろバカウヨ
2008/04/22(火) 08:03:32ID:uY/iJg580
半島、大陸からはボボン行きにしちゃえばいいのだろうけど国内からの投稿はなあ
2008/04/22(火) 14:17:45ID:kM4VdlnL0
結局決まったのは「人大杉の時はread.js使ってね」だけか?
2008/04/22(火) 17:00:23ID:Cn13HtzZ0
そんでひろゆき満足してそう
2008/04/22(火) 17:05:15ID:rxRpnF6x0
じゃあもう要らないね

↓スレスト
2008/04/22(火) 17:10:32ID:nZhF1lJIP?PLT(13132)
ひろゆきモンハンやろうぜ
2008/04/23(水) 04:42:43ID:syvdi/8X0
そもそも言語とはなんぞやという問題が云々
2008/04/23(水) 05:56:01ID:EDGasE+IP
いつかはやるべきだろうけど、「動いているモノはいじるな」でしょうか。
googlebot対策なんかやるのかな?
384ひろゆき@どうやら管理人 ★
垢版 |
2008/04/25(金) 07:50:49ID:???0?S★(1018222)
sports11もread.jsの設定お願いしますー。
2008/04/25(金) 09:56:53ID:deYgxNnf0
ぴろりん発見
2008/04/25(金) 10:42:26ID:3m/nTh190
>>384 人大杉時に read.js に振る設定が FOX さんに override されて
「秘密の花園」に飛ばされてしまうのですが,とりあえずやっておきます.

# 再度 override されるようなら,↓あたりの話を FOX さんと詰める必要があるのではないかと......
# http://qb5.2ch.net/test/read.cgi/operate/1208685863/15-n
2008/04/25(金) 13:20:09ID:g1Y2XeLi0
ぴろり菌発見w
388あぼーん
垢版 |
NGNG
あぼーん
389動け動けウゴウゴ2ちゃんねる
垢版 |
2008/05/05(月) 17:25:01ID:afyb9tX10
(´・ω・`)このスレ終わっちゃったの?
2008/05/05(月) 17:58:44ID:U3TbI2+30
>>389
「俺がUTF8化してやるぜ! utf.2ch.netという名前を付けて鯖よこせ! 」
みたいなことを言う人が現れなかったので終了しました。
2008/05/06(火) 20:48:45ID:ZGvvJhjr0
うお乗り遅れた

っつっても俺がやってやるから鯖よこせと言えるだけのパワーは無いけど
2008/05/06(火) 21:05:24ID:ztX/ckgM0
実際UTF8化した場合、簡単な設定変更で表示可能なブラウザって
IE以外だと何がありますか?(IEならエンコードは自動認識だったかな)
2008/05/06(火) 21:19:51ID:u8C45HHC0
ウェブブラウザのシェア統計に名前が出るブラウザなら特に設定の変更は無いです
2008/05/06(火) 22:11:05ID:ghDM9x940
navi2ch はすぐだな
2008/05/06(火) 22:42:03ID:V+cwX45t0
>>392
っていうか、むしろその IE(6) で問題が大有りなんだが… IE7 なら割と平気。
2008/05/07(水) 00:26:42ID:8uJffkUH0
>>394
emacs自体のユニコード処理が微妙だったり無かったり
2008/05/07(水) 00:43:11ID:FVQiW6yh0
今時、問題になるようなウェブブラウザはないかと。
(ウェブブラウザが見るのはhtmlだから、もし問題ならread.cgiが
SJISなhtmlを吐くようにすればいい)
対応が大変なのはdatを自分で読んでいる専ブラ。
2008/05/07(水) 05:20:13ID:QxFtrOUb0
専用ブラウザの場合、最悪IEコンポーネントを使っているなら
そのままUTF-8で吐き出せば表示されるかな?と思いますが
独自描画だとキツいでしょうねぇ。
内部でSJISにコンバートしてから表示ってことになるかな?

SUBJECT.TXTもUTF-8になるのなら、同じ感じですね。
スレッド一覧表示のところね。
上手く表示出来ない文字とか出るんでしょうねぇ。

SJISのままで行きましょうよ……。
2008/05/07(水) 05:59:47ID:YZj/IRfH0
もういいじゃないこのままで
2008/05/07(水) 10:37:11ID:FVQiW6yh0
ご時世を考えるとむしろ内部UTF-8な専ブラもあったりするんじゃないかと
思わないでもなかったり。

ところでトリップの話が出てますけど、トリップだけはSJISに変換して
計算すればいいんでない?
あと、トリップの強度を上げる話は、キーはSJIS8バイト以内なら現トリップ、
それよりキーが長ければ次世代トリップというように、互換性をもたせたまま
拡張する手もある。
2008/05/07(水) 17:07:17ID:swK7kCX6O
今こそおいらロビーインターナショナルの復活の時
2008/05/07(水) 18:05:49ID:PHJOcw2w0
>>400
トリップの件… 多分この板の過去スレのどこかにソースがあるはずだけど(トリップ
統一スレだっけかな?)、2ちゃんねるの仕様としては、non-ASCII なキャラクタは
トリップコードしては不正なはず。
403stream ◆PNstream2s
垢版 |
2008/05/07(水) 18:28:39ID:m32b509z0
>>188
2008/05/11(日) 10:29:19ID:3JPX5k+W0
管理人がそう言っていたとしても、
現実使ってる奴がいる以上需要はあるかと。

対応する理由が2ch側には無いのはわかってますけどね。
2008/05/16(金) 09:17:59ID:oK7aNu1R0
2NNはUTF-8なんだな
2008/05/18(日) 06:06:12ID:yWeFaP7n0
S-JISを通信の世界に出すなと言う20年以上昔の議論の結論が今頃出てきたなw わずかな期間のわずかなリソース節約の為にどれだけのパワーが削がれてきたのか、 そして、正しき状態に戻すためにどれだけのパワーを必要とされるのか、、、南無、、、
2008/05/18(日) 07:05:02ID:QBG0YZC80
正しき状態とかもうね
2008/05/18(日) 07:23:47ID:e9j/YDzI0
欠陥の多い間に合わせの文字コードだからな。
2008/05/18(日) 08:30:45ID:uwERh9TE0
>>406
20年以上前は80x40の端末しか存在しなかったから
改行して読みやすくするなどの
読み手のことなど全く考慮する必要がないということですね。
2008/05/18(日) 09:17:21ID:jVWe2BtW0
通信の世界で使えと言ってたのはISO-2022-JPなわけだが(今でも日本語メールにその名残がある)
datをISO-2022-JPにしろとでもおっしゃいますか
アホか
2008/05/18(日) 11:08:47ID:HxyQJ5j/0
>>410
名残もなにも、RFC 1468(ISO-2022-JP)は現役バリバリで obsolete されていないから、
text/plain での日本語環境 mail/netnews じゃ ISO-2022-JP しか使っちゃ駄目。
2008/05/18(日) 12:41:42ID:LZxEStfR0
mailとnetnewsではね
2chにはあまり関係のないお話
2008/05/19(月) 14:57:34ID:OHADN8NA0
そこまで言うならUTF-7でいいよ
2008/05/19(月) 19:36:53ID:CI88+YrjO
むしろUTF-18で
2008/05/19(月) 21:28:50ID:ETRrbr/x0
いっそのことUTF-9で
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況