そうそう、変換の結果、日本語文字にして85文字まで入るようになったようです。
万が一、これに収まらないスレタイが収集されると最後が切れちゃいます

それから、「a」とか「_」とかいう文字が化けるのは仕様です。
というか直し方知りません、誰か知ってたら教えてください。

・・・というのも、2ちゃんのデータは全部Shift_JISという日本語文字コードなんですが、
こちらのデータベースではUTF8を使っているので変換しています。
この変換で化けちゃうみたいです。変換は、PerlのEncodeモジュールがやっています。