>>128 今は,各 URL ごとに TF が上位 200 までの単語を登録してます.
仕組み的には,この数をもっと増やすことも不可能ではありませんが,
HDD 消費量やパフォーマンスなどとのバランスを考えるとこのぐらいかなぁ,と......

mysql> SELECT (SELECT COUNT(*) FROM urls) 'URL 総数', (SELECT COUNT(*) FROM words) '単語総数', (SELECT COUNT(*) FROM regwords) 'DF 計算用単語の URL との関連付け総数', (SELECT COUNT(*) FROM dispwords) '表示用単語の URL との関連付け総数';
+----------+----------+--------------------------------------+-----------------------------------+
| URL 総数 | 単語総数 | DF 計算用単語の URL との関連付け総数 | 表示用単語の URL との関連付け総数 |
+----------+----------+--------------------------------------+-----------------------------------+
|  465918 | 1064955 |               73515988 |              4320516 |
+----------+----------+--------------------------------------+-----------------------------------+

-rw-rw---- 1 c22chio ch2  108017350 1 4 22:14 dispwords.MYD
-rw-rw---- 1 c22chio ch2  75264000 1 4 22:14 dispwords.MYI
-rw-rw---- 1 c22chio ch2    8632 1 1 20:13 dispwords.frm
-rw-rw---- 1 c22chio ch2 1604234751 1 4 22:14 regwords.MYD
-rw-rw---- 1 c22chio ch2 1312161792 1 4 22:14 regwords.MYI
-rw-rw---- 1 c22chio ch2    8626 1 1 20:19 regwords.frm
-rw-rw---- 1 c22chio ch2  34500696 1 4 22:14 urls.MYD
-rw-rw---- 1 c22chio ch2  20992000 1 4 22:14 urls.MYI
-rw-rw---- 1 c22chio ch2    8694 1 1 20:13 urls.frm
-rw-rw---- 1 c22chio ch2  33554972 1 4 22:14 words.MYD
-rw-rw---- 1 c22chio ch2  44557312 1 4 22:14 words.MYI
-rw-rw---- 1 c22chio ch2    8612 1 1 20:13 words.frm