mabusse> Ну, не только, наверное. Если мы знаем все данные сразу, то у нас больше возможностей сжать их оптимальнее. Пример: Дык, если обработаем весь поток сразу (бесконечный словарь), то какая разница с блочным?
mabusse> Преобразование Барроуза — Уилера mabusse> Используется, например, в bzip2. Специально посмотрел - из командной строки позволяет выбирать размер блока от 100 до 900кБ. Народ пишет, что это еще мало, в других архиваторах BWT используют с блоками до 16 МБ. Где-то читал, что Шекспир за свою жизнь написал в 2 раза меньше: около 8 МБ У блочного минус тот, что словарь от предыдущих блоков не переиспользуется часто. Поэтому часто у блочных наполнение словаря начальное может быть статистическое — кто-то посчитал когда-то.