Когда-то давно по проблеме «fine reader лишние пробелы» набрёл на хорошую статью со сравнением качества распознавания и возможностей форматов: http://www.jurassic.ru/ebooking.rus.htm, pdf