Муки с Word`ом

Доброго времени суток. Кто может подсказать хорошее средство для "причесывания файла" после сканирования на предмет мусора. Делаю вычитку в Word`е и в fb2 перегонять пока не буду (хотя если кому интересно книга С.Р. Певзнер "Вождение автомобиля" Москва, 1972 г.)
Заранее спасибо за советы.

Комментарии

sc_pasechnik написал:
Доброго времени суток. Кто может подсказать хорошее средство для "причесывания файла" после сканирования на предмет мусора.

Если после сканирования сохранить текст не в ворде, а как текст, весь мусор сам собой исчезает.
После этого текст можно открыть тем же вордом, но в нем уже не будет ни левой графики (в т.ч. крокозябры на сгибах и в развороте), ни разделителей разделов и колонок!
Правда, текстовая разметка (курсив, жирный) тоже теряется.
Восстановление текстовой разметки же занимает существенно меньше времени и требует значительно меньше усилий и нервов.

Все бы ничего, но в тексте довольно большой объем занимают картинки и отдельная их вставка в документ будет несколько затруднительна. Думал, может макрос какой есть для чистки.

sc_pasechnik написал:
Все бы ничего, но в тексте довольно большой объем занимают картинки и отдельная их вставка в документ будет несколько затруднительна. Думал, может макрос какой есть для чистки.

Есть макрос, как не быть - сам себе его писал, много его пользую.
http://www.the-ebook.org/rus/?page_id=122&dl_page=2
http://www.the-ebook.org/rus/?p=255
Text_Cleaner_Macros
Размер файла: 21.0 KiB
Общее количество загрузок: 1,984 Дата обновления: 12 Июнь 2008

Макрос для MSWord (офис 97, 2003) по очистке и приведению в чувство текстов и страниц, скопированных из инета, отсканированных и прошедших обработку OCR pad. Приводит в достаточно красивый вид подавляющее большинство текстов. Подробнее:
.....

Но некоторые мусорные знаки мне проще регулярными выражениями потом именно в фб2 (в ФБЕ) искать.
мусорные знаки после скана (поиском, прямо как есть в квадратных скобках):
[/\\*>|'<_×`]
(включаем галку "Регулярное выражение")
и еще частые случаи
\s- (любой пробел+дефис)
-\s (дефис+любой пробел)
(включаем галку "Регулярное выражение")

И поскольку в фб2 можно перевести достаточно быстро, и он прекрасно открывается и правится вордом (для вычитки), то может имеет смысл все же сразу сделать фб2.

За макрос громадное спасибо. Сделаю и ФБ2 толькосначала всетаки вордовский.

Eсть знатная программа, убирающая большинство мусора - AfterScan (в варианте Lite - бесплатная, Pro и Express - shareware, но таблетки к ней также имеются). Попробуйте:
http://www.softoman.ru/windows/buisiness/other/11829.html
http://www.panvasoft.com/rus/15/

Всегда пользовался средством "Найти и заменить" :)
Хорошо помогает.
Например убрать двойные (многократные) пробелы, лишние переводы строки и абзацы, переносы...
И кодить ничего не надо)

После десятка текстов ручная работа по чистке типичных вещей через поиск начинает сильно утомлять ))
Нехай железный конь работает, он для того и нужен.
А пробелы, перевод строк и проч фбд сам исправляет, это вообще в 99% случаев нафиг не надо для фб2 делать.

X