Вычитка #5 (2010-I)
Опубликовано пн, 04/01/2010 - 14:06 пользователем soshial
Forums: Теперь главная тема по вычитке здесь. Архив тем: таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке. Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе. Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования. Присоединяйтесь к нам! :) golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"! Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня
ProstoTac RE:Как написать гениальный роман 3 дня sd RE:ЛИБРУСЕКУ 10 ЛЕТ!!! 3 дня Larisa_F RE:Ищу тексты книг 4 дня nehug@cheaphub.net RE:Илларион и Карлик 5 дней nehug@cheaphub.net RE:Дмитрий Алексеевич Глуховский - Метро. Трилогия под одной... 1 неделя alexk RE:Чтение и скачивание невозможны 1 неделя Саша из Киева RE:Улыбка дракона 1 неделя sibkron RE:Бетон 2 недели tvnic RE:Проблема с аннотациями в библиотеке. 2 недели s_Sergius RE:регистрация 2 недели Саша из Киева RE:Мелочи жизни. Русская сатира и юмор второй половины XIX -... 2 недели sibkron RE:Вкус свинца 3 недели sibkron RE:Мгновенная смерть 3 недели Isais RE:Не возможно скачивание книг 3 недели Zyrtex RE:сообщения-призраки 3 недели Саша из Киева RE:Выступают куклы 3 недели Саша из Киева RE:Подвиг героев - судьба страны. МНР: люди и годы 3 недели Впечатления о книгах
Ultima2m про Герц: Наперегонки с демоном (Фэнтези, ЛитРПГ)
09 02 Я бы многое мог высказать о книге, но лучше прочитайте аннотацию автора. Шедеврально. Оценка: плохо
скунс про Видум: Ступень третья. Часть первая [СИ] (Фэнтези, Самиздат, сетевая литература)
09 02 Хорошая серия,читать интересно Оценка: хорошо
Лысенко Владимир Андреевич про Усманов: Нормальные герои всегда идут… в обход! [СИ] (Героическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
09 02 Прочитал не отрываясь, жду продолжения причлючений ГГ. Оценка: отлично!
Лысенко Владимир Андреевич про Романов: Победителей не судят [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
09 02 Книга понравилась, хотелось бы продолжения. Оценка: отлично!
sproshkin про Пономарев: 290 миллионов лет назад и далее [litres] (Детская фантастика, Детские приключения)
08 02 В стили Кира Булычёва. Приключение девочки Лизы, её дяди Саши с машиной времени и подлецами из числа самих исследователей времени. Оценка: отлично!
Oleg68 про Фонкинос: Эротический потенциал моей жены [Le potentiel érotique de ma femme ru] (Современная проза)
08 02 Сюжет книги нормальный, но стиль изложенный автором не понравился. Можно почитать, если читать больше нечего. Оценка: неплохо
Drago23 про Дятлов: Чернобыль. Как это было (История, Технические науки, Биографии и Мемуары)
08 02 Короче, почитал и малость офигел от попыток автора откреститься от всего по принципу "я не я, и лошадь не моя". Там он был уверен, там нарушен регламент, но это фигня, мол, поломка насосов не должна приводить к катастрофе ……… Оценка: плохо
котег про Дятлов: Чернобыль. Как это было (История, Технические науки, Биографии и Мемуары)
07 02 Рассказ о том, что даже следуя всем уставам и регламентам можно сесть в тюрьму. Дятлов ничего не нарушил и ничего не придумал сам в этой аварии. Авария произошла по вине подлости советского союза, где на объекты, сверхопасные ……… Оценка: отлично!
obivatel про Каменистый: Рождение победителя (Фэнтези, Попаданцы)
07 02 Поддерживаю все отрицательные отзывы, нет ни одного "возводившего напраслину" на данный текст. Блевота, а не текст. Уж насколько я терпелив, но задолбал автор капитально. Я возмущен. Оценка: плохо
Кроухантер про Ким: Харальд Поттер. Огнём и сталью [СИ] (Фэнтези, Фанфик, Самиздат, сетевая литература)
07 02 читал когда-то и всю серию о Потном Гарри. читал в оригинале, чтобы не окосеть от "васянства" переводчиков. так вот, от Роулинг за милю разит калькой с книг Евы Ибботсон. только произведения Евы были оригинальными, интересными ……… Оценка: хорошо
valeryma про Delacruz: Красный рассвет [СИ] (Альтернативная история, Боевая фантастика, Киберпанк)
07 02 Написано м.б. и неплохо, но не моё yе зашло совсем. Без оценки. |
Отв: Вычитка #5 (2010-I)
Не совсем понял как сообщить о готовности заняться вычиткой одной из предложенных к вычитке книг?
Б. Р. Скотт Падение святого города http://lib.rus.ec/b/170827 вычитать ошибки OCR
Опыта в этом деле у меня нет, но есть желание. Думаю, я смогу разобраться с "инструментарием" и оказать библиотеке посильную помощь.
Отв: Вычитка #5 (2010-I)
Считайте, что сообщили. :)
Будут вопросы, не стесняйтесь их задавать. :)
Отв: Вычитка #5 (2010-I)
начинаю задавать вопросы 8)
Вопрос 1.
Попытался заглянуть, но скачать её не получается по известной причине 8).
Есть какие-нибудь альтернативные ссылки, по которым можно свободно скачать эту книгу?
Вопрос 2. Где взять исходный FB2-файл выбранной на вычитку книги? Скачать оный по указанной вами ссылке http://lib.rus.ec/b/170827 снова-таки не представляется возможным:
Вопрос 3.
Что конкретно подразумевается под этим понятием? Достаточно ли просто исправлять замеченные ошибки и несуразицы по мере прочтения книги, или же требуется обязательное её сравнение с текстом бумажного оригинала? Как быть если бумажный оригинал для этих целей достать проблематично?
Отв: Вычитка #5 (2010-I)
На сайте автора: http://www.yuzzich.narod.ru/mybook1.htm
Отв: Вычитка #5 (2010-I)
1. Странно, что не скачивается Кондратович. Одно время был какой-то глюк, что вообще ничего нельзя было скачать, но вроде бы его исправили. Может быть, опять? :(
2. См. п. 1. Если не получится, сообщите мне свой мэйл в личку, я вышлю Вам файл.
3. 90% всех ошибок OCR можно исправить без оригинала - достаточно просто внимательно читать, а после ещё и пройтись скриптами. Но бывают, конечно, и спорные или вовсе не читаемые места. Если у Вас нет оригинала и достать его сложно/невозможно, оставляйте как есть. Возможно, имеет смысл в хистори упомянуть о том, что в книге остались ещё ошибки OCR.
RE:Отв: Вычитка #5 (2010-I)
Ещё есть вариант: сравнивать текст не с бумажным оригиналом, а с тем файлом, с которого делался OCR, то есть с фотокопией. Часто на сайт выкладывают файлы в формате PDF или DJVU - их можно жрать за исходную точку для сравнения. То, что программы распознавания распознают плохо, человеческий мозг может сделать гораздо лучше. Часто при сканировании некоторые символы или целые слова искажаются, расплываются и т.д. Вот, программы часто сбиваются в таких местах, но люди могут восстановить правильное слово по смыслу, если есть хоть небольшой намёк на правильное слово со стороны расплывающегося текста. Если PDF или DJVU файла нет на сайте, думаю, можно попросить его переслать того пользователя, который занимался OCR.
в какой кодировке сохранять книгу?
скажите пожалуйста какую кодировку делать в книге
оставлять, какая была или есть какие-то предпочтительные кодировки, типа utf-8? но при этом размер чуть увеличится...
редактировал книгу, она была в win-1251, сейчас у меня utf-8, размер сжатой возрос на 50кб, стоит обратно ее в win-1251 переводить?
Отв: в какой кодировке сохранять книгу?
Отв: в какой кодировке сохранять книгу?
Только utf-8. Размер не имеет значения.:)
Отв: в какой кодировке сохранять книгу?
ну и отлично, мне тоже ближе утф
единственное сомневался из-за размера файла и что возможно некоторые читалки для кпк/телефонов не смогут открыть файл в этой кодировке
Отв: Вычитка #5 (2010-I)
В процессе производства журнала Искатель №4 за 1988 выяснилось, что один из рассказов имеется здесь: http://lib.rus.ec/b/150420, но качество плохое - не вычитан. Поставил пометку "вычитывается".
Отв: Вычитка #5 (2010-I)
как можно принять участие в вычитке? Спасибо )))))))))))
Отв: Вычитка #5 (2010-I)
Вы можете присмотреть себе что-нибудь в таблице (ссылка в первом постинге) или выбрать что-нибудь по вкусу из файлов, сделанных LibRusEc kit'ом http://lib.rus.ec/stat/document-author/rusec, или просто читать нравящиеся Вам книги и заодно исправлять ошибки.
На странице редактирования книги следует делать пометку в поле "доп. инф." что-то типа "вычитывается" или "в работе". Чтобы не получилось дублирования.
Отв: Вычитка #5 (2010-I)
Рассказ Андре Рюэллана "Мемо" заменил на вычитанную версию - http://lib.rus.ec/b/180047. Кроме того добавил в библиотеку журнал Искатель, №4, 1988 - http://lib.rus.ec/b/180046, в котором этот рассказ имеется. Не знаю, прав ли...
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готов что-то повычитывать.
У меня интересы -- история, религоведение. Это означает что тут я лучше вычитаю.
Впрочем, могу вычитывать и то что есть.
Из гугльдока заинтересовало "Ла Сор Обзор Ветхого завета",однако оригинала у меня нет. Есть только doc файл с погаными сканами фотографий.
Из проблем есть то что я использую Linux и не уверен что есть готовые тлзы для создания/редактирования fb2. Но думаю что разберусь...
Так что заявку я оставил :)
Отв: Вычитка #5 (2010-I)
В "Обзоре Ветхого завета" пропущены куски текста. Если в Вашем доке они есть, то и он годится. :)
А откуда взялся Ваш док? Если по тем же ссылкам, что приведены в дескрипторе, то значит, и в нём текст не полностью.
Если Вы умеете распознавать и конвертировать другие форматы в fb2 (и найдёте способ делать это под Линуксом), можно просмотреть книги по жанрам:
http://lib.rus.ec/g/sci_religion
http://lib.rus.ec/g/religion_budda
http://lib.rus.ec/g/religion
http://lib.rus.ec/g/religion_rel
http://lib.rus.ec/g/religion_self
http://lib.rus.ec/g/religion_esoterics
Все файлы, сделанные LibRusEc kit'ом, нуждаются в обработке.
Если возьмёте что-нибудь в работу не из таблицы, оставьте на странице редактирования книги пометку в поле "доп. инф.".
Успехов! :)
Отв: Вычитка #5 (2010-I)
Приветствую всех!
Временами, читая книги в Вашей прекрасной библиотеке, поражаюсь вопиющей малограмотностью некоторых текстов. Хотел бы помочь с вычиткой (благо имею определенный опыт), но... как это реализовать на практике?
Можно ли править "на грамотность" читаемые тексты с их последующей перезаливкой?
И не будет ли это воспринято, как "нарушение авторских прав" и т.п.?
В ожидании ответа, WildKitten.
Отв: Вычитка #5 (2010-I)
Можно и нужно.
Почитайте вступительный пост (особенно ту часть, где говорится о форматах). Если Вам там всё понятно и Вы со всем согласны, можете смело править читаемые Вами книги.
Уточню: речь идёт о грамматических ошибках и форматировании. Всё остальное остаётся на совести автора.
Отв: Вычитка #5 (2010-I)
Поправил и перезалил книгу Тома Шарпа "Флоузы": http://lib.rus.ec/b/180361 Сделал, что мог, но правил в основном ошибки орфографические и огрехи OCR. Оформил стихи тэгом. Внес дополнительную инфу в Description.
Много вопросов у меня было по разбиению книги на абзацы, но поправил лишь явные случаи. При сомнениях оставлял так, как оно есть - такие вещи, ИМХО, лучше сверять со сканом или бумажным изданием. Поскольку не было ни того, ни другого, решил, что лучше не навредить.
Отв: Вычитка #5 (2010-I)
Большое спасибо. Абсолютно верное решение.
Отв: Вычитка #5 (2010-I)
Здравствуйте.Отметьте пож.в таблице - Питер Уоттс "Ложная слепота" вычитан, обновленную версию я залил в базу библиотеки.Встречались сложные понятия в тексте, не разобрать - то ли опечатки,то ли это переводчик так перевел научные термины.Решил оставить как есть.
Беру новую книгу на вычитку из таблицы - Орлов "Смело мы в бой пойдем...".Отметьте пож. в таблице.На страничке книги я отметился.Спасибо.
Отв: Вычитка #5 (2010-I)
Готов заниматься вычиткой. К кому обращаться?
Отв: Вычитка #5 (2010-I)
Добро пожаловать!
Сначала просмотрите таблицу, может быть, там найдётся что-то, над чем Вам интересно будет "поработать". Если нет, то в списке файлов, сделанных LibRusEc kit'ом, можно выбирать любой файл и дорабатывать его. Там всегда отсутствует форматирование и зачастую нужна вычитка.
Если найдёте что-то для себя интересное, сделайте пометку на странице редактирования книги в поле "доп. инф.". Мол, вычитывается. ;)
Отв: Вычитка #5 (2010-I)
Почему-то библиотека не принимает доработанные файлы обратно - пишет что файл слишком короткий и просит паковать стихи по сто килобайт.
Отв: Вычитка #5 (2010-I)
Вечер добрый! Я бы с удовольствием занялась вычиткой, но только текстовых файлов. Таблица не информативна, т.к., посмотрев интересующие меня книги, обнаружила, что в таблице они никак не отмечены цветом, а на странице самой книги отмечено, что она вычитывается.
Киньте в меня, пожалуйста, книжкой, которую нужно вычитать.
Отв: Вычитка #5 (2010-I)
К сожалению, вряд ли кто-то сумеет Вам точно указать такую книгу.
Попробуйте подобрать себе что-нибудь интересное здесь: http://lib.rus.ec/stat/tot, полистав файлы в форматах doc, rtf, txt.
Читайте и правьте заодно. :)
Но заранее сказать, что книга нуждается в вычитке, никто не сможет.
Ой, вспомнила! Вдруг Вам будет интересно:
http://lib.rus.ec/a/36186
Нужно вычитать оба doc-файла.
При этом нужно удалить номера страниц, проставить сноски (если они есть). Сноски можно проставить либо при помощи инструментов Word'a (постраничные сноски), либо поставив их в фигурные скобки за словом, к которому они относятся.
Нужно также провести небольшое форматирование - выделить заголовки и стихи.
Заинтересовала Вас такая работа? :)
Отв: Вычитка #5 (2010-I)
Взяла бы на вычитку вот эту книгу http://lib.rus.ec/b/170065 "Сереброкрыл". Только не понимаю как ее взять. Скачать не могу (хочет абонемент или пользу), а кнопки чтения нет.
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
Отв: Вычитка #5 (2010-I)
Сегодня еще читала Сергея Лукьяненко не помню точно как называется (что-то вроде "Беседы с дьяволом"). Он в фб2 (я с ним не работаю, пока), но в нем есть опечатки, неверные окончания и пропущенные запятые. Если мне не нужно вставлять никаких тегов (так, по-моему, это нзывается), я могу поправить текст и залить его заново?
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
по ссылке открывается пустая страница
Отв: Вычитка #5 (2010-I)
Пришлите мне в личку свой мэйл, я Вам вышлю.
Отв: Вычитка #5 (2010-I)
после того, как выслала мейл, смогла открыть страницу и скачать оттуда. Начинаю читать. Отметьте.
Отв: Вычитка #5 (2010-I)
В таблице этой книге нет. А на странице редактирования Вы можете самостоятельно отметить: в графе "доп. инф." проставьте "вычитывается". Или Вы и конвертировать будете? Тогда можно поставить "конвертируется".
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готова заняться Иосиф Бродский Стихи (2) http://lib.rus.ec/b/9097 разобраться в перемешанных стихах, отформатировать
а также Иван Бунин Дневники 1939-1945 годов http://lib.rus.ec/b/177214 вычитать, сделать структуру, расставить сноски
Отв: Вычитка #5 (2010-I)
Отлично! Занесла в таблицу.
Если Вы на странице редактирования книги сделаете пометку, тоже не помешает. ;)
Отв: Вычитка #5 (2010-I)
Взял на конвертацию в фб2 и вычитку книгу Руперта Шелдрейка "Новая наука о жизни" - http://lib.rus.ec/b/180809
Отв: Вычитка #5 (2010-I)
Взял на конвертацию и вычитку "Поколение свиней" Хантера Томпсона - http://lib.rus.ec/a/20018
Отв: Вычитка #5 (2010-I)
Добрый вечер! Отметьте пожалуйста в таблице, что Иосиф Бродский Стихи (2) вычитан.
:)
Отв: Вычитка #5 (2010-I)
Отметила. Спасибо!
Отв: Вычитка #5 (2010-I)
Отметьте, плиз. Взялся поправить массу ошибок в книге Стивена Кинга "Кэрри": http://lib.rus.ec/b/140451. Сравню с бумажным изданием
Хотел посоветоваться, как сделать лучше: Фактически книга состоит из трех частей, соответственно три секции. Примерно 30-40% книги составляют выдержки из книг, газет и т.д., выделенные тегом cite + внутри курсив или bold. В бумажном издании курсив и bold присутствуют также.
Вопрос у меня заключается в следующем: бегло вычитываю книгу с КПК в AlReader-е и то, что выделяется тэгом cite, да еще с дополнительным курсивом и bold-ом внутри выглядит, мягко говоря аляписто... Есть задумка назначить пустые строки подзаголовками, оставить выделение жирным и курсивом, а вот тэг cite снять - ИМХО, подобное форматирование книги будет выглядеть намного читабельнее и нагляднее, нежели просто выделение тэгом цитаты...
Отв: Вычитка #5 (2010-I)
Подождите, подождите. Я тоже читаю на КПК AlReader'ом и цитаты (cite) выглядят прекрасно. Все стили настраиваются под вкус читателя. Размер, цвет, начертание, отступы и т.д. Например, cite выделяется только цветом и отступами (можно и другим шрифтом), а курсив и bold на этом фоне ничего не портят.
Удалять стилевую разметку совершенно нет никакой необходимости! К тому же подзаголовки (subtitle), поставленные для пустых строк, улетят в FBE при первой же обработке скриптами.
В общем, я бы не советовал.
Отв: Вычитка #5 (2010-I)
Спасибо за замечания. Поэтому прежде и спросил, прежде чем действовать.
Тогда оставляю расстановку тэгов as it и правлю орфографию, расстановку абзацев, добавляю курсив, там, где он отсутствует. Все по бумажному изданию. В воскресенье выложу результат.
Кстати, видел в таблице Волки Кальи того же Стивена Кинга: http://lib.rus.ec/b/67272 Книга вроде бы как в работе с 23.02.09. Если актуально, могу взять на себя - опять же есть бумажный вариант книги, есть по чему править...
Отв: Вычитка #5 (2010-I)
<cite> не удалять ни в коем случае, если это цитаты!
курсив внутри цитаты не нужен, т.к. обычно в печатной книжке для того и выделяют курсивом, чтобы читатель понял, что это цитата! Если там все цитаты выделены и курсивом и болдом, то тогда IMHO, имеет смысл убрать курсив и болд, а вот <cite> лучше оставить.
Отв: Вычитка #5 (2010-I)
papamuller. Раз уж переделываете, найдите обложку покрасивее и русскую и иностранную, в сети их, как грязи. И хорошо-бы выходные данные русской книги в Дескрипшн и автора, название и год написания на английском. А так-же переводчика:) Не много прошу?:)
Отв: Вычитка #5 (2010-I)
Igorek67 Description уже заполнил - я обычно с него начинаю работу. Все данные внес. А обложку... Тогда попутный вопрос - если указывается ISBN книги, издательство ее выпустившее, допустимо ли замена обложки? У меня бумажный вариант в этом же исполнении, разве что цветопередача отличается? Можно ли здесь позволять какие-то вольности, или данные должны стыковаться: ISBN - аутентичная обложка бумажного издания?
Отв: Вычитка #5 (2010-I)
Да должны стыковаться. Если есть бумажный вариант, то лучше конечно обложку самому отсканить и сделать скажем 400 пикселей по горизонтали. Гораздо лучше, чем обложка с Оzona к примеру, где по горизонтали 200.
Сам я ставлю обложку и ISBN по одному изданию, а если есть поинтереснее обложка тоже кладу обычно в файл, как и иностранные, если есть. Уж у Кинга то есть:)
Отв: Вычитка #5 (2010-I)
papamuller, если будете добавлять иностранную обложку - не подцепляйте ее в дескрипшен как обложку (сайт именно ее и выберет для демонстрации на странице книги), разместите иллюстрацией в конце книги.
Отв: Вычитка #5 (2010-I)
Zadd, Нет, тэг цитаты оставляю точно. Часть книги сделана просто в виде отсыла к другим источникам - они как раз и цитируются. С курсивом там я разобрался - вместо него должны стоять обычные кавычки, так что спокойно их заменяю. В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом. Смотрится очень даже, конечно. Ну а у fb2 инструментарий победнее, это понятно.
Igorek67, сделал бы это с удовольствием, был бы сканер в наличии. Но в этом году прикуплю обязательно.
Ronja_Rovardotter, спасибо за совет!
Да, собственно, спасибо всем помогающим здесь в теме таким вот "чечако" как я
Отв: Вычитка #5 (2010-I)
Уменьшенный шрифт можно делать при помощи тегов sub или sup.
Отв: Вычитка #5 (2010-I)
sub и sup не всеми читалками поддерживаются, а cite и есть cite, зачем его еще как-то особо выделять? Каждый читатель может настроить его вид у себя так, как ему нужно. Разве нет?
Страницы