Вычитка #5 (2010-I)

Теперь главная тема по вычитке здесь.

Архив тем:
1. 2008-I
2. 2008-II — 2009-I
3. 2009-II
4. 2009-III

таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA

Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: http://lib.rus.ec/stat/document-author/rusec. Книги из этого списка нуждаются в доработке: форматировании и вычитке.

Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе.

Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке http://lib.rus.ec/stat/tot и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования.

Присоединяйтесь к нам! :)
Обращение golma1'ы:

golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"!

Тем, кто не знаком с форматом fb2, рекомендую вначале заглянуть в эту книгу. Здесь в популярной форме даются описания и разъяснения основных моментов этого формата. Если вдруг что-то окажется непонятным, всегда можно обратиться с вопросом в форум, вам обязательно помогут. Нужные для работы с fb2-файлами программы вы найдёте здесь.

Книги, сделанные в fb2 и нуждающиеся в вычитке, следует и вычитывать в этом формате. При конвертировании файла в текстовый формат неизбежно теряются ценные детали форматирования, восстановить которые впоследствии если и возможно, то очень трудоёмко.

Под вычиткой подразумевается:
1. Исправление ошибок OCR.
2. Форматирование текста:
- разбиение текста на части, главы, подглавы (секции и вложенные секции, тэги title и subtitle)
- выделение жирным и наклонным шрифтом (тэги strong и emphasis)
- проставление разделений в тексте (тэг empty-line)
- проверка скриптами
3. Заполнение дескриптора (обложка, аннотация, выходные данные книги)
4. При необходимости конвертирование в fb2-формат.

Для вычитки можно пользоваться читалкой AlReader Vobis Edition или редактором FictionBookEditor. Ссылки на обе программы были даны выше.
В самом крайнем случае, файл fb2 можно открыть текстовым редактором, сохраняя при этом все тэги. В этом случае, если изменения вносятся только в текст, форматирование сохраняется.

Убедительная просьба - не конвертировать fb2-файлы в текстовый формат. Не забывайте, что fb2 является предпочтительным форматом нашей библиотеки и книги следует заливать, по возможности, в нём. И уж во всяком случае, не стоит заменять формат fb2 другим форматом.

Если почему-то вам не хочется разбираться в формате fb2, берите на вычитку книги, представленные в библиотеке в текстовом формате. Их можно заливать в том виде, в каком вы их скачали.
Также можно брать файлы в форматах djvu или pdf и распознать их в текстовый формат. Однако это касается преимущественно художественной литературы, т.е. произведений, состоящих в основном из текста. Книги с множеством иллюстраций, таблиц, формул лучше оставить в том виде, в каком они есть.

Если я что-то упустила или невнятно сформулировала, спрашивайте. :)

Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
Они помогут Вам разобраться в пользовании самой распространённой программой FBE.
Всем привет! :)

Пытаюсь поставить метку "вычитывается" на "Мечту на поражение" Калугина. Выдаёт, что файл и так достаточно хорош. Значит ли это что нельзя будет залить исправленную версию? (файл всё же недостаточно хорош)

Можете на страничке книги зайти в "Исправить" и в доп.поле названия книги прописать что-то по типу "вычитывается, ник-нэйм" (клик на "сохранить новое название"). Вычитав файл, не забудьте отметить сей факт в хистори и *самое главное* увеличить номер версии ;-) Тогда заливка пройдет нормально.

Может это только у меня, но "исправить" эту книгу нельзя.
Тыц

Разблокировала, ставьте метку
Самое интересное, что ее никто не блокировал, но она оказалась заблокированной

Залита исправленная версия. К сожалению даже после корректировки заголовка (до этого и в оригинальном (http://lib.rus.ec/b/96853) файле был заглавными буквами, в остальном description бинарно совпадает), новой версией той же книги она почему-то не признана. Соответственно все комментарии в пролёте. Кто может - объедините.

Добрый день!
Прочитала часть серий классики фэнтези (Конана, Рыжую Соню с продолжениями). Местами плохо вычитана (куча ошибок OCR, пропуск слов и кусков текста). Сравнила с PDF: по-моему, вина издательства - те же ошибки. Могла бы привести в порядок серии, если интересно (не быстро, очень много книг).

Аватар пользователя Isais

Очхорошо.
Но не забывайте: исправлять надо ошибки OCR, орфографические и пунктуационные, а если в бумажном издании недописан абзац или потеряно предложение, восстанавливать пропуски не следует - для соответствия электронной книги бумажному изданию.
Разве что в Вашем распоряжении есть другое бумажное издание, в котором эти пропуски отсутствуют. Но тогда и в дескрипшне надо будет изменять данные на бумажное издание - что электронка соответствует вот этому, а не прошлому изданию.

Так в этом и беда. Серии одного издательства, у них же права на перевод, так что пропуски, конечно, не подлежат восстановлению. А ошибки OCR, грамматики и пунктуации заложены в самих PDF.

Здравствуйте, у меня вопрос по одной из книг из таблицы для вычитки, а именно: Ганс Фаллада - Каждый умирает в одиночку. В таблице в комментариях указано, что необходима вычитка, но после перехода по ссылке на книгу, указанной в таблице, в информации о книге я прочла, что она уже заменена на исправленную. Вот и вопрос: вычитка по ней все-таки нужна или нет?

Лично я её вычитал по сканам.
Если хотите вычитать ещё раз - ибо все мы несовершенны(с) - ад раба вэ ад раба, вышлю сканы.

ло, ло роце. ани битах, ше ата хаита кашув лэмадай=))))
З.Ы.: ошибок, наверное, наделала)))но, думаю, вы поняли))

Mazltov написал:
ло, ло роце. ани битах, ше ата хаита кашув лэмадай=))))
З.Ы.: ошибок, наверное, наделала)))но, думаю, вы поняли))

))) ло роца, ки ани бэтуха, шеата асита авода кмошецарих
А почему именно эту книгу именно Фаллады?
В принципе в библиотеке полно книг на вычитку. Но вычитывать ЖЕЛАТЕЛЬНО в фб2.

да в таблице на нее наткнулась - а мне интересна военная тематика, поэтому и выбрала. книг-то на вычитку полно, но выбрать что-то нелегко. Я после таблицы вот здесь http://lib.rus.ec/stat/document-author/rusec смотрела - многие недоступны для скачивания. о предпочтительном формате уже уяснила с первого поста в данной теме, спасибо за нопоминание=).

З.Ы.: ёйй, 2 с минусом моему ивриту))), ну, ничего. это поправимо, в конце-концов.

Mazltov написал:
да в таблице на нее наткнулась - а мне интересна военная тематика, поэтому и выбрала. книг-то на вычитку полно, но выбрать что-то нелегко. Я после таблицы вот здесь http://lib.rus.ec/stat/document-author/rusec смотрела - многие недоступны для скачивания. о предпочтительном формате уже уяснила с первого поста в данной теме, спасибо за нопоминание=).

З.Ы.: ёйй, 2 с минусом моему ивриту))), ну, ничего. это поправимо, в конце-концов.


Ну вам с вашим статусом только СИшные книги доступны( Хотя и на них можно полезность сколотить.
По мне Каждый умирает в одиночку - не военная книга, а вымученная Фалладой книга в стиле соцреализма, далёкая от всего его творчества. Аваль аль таам вэ рэах...
Даже не знаю, что и посоветовать. Хотя, почти каждую третью книгу, что я беру читать - вычитываю (ибо есть что исправить).

Обновлён http://lib.rus.ec/b/448184 "Гелиополь" Эрнста Юнгера.
Из неисправленного:
"Я заключал договор с землевладельцем, дававший право на создание артелей; у меня рвали куксы из рук." Наиболее близкие куски в данном случае не подходят по контексту. Речь должна идти либо об участке, либо о бумаге - праве на его использование.

"Новой, прогрессивной стала энергетическая валюта: в основе ее лежали энергетические мощности, что позволяло выражать ее в цифрах и определять ее курс по отношению к золоту. Ее базой было второе валютное хранилище энергией, — сравнимый разве что с подземными кладовыми таких полезных ископаемых, как уголь и нефть." Замена на энергион очень хороша, благо в книге энергия напрямую передаётся по воздуху (привет Тесле!). Но, так же как и у нас, энергию просто вырабатывать, предавать, потреблять, но не хранить (по крайней мере отключения энергии в городе во время бунтов были действенной мерой). То есть энергион - средство распределения, а не хранения энергии.

"Посидим поболтаем у камина за рюмочкой parenpuyre." Поисковики о таком вине не знают.

"По этой причине уже разделались с Гаагскими конвенциями, а потом и конференцию в Миннесоте объявили утопической." Возможно, эта конференция происходила только в том мире.

"Это майский мед, от взятка, за которым пчелы спускаются вниз на липы." Липа цветёт в конце лета (хотя опять-таки альтернативный мир и всё такое).

"— Кстати, мое почтение, отдаю должное донесению — я как раз видел, как эта штуковина летела над городом." Не помню никаких штук и чего-либо летающего в донесении де Геера. Возможно пропущена фраза.

Пытаюсь залить вычитку "Младшего брата" Кори Доктороу (оригинал http://lib.rus.ec/b/218864, вычитка http://lib.rus.ec/b/451745), библиотека принимает версию за новую книгу; похоже, повторяется история с Калугинской "Мечтой".

Аватар пользователя Isais

А зачем книгу http://lib.rus.ec/b/451745 удалили?
Библиотека правильно принимает файл за новую книгу. Потому что это физически новый файл. С тем же ID-ом - Вы же ИД файла не меняли?
Их всего лишь объединить надо, а не удаляьть-перезагружать!
UPD. Сравнил, восстановил, объединил. Порядок.

Isais написал:

А зачем книгу http://lib.rus.ec/b/451745 удалили?

Чтобы библиотеки-зеркала не стащили, пока не приведём в порядок, иначе у них книга сдублируется.
Isais написал:

Библиотека правильно принимает файл за новую книгу.

Нет. В подавляющем большинстве случаев новая версия воспринимается библиотекой именно как новая версия, с конфликтом версий(это норма) и последующей полной заменой.
Isais написал:

Их всего лишь объединить надо, а не удаляьть-перезагружать!

Имхо предлагаемое объединение - это по сути силовое слияние двух разных с точки зрения библиотеки книг. Вопрос в том, почему библиотека иногда так считает и не принимает новую версию как именно как версию.
Isais написал:

С тем же ID-ом - Вы же ИД файла не меняли?

Нет. Всегда специально проверяю исходный-конечный файл diff-ом от возможных сбоев при редактировании. В данном случае fb2-заголовки бинарно (за исключением версии, разумеется) совпадают.
Аватар пользователя Isais

afj написал:
Вопрос в том, почему библиотека иногда так считает и не принимает новую версию как именно как версию.
Существенным представляется только этот вопрос. Задать его друпальному роботу невозможно.
Надейтесь, что представитель оного на Земле под ником support когда-нибудь прочтет этот топик и сможет ответить.

Хватает ли этих двух случаев, чтобы служители ближнего круга нижайше бы посмели побеспокоить Его?

Аватар пользователя Isais

Промыслы Его неисповедимы, дела support-a многочисленны.
Молитесь Пробуйте, может, ответит. И мы даже поймем ответ...

NB Предыдущий тред перенести в раздел "Функциональность"


Обновлён "Младший брат" Кори Доктороу (http://lib.rus.ec/b/451745)
Из неисправленного:
Косяк перевода "Восьмиосный грузовик" (в оригинале 16-wheeler). На самом деле это "автопоезд", а на оси может быть и более двух колёс. (http://www.google.com/search?q=16+wheeler+truck) (http://en.wikipedia.org/wiki/Semi-trailer_truck) (для сравнения http://images.yandex.ru/yandsearch?text=%D0%B2%D0%BE%D1%81%D1%8C%D0%BC%D0%B8%D0%BE%D1%81%D0%BD%D1%8B%D0%B9%20%D1%82%D1%8F%D0%B3%D0%B0%D1%87&stype=image)
"Среди них встречаются и нормальные люди, например, приезжие из штатов, названия которых начинаются и заканчиваются на гласные буквы, отпускники." Штаты на гласные - явное недообъяснение переводчиком каких-то американских тонкостей (если что - это Idaho, Iowa, Alabama, Alaska, Arizona, Indiana, Ohio, Oklahoma - лично я связей не вижу).
"Apple ][+" написание верное (стилизованное два плюс).
"Так вот, вы берете один из этих двух ключей (все равно какой) и просто-напросто раскрываете его, рассекречиваете, делаете общеизвестным. Пусть о нем знает весь белый свет. Вот, собственно, почему этот ключ и называется «открытым»." Неверно, не всё равно какой. В асимметричной криптографии оба ключа по сути одно и то же, они выводятся друг из друга; другое дело, что в одну сторону этот процесс очень лёгок (например перемножение двух чисел), в другую - невероятно сложен (обратное разложение произведения на множители). Так что публичным надо делать именно "тяжёлый" ключ.
"И криптовойны завершились победой [хороших парней, когда 9th Circuit Appellate Division Court поста]новил, что компьютерный код является формой выражения, а следовательно, защищен Первой поправкой к Конституции: «Конгресс не должен издавать ни одного закона, ограничивающего свободу слова»." Явно виден пропуск и последующая вставка. Буквальный «Апелляционный суд девятого округа» ничего не даёт читателю, незнакомому с американской судебной системой ("Чем хорош/плох/известен - типа нашего Басманного суда - подчинён ли он восьмому либо десятому округу..." и так далее). Посему заменён на "Апелляционный суд высшей инстанции" (это действительно так, приговоры окружных апелляционных судов можно оспорить только в Верховном суде).

Разблокируйте, пожалуйста, для редактирования "Пересмешника" Ли http://lib.rus.ec/b/210220

Аватар пользователя Isais

Зачем? Вы нашли в этом файле 10 (минимум 10) орфографических ошибок? или 20 (минимум 20) пунктуационных?

Именно.

Аватар пользователя Isais

Разблокировано.

Залито http://lib.rus.ec/b/453829. Добавлены некоторые комментарии из издания 86г, по нему же правки.
Не исправлены "глазные зубы" - явный косяк переводчиц. Eyetooth - это верхний клык.

Аватар пользователя Isais

afj написал:
Не исправлены "глазные зубы" - явный косяк переводчиц. Eyetooth - это верхний клык.

???
Никогда не слышали русского выражения "глазной зуб"? И даже "Понедельник начинается в субботу" не читали?
Цитата:
«Правый глазной (рабочий) зуб графа Дракулы Задунайского»

Тогда Гугль в помощь:
Клык - м. зуб, между резцами и коренными, у человека глазной зуб, которых четыре, но верхние два собственно глазные, нижние два клыки. (Толковый словарь Даля)
Придется спросить: может быть, Вам не стоит заниматься исправлениями - учитывая эрудицию?

Обновлена "Обитаемый остров Земля" Склярова http://lib.rus.ec/b/457547
Из неисправленного осталась цунами женского рода, принято за авторский замысел, так как встречается десятки раз.
"Упихивание" книги в пресловутые десять мегабайт с пережиманием иллюстраций в данном случае очень плохо: многие картинки с мелкими деталями типа клинописи или пиктографии стали просто нечитабельны.

afj написал:
"Упихивание" книги в пресловутые десять мегабайт с пережиманием иллюстраций в данном случае очень плохо: многие картинки с мелкими деталями типа клинописи или пиктографии стали просто нечитабельны.

Ограничение в 10 Мб действует при заливке по пп. 1 и 3, а если это делать через FTP (пп. 2 и 4), то можно заливать уже до 20 Мб.
Если же нужно добавить что-то бо́льшее, обращайтесь к библиотекарям.

На сайте автора оригинальные иллюстрации в сумме весят весят ~26 мегабайт. В фб2 это все 35 получится.
Всякие мобильные читалки такое переварят?

Да кто его знает?
Но можно сделать 2 варианта, например. С большими иллюстрациями и так себе.
Или приложить их отдельно.
Есть и такие примеры: http://lib.rus.ec/s/34316

ftp://lib.rus.ec/Sklyarov_Obitaemyiy_ostrov_Zemlya.7z
(кстати под 12й оперой авторизация не работает)
Книга получилась 26МБ. Alreader и FBreader открывают нормально.

C Вашего позволения, я пошаманю немножко над файлом?
Потом залью от Вашего имени.

upd.
Пошаманил. Перевел иллюстрации из inline в обычные и поправил кое-что по мелочи.
Залил: http://lib.rus.ec/b/457788

По горячим следам обновлена "Оттепель" Эренбурга http://lib.rus.ec/b/468011

Из неисправленного:
Имеет ли смысл добавлять комментарии для современного читателя? например кто такой Мосаддык.

"Нельзя не отметить глубоко реалистических панно художника Пухова, выполненных ..." Здесь не родительный падеж, а винительный, то есть должно быть "реалистические ... выполненные". Но это внутритекстовая цитата и, возможно, по дореформенным правилам фраза верна; не исключена и намеренная ошибка автора.

"И Горохова попросил: "Никому не рассказывайте"... Я не на экран работаю, как Демин. Хочу, чтобы лучше было, и только..." Непонятно что за экран.

afj написал:
"И Горохова попросил: "Никому не рассказывайте"... Я не на экран работаю, как Демин. Хочу, чтобы лучше было, и только..." Непонятно что за экран.

Чуть выше: "...А ему лишь бы позировать. Он и со мной разговаривал, как будто он на трибуне..." - в представлении Трифонова Демин живет для того, чтобы когда-нибудь попасть в "Новости", те, что показывали в кинотеатрах перед фильмом.
на экран = на камеру

Обновлена "У войны не женское лицо" Алексиевич. http://lib.rus.ec/b/483237
Сомнительное и неисправленное:
В.П.Максимчук в воспоминаниях себя называет Ивановой. Понятно, что это девичья фамилия, но автору в описании рассказчицы лучше было бы указать двойную фамилию.

КПРБ - неверное написание. Было либо КПБ - Коммунистическая партия Белоруссии, либо КП(б)Б.

По тексту везде БЕндера и бЕндеровцы. Правильно через а.

"— Азимут — пятнадцать ноль-ноль. Угол возвышения — десять ноль. Взрыватель сто двадцать, тем десять!" Непонятно что за тем.

Село Афоневка либо Афроневка Курской области. К сожалению, обоих вариантов на современных картах нет.

"Помню, у меня все пропитывалось кровью — до, до, до… Тапочки мои порвались, уже шла босиком." До чего?

Аватар пользователя Isais

Могу объяснить последнее.
Запись устной речи.
Последите внимательно за собой и окружающими: часто ли в устной речи договариваете предложение до конца? Особенно в эмоционально напряженной ситуации?
И здесь - женщина рассказывает о потрясшем ее событии и не может подобрать подходящих слов, поэтому не договаривает.
Знаете выражение "нет слов"? Так это вот о таком.

Обновлена "Смерть особого назначения" Романова
http://lib.rus.ec/b/491727
Есть кусок с явным сбоем сканирования или редактирования. У кого есть бумажная версия - исправьте.

"...Негромко чавкнула жижа, зашипели пузырьки, тонкой струйкой поднимаясь со дна неглубокой грязевой лужи: спецназовец с последнего планера безмятежным островом, залитым светом ярких прожекторов."

Обновлена "Воспоминания о войне" Никулина https://lib.rus.ec/b/497761 и удалена ветка дубликата.

Авторские ошибки в тексте:
"Я вспоминаю другую картину, открывшуюся мне тоже с семиэтажной высоты. Однажды летом 1943 года мы сидели среди густых ветвей высокой ели на деревянном помосте, укрепленном почти у макушки дерева. На стволе были прибиты планки, заменявшие лестницу, по которой мы карабкались наверх. Это был наблюдательный пункт артиллерийского полка, километрах в полутора от передовой, с которого открывалась широкая панорама окрестностей. Синее небо расстилалось над нами. Светило солнышко. Сосна слегка покачивалась, ветви ее скрипели и распространяли аромат смолы."
То ель, то сосна.



"Так началось 7 апреля 1944 года — день, когда мне стукнул 21 год.
...
Наступление продолжалось. Армия продвинулась клином вперед, почти дошла до реки Великой, но немцы усилили сопротивление. Мы вылезли в вершину клина, в только что взятую деревню Оленино. Здесь начался ад. Немецкие орудия безостановочно лупили с трех сторон — с фронта и с флангов. Непрерывно налетали на нас пикирующие бомбардировщики. В каменных фундаментах разрушенных домов рвались подожженные патроны и снаряды — там был наш склад. С жутким воем проносились танковые снаряды: по нам палил новейший немецкий танк «Тигр». Его семиметровая пушка вышвыривала снаряды со страшной силой. "
Во-первых, к 44му Тигр уже два года как не был "новейшим", а во втовых, непонятно что имелось в виду под "семиметровой пушкой": тут либо калибр- 88мм, либо длина орудия- 5м (88мм*56кал).

Доброго вам дня!
Посмотрел эту тему (в библиотека столько интересного - работы на года). Хочу взять в работу эту книгу из таблицы:
А. Л. Никитин Основания русской истории http://lib.rus.ec/b/119856 расставить сноски, вычистить мусор, полностью создать структуру

Скачал и начну вычитывать, отметить бы в таблице.

Аватар пользователя Isais

А Вы не заметили, что первая половина этого файла уже давно - года два как - исправлена на вполне качественный https://lib.rus.ec/b/329391 ?
Так что плотно заниматься надо второй частью, после "Итогов и перспектив", а первую можно вложить в файл из указанного https://lib.rus.ec/b/329391.

Цитата:
Доброго вам дня!
Посмотрел эту тему (в библиотека столько интересного - работы на года). Хочу взять в работу эту книгу из таблицы:
А. Л. Никитин Основания русской истории http://lib.rus.ec/b/119856 расставить сноски, вычистить мусор, полностью создать структуру

Скачал и начну вычитывать, отметить бы в таблице.


Таблица очень давно не обновлялась, и ориентироваться на нее не стоит.
Цитата:
Книга 119856 заменена на исправленную

Проверьте на Либрусеке - книга уже вычитана.

Я добавил уже две книги в формате fb2 сделанных мной, но ни где не отмечался просто делал и закачивал в библиотеку. Тут что ведутся какие-то списки о том, кто что сделал?!

Цитата:
Я добавил уже две книги в формате fb2 сделанных мной, но ни где не отмечался просто делал и закачивал в библиотеку. Тут что ведутся какие-то списки о том, кто что сделал?!

https://lib.rus.ec/stat/added/Andersen1313

Я имел ввиду, есть списки кто что вычитал? распознал? или нет? Мне как бы не принципиально))) Просто в следующий раз, если я захочу какую-то книгу распознать, надо в доп. информации написать вычитывается? Чтобы ни кто не взялся за тоже самое?

Здесь https://lib.rus.ec/ocr создать учетную карточку (см. внизу страницы). Все, кому надо, будут видеть ход процесса.

tvnic написал:
Здесь https://lib.rus.ec/ocr создать учетную карточку (см. внизу страницы). Все, кому надо, будут видеть ход процесса.

Мнэ...
Это карточки OCR (новых книг), а не вычитки существующих.

XtraVert написал:
Цитата:
Я добавил уже две книги в формате fb2 сделанных мной, но ни где не отмечался просто делал и закачивал в библиотеку. Тут что ведутся какие-то списки о том, кто что сделал?!

https://lib.rus.ec/stat/added/Andersen1313
Цитата:
Эта страничка доступна только библиотекарям, извините.
Библиотекари об этом иногда забывают, но Вы можете посмотреть Статистика/Моя работа

Zadd написал:
Библиотекари об этом иногда забывают, но Вы можете посмотреть Статистика/Моя работа

почему-то после заливки первого (неправлиьного) рисунка не даёт залить другой, можно только удалить рисунок, а при прикреплении лругого рисунка вместо прикрепления получается восстановление ранее залитого, который я уже удалил.

Страницы

X