Расширение для сканирования документов. Форматы файлов сканированных документов и их характеристика

Twitter

Сканирование документов и создание электронного архива могут занять у Вас длительное время, но, поверьте, это того стоит! Ведь грамотное сканирование позволяет пользоваться документами в электронном виде, а для бумажных носителей предусмотреть внеофисное хранение документов. Представьте, сколько офисного пространства Вы могли бы сэкономить!

Сканирование документов и создание электронного архива подразумевает три шага:

Шаг 1. Подготовка.

одного размера и в хорошем состоянии можно воспользоваться автоматическим устройством подачи документов. Кроме того, использование этого устройства при двусторонней печати поможет Вам существенно сэкономить время при сканировании документов.

Обязательно удалите все скобы и скрепки, разгладьте все загибы и складки на документах, чтобы избежать замятия бумаги в процессе сканирования.

Сканирование документов нестандартного размера нужно сканировать вручную.

Шаг 2. Выбор формата файлов.

Приступая ко второму шагу в процессе сканирования документов и создания электронного архива, задумайтесь, хотите ли Вы в будущем иметь возможность редактировать файлы в электронном архиве. Если Вы не собираетесь изменять отсканированные документы, сохраняйте их в формате PDF (Portable Document Format). В свою очередь, оптическое распознавание символов (OCR) позволяет сохранять документы в редактируемых форматах. При сканировании документов с OCR с расширением.RTF или.DOC, или с другим расширением, соответствующем приложению, которое Вы будете использовать для редактирования документа.

Итак, при сканировании и сохранении документов выберите один из следующих форматов:

Portable Document Format (PDF) – формат сохраненных файлов, позволяющий просматривать документы электронного архива на различных компьютерных платформах вне зависимости от шрифтов и программного обеспечения, использованных для создания оригинала.
Tagged Image Файл Format (TIFF) – формат высокого качества поддерживается в большинстве операционных систем, идеально подходит для сканирования и архивирования документов или чертежей, которые в дальнейшем можно будет изменять с помощью программ-редакторов изображения, таких как Adobe Photoshop.
Документы Microsoft Word (. DOC) или Microsoft Rich Text Format (. RTF) – цифровые текстовые форматы поддерживаются во всех операционных системах и позволяют также не допустить изменения документов.

Заключительный этап

Шаг 3. Хранение.

Закончив сканирование документов, Вы переходите к завершающему этапу создания электронного архива – передаче файлов на свой компьютер или другие устройства хранения информации. Для удобства можно воспользоваться специальными утилитами для создания электронного архива, или записать несколько DVD или CD дисков с отсканированными документами. Помните про резервные копии файлов электронного архива – они пригодятся в случае поломки компьютера.

BMP (от англ. Bitmap Picture) - формат хранения растровых изображений, разработанный компанией Microsoft. Файлы формата BMP могут иметь расширения.bmp, .dib и.rle.

С форматом BMP работает огромное количество программ, так как его поддержка интегрирована в операционные системы Windows и OS/2. Кроме того, данные этого формата включаются в двоичные файлы ресурсов RES и в PE-файлы. В данном формате можно хранить только однослойные растры. На каждый пиксель в разных файлах может приходиться разное количество бит (глубина цвета). Microsoft предлагает битности 1, 2, 4, 8, 16, 24, 32, 48 и 64. В битностях 8 и ниже он указывается индексом из таблицы цветов (палитры), а при больших непосредственным значением. Цвет же в любом случае можно задать только в цветовой модели RGB (как при непосредственном указании в пикселе, так и в таблице цветов), но в битностях 16 и 32 можно получить Grayscale с глубиной до 16 и 32 бит соответственно. Частичная прозрачность реализована альфа-каналом различных битностей, но при этом прозрачность без градаций можно косвенно получить RLE-кодированием.

В большинстве случаев пиксели хранятся в виде относительно простого двумерного массива. Для битностей 4 и 8 доступно RLE-кодирование, которое может уменьшить их размер. Формат BMP также поддерживает встраивание данных в форматах JPEG и PNG. Но последнее скорее больше предназначено не для компактного хранения, а для обхода ограничений архитектуры GDI, которая не предусматривает прямую работу с изображениями отличных от BMP форматов.

GIF (англ. Graphics Interchange Format - «формат для обмена изображениями») - популярный формат графических изображений. Способен хранить сжатые данные без потери качества в формате не более 256 цветов. Не зависящий от аппаратного обеспечения формат GIF был разработан в 1987 году (GIF87a) фирмой CompuServe для передачи растровых изображений по сетям. В 1989-м формат был модифицирован (GIF89a), были добавлены поддержка прозрачности и анимации. GIF использует LZW-компрессию, что позволяет сжимать файлы, в которых много однородных заливок (логотипы, надписи, схемы).

JPEG (произносится «джейпег » , англ. Joint Photographic Experts Group , по названию организации-разработчика) - один из популярных графических форматов, применяемый для хранения фотоизображенийи подобных им изображений. Файлы, содержащие данные JPEG, обычно имеют расширения (суффиксы) .jpg ,.jfif , .jpe или .jpeg . Однако из них .jpg является самым популярным на всех платформах. MIME-типом является image/jpeg.

PNG (англ. portable network graphics , сокращение произносится по-английски /pɪŋ/ ) - растровый формат хранения графической информации, использующий сжатие без потерь по алгоритму Deflate.TIFF (англ. Tagged Image File Format ) - формат хранения растровых графических изображений. TIFF стал популярным форматом для хранения изображений с большой глубиной цвета. Он используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. TIFF был выбран в качестве основного графического формата операционной системы NeXTSTEP и из неё поддержка этого формата перешла в Mac OS X. Формат был разработан Aldus Corporation в сотрудничестве с Microsoft для использования с PostScript. Компания-владелец спецификаций - Aldus Corporation - впоследствии объединилась с Adobe Systems, владеющей в настоящее время авторским правом на эти спецификации .

Изначально формат поддерживал сжатие без потерь, впоследствии формат был дополнен для поддержки сжатия с потерями в формате JPEG .

DjVu (от фр. déjà vu - «уже виденное») - технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов - книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценноераспознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д.

Изначально технология была разработана Яном Лекуном, Леоном Боту и Патриком Хеффнером в AT&T Labs с 1996 по 2001 годы. DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлятьполнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области - ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

Что такое TWAIN?

TWAIN - стандартный протокол и интерфейс (API), определяющий взаимодействие между программами и устройствами захвата изображения, такими как сканеры и цифровые камеры.

Поскольку TWAIN не является протоколом аппаратного уровня, производитель устройств для получения изображений может предоставлять TWAIN-совместимый драйвер. Таким образом, становится возможным захват изображений не только со сканеров, но и некоторых веб-камер, не только при помощи Video for Windows, DirectShow или WIA, но и через TWAIN. Благодаря открытости стандарта становится возможным использование оборудования с программным обеспечением сторонних поставщиков, например камер для микроскопических систем Leica Microsystems (англ.).

В процессе работы используется несколько абстракций: англ. Data source manager, управляющий всеми доступными в системе TWAIN-совместимыми устройствами и англ. Data source object для каждого отдельного устройства, отвечающий за передачу и настройки захвата получаемого кадра.

Взаимодействие клиентского приложения и устройства можно представить следующим образом:

Диалог выбора устройства захвата (Data source manager)

Открытие источника данных (Data source) и настройка параметров захвата, с установкой разрешения изображения, разрядности и пр.

Клиентское приложение опрашивает устройство. Доступны два механизма: опроса и callback. В последнем случае устройство само сообщает о готовности изображения для передачи.

Собственно передача данных от DS. Существует несколько механизмов передачи:

Native - в Windows это Device independent bitmap в памяти

Memory - блоки пикселей в буферах памяти

File - DS записывает изображение непосредственно в файл (не обязательно поддерживается)

Закрытие источника данных

В фотоархиве у любого фотографа хранятся фотографии, напечатанные на бумаге. Для того чтобы их эффективно хранить или использовать для каких-либо целей, их нужно оцифровать при помощи сканера. Для этого надо знать, как правильно сканировать и сохранять такие фотографии.

Правильно сканировать фотографии нужно сразу, так как может больше не быть такой возможности. Ошибки сканирования могут Вам обойтись дорого, особенно если речь идет о сотнях и тысячах фотографий. О том, как правильно сканировать фотографии и пойдет речь дальше.

Сканировать фотографии можно самому, а можно доверить специалисту в ближайшей фотолаборатории, но в любом случае нужно понимать, как и для каких целей, Вы будете сканировать свои фотографии. Для разных целей это делается по-разному. Выбор цели сканирования фотографий – это первый этап, с которого сканирование начинается.

Цели сканирования фотографий

Цели сканирования фотографий могут быть разными. В зависимости от того как после сканирования будут использоваться фотографии, зависят настройки сканирования – разрешение, глубина цвета, формат хранения фотографий. Правильное сканирование фотографий это всегда поиск компромисса между настройками, от которых зависит качество и размер будущей цифровой фотографии.

Рис.1 Оцифровка семейного фотоальбома это одна из самых популярных целей для сканирования фотографий.

Целями для сканирования фотографий могут быть:

1. Перевод фотографий в цифровой вид для эффективного хранения
2. Реставрация старых фотографий из семейного фотоальбома
3. Копирование фотографий у кого-либо или для кого-либо
4. Создание музыкального слайд-шоу из фотографий
5. Увеличение размера фотографии или ее части
6. Печать фотокниги из своих фотографий
7. Просмотр на каком-либо устройстве
8. Пересылка по электронной почте
9. Размещение в сети Интернет
10.Универсальное хранение

Это 10 основных целей сканирования фотографий, из которых видно то, что в каждом таком случаи фотографии нужно сканировать по-разному. Например, в случаях 1,2,5,10 фотографии должны иметь максимальное качество. В случаях 3,4,6,7 качество должно быть строго ограниченным, а в случаях 8,9 размер файла должен быть минимальным.

Кроме этих 10 целей, конечно, есть и другие, но эти встречаются очень часто и они наглядно показывают, как сильно могут отличаться файлы и размеры цифровых фотографий после их сканирования. Конечно же, все фотографии можно сканировать с максимальным качеством, но тогда их размер будет очень большим, что потребует дополнительных ресурсов.

При сканировании фотографий актуально выражение «Цель определяет средства». От того как правильно будет поставлена цель, будут зависеть время потраченное на дополнительные операции и деньги потраченные на хранение ненужных объемов информации. Выбор цели сканирования это залог того, что Вы будете правильно сканировать свои фотографии.

После того как будет выбрана цель для которой Вам нужно сканировать фотографии, эти фотографии нужно подготовить для сканирования. Это второй важный этап в сканировании фотографий, который поможет Вам значительно сократить общее время сканирования большого количества фотографий и сделать сам процесс сканирования менее утомительным.

Подготовка фотографий к сканированию

Если нужно отсканировать одну или несколько фотографий, какой-либо особой подготовки для этого не надо. Но если стоит задача оцифровать большой фотоархив, тогда без сортировки фотографий Вам не обойтись. Чем больше фотографий надо сканировать, тем тщательней их для этого нужно готовить (рис.2).

Рис.2 Перед сканированием фотографий их нужно разделить на характерные группы по общему признаку.

Перед тем как сканировать большое количество фотографий, сначала их нужно собрать в отдельную стопку. После этого они делятся на группы, для которых характерны одинаковые настройки. Это могут быть размер, ориентация, разрешение, глубина цвета или что-то еще. Сканер удобнее перестраивать под группу фотографий, а не под каждую из них.

Процесс сканирования большого числа фотографий чем-то напоминает работу конвейера. Берем из стопки фотографию, загружаем ее в сканер, нажимаем кнопку, сканируем, извлекаем фотографию и так повторяется со всеми фотографиями. Чем меньше Вы отвлекаетесь от этих действий, тем быстрее закончите сканировать свои фотографии.

Для того чтобы максимально увеличить общую скорость сканирования фотографий, их можно сканировать сразу по несколько штук. Для этого в сканере нужно разместить не одну фотографию, а например, сразу три или четыре. Проблема только в том, что потом их придется вырезать из общего файла.

Если сканирование фотографий выполняется на «автопилоте», попутно можно смотреть видео, слушать музыку или заниматься чем-то еще, что этому не мешает. Для того чтобы сканировать фотографии непрерывно, надо выполнить третий этап – правильно настроить сканер, учитывая те рекомендации о которых говорилось выше.

Настройка сканера для сканирования

Для сканирования фотографий лучше всего иметь планшетный с пометкой «Photo». Такой сканер имеет специальную программу-драйвер для работы с фотографиями. Сканировать фотографии удобнее сразу из этой программы (рис.3), но можно и в других программах как, например Adobe Photoshop или XnView.

Рис.3 Сканировать фотографии удобнее с помощью программы-драйвера сканера.

Независимо от марки сканера самый главный параметр, который нужно правильно выбрать, это разрешение будущей фотографии. Выбирать его надо для какой-то одной цели, о которых говорилось выше. Чем больше разрешение, тем качественнее изображение, но при этом и размер файла фотографии будет больше. Важно выбрать оптимальное разрешение.

Оптимальным разрешением сканирования фотографий для печати ее на бумажном носителе считается 300 пикселей на дюйм. Это при условии, что печать осуществляется в масштабе 1:1. Если при печати фотография будет увеличена в два раза, то и разрешение сканирования должно быть увеличено в два раза.

Печать фотографий на бумаге является своего рода ориентиром. Это то максимальное качество, которое требуется для просмотра фотографий. Для просмотра другого типа фотографий такого качества не нужно как, например, для просмотра с экрана монитора или телевизора.

Если говорить о формате, в котором надо сохранять файлы фотографий при сканировании, то для этого есть два основных графических формата и . Правило по их применению очень простое. Для сохранения максимального качества изображения – TIF, в других случаях – JPEG.

Сканирование фотографий – это популярный способ пополнения своего фотоархива цифровыми фотографиями, но есть и другие. О них читайте в следующих главах этой статьи:

Сканеры поставляются в трех основных форматах: скользящие, ручные и планшетные. Сканеры могут обеспечивать или только монохромный режим или цветной режим сканирования. Стоимость сканеров может отличаться существенно в зависимости от типа и характеристик, поэтому пользователи выбирают нужный вариант сканера исходя из решаемых ими задач.

Одной из важных характеристик сканера является разрешение, характеризующееся количеством точек на один дюйм изображения (dpi - dot per inch). Более простые сканеры дают разрешение от 300 до 600 dpi, более качественные - до 1200 dpi. Для выполнения полиграфических работ используются профессиональные сканеры, дающие большее разрешение, но и стоимость таких сканеров достаточно высока. Если пользователь ориентируется на получение изображений для экрана монитора, например, для подготовки материалов для Web-страниц, то ему достаточно иметь недорогой сканер с невысоким разрешением.

Следует заметить, что с помощью сканеров помимо сканирования графических образов можно сканировать и распознавать тексты. Большие возможности предоставляют, например, современные средства Microsoft Office. В этот пакет включена программа Microsoft Office Document Imaging, которая позволяет:

Сканировать документы, состоящие из одной страницы или из нескольких страниц.

Выполнять распознавание текста.

Копировать и экспортировать распознанный текст в Word.

Обнаруживать текст в отсканированных документах.

Распознавать страницы отсканированного документа так же просто.

Отправлять отсканированные документы по электронной почте.

В действительности Microsoft Office Document Imaging состоит из двух компонентов: Microsoft Office Document Scanning и Microsoft Office Document Imaging.

Первый компонент обеспечивает управление сканированием документов с применением любого установленного сканера. Для этого предназначены конфигурации сканирования, позволяющие управлять подключенным сканером с помощью ряда настроек, оптимизированных для определенных целей. Например, конфигурация сканирования Черно-белый идеально подходит для сканирования и распознавания страниц текста, тогда как конфигурация Цвет больше всего подходит для сканирования полноцветных рисунков или произведений искусства. Также по умолчанию автоматически производится оптическое распознавание текста в текстовых документах сразу по завершении сканирования, что помогает без затруднений сканировать большое количество страниц с созданием одного конечного файла.

Второй компонент позволяет производить просмотр отсканированных документов на экране, перекомпоновку многостраничных документов, выделение и обработку распознанного текста и отправку документов по электронной почте.

Когда документ сканируется в первый раз, в Microsoft Office Document Imaging может быть произведена проверка сканера с последующим проведением сканирования пробного документа. Данная процедура может занять какое-то время, но она нужна для того, чтобы после завершения операции в Microsoft Office Document Imaging было правильно идентифицировано установленное оборудование. При установке нового сканера можно повторно запустить процедуру проверки.

Microsoft Office Document Imaging обеспечивает ряд конфигураций параметров, позволяющих выполнять наиболее распространенные задачи сканирования. Каждая конфигурация оптимизирована для определенного вида сканирования. Можно настроить конфигурации определенным образом или создать свои собственные для достижения определенных целей. Среди встроенных конфигураций сканирования имеются следующие:

Черно-белый. Сканирование производится в монохромном режиме с разрешением 300 точек на дюйм. Данная конфигурация разработана для распознавания текста при сканировании черного текста на белой бумаге или при сканировании контрастных изображений. Само сканирование производится быстрее, чем при других конфигурациях, а получающиеся в итоге файлы изображений меньше по размерам.

Черно-белый с цветной страницы. Сканирование производится в оттенках серого с разрешением 300 точек на дюйм, но сохраняется документ в файле монохромного формата. Данная конфигурация разработана для сканировании с распознаванием текста на цветном фоне или цветного текста.

Оттенки серого. Сканирование производится в оттенках серого с разрешением 200 точек на дюйм. Данная конфигурация подходит для сканирования страниц, содержащих непрерывные черно-белые изображения (такие как фотографии) и текст, или же только цветной текст.

Цвет. Сканирование производится с разрешением 150 точек на дюйм. Данная конфигурация предназначена для сканирования полноцветных документов. Само сканирование производится довольно медленно, мелкий текст может оказаться недостаточно читаемым для распознавания, а получающиеся в результате файлы будут большого размера.

Кроме разрешения и типа сканирования, каждая конфигурация задает следующие параметры:

Размер страницы.

Папку по умолчанию для сохранения файлов.

Язык для распознавания текста.

Сохранение многостраничных документов целиком или в виде отдельных страниц.

Автоматическое проведение распознавания текста после сканирования.

Автоматическое создание имен файлов.

Автоматическое выравнивание страниц, отсканированных вверх ногами, или криво.

Программа сканирования изображений DeskScan II

Сканеры обычно поставляются вместе с программным обеспечением. Программы позволяют не только настроить параметры и выполнить сканирование изображения, но и произвести дополнительную модификацию обработку. Приведем в качестве примера возможности программы сканирования изображений DeskScan II, разработанной фирмой Hewlett Packard для планшетного сканера ScanJet 4С. Эта фирма является ведущим поставщиком оборудования этого типа и программного обеспечения к нему.

После вызова программы сканирования на экране появляется панель, управляющая процессом сканирования. Щелчок по кнопке "Просмотр" инициирует процесс сканирования. Через несколько секунд в правой части панели появляется сканированное изображение. С помощью имеющейся в правой половине панели подвижной рамки можно настроиться на ту часть рисунка, которую нужно записать в файл.

Исходные изображения

Существуют два основных типа исходных сканируемых изображений: рисунки и фотографии. Для рисунков и фотографий имеются как черно-белые, так и цветные варианты. Эти варианты употребляются, в частности, для того, чтобы сканировать материалы для черно-белого принтера или же для цветного принтера (или для вывода на экран).

Для получения компьютерного изображения требуемого качества нужно уточнить параметры сканирования. При сканировании изображения задается следующая информация:

цветосодержание (черно-белое или цветное) глубина цвета (16 и 256 оттенков серого цвета для черно-белого и 16, 256 или миллионы цветов для цветного изображения) метод сканирования (Рисунок, Полутон или Фото) дополнительный стиль (Цветное пятно или Детализированный для Фотографий, Нормальный, Диффузионный, Качественный, Высококачественный для Полутонов)

Методы сканирования

Рассмотрим основные методы сканирования.

Рисунок

Используется для изображений с большими участками сплошного цвета. Примерами изображений, сканируемых методом "Рисунок", являются изображения из кривых и линий, фирменные знаки, изображения со сплошным цветом без градиента. Файлы, созданные методом "Рисунок", могут в дальнейшем легко редактироваться.

Фото

Используется для сканирования изображений со многими оттенками серого цвета или цветных изображений. При использовании метода "Фото" вариация цветных значений в изображении сохраняется от пиксела к пикселу.

Примерами изображений, которые следует сканировать данным методом, могут служить оригинальные фотографии, иллюстрации в книгах и журналах.

Полутон

Используется для оптимизации качества сканируемых фотографий при печати на принтерах.
Изображения, сканируемые с типом изображения "Полутон", обрабатываются таким способом, который имитирует многие оттенки цветов в изображении.

Типы получаемых изображений

Меню на передней панели дает возможность выбрать тип получаемого изображения, при этом все необходимые характеристики задаются автоматически. Программа DeskScan II автоматически выберет тип получаемого изображения после выполнения пробного сканирования.

В меню представлены следующие типы:

Черно-белый рисунок

Четкий черно-белый рисунок

Цветной рисунок

Черно-белый полутон

Цветной полутон

Черно-белое фото

Четкое черно-белое фото

Цветное фото

Четкое цветное фото

Миллионы цветов

Четкие миллионы цветов

Параметры "Миллионы цветов" и "Четкие миллионы цветов" используются для сканирования изображений, которые будут выводиться на мониторах высокого качества или будут напечатаны на принтерах с фотографическим качеством. Файлы изображений, просканированных с таким качеством, могут занимать на диске несколько мегабайтов.

Помимо стандартных типов изображения, в диалоговом окне Адаптированный тип можно задавать адаптированные типы изображения, когда явно устанавливаются требуемые параметры качества.

Стратегия сканирования

Готовясь к публикации материалов в Интернете, мы нередко сталкиваемся с проблемой подготовки качественных иллюстраций. Часто в нашем распоряжении имеется фотография, полученная с помощью обычного фотоаппарата. Качество фотографии не всегда нас устраивает, однако нечеткие или плохо кадрированные снимки тоже могут пригодиться: компьютер позволяет получить вполне приемлемое изображение, даже если качество исходного снимка далеко от совершенства.

Опишем несколько приемов сканирования фотографий.

Общий принцип состоит в том, что при сканировании нужно установить большее разрешение, чем требуется для вывода готового снимка на экран.

Чтобы разобраться с правилами установки нужного разрешения проделаем несколько экспериментов в программе DeskScan II. Установим для начала в поле "Путь" значение "Экран". Это означает, что мы планируем выводить сканируемое изображение на экран. Для того чтобы узнать, какое при этом установилось разрешение, щелкнем в верхнем меню позицию "Адаптировать", а далее выберем из выпадающего меню позицию "Маршрут печати". В появившейся таблице можно увидеть, что параметр "разрешение" имеет и по горизонтали, и по вертикали значение 75 точ./д (точек на дюйм).

Нам теперь достаточно установить вдвое большее разрешение. Для этого можно внести в соответствующие поля выведенной таблицы значения 150 вместо 75. Или можно закрыть окно с таблицей, и установить в поле "Путь" другое устройство вывода. Так, например, при выводе на лазерный цветной принтер (в поле "Путь" устанавливается значение "Color laser Jet Series") разрешение устанавливается 150 точ./д. Это можно проверить описанным ранее способом: выбрать в меню позицию "Адаптировать", далее позицию "Маршрут печати" и посмотреть установленные параметры разрешения.

Не следует забывать, что при сканировании больших цветных фотографий при большом разрешении вы будете получать файлы очень больших размеров. Поэтому в вашем распоряжении должен быть достаточно мощный компьютер и несколько десятков мегабайт свободного места на диске. Есть несколько вариантов решения проблемы больших файлов:

можно "вырезать" из фотографии только нужный вам фрагмент (нужную часть снимка выделить с помощью подвижной рамки), можно сканировать изображение в меньшем масштабе (переместив ползунок в поле "масштаб" влево до достижения нужного значения масштаба), можно, в конце концов, пожертвовать качеством, установив меньшее разрешение или меньшее количество цветов (например, в параметре "Тип" установить значение "Четкое цветное фото" вместо "Четкие миллионы цветов").

В нижней левой части экрана указывается размер (в килобайтах) файла, который будет получаться при установленных параметрах сканирования. Вы можете варьировать параметры, получая на экране размер конечного изображения, и выбрать тот, который вам подходит из соображений экономии места на диске. Но если вы готовите материалы для размещения в Интернете, то на размер файла можно не обращать внимания - файл нужно будет потом преобразовать в другой формат (jpeg или gif), и его размеры сильно уменьшатся.

После начального сканирования (с помощью кнопки "Просмотр"), желательно поставить автоматическую экспозицию и потом сохранить изображение (с помощью кнопки "Окончательный") в формате.bmp. После этого можно продолжить обработку изображения в редакторе Adobe Photoshop. Именно средствами этого графического редактора можно "дотянуть" качество изображения до нужного вам уровня.

Технология изображения

Рассмотрим более подробно технологию получения изображений на мониторе компьютера.

Наиболее распространенными мониторами сейчас являются мониторы, основанные на технологии электронно-лучевых трубок (CRT - cathode ray tube). Это в основном та же технология, которая используется в наших телевизионных приемниках. Пользователи компьютеров покупают сейчас 15 или 17-дюймовые цветные мониторы с коэффициентом обновления (частотой развертки) 75 Гц и выше, с отображением цветовой палитры True Color (несколько миллионов цветов). Для реализации высоких качеств монитора нужна также соответствующая графическая плата (графический адаптер), устанавливаемая в системный блок компьютера.

Технология CRT требует достаточно больших размеров монитора, в отличие от технологии жидкокристаллических дисплеев (LCD - liquid crystall display). LCD-мониторы применяются для портативных компьютеров notebook (laptop). Пока стоимость жидкокристаллических мониторов существенно выше, чем у обычных мониторов. Если же LCD-мониторы станут дешевле, они имеют все шансы вытеснить мониторы с электронно-лучевыми трубками. Пользователи не без основания считают LCD-мониторы экологически чистыми устройствами, не создающими заметных электромагнитных излучений.

Жидкокристаллические экраны могут быть пассивными, обладая при этом не слишком высокой четкостью изображений, или активными. У активных LCD-экранов каждая точка (пиксел) отображается самостоятельным транзистором. Большой размер экрана требует большого числа транзисторов, что приводит к значительному удорожанию монитора.

CRT-мониторы создают изображение на экране, получая от графической карты RGB (red-green-blue) данные и направляя электронный пучок на экран. Экран покрыт фосфорицирующими группами (тремя фосфорицирующими точкам трех цветов). Электроны вызывают свечение фосфора надлежащих цветов. Фосфор светится короткое время, поэтому он должен постоянно получать электронные сигналы, чтобы удерживать изображение на экране. Частота регенерации - это время, которое требуется для перерисовки экранного изображения. Более высокая частота регенерации (частота развертки) дает меньше мерцания и создает меньшее напряжение для глаз.

Для обеспечения работы монитора в компьютере имеется графический адаптер. Обычно адаптеры поддерживают несколько графических режимов, которые отличаются качеством изображения в двух направлениях: разрешающей способности и глубине цветовой гаммы. Разрешение монитора определяется количеством пикселов по горизонтали и вертикали. Цветовая глубина - это количество цветов, в которое может быть окрашен каждый пиксел.

Графические адаптеры имеют память для хранения и обработки информации, поступающей на экран. Для хранения информации для каждого пиксела можно использовать разное число бит, что и определяет в конечном итоге глубину цвета на экране. С помощью 8 бит можно отобразить 256 цветов, 15 бит достаточно для хранения 32000 цветов, 24 бита могут отображать 16,7 млн. цветов.

Векторные и растровые изображения

Имеются два основных класса компьютерных изображений: векторные и растровые.

Векторные изображения, известные также как объектно-ориентированные изображения, определяются множеством точек, связанных математическими соотношениями. Растровые изображения задаются матрицей, описывающей точки экрана и их цвет. Чем выше качество растрового изображения (больше пикселов и больше глубина цвета), тем больше потребуется памяти для хранения информации для каждого пиксела.

Растровые изображения ближе к фотографии, поскольку позволяют более точно воспроизводить основные характеристики фотографии: освещенность, прозрачность, плавность переходов, тональность и пр. В отличие от векторных изображений растровые изображения плохо масштабируются, нужные масштабы и разрешение задаются при создании изображения. Один из способов получения растровых изображений - сканирование фотографий или слайдов. Существуют также разнообразные пакеты компьютерной графики, создающие растровые изображения. Более профессиональные пакеты предлагают пользователям разнообразные графические эффекты, которые позволяют в некоторых случаях достигать изображений, сравнимых с "ручным" рисование или фотографией.

Если посмотреть на фрагмент растрового изображения в увеличенном виде, то можно заметить, что плавная линия представляется в виде ступени, но при высокой разрешающей способности и большом числе цветов эти ступеньки не заметны для глаза.

Векторное изображение может отличаться очень высокой точностью передачи линий и сложных геометрических форм. Векторная графика не дает особых преимуществ в передаче оттенков или текстуры по сравнению с растровыми изображениями, но все же имеет ряд преимуществ:

Несложные векторные изображения обладают меньшими размерами по сравнению с растровыми изображениями,

Векторные изображения являются масштабируемыми, что означает возможность их увеличения или уменьшения без каких-либо искажений,

В векторных изображениях часто раздельно представлены координаты векторов (точек) и характеристики их визуализации, что позволяет легко получать разнообразные визуальные образы для одной математической (геометрической) формы.

Векторные изображения не могут быть получены путем сканирования или перехвата экранных изображений. Они создаются с помощью специальных пакетов векторной графики или путем специальных математических преобразований растровых изображений.

Традиционно векторная графика широко использовалась в геоинформационных системах (ГИС) и картографии. Векторные форматы были более компактны и с ними легче было работать. Современные ГИСы чаще используют теперь векторно-растровые технологии. Некоторые задачи, например, интерполяцию точечных изображений на поверхность, проще решать на растровых изображениях. Кроме того, здесь часто приходится иметь дело с фотографиями поверхности Земли, полученными со спутников. Такие снимки преобразуются в проекции карты, где начинают применяться методы математического моделирования.

Большинство программ по созданию или обработке растровых изображений предлагают следующие типы изображений, которые отличающиеся количеством выделяемых бит на один пиксел.

Монохромная графика

Этот режим иногда называют черно-белой графикой, или графикой с однобитовым разрешением. Это означает, что каждый пиксел может быть окрашен только в белый или черный цвет. Такие изображения можно получить с помощью графических пакетов или с помощью сканирования картинок в режиме "Монохромная графика". В этом режиме можно создавать изображения, которые по стилю относятся к художественной черно-белой графике.

Оттенки серого

Изображения этого типа содержат 8 бит на пиксел и позволяют в каждой точке получить 256 оттенков серого цвета. Этот тип изображения можно получить, например, при сканировании черно-белых фотографий в режиме "Оттенки серого". Разумеется, любая цветная фотография также может быть отсканирована в этом режиме, но качество изображения может быть не вполне удовлетворительным, поскольку некоторые цвета из-за недостаточной контрастности могут сливаться.

Индексированный 16-цветный

Каждый пиксел здесь представлен 4 битами, в которых записывается номер цвета в палитре из 16-ти цветов. Палитра строится таким образом, что каждый цвет для всех трех составляющих цветов (красного, зеленого и синего) имеет конкретное значение в диапазоне от 0 до 256. Индексированные изображения небольшие по объему и содержат палитру внутри себя или в виде отдельного файла.

Индексированный 256-цветный

Аналогично предыдущему типу здесь каждый пиксел представлен номером цвета в палитре, состоящей из 256 цветов. Для хранения информации о пикселе требуется 8 бит.

Истинный цвет RGB

Этот тип изображений содержит 24 бита на пиксел, и эти 24 бита представляют информацию о трех цветах (красном, зеленом и синем) по 8 бит на каждый цветной компонент. Этот тип изображения передает 16,7 млн цветов.

Форматы графических файлов

Программные пакеты для работы с графикой ориентированы на создание или редактирование графических файлов нескольких типов. Из всего множества разнообразных форматов можно выделить несколько наиболее популярных, поддерживаемых большим число пакетов. К таким форматам относятся:

BMP - растровый формат, разработанный фирмой Microsoft в качестве способа хранения и обмена данными. Этот формат может отображать изображения с глубиной до 24 бит. Созданные в этом формате файлы могут передавать очень качественные и реалистичные изображения.

EPS - формат Encapsulated PostScript, основанный на языке описания страниц PostScript, разработан фирмой Adobe в 1985 г. Эти файлы используются в программах настольных издательств. Файлы EPS могут использоваться в качестве средства обмена между векторной информацией и растровыми изображениями. Этот формат основан на модели изображения, которая становится стандартным способом передачи графической информации между аппаратными средствами (принтерами) и программными пакетами.

GIF - Graphic Interchange Format, может сохранять несколько растровых изображений в одном файле. Поддерживает до 256 цветов и может создавать высококачественные изображения. Формат использует сжатие данных, которое может уменьшить 8-битовое изображение примерно на 40%. Широко используется для создания изображений, помещаемых в Интернете. Может иметь "прозрачный" фон, что также привлекательно для разработчиков Web-страниц.

PCX - использовался в программе Paitbrush, которая стала входить в пакеты фирмы Microsoft. Этот формат может поддерживать изображения вплоть до 24-битового цвета. Файлы могут сжиматься в случае 16-цветого изображения на 40-70%, а 256-цветовое изображение может быть уменьшено на 10-30%.

TIF - широко используется в издательских системах. Формат может поддерживать несколько различных алгоритмов сжатия данных. Нередко возникает ситуация, когда некоторый конкретный пакет не поддерживает используемый в файле TIF метод сжатия, и могут возникать ошибки типа "Неподдерживаемый тип сжатия". Иногда проблемы возникают из-за того, что пакет может читать только черно-белые TIF-файлы, а изображение является цветным.

WMF - метафайл Windows, созданный фирмой Microsoft для хранения векторной и растровой графики. Формат может создавать и хранить изображения вплоть до 24 бит на пиксел, передавая высококачественные изображения. Изображения в этом формате хорошо масштабируются.

JPG - формат, разработанный Объединенной группой экспертов по фотографии. Использует основанный на аппаратуре стандартный алгоритм сжатия. Коэффициент сжатия может достигать 100:1. В силу этих особенностей широко используется для представления графических (фотографических) материалов в Интернете.

Преобразование графических форматов

С проблемой преобразования форматов графических файлов приходится сталкиваться, например, при подготовке мультимедиа проекта, размещаемого в Интернете. На Web-страницах должны быть графические объекты, подготовленные в формате.GIF или.JPG, другие графические объекты существующие программы просмотра Web-страниц пока не воспринимают.

Преобразование форматов графических файлом можно выполнить с помощью графических пакетов, воспринимающих файлы разных форматов. Одним из таких графических пакетов является пакет Photo Editor, входящий в Microsoft Office. Этот пакет умеет работать практически со всеми наиболее распространенными форматами изображений: рисунками Windows, TIF, PCX, GIF, JPG, Kodak Photo CD. При этом он дает возможность конвертировать файлы из одного формата в другой с помощью обычной операции Save as ...

При преобразовании файлов можно уточнить желаемые параметры. Например, можно выполнить преобразование из цветного в черно-белый формат. Для выбранного типа файла можно также выбрать количество цветов, степень сжатия файла, либо фактор качества - большой файл и лучшее качество изображения, или же маленький файл более низкого качества.

Графический пакет дает возможность выделить и сохранить некоторую область рисунка, выполнить редактирование изображения - растянуть или повернуть на произвольный угол изображение, поменять его яркость или контрастность, поменять цветовую гамму. Имеется также несколько художественных эффектов: украшение рельефом, эффект мелка или угля, эффект погружения в воду, эффект цветного витража.

Еще один простой способ подготовки материалов для Интернета - воспользоваться текстовым процессором Word, который умеет преобразовывать документ в формат HTML. Если при этом в документе были картинки, то они переводятся в формат GIF и записываются на диск в виде отдельных файлов.

Сканирование из Acrobat принимает изображения с разрешением в диапазоне 10–3000 dpi. При выборе параметра Изображение в возможностью поиска или ClearScan в разделе Стиль вывода PDF требуется разрешение выводимого изображения не ниже 72 dpi. Кроме того, разрешение выводимого изображения, превышающее 600 dpi, будет уменьшено до 600 dpi или менее.

Сжатие изображения без потери качества может выполняться только с монохромными изображениями. Для сжатия отсканированного изображения без потери качества выберите в разделе «Параметры оптимизации» диалогового окна «Оптимизация отсканированного PDF» один из следующих параметров: «CCITT Group 4» или «JBIG2 (без потери качества)» для монохромных изображений. Если это изображение добавлено к документу PDF, можно сохранить файл с помощью параметра Сохранить; отсканированное изображение остается без сжатия. При сохранении документа PDF с помощью функции Сохранить как отсканированное изображение может быть сжато.

Для большинства страниц сканирование в черно-белом режиме при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность оптического распознавания символов несколько снижается и количество ошибок распознавания шрифта возрастает; при разрешении 400 dpi и выше обработка замедляется, а размер файлов со сжатыми страницами увеличивается. Если на странице содержится много нераспознанных слов или текст небольшого размера (9 пунктов и меньше), попытайтесь выполнить сканирование в более высоком разрешении. Когда это возможно, сканируйте в черно-белом режиме.

Если функция Оптическое распознавание символов выключена, можно использовать разрешением в диапазоне 10–3000 dpi, рекомендованное разрешение - 72 dpi и выше. Для параметра адаптивного сжатия рекомендуемые разрешения при сканировании: 300 dpi для изображений в градациях серого и RGB и 600 dpi для черно-белых изображений.

Страницы, отсканированные в режиме 24-разрядных цветов, 300 dpi, размером 8,5 х 11 дюймов (21,59 х 27,94 см) до сжатия представляют собой изображения большого размера (25 МБ). Системе может потребоваться 50 МБ виртуальной памяти и более для сканирования изображения. При разрешении 600 dpi процесс сканирования и обработки обычно происходит в четыре раза медленнее, чем при 300 dpi.

Избегайте настройки параметров полутонов и диффузионного смешения сканера. Это может улучшить внешний вид, но станет сложно распознавать текст.

Для текстов, распечатанных на цветной бумаге, рекомендуется увеличить яркость и контрастность примерно на 10%. Если сканер обеспечивает световую фильтрацию, следует подавить цвет фона при помощи специального фильтра или лампы. Или, если текст не подавляется, попробуйте настроить контрастность и яркость сканера, чтобы очистить отсканированный документ.

Если у сканера есть ручное управление яркостью, настройте его так, чтобы символы были четкими и имели правильную форму. Если символы соединены между собой, используйте более высокие параметры (более яркого цвета). Если символы разделены, используйте более низкие параметры (более темного цвета).

Расширение для сканирования документов. Форматы файлов сканированных документов и их характеристика

Сканирование документов и создание электронного архива подразумевает три шага:

Итак, при сканировании и сохранении документов выберите один из следующих форматов:

Заключительный этап

Цели сканирования фотографий

Подготовка фотографий к сканированию

Настройка сканера для сканирования

Популярные статьи

Последние статьи

Разделы

Страницы

Спецпроекты

Контакты