Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Основы технологии обработки текстов
Обработка текстов — один из наиболее распространенных видов работ, выполняемых на персональном компьютере. Это обусловлено тем, что деятельность любого учреждения неизбежно требует создания многих видов документов, без которых невозможно решать задачи планирования, финансирования, кредитования, бухгалтерского учета и отчетности, оперативного управления, кадрового обеспечения деятельности учреждения. Для создания документов используются специальные программы — текстовые редакторы. Существует большое количество текстовых редакторов, различающихся набором предоставляемых пользователю функций, легкостью освоения, операционными системами, в которых они могут работать, быстродействием, стоимостью, распространенностью и другими параметрами. Несмотря на различия, в большинстве текстовых редакторов используются одни и те же принципы работы. Данное обстоятельство позволяет использовать в качестве примера для уяснения технологии обработки текстовой информации текстовый процессор MS Word. Прикладная программа MS Word представляет документ как совокупность символов, логически связанных между собой и образующих завершенную лексическую конструкцию. Во внешней памяти компьютера документ хранится как файл с расширением *.doc. Документ состоит из объектов, каждый из которых обладает своими свойствами. Основное содержание документа составляет, как правило, текст — набор символов, вводимых с помощью клавиатуры. Эти символы образуют текстовые объекты: слова, предложения и абзацы. Текстовые объекты располагаются на страницах так, как они будут отображаться на бумажном носителе при выводе документа на печать. Рассмотрим подробнее текстовые объекты, составляющие документ. Символ — наименьший элемент текста, вводимый в документ при однократном нажатии клавиши. В документе символы отображаются как буквы, цифры, знаки препинания. Нажатие некоторых клавиш вводит в текст непечатаемые символы (табл. 2.1). Эти символы не отображаются в документе при выводе его на печать. Для того чтобы увидеть эти символы на мониторе компьютера при подготовке документа к печати, следует использовать кнопку на панели инструментов ¶.
Таблица 2.1. Перечень непечатаемых символов
Следует отметить, что программы обработки текста позволяют включать в текст и специальные символы. Они создаются специальными программами, входящими в состав текстовых редакторов, и хранятся в специальных таблицах. Фрагмент такой таблицы представлен на рис. 2.1. Слово — набор символов, ограниченный с двух сторон пробелами или знаками препинания (точками, запятыми и т. д.). Строка — набор слов или символов, расположенных в одну линию (без переносов). Предложение — набор символов и слов, ограниченный с двух сторон знаками препинания (точками, восклицательными или вопросительными знаками, многоточием).
Рис. 2.1. Пример таблицы символов
Абзац — произвольная последовательность символов, замкнутая символом «Возврат каретки» (клавиша Enter). В документе абзац представляет собой часть текста, содержащую законченную мысль. Необходимость принудительного обозначения конца абзаца обусловлена тем, что программы обработки текста не могут осуществить анализ смысла текста. Страница — часть текста, ограниченная линиями разделения страниц. Страница представляет собой сложный объект, обязательными элементами которого являются поля (рис. 2.2). Поля — области страницы, где не может размещаться текст. Исключение составляют верхнее и нижнее поля, в которых может размещаться служебная информация. Эти элементы страницы называются колонтитулами. В качестве колонтитула может быть использован текст и/или рисунок (номер страницы, дата печати документа, логотип организации, название документа, имя файла, фамилия автора и т. п.). Область страницы, на которой может располагаться текст, называется полем текста или логической страницей. Текст может располагаться на некотором расстоянии от боковых (левого/правого) полей. Это расстояние называется отступом. При нулевом отступе границы текста совпадают с границами полей. Иногда при оформлении текста первую строку абзаца размещают с отступом от левого поля. Такую строку называют красной.
Рис. 2.2. Схема страницы документа
Раздел — часть страницы или группа страниц с одинаковыми параметрами оформления. Дело в том, что зачастую возникает необходимость создать документ с разной ориентацией страниц — вертикальной и горизонтальной, разные колонтитулы, непоследовательную нумерацию и т. д. Или же внутри одной страницы с одноколонным текстом нужно поместить текст, расположенный в нескольких колонках. Текстовый объект «раздел» позволяет обеспечить такое оформление документов. Свойства объекта, которые могут быть изменены пользователем, называются его атрибутами. Рассмотрим атрибуты текстовых объектов документа. Любой текст может быть представлен как совокупность символов. Для обозначения размера и рисунка символов, используемых при создании документа с помощью программ обработки текста, применяется термин «шрифт». Любой текстовый редактор дает возможность использовать различные виды шрифтов, каждый из которых может иметь достаточно большое количество модификаций, различающихся своими атрибутами, основными из которых являются: · гарнитура шрифта — совокупность наборного материала, имеющего одинаковый характер рисунка символов, который определяется видом элементов, составляющих их (символов) (рис. 2.3). Рис. 2.3. Элементы текстовых символов По внешнему виду различают шрифты с засечками и рубленые (без засечек). Горизонтальные засечки как бы подчеркивают строку под символами. В результате такой текст легко воспринимается глазами, и поэтому шрифты с засечками служат для набора основного текста документов. Рубленые шрифты, как правило, используются в заголовках и подписях к рисункам. По способу формирования изображения символов шрифты делятся на растровые и векторные. Изображение растрового символа кодируется по точкам в битовой карте (матрице), а затем без изменений отображается на экране или бумаге принтера. Матрица растрового шрифта, как правило, представляет собой квадрат (например 8x8 или 16x16 пикселей). Существенный недостаток растровых шрифтов состоит в ухудшении качества при увеличении символа. В этом случае изображение символа приобретает ступенчатые очертания. При создании векторного шрифта рисунок символа не кодируется по точкам, а описывается совокупностью геометрических фигур. Поэтому при воспроизведении символа его контур рассчитывается по определенным формулам. Это позволяет легко изменять масштаб векторных шрифтов без потери качества изображения. В среде Windows для работы с документами, как правило, используются векторные шрифты специального формата TrueType. При этом один и тот же шрифт применяется и для вывода сообщений на экран, и для распечатки текста на принтере. Технология TrueType позволяет реализовать принцип WYSIWYG (What You See Is What You Get). Это означает, что документ, распечатанный на принтере, будет выглядеть так же, как и на экране монитора. Каждый шрифт TrueType имеет название (имя), например: Arial, Times New Roman, Symbol. Шрифты TrueType делятся на моноширинные и пропорциональные. В моноширинных шрифтах все символы имеют одинаковую ширину, например, символ «.» (точка) занимает столько же места, сколько буква «ж». В пропорциональных шрифтах ширина каждого символа разная. Точка занимает совсем мало места, промежуточную ширину имеет буква «н», а буквы «ж», «ш» — шире всех других. В качестве примеров различных шрифтов можно привести: · шрифт Times New Roman — пропорциональный с засечками; · шрифт Arial — пропорциональный рубленый; · шрифт Courier New — моноширинный с засечками. Набор доступных для работы шрифтов определяется не программой текстового редактора, а операционной системой MS Windows; · начертание шрифта. Каждый шрифт имеет четыре варианта начертания: обычный, полужирный, наклонный (часто называемый курсивом) и подчеркнутый. Могут также использоваться комбинации начертания, например, одновременно полужирный, наклонный и подчеркнутый: · размер символов. Символы имеют размер, называемый кеглем. Величина кегля измеряется в пунктах (пт, pt). 1 пт =1/72". Данная запись означает, что 1 пт равен 1/72 части дюйма (2, 54 см). Следовательно, символы размером 12 пт имеют высоту около 4, 2 мм. Соотношение между единицами измерения приведено в табл. 2.2. Кроме этих атрибутов, можно изменять и другие: цвет символов, их подчеркивание, видоизменения символов, интервал между ними. Представление о других атрибутах шрифта дает рис. 2.4, на котором изображено диалоговое окно форматирования шрифта в текстовом процессоре MS Word (команда Формат/Шрифт). Таблица 2.2. Соотношение между единицами измерения
Рис. 2.4. Атрибуты шрифта в MS Word Для текстового процессора MS Word абзац — это часть текста, введенная между двумя нажатиями клавиши Enter. Основными атрибутами абзацев являются выравнивание, отступы и интервалы. Различается четыре вида выравнивания (рис. 2.5): по левому краю (1), по центру (2), по правому краю (3) и по ширине (4). Представление об атрибутах абзаца даст рис. 2.6, на котором изображено диалоговое окно форматирования шрифта в текстовом процессоре MS Word (команда Формат/Абзац). Атрибут «отступ» характеризует расстояние от края текста до соответствующей внутренней границы бокового поля. Для задания Рис. 2.5. Пример различного выравнивания абзацев
Рис. 2.6. Атрибуты абзаца в MS Word отступов можно использовать не только диалоговое окно Абзац, но и маркеры на горизонтальной линейке (рис. 2.7).
Рис. 2.7. Элементы форматирования абзаца Что касается атрибута «интервал», то различают: · интервалы междустрочные — расстояние между строками внутри абзаца; · интервалы между абзацами — расстояние от последней строки предыдущего абзаца до первой строки последующего. Основными атрибутами страницы являются: се размер, ширина полей и ориентация страницы, которая может быть книжной или альбомной (рис. 2.8). Совокупность страниц с одинаковыми атрибутами образует раздел. Кроме того, раздел создастся и тогда, когда на одной странице размещается текст с разным числом колонок. Таким образом, могут иметь место случаи, когда на одной странице располагается несколько разделов.
Рис. 2.8. Варианты ориентации страницы А4: а — книжная; б — альбомная И наоборот, один раздел может состоять из нескольких страниц. Так, на рис. 2.9 представлен документ, в котором каждый из трех разделов занимает по одной странице.
Рис. 2.9. Пример документа, состоящего из трех разделов
К разделам применяется самый высокий уровень форматирования документов MS Word. К сожалению, в этом текстовом процессоре нет универсальной команды, которая открывала бы диалоговое окно для выполнения операции форматирования разделов. Эти команды находятся в разных пунктах меню: · Файл/Параметры страницы, · Формат/Колонки; · Вставка/Разрыв. Последняя команда позволяет пользователю управлять размещением разделов (рис. 2.10). Итак, документ, создаваемый с помощью текстового процессора MS Word, имеет сложную структуру. Его основу составляют текстовые объекты — разделы, страницы, абзацы и символы. Документ состоит из одного или нескольких разделов, хотя большинство служебных документов имеет в своем составе только один раздел. Раздел состоит из одного или нескольких абзацев. Абзацы могут состоять из символов, число которых может быть различным: от одного до нескольких сотен. В зависимости от этого абзац (абзацы) может размещаться на одной или нескольких страницах документа. Представление о структуре документа как сложного объекта дает схема, представленная на рис. 2.11.
Рис. 2.10. Диалоговое окно Вставка/Разрыв
Рис. 2.11. Иерархия текстовых объектов документа Зачастую текст, создаваемый с помощью текстовых процессоров, нуждается в пояснении с помощью наглядных примеров или образов. Изображение, которое включается в текст с этой целью, называется иллюстрацией. В качестве иллюстраций в документ могут включаться изображения, созданные как специальными приложениями, так и средствами, входящими в состав текстового процессора. Текстовый процессор MS Word позволяет в полной мере реализовать эти возможности. Так, с помощью команды. Вставка/Рисунок в текст документа можно включить графические объекты, созданные с помощью разных средств (рис. 2.12).
Рис. 2.12. Меню команды Вставка/Рисунок Команда Картинки позволяет вставить в текст рисунки, входящие в комплект поставки пакета Microsoft Office. Они хранятся в папке C: \\MicrosoftОffice\ProgramFiles\media\cagcat. При этом каждой картинке, хранящейся здесь, соответствует определенный набор ключевых слов. Поэтому выбор подходящей картинки существенно облегчается, так как пользователь может указать, что именно ему требуется. Так, например, ключевому слову «компьютер» в текстовом процессоре MS Word отвечают картинки, часть которых приведена на рис. 2.13.
Рис. 2.13. Картинки, найденные по ключевому слову «компьютер» С помощью команды Из файла можно вставить графические файлы, созданные в среде различных графических редакторов, например Adobe PhotoShop, Corel Draw, 3 D Studio Max, GIMP и др. Кроме того, изображение в документ можно импортировать непосредственно со сканера или с цифровой камеры с помощью соответствующей команды. Для включения в текст документа отдельных графических объектов могут быть использованы графические приложения, входящие в состав текстового процессора. Организационная диаграмма. Данная команда позволяет включить в текст документа шесть типов диаграмм, выражающих отношения между объектами (рис. 2.14). Рис. 2.14. Варианты организационных диаграмм в MS Word: а структура отношений подчинения; б — структура непрерывного процесса; к структура с центральным элементом; г — иерархическая структура с базовым элементом; д — перекрывающиеся множества; е — последовательность достижения цели
Объект WordArt. С помощью этой команды в текст документа можно ввести художественно оформленную надпись. Программа позволяет выбрать один из тридцати вариантов ее оформления (рис. 2.15). Кроме того, пользователь может не только выбрать тип и размер шрифта, но и изменить некоторые свойства такой надписи. Рис. 2.15. Варианты начертания надписи WordArt Диаграмма. Диаграмма является способом графического представления числовых данных, хранящихся в таблицах. Это позволяет визуально представить соотношение различных значений и динамику их изменения. Программа включает большое количество различных типов диаграмм (рис. 2.16). Каждый тип диаграмм служит для определенных целей. Обычно пользователь не ограничен жесткими правилами использования какого-либо типа диаграмм. Рис. 2.16. Типы диаграмм MS Word Рис. 2.17. Панель инструментов Рисование
Кроме этих графических объектов пользователь может создать и другие с помощью инструментов Рисование. Доступ к ним открывается после запуска соответствующей панели инструментов (рис. 2.17).
Популярное:
|
Последнее изменение этой страницы: 2016-08-31; Просмотров: 571; Нарушение авторского права страницы