Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Основы технологии обработки текстов



 

Обработка текстов — один из наиболее распространенных видов работ, выполняемых на персональном компьютере. Это обусловлено тем, что деятельность любого учреждения неизбеж­но требует создания многих видов документов, без которых не­возможно решать задачи планирования, финансирования, кре­дитования, бухгалтерского учета и отчетности, оперативного управления, кадрового обеспечения деятельности учреждения. Для создания документов используются специальные програм­мы — текстовые редакторы. Существует большое количество текстовых редакторов, различающихся набором предоставляе­мых пользователю функций, легкостью освоения, операционны­ми системами, в которых они могут работать, быстродействием, стоимостью, распространенностью и другими параметрами. Не­смотря на различия, в большинстве текстовых редакторов ис­пользуются одни и те же принципы работы. Данное обстоятель­ство позволяет использовать в качестве примера для уяснения технологии обработки текстовой информации текстовый про­цессор MS Word.

Прикладная программа MS Word представляет документ как совокупность символов, логически связанных между собой и об­разующих завершенную лексическую конструкцию. Во внешней памяти компьютера документ хранится как файл с расширением *.doc. Документ состоит из объектов, каждый из которых облада­ет своими свойствами. Основное содержание документа состав­ляет, как правило, текст — набор символов, вводимых с помощью клавиатуры. Эти символы образуют текстовые объекты: слова, предложения и абзацы. Текстовые объекты располагаются на страницах так, как они будут отображаться на бумажном но­сителе при выводе документа на печать.

Рассмотрим подробнее текстовые объекты, составляющие документ.

Символ — наименьший элемент текста, вводимый в доку­мент при однократном нажатии клавиши. В документе символы отображаются как буквы, цифры, знаки препинания. Нажатие некоторых клавиш вводит в текст непечатаемые символы (табл. 2.1). Эти символы не отображаются в документе при вы­воде его на печать. Для того чтобы увидеть эти символы на мо­ниторе компьютера при подготовке документа к печати, следует использовать кнопку на панели инструментов ¶.

 

 

Таблица 2.1. Перечень непечатаемых символов

Символ Значение символа   Клавиша (соче­тание клавиш)   Отображение символа в режиме показа непе­чатаемых символов  
Пробел Пустой промежуток между символами или словами   Пробел
Конец строки Команда программе начать печать текста с новой строки   Shift + Enter  
Табуля­тор   Команда программе начать ввод символа с новой позиции табуляции   Tab  
Конец абзаца   Команда программе перейти к следующему абзацу текста Enter  

 

Следует отметить, что программы обработки текста позволя­ют включать в текст и специальные символы. Они создаются специальными программами, входящими в состав текстовых ре­дакторов, и хранятся в специальных таблицах. Фрагмент такой таблицы представлен на рис. 2.1.

Слово — набор символов, ограниченный с двух сторон про­белами или знаками препинания (точками, запятыми и т. д.).

Строка — набор слов или символов, расположенных в одну линию (без переносов).

Предложение — набор символов и слов, ограниченный с двух сторон знаками препинания (точками, восклицательными или вопросительными знаками, многоточием).

 

 

Рис. 2.1. Пример таблицы символов

 

Абзац — произвольная последовательность символов, замк­нутая символом «Возврат каретки» (клавиша Enter). В документе абзац представляет собой часть текста, содержащую закончен­ную мысль. Необходимость принудительного обозначения конца абзаца обусловлена тем, что программы обработки текста не мо­гут осуществить анализ смысла текста.

Страница — часть текста, ограниченная линиями разделения страниц. Страница представляет собой сложный объект, обяза­тельными элементами которого являются поля (рис. 2.2).

Поля — области страницы, где не может размещаться текст. Исключение составляют верхнее и нижнее поля, в которых мо­жет размещаться служебная информация. Эти элементы страни­цы называются колонтитулами. В качестве колонтитула может быть использован текст и/или рисунок (номер страницы, дата печати документа, логотип организации, название документа, имя файла, фамилия автора и т. п.). Область страницы, на кото­рой может располагаться текст, называется полем текста или ло­гической страницей. Текст может располагаться на некотором расстоянии от боковых (левого/правого) полей. Это расстояние называется отступом. При нулевом отступе границы текста сов­падают с границами полей. Иногда при оформлении текста пер­вую строку абзаца размещают с отступом от левого поля. Такую строку называют красной.

 

Рис. 2.2. Схема страницы документа

 

Раздел — часть страницы или группа страниц с одинаковыми параметрами оформления. Дело в том, что зачастую возникает необходимость создать документ с разной ориентацией стра­ниц — вертикальной и горизонтальной, разные колонтитулы, непоследовательную нумерацию и т. д. Или же внутри одной страницы с одноколонным текстом нужно поместить текст, рас­положенный в нескольких колонках. Текстовый объект «раздел» позволяет обеспечить такое оформление документов.

Свойства объекта, которые могут быть изменены пользовате­лем, называются его атрибутами. Рассмотрим атрибуты тексто­вых объектов документа.

Любой текст может быть представлен как совокупность сим­волов. Для обозначения размера и рисунка символов, используе­мых при создании документа с помощью программ обработки текста, применяется термин «шрифт». Любой текстовый редак­тор дает возможность использовать различные виды шрифтов, каждый из которых может иметь достаточно большое количество модификаций, различающихся своими атрибутами, основными из которых являются:

· гарнитура шрифта — совокупность наборного материала, имеющего одинаковый характер рисунка символов, кото­рый определяется видом элементов, составляющих их (сим­волов) (рис. 2.3).

Рис. 2.3. Элементы текстовых символов

По внешнему виду различают шрифты с засечками и рубле­ные (без засечек). Горизонтальные засечки как бы подчеркивают строку под символами. В результате такой текст легко восприни­мается глазами, и поэтому шрифты с засечками служат для на­бора основного текста документов. Рубленые шрифты, как пра­вило, используются в заголовках и подписях к рисункам.

По способу формирования изображения символов шрифты делятся на растровые и векторные. Изображение растрового символа кодируется по точкам в битовой карте (матрице), а за­тем без изменений отображается на экране или бумаге принтера. Матрица растрового шрифта, как правило, представляет собой квадрат (например 8x8 или 16x16 пикселей). Существенный недостаток растровых шрифтов состоит в ухудшении качества при увеличении символа. В этом случае изображение символа приобретает ступенчатые очертания.

При создании векторного шрифта рисунок символа не коди­руется по точкам, а описывается совокупностью геометрических фигур. Поэтому при воспроизведении символа его контур рас­считывается по определенным формулам. Это позволяет легко изменять масштаб векторных шрифтов без потери качества изо­бражения.

В среде Windows для работы с документами, как правило, ис­пользуются векторные шрифты специального формата TrueType. При этом один и тот же шрифт применяется и для вывода сооб­щений на экран, и для распечатки текста на принтере. Техноло­гия TrueType позволяет реализовать принцип WYSIWYG (What You See Is What You Get). Это означает, что документ, распеча­танный на принтере, будет выглядеть так же, как и на экране монитора.

Каждый шрифт TrueType имеет название (имя), например: Arial, Times New Roman, Symbol. Шрифты TrueType делятся на моноширинные и пропорциональные. В моноширинных шриф­тах все символы имеют одинаковую ширину, например, символ «.» (точка) занимает столько же места, сколько буква «ж». В про­порциональных шрифтах ширина каждого символа разная. Точ­ка занимает совсем мало места, промежуточную ширину имеет буква «н», а буквы «ж», «ш» — шире всех других.

В качестве примеров различных шрифтов можно привести:

· шрифт Times New Roman — пропорциональный с засеч­ками;

· шрифт Arial — пропорциональный рубленый;

· шрифт Courier New — моноширинный с засечками.

Набор доступных для работы шрифтов определяется не про­граммой текстового редактора, а операционной системой MS Windows;

· начертание шрифта. Каждый шрифт имеет четыре вариан­та начертания: обычный, полужирный, наклонный (часто на­зываемый курсивом) и подчеркнутый. Могут также исполь­зоваться комбинации начертания, например, одновремен­но полужирный, наклонный и подчеркнутый:

· размер символов. Символы имеют размер, называемый кег­лем. Величина кегля измеряется в пунктах (пт, pt). 1 пт =1/72". Данная запись означает, что 1 пт равен 1/72 части дюйма (2, 54 см). Следовательно, символы раз­мером 12 пт имеют высоту около 4, 2 мм. Соотношение ме­жду единицами измерения приведено в табл. 2.2.

Кроме этих атрибутов, можно изменять и другие: цвет симво­лов, их подчеркивание, видоизменения символов, интервал меж­ду ними. Представление о других атрибутах шрифта дает рис. 2.4, на котором изображено диалоговое окно форматирования шриф­та в текстовом процессоре MS Word (команда Формат/Шрифт).

Таблица 2.2. Соотношение между единицами измерения

Единица измерения Дюйм (1" ) Сантиметр (1 см) Пункт (1 пт)
Дюйм (1" ) 2, 54
Сантиметр (1 см) 0, 39 28, 35
Пункт (I пт) 1/72 0, 035

Рис. 2.4. Атрибуты шрифта в MS Word

Для текстового процессора MS Word абзац — это часть тек­ста, введенная между двумя нажатиями клавиши Enter. Основ­ными атрибутами абзацев являются выравнивание, отступы и интервалы.

Различается четыре вида выравнивания (рис. 2.5): по левому краю (1), по центру (2), по правому краю (3) и по ширине (4).

Представление об атрибутах абзаца даст рис. 2.6, на котором изображено диалоговое окно форматирования шрифта в тексто­вом процессоре MS Word (команда Формат/Абзац).

Атрибут «отступ» характеризует расстояние от края текста до соответствующей внутренней границы бокового поля. Для задания

Рис. 2.5. Пример различного выравнивания абзацев

Рис. 2.6. Атрибуты абзаца в MS Word

отступов можно использовать не только диалоговое окно Абзац, но и маркеры на горизонтальной линейке (рис. 2.7).

 

Рис. 2.7. Элементы форматирования абзаца

Что касается атрибута «интервал», то различают:

· интервалы междустрочные — расстояние между строками внутри абзаца;

· интервалы между абзацами — расстояние от последней стро­ки предыдущего абзаца до первой строки последующего.

Основными атрибутами страницы являются: се размер, ши­рина полей и ориентация страницы, которая может быть книж­ной или альбомной (рис. 2.8).

Совокупность страниц с одинаковыми атрибутами образует раздел. Кроме того, раздел создастся и тогда, когда на одной странице размещается текст с разным числом колонок. Таким образом, могут иметь место случаи, когда на одной странице располагается несколько разделов.

Рис. 2.8. Варианты ориентации страницы А4: а — книжная; б — альбомная

И наоборот, один раздел мо­жет состоять из нескольких страниц. Так, на рис. 2.9 представ­лен документ, в котором каждый из трех разделов занимает по одной странице.

 

Рис. 2.9. Пример документа, состоящего из трех разделов

 

К разделам применяется самый высокий уровень формати­рования документов MS Word. К сожалению, в этом текстовом процессоре нет универсальной команды, которая открывала бы диалоговое окно для выполнения операции форматирования разделов. Эти команды находятся в разных пунктах меню:

· Файл/Параметры страницы,

· Формат/Колонки;

· Вставка/Разрыв.

Последняя команда позволяет пользователю управлять раз­мещением разделов (рис. 2.10).

Итак, документ, создаваемый с помощью текстового процес­сора MS Word, имеет сложную структуру. Его основу составляют текстовые объекты — разделы, страницы, абзацы и символы. До­кумент состоит из одного или нескольких разделов, хотя боль­шинство служебных документов имеет в своем составе только один раздел. Раздел состоит из одного или нескольких абзацев. Абзацы могут состоять из символов, число которых может быть различным: от одного до нескольких сотен. В зависимости от этого абзац (абзацы) может размещаться на одной или несколь­ких страницах документа. Представление о структуре документа как сложного объекта дает схема, представленная на рис. 2.11.

 

Рис. 2.10. Диалоговое окно Вставка/Разрыв

Рис. 2.11. Иерархия текстовых объектов документа

Зачастую текст, создаваемый с помощью текстовых процессо­ров, нуждается в пояснении с помощью наглядных примеров или образов. Изображение, которое включается в текст с этой целью, называется иллюстрацией. В качестве иллюстраций в документ могут включаться изображения, созданные как специальными приложениями, так и средствами, входящими в состав текстового процессора. Текстовый процессор MS Word позволяет в полной мере реализовать эти возможности. Так, с помощью команды.

Вставка/Рисунок в текст документа можно включить графические объекты, созданные с помощью разных средств (рис. 2.12).

Рис. 2.12. Меню команды Вставка/Рисунок

Команда Картинки позволяет вставить в текст рисунки, вхо­дящие в комплект поставки пакета Microsoft Office. Они хранят­ся в папке C: \\MicrosoftОffice\ProgramFiles\media\cagcat. При этом каждой картинке, хранящейся здесь, соответствует опреде­ленный набор ключевых слов. Поэтому выбор подходящей кар­тинки существенно облегчается, так как пользователь может указать, что именно ему требуется. Так, например, ключевому слову «компьютер» в текстовом процессоре MS Word отвечают картинки, часть которых приведена на рис. 2.13.

Рис. 2.13. Картинки, найденные по ключевому слову «компьютер»

С помощью команды Из файла можно вставить графические файлы, созданные в среде различных графических редакторов, например Adobe PhotoShop, Corel Draw, 3 D Studio Max, GIMP и др. Кроме того, изображение в документ можно импортиро­вать непосредственно со сканера или с цифровой камеры с по­мощью соответствующей команды.

Для включения в текст документа отдельных графических объектов могут быть использованы графические приложения, входящие в состав текстового процессора.

Организационная диаграмма. Данная команда позволяет вклю­чить в текст документа шесть типов диаграмм, выражающих от­ношения между объектами (рис. 2.14).

Рис. 2.14. Варианты организационных диаграмм в MS Word: а структура отношений подчинения; б — структура непрерывного процесса; к структура с центральным элементом; г — иерархическая структура с базовым элементом; д — перекрывающиеся множества; е — последовательность достиже­ния цели

 

Объект WordArt. С помощью этой команды в текст документа можно ввести художественно оформленную надпись. Программа позволяет выбрать один из тридцати вариантов ее оформления (рис. 2.15). Кроме того, пользователь может не только выбрать тип и размер шрифта, но и изменить некоторые свойства такой надписи.

Рис. 2.15. Варианты начертания надписи WordArt

Диаграмма. Диаграмма является способом графического представления числовых данных, хранящихся в таблицах. Это позволяет визуально представить соотношение различных значе­ний и динамику их изменения. Программа включает большое количество различных типов диаграмм (рис. 2.16). Каждый тип диаграмм служит для определенных целей. Обычно пользователь не ограничен жесткими правилами использования какого-либо типа диаграмм.

Рис. 2.16. Типы диаграмм MS Word

Рис. 2.17. Панель инструментов Рисование

 

Кроме этих графических объектов пользователь может соз­дать и другие с помощью инструментов Рисование. Доступ к ним открывается после запуска соответствующей панели инструмен­тов (рис. 2.17).

 


Поделиться:



Популярное:

Последнее изменение этой страницы: 2016-08-31; Просмотров: 571; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.035 с.)
Главная | Случайная страница | Обратная связь