Типы
текстовых файлов
Если говорить
о форматах текстовых файлов, их можно разделить на два типа. Собственно текстовые
файлы, имеющие расширение txt, содержащие только сведения о символах. Каждому
символу соответствует стандартный код. Существует несколько таблиц кодировки.
В таблице кодировки каждому символу латинского алфавита присвоен уникальный
двоичный код. Для символов национальных алфавитов в странах, где они используются
(в частности, для кириллицы), применяются расширенные кодовые страницы.
К наиболее
распространенным текстовым форматам относятся ASCII (American Standart Code
for Information Interchange), ANSI (American National Standart Insitiute) и
Unicode-файлы. Они имеют разные кодовые таблицы. Полученный файл будет обладать
рядом недостатков. Формат ASCII — это базовый уровень представления текстовой
информации, он един для всех программных средств, работающих с текстами. В тексте
ASCII нет полужирного и курсивного начертания, отсутствует система гарнитур
и кеглей (только один, стандартный). В нем нет отступов, и, как правило, каждая
строка в этом документе представляет собой отдельный абзац.
Второй тип,
условно относимый к текстовым, — это файлы с форматированием. В формате этих
файлов содержится не только информация об их содержании, т. е. о символах, но
и о способе представления этих символов, т. е. шрифтах, кеглях, начертаниях,
разбивке на абзацы и страницы, размере полосы набора, иногда о стилях абзацев
и символов В общем, обо всех элементах форматирования, выполненных в данном
тексте. Файлы с форматированием создаются в текстовых процессорах различного
класса.
Особое место
занимают текстовые файлы со стилевой разметкой — Tagged format — в них сохраняется
стилевая разметка, а полученный файл имеет расширение txt, являясь обычным ASCII-файлом.
Для того чтобы конвертировать файлы из одних форматов в другие, используют фильтры импорта и экспорта.