Типы текстовых файлов

Если говорить о форматах текстовых файлов, их можно разделить на два типа. Собственно текстовые файлы, имеющие расширение txt, содержащие только сведения о символах. Каждому символу соответствует стандартный код. Существует несколько таблиц кодировки. В таблице кодировки каждому символу латинского алфавита присвоен уникальный двоичный код. Для символов национальных алфавитов в странах, где они используются (в частности, для кириллицы), применяются расширенные кодовые страницы.

К наиболее распространенным текстовым форматам относятся ASCII (American Standart Code for Information Interchange), ANSI (American National Standart Insitiute) и Unicode-файлы. Они имеют разные кодовые таблицы. Полученный файл будет обладать рядом недостатков. Формат ASCII — это базовый уровень представления текстовой информации, он един для всех программных средств, работающих с текстами. В тексте ASCII нет полужирного и курсивного начертания, отсутствует система гарнитур и кеглей (только один, стандартный). В нем нет отступов, и, как правило, каждая строка в этом документе представляет собой отдельный абзац.

Второй тип, условно относимый к текстовым, — это файлы с форматированием. В формате этих файлов содержится не только информация об их содержании, т. е. о символах, но и о способе представления этих символов, т. е. шрифтах, кеглях, начертаниях, разбивке на абзацы и страницы, размере полосы набора, иногда о стилях абзацев и символов В общем, обо всех элементах форматирования, выполненных в данном тексте. Файлы с форматированием создаются в текстовых процессорах различного класса.

Особое место занимают текстовые файлы со стилевой разметкой — Tagged format — в них сохраняется стилевая разметка, а полученный файл имеет расширение txt, являясь обычным ASCII-файлом.

Для того чтобы конвертировать файлы из одних форматов в другие, используют фильтры импорта и экспорта.