Я Милютин Александр Вячеславович это мой проект "Руководства по вашему компьютеру", а мой главный сайт тут http://ofru.ru на нём вы сможете помочь мне инвалиду детства по ДЦП первой группы и третьей степени нетрудоспособности.


21 января 2011

Если на экране буквы незнакомого вам алфавита, значит пора узнать о том, что такое кодировка. В середине XX века, когда компьютеры исполь­зовались только для математических вычисле­ний, появилась идея научить их работать еще и с текстом. Но тогда никто даже не задумывался, что буквы одного алфавита на разных компьюте­рах будут отображаться по-разному.Как известно, родной язык компьютеров — это язык чисел. Для того чтобы записать текстовую информацию в память вычислительной машины, были придуманы так называемые таблицы коди­ровок. В них каждой букве конкретного алфави­та соответствует определенное число, понятное электронному устройству. Поскольку объем па­мяти у первых компьютеров был маленьким, то и таблицы кодировок содержали в себе только наиболее часто используемые символы. В то вре­мя большинство пользователей говорили на анг­лийском. Поэтому в первых таблицах кодировок было отведено место для 127 символов, среди ко­торых — заглавные и строчные буквы латинско­го алфавита, знаки препинания и некоторые дру­гие служебные символы.

Со временем компьютеры стали все глубже прони­кать в повседневную жизнь, выполняя все боль­шее число совершенно новых прикладных задач. Настал момент, когда они пришли в дом к поль­зователям, которые совершенно не знали англий­ский. Тогда и возникла проблема: как научить компьютеры другим языкам?

Решение оказалось довольно простым: размер таблиц кодировок был просто удвоен. Это позволило, сохранив прежние 127 симво­лов на своих местах, закодировать симво­лы любого национального алфавита. Но на тот момент не существовало единого стан­дарта, устанавливающего правила созда­ния кодировок для разных языков. Даже для одного языка применялись разные таблицы кодировки. Отличие в записи символов в разных таблицах кодировки было настолько велико, что текст, набран­ный на одном компьютере, не мог быть прочитан на другом. Поэтому до сих пор бывают случаи, когда в каком-нибудь фай­ле или где-нибудь в Интернете вместо при­вычного текста можно увидеть непонят­ную абракадабру.

Сегодня для представления кирил­лических текстов используют такие кодировки:

DOS-866: Применяется в устаревших опера­ционных системах.

ISO-8859-5 С: ней работают пользователи систем, отличных от Windows.

KOI8-R: Установлена в операционных систе­мах, отличных от Windows. Кроме того, часто используется на вэб-сайтах и в электронной корреспонденции.

Windows-1251: Применяется в основном в операционной системе Windows.

Как одно из решений создавшейся проблемы ор­ганизация Unicode Consortium разработала одно­именную кодировку, вместившую в себя целых 65 536 символов! Этого вполне хватит для того, чтобы описать все возможные символы, которые присутствуют в языках народов мира. Однако прежние таблицы кодировок еще достаточно распространены, поэтому окончательный пере­ход на универсальную кодировку — дело буду­щего. Сегодня же пользователей интересует во­прос, что нужно делать, если в очередной раз в документе вместо необходимой информации отоб­разилось множество непонятных символов.

Боремся с текстовым беспорядком

Чтобы получить из непонятного набора символов удобоваримый текст, в первую очередь стоит про­верить, не содержится ли в программе, с которой вы работаете, встроенных возможностей перекодировки. К примеру, программа Microsoft Word ос­нащена средствами распознавания кодировки, в которой записан выбранный файл. Чтобы вклю­чить этот механизм, выберите пункт меню Сереис\ Параметры… и на закладке Общие отметьте пункт подтверждать преобразование при открытии. После этого при открытии текстового документа, который сохранен в нестандартной кодировке, Word предложит преобразовать текст, подобрав для вас наиболее подходящий набор символов.

Путешествуя по Интернету, пользователи иногда сталкиваются с тем, что какую-нибудь страницу нельзя прочесть. И здесь в первую очередь стоит предположить, что вэб-сайт содержит информа­цию, записанную в непонятной кодировке, кото­рую в большинстве случаев поможет определить любой современный вэб-браузер. Например, в Internet Explorer нужно отметить пункт Вид Кодировка или выбрать значение Коди­ровка контекстного меню и переключиться в одну из кодировок кириллицы. Обяза­тельно зайдите и в подменю Дополнитель­но — в нем можно найти еще несколько кодировок. Полезным окажется также и пункт Автовыбор, его включение даст про­грамме команду самостоятельного определе­ния правильной кодировки. Это возможно, если создатели вэб-страницы дополнили ее соответствующей служебной информацией. В противном случае вэб-браузер «подхва­тит» первую попавшуюся, чаще всего не­правильную, кодировку. Тогда выбор придется делать вам.

Так же, как и в Internet Explorer, происходит переключение кодировок и в почтовой программе Outlook Express. Потому при работе с электронной почтой нужно обязательно помнить об этом.

Если встроенные средства какой-либо программы не позволяют привести текст в читабельный вид, следует воспользоваться так называемыми пере­кодировщиками. Эти приложения предназначены для того, чтобы на основе определенных правил отобразить полученный текст в нужной кодиров­ке. Причем основная задача перекодировщика — распознать текст, который прошел множествен­ное преобразование. На сегодняшний день разра­ботано несколько программ, предназначенных для работы с документами различных форматов. Наиболее популярные из них — «Штирлиц» и TCode. Эти приложения в любой момент можно бесплатно загрузить с соответствующих сайтов.




Комментарии RSS

Оставьте отзыв


в отзыве ЗАПРЕЩЕНО указывать сторонние ресурсы

Защита от ботов: