Если doc странная кодировка как поменять. Как решать проблемы кодировок в Windows и MS Office


Меня несколько раз просили написать, как поменять кодировку на сайте . Дело это состоит из нескольких частей, поэтому в двух словах не объяснить. И я принял решение написать эту статью, в которой чётко расписать, что требуется для смены кодировки на сайте .

Давайте с Вами будем переводить сайт в кодировку UTF-8 . Если Вы хотите перевести в любую другую кодировку, то всё будет аналогично. Итак, вот порядок действий для этого:

  1. Все текстовые файлы (html , php , js , txt , в общем, в которых есть текст) перекодируйте в UTF-8 . Сделать это очень просто через Notepad++ в пункте "Преобразовать в UTF-8 без BOM " из меню "Кодировки ". Причём именно все файлы, которые даже ничего не выводят на страницу.
  2. Поместите в корень сайта файл .htaccess с текстом AddDefaultCharset UTF-8 .
  3. Поменяйте кодировку в мета-теге

Если Ваш сайт не использует базу данных, то на этом этапе можно закончить менять кодировку. Но если база данных есть, то нужно сделать ещё и следующие шаги:

  1. Сразу после подключения к БД выполните запрос: SET NAMES UTF-8
  2. В phpMyAdmin поменяйте кодировку базы данных на utf8_general_ci в её настройках.
  3. Поставьте у всех таблиц кодировку utf8_general_ci .
  4. У всех текстовых типов полей так же поставьте кодировку utf8_general_ci .

Всё, теперь Ваша кодировка на сайте изменена. Добавлю лишь, что если где-то в коде Вы занимались преобразованием из одной кодировки в другую (например, через функцию iconv() ), то тщательно проверьте это место, возможно, там появится проблема.

Файлы и документы, созданные на компьютере, всегда имеют свою кодировку. Часто случается так, что при обмене файлами или скачивании их из интернета кодировка, в которой они созданы, не читается нашим компьютером. Причины этому могут быть разные - как отсутствие необходимой кодировки в программе, которой мы хотим открыть файл, так и просто отсутствие некоторых компонентов программы (дополнительного пакета шрифтов, например).

Ниже рассмотрим, как поменять кодировку нечитаемого файла или документа в разных программах.

Изменение кодировки на странице браузера

Для Google Chrome

  1. Выбираем меню «Настройки» → «Инструменты».
  2. Строка «Кодировка» - наводим мышью, и появляется список возможных кодировок в браузере.
  3. Выбираем для русских сайтов «Windows 1251». Если не поможет, пробуем «Автоматически».

Для Opera

  1. Нажимаем «Opera» → «Настройки»
  2. Слева меню «Веб-сайты» → поле 2 «Отображение» → «Настроить шрифты»
  3. В поле «Кодировка» выбираем «Кириллица (Windows 1251)».

Для Firefox

  1. Firefox → Настройки → Содержимое.
  2. Напротив строки «Шрифт по умолчанию» нажимаем кнопку «Дополнительно».
  3. Внизу окна выбираем «Кодировка» &rarr «Кириллица (Windows 1251)».

Изменение кодировки в Word

Рассмотрим процедуру изменения кодировки на примере Word 2010

  1. Открываем документ.
  2. Вкладка «Файл» → «Параметры».
  3. Выбираем строку «Дополнительно». В разделе «Общие» напротив строки «Подтверждать преобразование формата файла при открытии» ставим галочку. Нажимаем ОК.
  4. Далее откроется окно «Преобразование файла». Выбираем «Кодированный текст», жмем ОК.
  5. Далее в открывшемся окне отмечаем «Другая» и выбираем из списка кодировку, которая отобразит необходимый текст. В окне «Образец» можно просмотреть, как отображается текст в той или иной кодировке, выбранной нами.

Если пройденная процедура не помогла отобразить документ, можно попробовать поменять шрифт. Иногда документ может отображаться в виде «квадратиков» или других знаков, если в программе нет соответствующего шрифта.

Изменение кодировки в Excel

Рассмотрим процедуру изменения кодировки для Excel 93-2004 и 2007:

  1. Открываем нечитаемый документ с помощью программы Notepad++.
  2. Выбираем меню Encoding (Кодировка) → Конвертировать в UTF-8.
  3. Символы не изменятся, изменится только кодировка внизу экрана. Далее выбираем набор символов. Если это русский язык: Encoding → Character sets → Cyrillic → Windows-1251.
  4. Нажимаем "Сохранить". Открываем файл в Excel. Если не читается текст, пробуем повторить шаги 3-4.

Изменение кодировки текста

  1. Открываем файл в стандартном текстовом процессоре Блокнот.
  2. Нажимаем «Сохранить как».
  3. В открывшемся окне сохранения выбираем место, куда хотим сохранить файл, тип документа - текстовый, а также ставим другой тип кодировки.
  4. Сохранить.
  5. Пробуем открыть документ.

Дополнительно читайте статью

Каким образом компьютер способен воспринимать, разделять и распознавать всё множество команд? Все символы, которыми мы пользуемся, представляют собой набор чисел. Другими словами, каждая буква и любой другой знак имеет своё обозначение в виде числа. Так компьютерной системе гораздо легче и быстрее обрабатывать информацию. Но не стоит забывать о том, что в мире множество языков, а для обозначения команд используется всего 256 символов. Поэтому существуют различные кодировки.

Кодировка — это способ сохранения информации, данных для последующего использования. Если на экране мы видим набор непонятных нам букв, это означает, что кодировка выбрана неправильно. И эти самые 256 цифр обозначают символы, записанные под их значениями, на иностранном языке. При возникновении этой проблемы компьютер при открытии файла предлагает изменить кодировку на другую, имеющуюся у него. Обычно кодировка определяется автоматически по выбранному языку (раскладке клавиатуры) на компьютере.

Изменение кодировки в браузере, если «криво» отображается интернет-страница

Иногда подобная ситуация с появлением непонятных букв может возникнуть и при использовании поисковых систем. Так же, как и в документе, мы можем изменить кодировку страницы. Для этого в меню установленного браузера Internet Explorer выбираем вкладку «Вид». Справа появляется окно, в нём нажимаем на раздел «Кодировка», затем выбираем «Дополнительно» и, наконец, появляется список возможных кодировок. Нажимаем на вариант нужной нам кодировки. Internet Explorer настроен на применение шести видов кодировок: Windows-1251 и UTF-8 (часто используемые кодировки), ISO-8859-5, KOI-8U, Mac, KOI-8R. Р

*изменение кодировки на примере браузера Мазила

Разработчики сайтов и других интернет-ресурсов опираются на данную информацию и используют эти же кодировки. Здесь уже язык клавиатуры будет влиять на язык ввода информации в поисковую строку, но не на информацию, которую будет выдавать поисковая система. К слову, Windows-1251 используется для кодировки страниц на русском языке. Это основной вид кодировки для русскоязычных сайтов. Для сайтов на иностранных языках в кодировке меняется цифра в конце названия. Например, для английского языка это будет Windows-1252, а для языков Центральной Европы – Windows-1250.

Изменение кодировки на сайте

* как меняеться(точнее преобразовываеться) кодирвока отдельной страницы сайта в HTML-редакторе Notepad++

Проблема становится гораздо серьёзнее, если выбрана неправильная кодировка всего сайта. Наиболее популярными в России являются две кодировки. Первая из них – кодировка Юникод, обозначается в виде символов utf-8. Кодировка обладает несколькими формами представления: UTF-8, UTF-32 и наиболее известная UTF-16. Она содержит в себе огромное множество языков. Вторая российская кодировка Windows-1251. Также имеет большое число языков, среди которых наиболее используемые среди русскоязычного населения и жителей стран СНГ.

Многие опытные пользователи персонального компьютера считают, что кодировка Windows-1251 практически изжила себя и скоро отойдёт на второй план. Массовый переход от одной кодировки к другой уже заметен, но идёт постепенно. Свидетельством тому служит применение utf-8 за границей и среди серьёзных дорогостоящих российских интернет-ресурсов.

Допустим, что вы решаете перекодировать сайт с Windows-1251 на Юникод. Для этого вам нужно будет совершить несколько операций. Для начала указывается кодировка в настройках. Во вкладке «Управление» нужно будет выбрать раздел «Настройки веб-сервера». Вместо предыдущей кодировки нужно выставить выбранную новую кодировку. В рассматриваемом случае это utf-8. На этом несложный процесс закончен, и теперь можно пользоваться сайтом с новой кодировкой. Однако, следует в меню браузера (как это было описано в пункте «Изменение кодировки интернет-страницы» данной статьи) в разделе «Кодировка» нажать «Выбирать автоматически». Это нужно для открытия всех страниц и сайтов, согласно настройкам, при использовании новой кодировки.

Затем нужно исправить запись в метатегах . Это сделать нетрудно, нужно всего лишь изменить запись в скобках. Перед правой скобкой нужно удалить слова Windows-1251 и вместо них вписать utf-8. Завершая процесс перекодировки сайта, пользователю нужно будет осуществить это действие для каждой страницы. Так как в противном случае некоторые страницы будут по-прежнему отображать бессмысленную информацию. Длительность перекодировки зависит от количества страниц сайта, то есть от объёма информации на нём. Всё же лучше не жалеть на это времени.

* подчеркнут красным мета-тег который отвечает за кодировку сайта.

Чтобы избежать возникновения трудностей с изменением кодировки существующего интернет-ресурса, нужно применять правильную кодировку перед созданием сайта. Если при открытии страниц сайта проблема с появлением неизвестного текста на экране возникает, то пользователь не захочет тратить собственное время на подобный сайт, тем более на расшифровку страницы вручную.

И тогда сайт потеряет своих посетителей, что создаёт неблагоприятные условия для дальнейшего существования сайта. Конкуренты не будут ждать, пока организатор сайта исправит все неполадки, а воспользуется данной ситуацией. Потерянную аудиторию будет сложно вернуть в дальнейшем. Именно поэтому к созданию сайта нужно подходить ответственно, так как на его организацию вы потратите меньше времени, чем на исправление.

В текущей статье мы поговорим о том, как изменить кодировку на сайте, какие кодировки бывают и какую кодировку выбрать более оптимально.

Кодировка сайта задается с помощью тега meta . Что такое мета-теги и для чего они необходимы мы уже обсуждали в статье . Задается кодировка страницы следующим образом:

Эта строка помещается между тегами .

Примечание: Помимо указания нужной кодировки, рекомендуется указывать и язык контента на странице, чтобы помочь поисковым системам правильно определить язык на сайте:

Основные типы кодировок на сайте

Поскольку мы нацелены на русскоязычную аудиторию, будем говорить о наиболее популярных кодировках, которые поддерживают русский язык. К ним относятся:

  • UTF-8 - (Юникод) на данный момент наиболее популярная кодировка для веб-сайтов (8 бит);
  • Windows-1251 - одна из наиболее распространенных кодировок (8 бит);
  • KOI8-R - стандарт для кириллицы в Unix-подобных системах (8 бит).

Юникод (Unicode) является стандартом кодирования, который позволяет представить символы практически всех языков письменности (в том числе математических, музыкальных и других). Юникод имеет своё проявление в форматах UTF-8, UTF-16 и UTF-32, которые различаются между собой способом хранения данных. Для обеспечения наилучшей совместимости со старыми системами используется 8-битная кодировка.

Изменение кодировки текста при помощи блокнота

Чтобы изменить кодировку произвольного текста, можно воспользоваться обычным блокнотом. Допустим, вам необходимо изменить кодировку текста с KOI8 на Windows-1251. Для этого нужно:

  • Перенести нужный текст в стандартный редактор "Блокнот" (Notepad);
  • В меню "Вид" -> "Кодировка" выбрать "Кирилица (Windows)".

При сохранении файла с помощью блокнота есть возможность выбрать нужную кодировку.

В конструкторе сайтов "Нубекс" все сайты создаются в кодировке UTF, благодаря чему корректно отображаются различные символы и языки.

Набор символов, которые мы видим на экране при открытии документа, называется кодировкой. Когда она выставлена неправильно, вместо понятных и привычных букв и цифр вы увидите бессвязные символы. Эта проблема часто возникала на заре развития технологий , но сейчас текстовые процессоры умеют сами автоматически выбирать подходящие комплекты. Свою роль сыграло появление и развитие utf-8, так называемого Юникода, в состав которого входит множество самых разных символов, в том числе русских. Документы в такой кодировке не нуждаются в смене и настройке, так как показывают текст правильно по умолчанию.

Современные текстовые редакторы определяют кодировку при открытии документа

С другой стороны, такая ситуация всё же иногда случается. И получить нечитаемый документ очень досадно, особенно если он важный и нужный. Как раз для таких случаев в Microsoft Word есть возможность указать для текста кодировку. Это вернёт его в читаемый вид.

Принудительная смена

Если вы получили из какого-то источника текстовый файл, но не можете прочитать его содержимое, то нужна операция ручной смены кодировки. Для этого зайдите в раздел «Сведения» во вкладке «Файл». Тут собраны глобальные настройки распознавания и отображения, и если вы будете изменять их в открытом документе , то для него они станут индивидуальными, а для остальных - не изменятся. Воспользуемся этим. В разделе «Дополнительно» появившегося окна находим заголовок «Общие» и ставим галочку «Подтверждать преобразование файлов при открытии». Подтвердите изменения и закройте Word. Теперь откройте документ снова, как бы применяя настройки, и перед вами появится окно преобразования файла. В нём будет список возможных форматов, среди которых находим «Кодированный текст», и получим следующий диалог.

В этом новом окне будет три переключателя. Первый, по умолчанию, - это CP-1251, кодировка Windows. Второй - MS-DOS. Нам нужен третий пункт - ручной выбор, справа от него перечислены разнообразные наборы символов. Но, как правило, пользователь не знает, какими символами был набран текст предыдущим автором, поэтому в нижней части этого окна есть поле под названием «Образец», в котором фрагмент из текста будет в реальном времени отображаться при выборе того или иного комплекта символов. Это очень удобно, потому что не нужно каждый раз закрывать и отрывать документ снова, чтобы подобрать нужную.

Перебирая варианты по одному и глядя на текст в поле образцов, выберите ту кодировку, при которой символы будут русскими. Но обратите внимание, что это ещё ничего не значит, - внимательно смотрите, чтобы они складывались в осмысленные слова. Дело в том, что для русского языка есть не одна кодировка, и текст в одной из них не будет отображаться корректно в другой. Так что будьте внимательны.

Нужно сказать, что с файлами, сделанными на современных текстовых процессорах, крайне редко возникают подобные проблемы. Однако есть ещё и такой бич современного информационного общества, как несовместимость форматов. Дело в том, что существует целый ряд текстовых редакторов, и каждым кто-то пользуется. Возможно, для кого-то не нужна функциональность Ворда, кто-то не считает нужным за него платить и т. п. Причин может быть множество.

Если при сохранении документа автор выбрал формат, совместимый в MS Word, то проблем возникнуть не должно. Но так бывает нечасто. Например, если текст сохранён с расширением.rtf, то диалог выбора кодировки отобразится перед вами сразу же при открытии текста. А вот форматы другого популярного текстового процессора OpenOffice Ворд даже не откроет, поэтому, если им пользуетесь, не забывайте выбирать пункт «Сохранить как», когда отправляете файл пользователю Office.

Сохранение с указанием кодировки

У пользователя может возникнуть ситуация, когда он специально указывает определённую кодировку. Например, такое требование ему предъявляет получатель документа . В этом случае нужно будет сохранить документ как обычный текст через меню «Файл». Смысл в том, что для заданных форматов в Ворде есть привязанные глобальными системными настройками кодировки, а для «Обычного текста» такой связи не установлено. Поэтому Ворд предложит самостоятельно выбрать для него кодировку, показав уже знакомое нам окно преобразования документа. Выбирайте для него нужную вам кодировку, сохраняйте, и можно отправлять или передавать этот документ. Как вы понимаете, конечному получателю нужно будет сменить в своём текстовом редакторе кодировку на такую же, чтобы прочитать ваш текст.

Заключение

Вопрос смены кодировки в Вордовских документах перед рядовыми пользователями встаёт не так уж часто. Как правило, текстовый процессор может сам автоматически определить требуемый для корректного отображения набор символов и показать текст в читаемом виде. Но из любого правила есть исключения, так что нужно и полезно уметь сделать это самому, благо, реализован процесс в Word достаточно просто.

То, что мы рассмотрели, действительно и для других программ из пакета Office. В них также могут возникнуть проблемы из-за, скажем, несовместимости форматов сохранённых файлов. Здесь пользователю придётся выполнить всё те же действия, так что эта статья может помочь не только работающим в Ворде. Унификация правил настройки для всех программ офисного пакета Microsoft помогает не запутаться в них при работе с любым видом документов, будь то тексты, таблицы или презентации.

Напоследок нужно сказать, что не всегда стоит обвинять кодировку. Возможно, всё гораздо проще. Дело в том, что многие пользователи в погоне за «красивостями» забывают о стандартизации. Если такой автор выберет установленный у него шрифт, наберёт с его помощью документ и сохранит, у него текст будет отображаться корректно. Но когда этот документ попадёт к человеку, у которого такой шрифт не установлен, то на экране окажется нечитаемый набор символов . Это очень похоже на «слетевшую» кодировку, так что легко ошибиться. Поэтому перед тем как пытаться раскодировать текст в Word, сначала попробуйте просто сменить шрифт.







2024 © gtavrl.ru.